Hézagpótló művet tartok a kezemben; már az első kiadás is alapműnek számított és nem hiányozhatott senki polcáról, aki adatfeldolgozással, kísérlettervezéssel foglalkozik. A korábbi, bibliaként forgatott könyv, többszöri utánnyomás dacára is elfogyott, hiánycikknek számít. A jelen mű ennek átdolgozott, javított kiadása.
A könyv szándékai szerint nem matematikusoknak szól, felhasználók, mérnökök használhatják sikerrel. Valóságos problémákkal foglalkozik, nem steril elméleti, matematikai levezetésekkel, bizonyításokkal. Egyszerű, könnyen érthető példáktól vezet a gondolatmenet a bonyolult, nem egyszerűsíthető komplex feladatokig.
A legtöbb felhasználó csak alkalmazni, használni akarja a statisztikai apparátust, és ezért gyakran hibáznak, ha nem alaposan megértett módszereket alkalmaznak. A módszerek hátterének megértése nélkül az is gyakran előfordul, hogy az alkalmazó az érvényességi határokon kívül is alkalmazni akarja a módszereket. Szerencsére a könyv részletes utalásokat, gyakorlati útmutatókat tartalmaz, így mindenki, aki gondosan követi a gondolatmenetet, meg fogja érteni a példákat, eredményesen tudja alkalmazni a módszereket.
Meggyőződésem, hogy a mérnökhallgatókat, doktoranduszokat nem zavarja majd a sok képlet, szumma-, sőt integráljel, hisz manapság egy táblázatkezelő programban egy kattintással megkaphatjuk számoszlopok összegét. Félő azonban, hogy a sok képlet sok tudományterületen riasztólag hat, de meggyőződésem szerint fölöslegesen, csak nem szabad „félni”, illetve úgy hozzáállni, hogy ez bonyolult, úgysem értem majd meg. Sok évtizedes oktatói gyakorlat csiszolta a felépítést, a példák életből ellesettek, könnyen érthetők, a fejezetek egymásra épülnek. Jómagam sokszor elcsodálkoztam, hogy olyan problémákra is megvan a megoldás (van már megoldás), melyeknek még a létezéséről sem tudtam.
A könyv első fele a valószínűségszámítási és statisztikai alapfogalmakat összesíti. Ismerteti a statisztikai próbákat, a paraméterbecslési módokat, a konfidenciaintervallum és a korreláció fogalmát, hogy csak néhány alapfogalmat említsünk. A második részt a regresszió problémájának szentelték: egyváltozós, többváltozós lineáris regresszió. Külön fejezetek foglalkoznak azokkal az esetekkel, amikor a független változóban is hiba van, a hibaterjedési törvénnyel, és a regresszió feltételezéseinek utólagos ellenőrzésével (reziduumvizsgálat). A harmadik rész tárgya a varianciaanalízis, ennek egyes fejezeteit külön kiegészítő kötetben adják közre. Ez a legjobban kidolgozott, legtöbb valós problémát tartalmazó rész. A negyedik rész szól a kísérlettervezésről (faktoros kísérleti tervek): bevezetés, kétszintes kísérleti tervek, a válaszfelület módszere, és a kísérlettervezés megvalósítása. Az ötödik részt a minőségjavító kísérlettervezésnek szentelték: ismertetik a Taguchi-módszert, a négyzetes veszteségfüggvényt, a kétlépcsős optimalizálás elvét és gyakorlatát, a célfüggvények megválasztását, míg a kiegészítő kötetben a Taguchi-módszerben használt ortogonális terveket, a faktorok megválasztását, és az ellenőrző kísérleteket találjuk.
A könyv egyik, ha nem a legnagyobb előnye az, hogy önálló tanulást is lehetővé tesz. Akik vizsgázni szeretnének statisztikából, akkor is sikerrel vehetik az akadályt, ha nem jártak előadásra, de a könyvet alaposan áttanulmányozzák és megértik. Ugyancsak nem hagyja cserben a könyv azokat, akik nem rendelkeznek megfelelő (validált, drága) számítógépes programokkal. Programozási ismeretek nélkül is jól használható algoritmusok vannak a könyvben, képletekkel, táblázatokkal. Az eltérések négyzetösszegének felbontásával kiegészítve könnyen követhetővé válik a gondolatmenet. A megértést nagyban segíti a digitális formában elérhető EXCEL adattáblázatok gyűjteménye: az összes példa adatai megtalálhatók így.
Tudja valaki, mit jelent a „független változókban nemlineáris, de a paraméterekben lineáris függvényekkel” végzett regresszió?
Mi az a Boksz—Cox-transzformáció? Mikor van rá szükség?
Hány kísérlet szükséges egy teljes faktorú kísérleti tervhez?
Mi az az Abbé-próba, mikor használjuk?
Hogyan kell a veszteségfüggvényt alkalmazni diszkrétváltozókra?
Mi a Kolmogorov—Szmirnov-próba próbastatisztikája?
Hogyan határozzuk meg egy egyenes paramétereinek együttes konfidenciatartományát? Vagy éppenséggel a varianciák azonosságát (homogeneitását)?
Okoz-e ingadozást az, hogy különböző napokon végezték a méréséket?
Aki a fenti, és ezekhez hasonló kérdésekre nemleges a választ ad, annak érdemes a könyvet kezébe vennie, sőt alaposan áttanulmányoznia.
A könyv nyelvezete színvonalas, az angol szakkifejezések fordítása szabatos és egyértelmű, ami nagyon ritka manapság.
Amire nem kapunk választ:
Idézünk a könyvből: „Ha az arány a kritikus értéket meghaladja, el kell vetnünk a nullhipotézist, amely szerint - változó hatása nem szignifikáns. ...Minthogy a ...becslések egymástól nem függetlenek, az előbbi vizsgálat -próbával nem végezhető el. Ha a normális eloszlás feltételezése nem jogos, az itt leírt módszer hamis eredményeket ad!”
Mi a teendő ilyenkor? Hisz a -próbát is rutinszerűen használják, még akkor is, ha tudják, hogy a feltételezések nem jogosak. Ha a normális eloszlás feltételezése nem teljesül, nemparaméteres, robusztus regressziót kellene végezni? Ám az eredmény, ekkor is, mint a -próba esetén, az esetek túlnyomó többségében megegyezik azokkal az eredményekkel, (azaz nem tér el szignifikánsan azoktól) melyeket a normális eloszlás feltételezésével kapunk.
A könyv 17 táblázatot (a kiegészítő kötet 19-et) tartalmaz, melyek a hipotézisvizsgálatokhoz, döntésekhez nyújtanak segítséget, anélkül, hogy drága számítógépes programokat kellene használni.
Összefoglalva megállapítható, hogy hiánypótló műről van szó, amely nem hiányozhat senkinek a könyvespolcáról, aki adatelemzéssel, kísérlettervezéssel, egyváltozós statisztikával, görbeillesztéssel, varianciaelemzéssel és hasonló tárgykörökkel foglalkozik.
Kemény Sándor, Deák András, Lakné Komka Kinga, Kunovszki Péter: Kísérletek tervezése és értékelése (Bővített, javított kiadás, két kötet), Typotex, Budapest, 2017.( A szerzők a Budapesti Műszaki és Gazdaságtudományi Egyetem Kémia és Környezeti Folyamatmérnöki Tanszékének oktatói.)
Héberger Károly
MTA Természettudományi Kutatóközpont
A szerző az MTA doktora, éveket töltött külföldön: Göttingenben, Zürichben és Olaszországban. Jelenleg többváltozós adatelemzéssel (mintázatfelismerés, modellek összehasonlítása, rangsorolás, molekulák hasonlósága) foglalkozik, fő szervezője a Conferentia Chemometrica konferenciasorozatnak. http://aki.ttk.mta.hu/scientist/heberger/