Bogárdi János: Korrelációszámítás és alkalmazása a hidrológiában (Akadémiai Kiadó, Budapest, 1952)
II. A kétváltozós, egyszerű korreláció számítása
esetben azonban megadtuk, hogy végesszámú észlelés esetén milyen összefüggések határozzák meg a stochasztikus kapcsolat mértékszámait és a kapcsolatot kifejező összefüggések együtthatóit. A két eset, ha a két valószínűségi változónak valójában csak az ismert N számú1 értékpárja létezik, természetesen teljesen azonos. Több helyen említettük azonban, hogy a megadott értékpárok, amelyekkel számításainkat végezni szoktuk, csupán a természetből vett minták, ami által a belőlük kiszámított paraméterek csupán közelítő értékeknek tekinthetők. Ezekután természetesen felmerül az a gondolat, hogy milyén mértékben tekinthetők a természetből vett minták alapján kiszámított mértékszámok az előttünk ismeretlen teljes értéktartományt jellemző mértékszámoknak. Röviden tehát, a rendelkezésünkre álló értékpárok segítségével kiszámított mértékszámokból mi módon következtethetünk a valódi értékekre. Ilyen következtetések csak az ú. n. »nagyszámok törvénye« alapján vonhatók le. Mivel a valódi értékeket nem ismerjük, a rendelkezésünkre álló észlelési anyagból levezetett mértékszámoknál meg kell becsülni azt a hibát, ami a valódi értékekhez viszonyítva fennáll. Lényegileg tehát meg kell becsülnünk azt a hibát, amelyet elkövetünk akkor, ha a keresett és ismeretlen valódi mértékszámok helyett a közelítő mértékszámokat használjuk. Tanulmányunk keretén kívül fekszik, hogy a változók mintavételének teljes hibaelméletét részletezzük. Ezért röviden csak a valószínűség-elméleti mértékszámoknál elkövetett hibákra és a bonyolult matematikai levezetések elkerülése céljából ezeknek is csak a végső összefüggéseire fogunk kitérni.* A korrelációs tényező számításánál a véletlen középhiba mellett szisztematikus hibát is elkövetünk, ha a számításhoz ugyanazokat az összefüggéseket használjuk, mint amelyek a valódi tényezők kiszámítására szolgálnak. Itt röviden meg kell emlékeznünk a véletlen és szisztematikus hibák definíciójáról is. A kiegyenlítő számításnál véletlen, vagy szabálytalan hibának azokat a hibákat nevezzük, melyek a mérés, vagy észlelés megismétlése alkalmával mind előjelre, mind nagyságra nézve a véletlen szeszélye szerint jelentkeznek. Szisz- tematikus vagy szabályos hibáknak pedig azokat a hibákat nevezzük a kiegyenlítő számításnál, melyek a mérés, vagy észlelés megismétlése alkalmával értéküket valami szabályossággal változtatják. A szabályos hiba értéke nem szükségképpen állandó, de előjelre túlnyomóan ugyanaz. A korrelációszámításnál természetesen a hibaszámítások célja nem a változók véletlen és szisztematikus hibáinak a kiszámítása, hanem a két változó kapcsolatát jellemző paraméterek azon hibáinak a megállapítása, amelyek abból származnak, hogy az észleléseknek csak korlátozott számából határoztuk meg a paramétereket. Azáltal ugyanis, hogy a paraméterek valódi értékének a kiszámítására szolgáló összefüggésekbe nem az egyes tényezők (pl. szórások) valódi értékét, hanem ezeknek (pl. a szórásoknak) csak közelítő értékét helyettesítjük be, a véletlen hiba mellett szisztematikus hibát is elkövetünk. A szisztematikus hiba esetenkint pozitív, vagy negatív, ami által a paraméterek kiszámított közelítő % értéke nagyobb, vagy kisebb lesz a paraméterek valódi értékénél. 48 * Az ebben a fejezetben megemlített és a paraméterek hibáinak számítására vonatkozó teljes elméletet lásd Csuprov A.: Grundbegriffe und Grundprobleme der Korrelationstheorie című munkájában.