Bogárdi János: Korrelációszámítás és alkalmazása a hidrológiában (Akadémiai Kiadó, Budapest, 1952)
II. A kétváltozós, egyszerű korreláció számítása
22 5. Korreláció-táblázatok, alapvető paraméterek Láttuk, hogy a változók, vagy attribútumok eloszlását gyakorisági táblázatokkal, vagy ahogyan a statisztikában nevezik, eloszlási táblázatokkal jellemezhetjük. A gyakorisági, ill. eloszlási táblázatokat két, sőt esetleg több változónál is szerkeszthetünk. A két változás gyakorisági, ill. eloszlási táblázatokat, ha azt az összetartozó értékpárok szerinti szétoszlással kiegészítjük, nevezzük korreláció-táblázatnak. A korreláció-táblázat még rendszerint a feltételes várható értékekkel is bővül. A korreláció-táblázatoknak ezekre a különleges sajátságaira a következőkben majd fokozatosan fogunk kitérni. Lényegét tekintve a korreláció-táblázat a kapcsolatba hozandó két változó gyakorisági, ill. eloszlási táblázatából tevődik össze oly módon, hogy az egyik változó gyakoriságai a sorok, a másik változó gyakoriságai pedig az oszlopok összegeként van feltüntetve. Folytonos változóknál a sorok és oszlopok fejrovatait az egyes változókra választott intervallumok középértékével, az úgynevezett intervallum-közepekkel jelöljük. Nem folytonos változóknál a tulajdonságot, fajtát, vagy sajátságot kifejező szám, vagy jel kerül a fejrovatokba. A fejrovatok ily módon a két változó egész értéktartományát felölelik. A fejrovatoknak megfelelően hálózat készítendő. Ezután a két változó az X és Y egy-egy értékpárját véve, megállapítjuk ezek abszolút gyakoriságát, vagyis az egyes értékpárok előfordulásának zíy- számát. Ezek a ztj számok kerülnek a hplózat egyes mezőibe. Folytonos változóknál igen célszerű a fejrovatot a középértéktől való eltérésekkel kitölteni. Ebben az esetben a középértéktől való eltérések részére választunk intervallumot és így állapítjuk meg a fejrovatokba kerülő intervallumközepeket. A fejrovatok tehát a középértéktől való eltérések nagyságrendjét tüntetik fel. Sok esetben nem folytonos változóknál is lehet a középértéktől való eltéréseket alkalmazni. Számokkal ki nem fejezhető tulajdonságok, vagy sajátságok esetén azonban középértéket nem tudunk képezni és így a korrelációtáblázat ily módon való megszerkesztése nem lehetséges. A korreláció-táblázat megszerkesztésére szolgáljon az alábbi példa. A választott példánál nem folytonos változók szerepelnek és a fejrovatokat a két változó egyes lehetséges értékeivel töltöttük ki. Ilyen példát a következőkben nem fogunk bemutatni és éppen ezért ezen a helyen szándékozunk a korreláció-táblázatnak ezt az alakját ismertetni. A választott példa nem tartozik a hidrológia körébe, mivel ott nehéz lenne jó példát találni. Az alábbi táblázat megadja a Trientális europaea virág szirmainak és kocsá- nyainak összefüggését. A Charlier által összeállított korreláció-táblázat összesen N = 321 összetartozó értékpár eloszlását tünteti fel. A táblázat megadja, hogy például a vizsgált esetek közül 119 esetben a kocsányok száma egy, a virágszirmok száma 5 volt, és így tovább. A korreláció-táblázat ilymódon feltünteti az n, sorban a kocsányok számának, vagyis az X változónak, Uj oszlopban pedig a virágszirmok számának, vagyis az V változónak gyakorisági eloszlását. A hálózatban azután az n( és Uj gyakoriságok a másik változóval való összetartozás alapján vannak szétválasztva. A korreláció-táblázat utolsó sorának és oszlopának értelmezését a következőkben fogjuk majd látni. Nem minden korreláció számításához szükséges a korreláció-táblázat felállítása. Mégis a jobb áttekinthetőség kedvéért is célszerű a korreláció-táblázatot megszerkeszteni. A korrelációszámításnál szerepelő legfontosabb paraméterek fogalmához ugyanaz a gondolat vezet el bennünket, amelynek segítségével felismertük egy