Bogárdi János: Korrelációszámítás és alkalmazása a hidrológiában (Akadémiai Kiadó, Budapest, 1952)

II. A kétváltozós, egyszerű korreláció számítása

45 Mivel jü és jí2lo mindig pozitív, r mindig kisebb az egységnél és szélső értéke az egység lehet, amely esetben, mint fentebb már láttuk, a két egyenes Egybeesik, jelezve, hogy a két változó függvénykapcsolatban áll egymással. Az átlagos feltételes szórásnégyzetek fenti összefüggései is módot nyújtanak, hogy bizonyos esetekben az ri(1 korrelációs tényezőt közelítőleg meghatározhassuk. Nyilvánvaló ugyanis, hogy bizonyos adatoknál az átlagos feltételes szórás­négyzeteket náhány sor, vagy oszlop szórás-négyzetének átlagával, legalább is közelítőleg helyettesíthetjük. Ha pedig néhány sor, vagy oszlop szórásnégyze­tének átlagát ismerjük, akkor r„,= / !- — • (47) a-y A korrelációszámításnál rendkívül fontos annak a megállapítása, hogy a két valószínűségi változó valószínűség-elméleti kapcsolata lineáris-e, vagy sem. Feltétlenül szükséges tehát, hogy a linearitás biztos megítéléséhez valamilyen mértékszámot vezessünk be. Erre a célra a legalkalmasabb a Pearson által bevezetett korrelációs arányszám. A korrelációs arányszám fogalmához a következőképpen juthatunk. Legyen a korreláció-táblázatban Y° szórásának négyzete az j'-edik oszlop­ban és legyen ebben az oszlopban az észlelések száma nt. Az egye? észlelések fii valószínűsége, vagyis relatív gyakorisága pedig Pi = , akkor Y átlagos fel­tételes szórásnégyzete az alábbi módon is kifejezhető : — Or \ . M (i) 1 .. (1 (0 Z/iQ\ U — Pí pO\2 -- E It, P'012 • (48) L áttuk a szórás, a standard deviation fogalmának bevezetésénél, hogy egy észlelési sorozat középértéktől számított teljes szórásnégyzete a (11) szerint egyenlő a teljes észlelési sorozatot alkotó bizonyos részsorok középértéktől való szórásnégyzeteinek összegével. Itt is felírható tehát, hogy a középértéktől számított teljes szórásnégyzet, ju,ol2 egyenlő a feltételes szórásnégyzetnek és a feltételes értékeknek a közép­értéktől való szórásnégyzeteinek összegével, vagyis N/xou =E {«/ [juou + (mia -mon)2] } , vagy kifejtve Nftoit = N[E pt /u-oil + E Pi(ml\\ - moli)2] és így ju-oia = r Pi ju-o/, + E Piimin - m0|i)2, hasonlóképpen fi21„ = Eqj & + E qj(m[\l - muoy. (49) A fenti két egyenlőség azt mutatja, hogy az átlagos feltételes szórásnégyzet mindig kisebb a teljes szórás-négyzetnél. Minél kisebb XPi^‘1 ju.0I2-höz viszonyítva, ill. /u,2|0-hoz viszonyítva, annál biztosabb a kapcsolatot kifejező egyenlő­ség alapján Y, ill. X megbecsülése és annál jobban megközelítik Y és X előre- jelzett értékei a függvénykapcsolat esetében kiszámítható Y, ill. X értékeket. Függvénykapcsolat esetén ugyanis valamennyi és fYi\ zérussal egyenlő, mivel minden X értékhez csak egy Y, ill. fordítva, minden Y értékhez csak egy X érték tartozik.

Next

/
Oldalképek
Tartalom