Bogárdi János: Korrelációszámítás és alkalmazása a hidrológiában (Akadémiai Kiadó, Budapest, 1952)
I. A valószínűségszámítás néhány alapvető tétele
18 az észlelt értékpárok közül bármelyik kettőnek a behelyettesítése révén egyértelműen kiszámíthatjuk. A .valóságban azonban az észlelési értékek még függvénykapcsolat esetén is hibákkal terheltek. Legtöbb esetben pedig szigorúan vett függvénykapcsolat nem is áll fenn a változók között. A feladat ebben az esetben az V és X-re vonatkozó észlelési adatok alapján az ax és bx együtthatóknak a legmegbízhatóbb módon való meghatározása. Ezt úgy is kifejezhetjük, hogy ax és bx állandót az észlelési értékek alapján olymódon kell meghatároznunk, hogy azok a rendelkezésre álló adatpároknak a legjobban megfeleljenek. Természetesen ez a kifejezés, hogy a »legjobban megfeleljen« nem egyértelmű, aminek következtében az állandók meghatározása is többféle, egymástól eltérő módszerrel lehetséges. Az eljárások közül a célszerűség alapján választjuk ki a legmegfelelőbbet. Lehetne azt a módot választani, hogy az együtthatókkal meghatározott összefüggéshez képest az egyes értékpároknál mutatkozó eltérések összege (minden eltérést pozitívnak véve) minimum legyen, ami azt jelenti, hogy az eltérések összegét tekintjük a kiegyenlítés mértékének. Ez az eljárás azonban elméletileg bármennyire is megfelelő, a gyakorlatban a lineáris összefüggés esetétől eltekintve, hátrányosnak mutatkozik. A másik, a legkisebb négyzetek módszere név alatt ismert eljárás. A legkisebb négyzetek módszerénél az együtthatókat azzal a feltevéssel határozzuk meg, hogy az eltérések négyzetösszege minimum legyen. Ha tehát az eltérések négyzet- összegének a keresett együtthatók szerinti első parciális differenciál-hányadosait rendre zérussal tesszük egyenlővé, a keresett együtthatók számának megfelelően úgynevezett normál egyenleteket nyerünk, amelyekből az együtthatók értékét kiszámíthatjuk. A legkisebb négyzetek módszerénél tehát a kiegyenlítés mértékét az eltérések négyzetösszege méri, a legjobb kiegyenlítést pedig az eltérések négyzetösszegének minimuma biztosítja. Meg kell jegyeznünk, hogy a kiegyenlítés mértékeként az eltérések négyzet- összegét célszerűségből választották. Régebben szokásos volt, hogy a legkisebb négyzetek elvét elméleti meggondolásokkal alátámasszák, például az észlelésekben elkövetett hibák normális eloszlásának a feltételezésével. A normális eloszlású hibák, mint a továbbiakban látni fogjuk, a Gauss-féle hibatörvényt követik. Azonban több mint kétséges, hegy a gyakorlati statisztikában ezeknek az elméleti meggondolásoknak az érvényessége valójában fennáll-e. Éppen ezért a statisztikusok ma már azt ajánlják, hogy a legkisebb négyzetek módszerét inkább egyszerűsége és a gyakorlatban való jó használhatósága, mint elméleti indokoltsága miatt alkalmazzuk. A valószínűségszámításnál X változó valódi szórása alatt a mennyiséget értjük. Ez a mennyiség egy szummából vont négyzetgyök, ahol az összeadandól^itik az egyes értékeknek a várható értéktől való eltéréseinek négyzetei, megszorozva a megfelelő valószínűségekkel. Vagyis a valódi szórás aiX valószínűségi változónak a várható értékétől való eltérésnégyzeteiből a megfelelő valószínűségekkel, mint súlyokkal1 képezett középértékének pozitív négyzetgyökével egyenlő. (9)