1960. ÉVI NÉPSZÁMLÁLÁS 2. Személyi és családi adatok képviseleti minta alapján (1960)
IV. A fogalmak magyarázata
Ily módon a korrekció során 3 db egytagú, 5 db kéttagú, 6 db háromtagú háztartást kellett kiemelni a mintából és 8 db négytagú, 4 db öttagú, 2 db hattagú, 2 db héttagú háztartást kellett pótlólag a mintába helyezni. Az alábbi táblázat összefoglalva mutatja be, hogy a minta területi egységei (Budapest, a 4 megyei jogú város és a 19 megye) hogyan oszlanak meg a háztartások és a népesség számában mutatkozó különböző irányú eltérések szerint. Megnevezés Nem volt eltérés Negatíveltérés volt a háztartások számában Pozitív Negatív irányú eltérés volt Nem volt eltérés a népesség számában 10 12 A képviseleti minta kiválasztása során összesen 195 magánháztartással és 540 személlyel kevesebbet választottunk ki. E különbségek megyénkénti korrekciójánál összesen 284 magánháztartás és 1015 személy anyagát emeltük ki a mintából, ugyanakkor pedig pótlólag 471 magánháztartás és 1549 személy anyagát választottuk ki az alapsokaságból a mintába. Az intézeti háztartások tagjainál az eltérés mindig negatív előjelű volt és így pótkiválasztással korrigáltuk az anyagot. Ily módon a korrekció során a minta összes háztartásainak még 1%-ához sem kellett hozzányúlnunk, míg a korrekció során mintába került személyek száma a mintaelemszámnak 1,6%-át teszi ki. Ezáltal elértük, hogy a képviseleti minta az ország magánháztartásainak és lakosságának pontosan 1%-át tartalmazza. 7. A minta adatainak pontossága Láttuk, hogy a képviseleti módszerrel nyert adatoktól nem várhatjuk azt, hogy a valószínűségi változó megfigyelt értékeiből annak eloszlására, vagy az eloszlás bizonyos paramétereire vonatkozó, teljes bizonyossággal érvényes következtetéseket tudjunk levonni. Meg kell elégednünk pl. olyan típusú következtetésekkel, hogy az ismeretlen paraméter értéke bizonyos valószínűséggel megadott határok (hibahatárok) közé esik. Esetünkben a kérdéses határok maguk is valószínűségi változók, a számegyenes általuk határolt szakasza az ismeretlen paraméterérték megbízhatóságikonfidencia-) intervalluma. Mintavételi adataink annál pontosabbak, mennél kisebbek ezek megbízhatósági intervallumai. Mivel a mintavételi adatok gyakorlatilag csak akkor használhatók, ha ismerjük pontosságukat, ezért ezen adatok felhasználása szempontjából elengedhetetlen a megfelelő megbízhatósági intervallumok (a véletlen hiba nagyságának) meghatározása. A képviseleti minta alapján az adatokat általában 95%-os valószínűségi szinten közöljük, így az adatok megbízhatósági határait is 95%-os valószínűségi szint mellett adjuk meg. Ez azt jelenti, hogy ha igen sok és mindig ugyanannyi elemből álló mintát készítenénk, akkor 20 eset közül átlagosan 19-ben adatunk helyesnek bizonyulna, abban az értelemben, hogy a jelzett értékközben helyezkedne el. Természetesen előfordulhat olyan eset is (átlagosan legfeljebb 1 a 20 közül), amikor a mintavételi adat pontatlannak bizonyul, és ilyenkor nem esik bele az előre megadott megbízhatósági intervallumba. Ez, mint a fentiekből is világos, nem a minta hibája, hanem az alkalmazott matematikai-statisztikai módszer természetéből adódik. Mivel az 1%-os kepviseleti minta elkeszítesenel haztartasonkenti szisztematikus kiválasztási módszert alkalmaztunk, a mintavételi adatok szórását, ill. megbízhatósági intervallumát előre pontosan meghatározni nem lehet, mert ehhez pl. ismerni kellene az egyes ismérvek háztartásokon belüli szórását, vagy a szisztematikus kiválasztás hatását a mintára. Ezek meghatározása hoszszadalmas számolási munkát igényelne és így késleltetné a minta adatainak közlését. Ezért a mintavételi adatok pontosságát előre csak közelítően tudtuk meghatározni oly módon, hogy — noha szisztematikus, csoportos kiválasztást végeztünk — a mintavételnél egyszerű, véletlen kiválasztást tételeztünk fel. Természetesen a minta anyagának háztartásonkénti és szisztematikus kiválasztása, az elmondottaknak megfelelően, különböző irányokban befolyásolhatja, ronthatja vagy javíthatja az adatok pontosságát. Ezt a tényt — mivel e hatások irányára és eredményére vonatkozó számítások elvégzésére csak később kerülhet sor — az adatok gyakorlati felhasználásánál, illetve a hibahatárok mérlegelésénél feltétlenül figyelembe kell venni. A mintavételi adatok megbízhatósági intervallumait, azaz ezek pontossági fokát a fenti megjegyzések, ill. egyszerűsítések figyelembevételével határoztuk meg. 154