1960. ÉVI NÉPSZÁMLÁLÁS 2. Személyi és családi adatok képviseleti minta alapján (1960)

IV. A fogalmak magyarázata

Ily módon a korrekció során 3 db egytagú, 5 db kéttagú, 6 db háromtagú háztartást kellett kiemelni a mintából és 8 db négytagú, 4 db öttagú, 2 db hattagú, 2 db héttagú háztartást kellett pótlólag a mintába helyezni. Az alábbi táblázat összefoglalva mutatja be, hogy a minta területi egységei (Budapest, a 4 megyei jogú város és a 19 megye) hogyan oszlanak meg a háztartások és a népesség számában mutatkozó különböző irányú eltérések szerint. Megnevezés Nem volt eltérés Negatív­eltérés volt a ház­tartások számában Pozitív Negatív irányú eltérés volt Nem volt eltérés a népesség számában 10 12 A képviseleti minta kiválasztása során összesen 195 magánháztartással és 540 személlyel kevesebbet választottunk ki. E különbségek megyénkénti korrekciójánál összesen 284 magánház­tartás és 1015 személy anyagát emeltük ki a mintából, ugyanakkor pedig pótlólag 471 magánház­tartás és 1549 személy anyagát választottuk ki az alapsokaságból a mintába. Az intézeti háztartások tagjainál az eltérés mindig negatív előjelű volt és így pótkiválasztással korrigáltuk az anyagot. Ily módon a korrekció során a minta összes háztartásainak még 1%-ához sem kellett hozzányúlnunk, míg a korrekció során mintába került személyek száma a mintaelemszámnak 1,6%-át teszi ki. Ezáltal elértük, hogy a képviseleti minta az ország magánháztartásainak és lakosságának pontosan 1%-át tartalmazza. 7. A minta adatainak pontossága Láttuk, hogy a képviseleti módszerrel nyert adatoktól nem várhatjuk azt, hogy a valószínű­ségi változó megfigyelt értékeiből annak eloszlására, vagy az eloszlás bizonyos paramétereire vonat­kozó, teljes bizonyossággal érvényes következtetéseket tudjunk levonni. Meg kell elégednünk pl. olyan típusú következtetésekkel, hogy az ismeretlen paraméter értéke bizonyos valószínűséggel megadott határok (hibahatárok) közé esik. Esetünkben a kérdéses határok maguk is valószínűségi változók, a számegyenes általuk határolt szakasza az ismeretlen paraméterérték megbízhatósági­konfidencia-) intervalluma. Mintavételi adataink annál pontosabbak, mennél kisebbek ezek meg­bízhatósági intervallumai. Mivel a mintavételi adatok gyakorlatilag csak akkor használhatók, ha ismerjük pontosságukat, ezért ezen adatok felhasználása szempontjából elengedhetetlen a megfelelő megbízhatósági intervallumok (a véletlen hiba nagyságának) meghatározása. A képviseleti minta alapján az adatokat általában 95%-os valószínűségi szinten közöljük, így az adatok megbízhatósági határait is 95%-os valószínűségi szint mellett adjuk meg. Ez azt jelenti, hogy ha igen sok és mindig ugyanannyi elemből álló mintát készítenénk, akkor 20 eset közül átlagosan 19-ben adatunk helyesnek bizonyulna, abban az értelemben, hogy a jelzett értékközben helyezkedne el. Természetesen előfordulhat olyan eset is (átlagosan legfeljebb 1 a 20 közül), amikor a mintavételi adat pontatlannak bizonyul, és ilyenkor nem esik bele az előre megadott megbízha­tósági intervallumba. Ez, mint a fentiekből is világos, nem a minta hibája, hanem az alkalmazott matematikai-statisztikai módszer természetéből adódik. Mivel az 1%-os kepviseleti minta elkeszítesenel haztartasonkenti szisztematikus kiválasz­tási módszert alkalmaztunk, a mintavételi adatok szórását, ill. megbízhatósági intervallumát előre pontosan meghatározni nem lehet, mert ehhez pl. ismerni kellene az egyes ismérvek háztartásokon belüli szórását, vagy a szisztematikus kiválasztás hatását a mintára. Ezek meghatározása hosz­szadalmas számolási munkát igényelne és így késleltetné a minta adatainak közlését. Ezért a mintavételi adatok pontosságát előre csak közelítően tudtuk meghatározni oly módon, hogy — noha szisztematikus, csoportos kiválasztást végeztünk — a mintavételnél egyszerű, véletlen kiválasztást tételeztünk fel. Természetesen a minta anyagának háztartásonkénti és szisztematikus kiválasztása, az elmondottaknak megfelelően, különböző irányokban befolyásolhatja, ronthatja vagy javíthatja az adatok pontosságát. Ezt a tényt — mivel e hatások irányára és eredményére vonatkozó számítások elvégzésére csak később kerülhet sor — az adatok gyakorlati felhasználásánál, illetve a hibahatárok mérlegelésénél feltétlenül figyelembe kell venni. A mintavételi adatok megbízhatósági intervallumait, azaz ezek pontossági fokát a fenti megjegyzések, ill. egyszerűsítések figyelembevételével határoztuk meg. 154

Next

/
Oldalképek
Tartalom