1960. ÉVI NÉPSZÁMLÁLÁS 4. Lakásadatok I. (1961)

IV. A mintavételi eljárás módszere

A képviseleti minta kiválasztása során összesen 139 lakással és 247 személlyel kevesebbet választottunk ki. E különbségek megyénkénti korrekciójánál összesen 288 lakás és 1653 személy anyagát emeltük ki a mintából, ugyanakkor pedig pótlólag 427 lakás és 1900 személy anyagát válasz­tottuk ki az alapsokaságból a mintába. Ily módon a korrekció a mintasokaság kis hányadát érintette és számottevően nem befolyásolta a mintavételi adatok pontosságát. Ezáltal elértük, hogy a képviseleti minta az ország lakásainak és lakosságának pontosan 1%-át tartalmazza. A képviseleti adatoktól nem várhatjuk azt, hogy a valószínűségi változó megfigyelt értékeiből annak eloszlására, vagy az eloszlás bizonyos paramétereire vonatkozó, teljes bizonyossággal érvényes következtetéseket tudjunk levonni. Meg kell elégednünk pl. olyan típusú következtetésekkel, hogy az ismeretlen paraméter értéke bizonyos valószínűséggel megadott határok (hibahatárok) közé esik. Esetünkben a kérdéses határok maguk is valószínűségi változók, a számegyenes általuk határolt szakasza az ismeretlen paraméterérték megbízhatósági — (konfidencia) — intervalluma. Mintavételi adataink annál pontosabbak, mennél kisebbek ezek megbízhatósági intervallumai. Mivel a minta­vételi adatok gyakorlatilag csak akkor használhatók, ha ismerjük pontosságukat, ezért ezen adatok felhasználása szempontjából elengedhetetlen a megfelelő megbízhatósági intervallumok (a véletlen hiba nagyságának) meghatározása. A képviseleti minta alapján az adatokat általában 95%-os valószínűségi szinten közöljük, így az adatok megbízhatósági határait is 95%-os valószínűségi szint mellett adjuk meg. Ez azt jelenti, hogy ha igen sok és mindig ugyanannyi elemből álló mintát készítenénk, akkor 20 eset közül átlagosan 19-ben adatunk helyesnek bizonyulna, abban az értelemben, hogy a jelzett értékközben helyezkedne el. Természetesen előfordulhat olyan eset is (átlagosan legfeljebb 1 a 20 közül), amikor a mintavételi adat pontatlannak bizonyul és ilyenkor nem esik bele az előre megadott megbízhatósági intervallumba. Ez, mint a fentiekből is világos, nem a minta hibája, hanem az alkalmazott matematikai-statisztikai módszer természetéből adódik. Mivel az 1%-os reprezentatív lakásminta elkészítésénél lakásonkénti szisztematikus kiválasz­tási módszert alkalmaztunk, a mintavételi adatok szórását, ill. megbízhatósági intervallumát előre pontosan meghatározni nem lehet, mert ehhez ismerni kellene a szisztematikus kiválasztás hatását a mintára. Ezt csak hosszadalmas számolási munkával lehetne meghatározni, ami késleltetné a minta adatainak közlését. Ezért a mintavételi adatok pontosságát előre csak közelítően tudtuk megha­tározni oly módon, hogy — noha szisztematikus kiválasztást végeztünk — a mintavételnél egyszerű véletlen kiválasztást tételeztünk fel. Természetesen a minta anyagának szisztematikus kiválasztása, az elmondottaknak megfelelően, befolyásolhatja, ronthatja vagy javíthatja az adatok pontosságát. Ezt a tényt — mivel e hatások irányára és eredményére vonatkozó számítások elvégzésére csak később kerülhet sor — az adatok gyakorlati felhasználásánál, illetve a hibahatárok mérlegelésénél feltétlenül figyelembe kell venni. A mintavételi adatok megbízhatósági intervallumait, azaz ezek pontossági fokát a fenti meg­jegyzések, ill. egyszerűsítések figyelembevételével határoztuk meg. Az ismertetett eljárást figyelembevéve azt kapjuk, hogy a képviseleti lakásminta np értékű adatainak D relatív hibája (a fentebb ismertetett egyszerűsítő feltételezéseket figyelembevéve) 95%-os valószínűségi szinten ahol p = 1 — g az adott ismérv relatív gyakorisága a mintában és n a minta elemszáma 6. A fenti formulából következik, hogy a 150 000-es nagyságrendű kivetített mintavételi adatok relatív hibája közelítőleg 5%, ennél kisebb mintavételi adatok relatív hibája nagyobb, nagyobb mintavételi adatok hibája pedig kisebb 5%-nál. Ezért a korábbi feltételekből kifolyólag olyan táb­lázatok készítésére törekedtünk, amelyek zömében 150 000-nél nagyobb kivetített mintavételi ada­tokat tartalmaznak. A különböző nagyságú mintavételi, valamint a megfelelő kivetített adatok relatív hibáját a fenti formula felhasználásával számítottuk ki, ezeket százalékban és abszolút értékben a következő táblázat tartalmazza. 3. A minta adatainak pontossága, megbízhatósági határai 117

Next

/
Thumbnails
Contents