Az 1984. évi mikrocenzus adatai (1985)
XI. A MINTAVÉTELI ADATOK MEGBÍZHATÓSÁGI HATÁRAI
XI. A mintavételi adatok megbízhatósági határai A közzétett adatok megfelelő használata érdekében ismerni kell azokat a határokat, amelyek között a mintavételes uton megállapított adatokat megbízhatóknak tekinthetjük. A következők a mintavételes /képviseleti/ eljárásból, vagyis a számlálás nem teljeskörü voltából származó hiba mértékével foglalkoznak. Utalni kell azonban arra, hogy a mintavételi hiba /az un. szórás/ mellett más forrásból származó eltérések is lehetségesek; ilyenek a mikrocenzus ismertetett módjából adódóan a cimjegyzékekből eredő pontatlanságok, továbbá az összeírás egyéb, teljes népszámlálásnál is jelentkező hibaforrásai /pontatlan vagy hiányos adatbevallások stb./. A szorosan vett mintavételi hiba tekintetében előre kell bocsátani, hogy az itt alkalmazott háromlépcsős, csoportos /tehát nem személyek, hanem községek, számlálókörzetek és lakások kiválasztásával dolgozó/, továbbá rétegzett minta esetén a mintavételi hiba ismérvről ismérvre változó. Nagysága attól függ, hogy az ismérv egyedi adatainak szórása rétegenként és csoportokon belül, valamint ezek között hogyan alakul. Ennek minden ismérvre, vagyis a kiadvány minden rovatára, illetve adatára vonatkozó megállapítása lehetetlen. ELAR felvételnél - ahol a minta felépítése hasonló a mikrocenzuséhoz - kapott tapasztalatok azt mutatják, hogy a tényleges mintavételnek - többlépcsős, mélyen rétegzett, személyi ismérvek esetén csoportos kiválasztás - megfelelő véletlen hiba a legtöbb ismérv esetén csak néhány százalékkal tér el attól a szórástól, ami egyszerű véletlen kiválasztás feltételezése mellett adódik. Ez abból ered, hogy a több lépcsőben történő, illetve csoportos kiválasztás egyrészt ugyan növeli a valószínű hibát, de a megfelelő rétegzés szóráscsökkentő hatása kiegyenlíti ezt. Ezért a mikrocenzus esetén megalapozottnak tűnik az adatok hibahatárainak megállapításához az egyszerű véletlen mintavételnek megfelelő szórásformulák alkalmazása. Egyedi, egyszerű véletlen kiválasztás esetén viszont egy kivetített /felszorzott/ adat mintavételi hibája lényegileg az adat nagyságrendjétől függ, ezért egyszerűen táblázatba foglalható . EGYEDI, EGYSZERŰ VÉLETLEN KIVÁLASZTÁS HIBÁJA Az n elemszámú mintában a p relatív előfordulási gyakoriságú ismérv np abszolút gyakoriságának standard hibája a 2 %-os kiválasztási arány mellett a közismert O n p = 0,98 . n p q képlettel számitható, ahol q = 1-p. A relativ hiba: v = 0 "p - \í °' 9 8 q P np V np A kivetített adat standard hibája pedig: ^ Np = N ]] °' 9;;pq 67. 1984. évi Mikrocenzus 529