1980. ÉVI NÉPSZÁMLÁLÁS Részletes adatok a 2%-os képviseleti minta alapján (1990)
VII. A MINTAVÉTELI ADATOK MEGBÍZHATÓSÁGI HATÁRAI
VII. A MINTAVÉTELI ADATOK MEGBÍZHATÓSÁGI HATÁRAI A mintavételből származó adatok bizonyos mértékben eltérhetnek a teljeskörü feldolgozás eredményeitől. A matematikai statisztikai módszerek lehetővé teszik azon megbízhatósági határok /intervallumok, hibahatárok/ becslését, amelyek bizonyos valószínűséggel meghatározzák az adatok tényleges értékét. Általában a pontosság - adott minta esetén - az adatok nagyságrendjétől függ, nagyobb esetszámoknál a mintavételi hiba relatív mértéke kisebb. A megbízhatósági határok egyedi, egyszerű véletlen kiválasztás esetén könnyen megállapithatók és - minthogy adott mintában csak a mintavételi adat nagyságrendjétől függenek - általános érvényű táblázatba foglalhatók. Ebben az esetben azonban nem egyedi, hanem - személyi adatok tekintetében - csoportos /lakásonkénti/ kiválasztás történt, módszere pedig földrajzi rendben végzett szisztematikus /tehát automatikusan rétegzett/ mintavétel volt. A csoportos kiválasztás többnyire növeli, egyes esetekben csökkenti, a rétegzés pedig csökkenti a hibahatárokat az egyedi, egyszerű véletlen kiválasztáshoz képest. Az ilyen mintavétel hibahatárainak számításához ismerni kellene minden egyes ismérv lakásonkénti átlagainak szórását, továbbá a rétegzés befolyását. Ezt a terjedelmes számitást a népszámlálás összes ismérveire végrehajtani nem lenne célszerű. Ezért kellő tájékoztatás megadása érdekében ugy járunk el, hogy közöljük az egyedi egyszerű véletlen mintavétel hibatáblázatát, amely a megbízhatósági határok közelitő elbírálására alkalmas. AZ EGYEDI, EGYSZERŰ VÉLETLEN KIVÁLASZTÁS HIBÁJA Az n elemszámú mintában a p relativ gyakoriságú ismérv standard hibája a 2 %-os kiválasztási arány mellett az ismert (O n p = ||o,98- n-p -Cf. ; ahol q, = \ ~ p képlettel számitható. A relativ hiba: V P np | np A kivetített adat standard hibája pedig: _ Sn P _ 1 0,98 cy 1 np N = 10 709 550 népességszám és n = 214 191 mintabeli elemszám mellett a képlet ^Mp = 2313 0 lesz. Ennek 1,96-szorosa adja + értelemben a megbízhatósági határokat, 95 %-os valószínűség mellett. Az 1. számú táblázat ilyen valószínűségi szinten mutatja ki a mintavételi hiba abszolút és százalékos értékét, valamint a megbizhatósági határokat. Ez a táblázat első közelítésben a minta adatainak elbírálására felhasználható. Az 1. számú táblázat személyi adatokra, a 2. számú lakás-, háztartás- és családadatokra vonatkozik. Az utóbbi 2. számú táblázat csak a nagyobb /50 ezernél nagyobb nagyságrendű kivetített, 1000-nél nagyobb mintabeli/ adatokat tartalmazza, e határoknál kisebb adatoknál lakásokra, háztartásokra és családokra is az 1. számú táblázat használható. 369