1990. ÉVI NÉPSZÁMLÁLÁS 2. Részletes adatok a 2 %-os képviseleti minta alapján (1991)
IV. AZ ADATOK MINTAVÉTELI HIBÁJA
A A képletében X és Y nem a minta valamely rétegéhez, hanem egy több réteget magában foglaló részsokasághoz, például A A egy megyehez tartozik, és ugyanez érvényes a z^j = y^j - Rx^j segédváltozó Z becsült értékösszegére vonatkozóan is. Azt is érdemes megjegyezni, hogy Z-nek a várható értéke közelítőleg 0, míg az egyes rétegekhez tartozó Z^ = A AA A A AA " = Y2-RX2 stb. részletösszegeikre vonatkozóan ez nem áll fenn. Az adatok szórását, más néven standard hibáját mind az értékösszegek, mind pedig a hányadosok esetén a szórásnégyzet pozitív négyzetgyökeként állítjuk elő, a relatív szórás pedig a standard hiba és a szóban forgó adat hányadosa. A 95 Vos megbízhatósági szinthez tartozó mintavételi hibán - abszolút, illetve relatív értelemben a standard hiba, illetve a relatív szórás 1,96-szorosát értjük. A táblázatokban az adatok mellett a hozzájuk tartozó abszolút és relatív mintavételi hiba egyaránt megtalálható. Az abszolút mintavételi hiba az adat valódi értékét 95 Vos valószínűséggel lefedő intervallum hosszának a fele, így például a 2.1.1 táblázatban a lakónépességhez tartozó 45-49 éves férfiak 327550 fős létszámadata mellett a 7257 mintavételi hiba azt jelenti, hogy az adat valódi értéke 95 Vos valószínűséggel 320293 és 334007 közé esik. Ugyanebben a táblázatban hasonló következtetéssel adódik, hogy a 45-49 éves nők tényleges létszáma ugyancsak 95 Vos valószínűséggel 335517 és 350183 közé esik, tehát az adott megbízhatósági szinten a tekintett korcsoportban a nők száma szignifikánsan meghaladja a férfiakét. A táblázatokban közölt hibahatárokból látható, hogy a kötet egyes adatai a mintavételi hiba nagysága miatt inkább csak a nagyságrend behatárolására használhatók. Bár - mint arra a bevezetőben már utalás történt - az alkalmazott mintavételi eljárás mellett nincs képlettel megadható kapcsolat a mintaelemek száma és a hibahatár között, mert az utóbbi az adat jellegétől is függ. Általában mégis elmondható, hogy az 50-nél kevesebb megfigyelésen alapuló, azaz 2500-nál kisebb számadatok csak fenntartással használhatók fel. A minta hatékonyságának vizsgálata céljából néhány mutató esetében kiszámítottuk, hogy mekkora lenne a mintavételi hiba mértéke, ha azonos nagyságú, egyszerű véletlen minta állt volna rendelkezésünkre. Ezek a számítások azt mutatták, hogy az alkalmazott mintavételi terv hatása a mutatók többsége esetén nem túl jelentős, azaz, a tényleges mintavételi eljárásnak megfelelő formulák alapján kiszámított hibák csak kismértékben tértek el az egyszerű véletlen kiválasztás feltételezése mellett számítottaktól. A 2.3.1. táblázatban például az összes háztartásra vonatkozóan a 100 aktív keresőre jutó inaktív keresők és eltartottak együttes számának (127) abszolút mintavételi hibája egy tizedesre kerekítve 1,l-nek adódott inind a mintavételi terv szerint, mind pedig az egyszerű véletlen kiválasztás feltételezése mellett. Az adatok többsége esetén azonban az alkalmazott kétlépcsős mintavételi eljárás valamivel nagyobb hibahatárokkal jár, mint amekkorák egyszerű véletlen minta esetében adódnának. Megnevezés Érték Abszolút hiba Relatív Megnevezés Érték Abszolút Relatív Megnevezés Érték Abszolút hiba Relatív Megnevezés Érték hiba (+,-) DEMOGRÁFIA Féríi 4987300 37450 0,75 Ebből: 0,75 A 2.1.1 táblához 0- 4 5- 9 éves éves 329000 342150 0078 7995 2,46 2.34 Népesség 10375300 65051 0,63 10-14 éves 463100 9009 2,12 Ebből: 15-19 éves 392600 10781 2,75 0- 4 éves 632550 12156 1,92 20-24 éves 337950 8442 2,50 5- 9 éves 672800 12210 1,81 25-29 éves 293550 7039 2,40 10-14 éves 899900 14842 1,65 30-34 éves 375950 7917 2,11 15-19 éves 778250 15975 2,05 35-39 éves 412750 8163 1,98 20-24 éves 648650 12556 1,94 40-44 éves 365050 7643 2,09 25-29 éves 587150 11190 1,91 45-49 éves 327550 7257 2,22 30-34 éves 758550 12838 1,69 50-54 éves 274250 6501 2,37 35-39 éves 842100 13383 1,59 55-59 éves 269500 6558 2,43 40-44 éves 720950 12100 1,66 60-64 éves 263200 6587 2,50 45-49 éves 670400 11558 1,72 65-69 éves 226450 5968 2,64 50-54 éves 593750 10503 1,78 70-74 éves 100200 4149 3,83 55-59 éves 590050 10676 1,81 1,83 75-79 éves 118600 4368 3,68 60-64 éves 589650 10770 1,81 1,83 80-84 éves 60700 3063 5,05 65-69 éves 530750 10029 1,89 85-89 éves 21200 1872 8,83 70-74 éves 271700 7010 2,58 90-94 éves 4950 880 17,78 75-79 éves 314950 7728 2,45 95-99 éves 500 277 55,40 00-84 éves 177050 5808 3,28 100- X éves 100 124 124,00 85-89 éves 67200 3477 5,17 90-94 éves 18350 1789 9,75 95-99 éves 2200 580 26,36 100- X éves 350 232 66,29 301