1960. ÉVI NÉPSZÁMLÁLÁS 2. Személyi és családi adatok képviseleti minta alapján (1960)
IV. A fogalmak magyarázata
9. Mintavételi adatok viszonyszámainak megbízhatósági határai Viszonyszámok relatív hibáját, illetve megbízhatósági határait csak abban az esetben határozhatjuk meg az előzőkben ismertetett módon, ha a viszonyítási adat (a viszonyszám nevezőjében álló szám) teljes országos, vagy egy teljes megyei sokaság és így az egész (országos, vagy megyei) mintához viszonyított arányokról van szó (pl. keresők száma a teljes vagy megyei mintasokasághoz viszonyítva). Ellenkező esetben, amikor a viszonyítási adat nem a teljes mintasokaság, hanem valamilyen mintából vett adat, akkor a viszonyszám számlálója és nevezője is valószínűségi változó, amelynek megbízhatósági határait a fentiektől némiképpen eltérő módon állapíthatjuk meg. Ilyen eset fordul elő pl. amikor a házas nők számát a mintában előforduló összes nők számához (amely tehát már maga is valószínűségi változó) viszonyítjuk. |-vel és Tj-val jelölve a két összehasonlítandó sokaság elemszámát az n elemű mintában, az — viszonyszám szórásnégyzetét a jól ismert £ V C) " ' f O-^N = rF p + F„ — 2 q V, : F, 1(1-/) (18) formula szolgáltatja, ahol V és V r / — valószínűségi változóink (2)-ben definiált variációs együtthatói, g pedig e változók korrelációs együtthatója. A mintából számított szórásnégyzet nem lesz az elméleti szórásnégyzet torzítatlan becslése, azonban e torzítás nagy n esetén elhanyagolható. Továbbá £ =f=- 0 miatt — eloszlása a minta nagy elemszáma és a kis kiválasztási arány következtében közelítőleg normális eloszlásnak tekinthető, így — hányados megbízhatósági határai T) 71 ——to-, v s. és —+ ítr /r )v (19) e KJ) é ij) lesznek, ahol t a választott valószínűségi szintnek megfelelő (5)-ből számított érték. Alternatív valószínűségi változókra, rendre p^-vel, 2> 7 í-val és p^-val jelölve a az rj, valamint a (£, rj) sokaságok 7 teljes mintára vonatkoztatott relatív gyakoriságait, (18)-ból kapjuk, hogy: ^-m'riL + ia-l^-^d-/)!. (20) KJJ v£/ L np* n p, p 7 ] J a) Jelen kötetben leggyakrabban megoszlási viszonyszámok fordulnak elő, amikor az egyik sokaság teljes egészében tartalmazza a másik sokaságot, és így pl. = Vy, (v < £)• esetben (20)-ból np^ = £ és np, v — rj figyelembevételével a szórásnégyzetre a következő egyszerű kifejezés adódik: (21) felhasználásával (19)-bői a 95%-os valószínűségi szintnek megfelelő t — 1,96 érték mellett minden — arány megbízhatósági határai meghatározhatók. A II. Táblázatban közöljük néhány £ viszonyszám hibáit és megbízhatósági határait a kivetített nevező függvényében. (Természetes, hogy különböző £ és r) számok mellett adódó ugyanazon viszonyszám hibái különbözőek lesznek.) Ha pl. a 60—64 éves korú nők számának az összes nők számához viszonyított aránya a képviseleti minta adatai szerint 5%, akkor a (21) formula alapján e megoszlási viszonyszám hibája 95%-os valószínűségi szinten 0,19% lesz. így a tényleges viszonyszám 95%-os valószínűséggel 4,81% és 5,19% között helyezkedik el. 7 Itt £ és v) sokaságok közös részét (<JJ> 17) szimbólummal jelöltük. 157