1960. ÉVI NÉPSZÁMLÁLÁS 2. Személyi és családi adatok képviseleti minta alapján (1960)
IV. A fogalmak magyarázata
Az elmondottak alapján adott számú háztartásból álló minta elemszámára vonatkozó megbízhatósági intervallumok félhosszát az 1. ábrán tüntettük fel, külön 95%-os (alsó görbe), külön 99%-os (felső görbe) valószínűségi szint mellett. A képviseleti minta elemszámára vonatkozó hibahatárok 95%~os és 99%-os valószínűségi szinten A minta kiválasztását megyénként ellenőriztük, figyelembe véve, hogy a (11) eloszlás az országos adatokra vonatkozik és így a megyénkénti ellenőrzéshez csakis közelítő értékeket szolgáltat. A fenti formulákból pl. a képviseleti minta Csongrád megyei anyagánál a minta terjedelmére vonatkozó megbízhatósági intervallum félhosszára 95%-os valószínűségi szinten 103 adódott, viszont a minta terjedelmének a várható értékétől való eltérése mindössze 41 volt. A képviseleti minta kiválasztása során, a népességszámokban mutatkozó eltérések nagysága — 19 megye és 4 megyei jogú város közül 1 megye kivételével (ami megfelel a 95%-os valószínűségi szintnek) — minden esetben jóval a megfelelő hibahatárokon belül volt. Ez azt mutatja, hogy a minta kiválasztását (legalábbis háztartás-nagyságokra vonatkozóan) jól végeztük és semmiféle szisztematikus hiba nem torzítja a minta adatait. Végül a fenti eredményekből a (11) értékek használatának jogosságára is következtetni tudtunk. 6. A képviseleti minta korrekciója A képviseleti minta elemszámának, mint valószínűségi változónak szórása miatt mintánk éppen a legfontosabb jellemző, a személyek száma tekintetében általában nem azonos a kívánt nagysággal. Ezenkívül kiválasztási módszerünknek megfelelően (a századik háztartással, ill. intézeti lakóval való kezdés miatt) egy-egy megyében 5—6 magánháztartással és 1 — 2 intézeti lakóval kevesebbet választottunk ki. Természetesen a népesség számára vonatkozó különbséget legtöbb esetben nem lehet eltüntetni a hiányzó háztartások pótlólagos kiválasztásával. Ha a minta feldolgozását a kiválasztás útján kapott nyers anyaggal végeznénk, akkor nehézségek merülnének fel az adatok közlésénél és az alapsokaságra való kivetítésnél. Ez esetben tulajdonképpen leghelyesebb az lenne, ha külön közölnénk a minta adatait és külön az alapsokaságra kivetített adatokat. De még egyedül a kivetített adatok közlése esetén is a kivetítés pontos végrehajtása (bár a szorzószám jelentéktelenül különbözik 100-tól) terjedelmes és hosszadalmas számolási munkát igényelne. E nehézségek elkerülésének legjobb módja a képviseleti minta anyagának a feldolgozási munka első szakaszában végrehajtandó korrekciója. A módszer lényege: bizonyos számú alkalmas nagyságú háztartásnak a mintából való kiemelése és bizonyos számú megfelelő nagyságú háztartás anyagának a mintába való helyezése útján elértük, hogy a mintába került háztartások és személyek száma pontosan a kívánt mintanagyságot szolgáltassák. A megfelelő háztartások kiválasztása véletlen számtáblázat segítségével történt. E módszer teljesen megalapozott, ha a korrekció során felhasznált háztartások nagyság szerinti megoszlása megegyezik a háztartások alapsokaságbeli megoszlásával. Ebben az esetben a korrekció után a háztartások mintabeli megoszlása jobban közelíti az alapsokaságbeli megoszlást, mint a korrekció előtt. 152