NÉPSZÁMLÁLÁS AZ EZREDFORDULÓN 3. / Tanulmányok (2000)
Erdei Virág - Sánta József: A statisztikai adatok védelmének nemzetközi szabályozása, módszertani kérdései
A 200l-es népszámlálás a huszadik lesz Nagy-Britannia történetében. Bár a népszámlálásban való részvétel itt is kötelező, fontos kiemelni az adatok bizalmas kezelését és védelmét a széleskörű társadalmi támogatottság érdekében. Ez hagyományosan szerepel a kérdőíveken, hangoztatott a médiában, és jogilag is védett az 192 l-es népszámlálási valamint az 199 l-es népszámlálási adatvédelmi törvényben. E két törvényi szabályozást viszonylag könnyű megvalósítani, annál nehezebb viszont védekezni a nyilvánvalóan anonim statisztikai információknak az előállítás során gondatlanságból elkövetett felfedhetősége (akár valós vagy vélt) ellen. A 200l-es népszámlálás esetén a hivatal az adatok közzététele előtt kívánja módosítani az adatbázist. Ezek a módszerek pretabulációs technikák néven ismertek. Az anyag azt ismerteti, hogy miért megfelelőbbek ezek a technikák a korábbi népszámlálásoknál alkalmazott posttabulációs (táblázás utáni) technikáknál. 1971 óta az adatok perturbációs (ők „barnardizálás"-nak hívják) és küszöbérték megadásos (thresholding) módszerrel voltak védve. A perturbáció egy olyan módszer, amely véletlenszerűen módosítja a cellák tartalmát ±l-gyel, míg a küszöbérték megadás limitálja azt a sokaságot, amelyekre adatok publikálhatók. E módszerek előnye az átláthatóság. Világos a felhasználó számára, hogy valamilyen védelem történt, és a küszöbérték megadás általában könnyen megérthető és magyarázható. Jelentősek azonban a hátrányok is: a módosított táblák előállítása nehézkes és a közölhető adatok korlátozottak annak érdekében, hogy megakadályozzák a különbségképzéssel elérhető felfedéseket. A különbségképzés nem feltétlenül egyszerű (aritmetikai) kivonást jelent, hanem halmazelméleti értelemben vett különbségképzést is, egy (nagyobb) halmazból kivonunk egy kisebbet, hogy egy kisebb halmazt azonosítani tudjunk. Sőt azt is említettük, hogy ennél jóval kifinomultabb módszerek is léteznek. Egy másik probléma abból adódik, hogy a kisebb területekről készített táblákat összeadva eltérések lesznek a teljes összegtől. A felhasználói igények 1991 óta erősen növekedtek a rugalmasabb és „testre szabottabb" eredmények iránt. A posttabulálási technika időigényes és nem alkalmas a jelenlegi igények kielégítésére. A számítástechnika jelenleg lehetővé teszi bonyolult összekapcsoló szoftverek létrehozását és annak kockázata, hogy népszámlálási adatokat összekapcsolnak más forrásból származó adatokkal, megnőtt. 174