NÉPSZÁMLÁLÁS AZ EZREDFORDULÓN 3. / Tanulmányok (2000)
Erdei Virág - Sánta József: A statisztikai adatok védelmének nemzetközi szabályozása, módszertani kérdései
Ezek az okok vezették az angol hivatalt arra, hogy 2001-ben majd pretabulálást alkalmazzanak. E módszer a következő lépéseket foglalja magában: rekordcsere, adatösszekapcsolás (párosítás) és adatpótlás (inputation). Ezek a módszerek módosítják az adatbázist még mielőtt az adatokat aggregálták volna. A cél az, hogy a népszámlálási adatokat elegendően módosítsuk ahhoz, hogy minden egyes rekordnak legyen egy bizonytalansági szintje. Ez a módszer megkísérli biztosítani azt, hogy ha egy adattolvaj azonosít egy személyt, ne tudja biztosan, hogy az adatot tényleg az illető személy szolgáltatta, vagy azt már valamilyen módon megváltoztatták. A fő előnye ennek a módszernek az, hogy amint a módosított adatbázis létrejött, bármilyen formában aggregálható. Ez azt jelenti, hogy az output rugalmassági foka maximális és az eredmény konzisztens, a kisterületekre készített táblák összeadva kiadják a teljes táblát. További előny az, hogy az egyes elkészített táblákat nem kell majd felülvizsgálni adatvédelmi szempontból. A módszemek természetesen hátrányai is vannak. Nem biztos, hogy a felhasználók szeretni fogják azt a tényt, hogy az adatokat módosították és a módszert bonyolult lehet elmagyarázni a közönségnek. Kérdés lehet az is, hogy a pretabulációs módszer megvédi-e a ritka jellemzőjű egyéneket. Ebből az okból kifolyólag valószínű, hogy olyan posttabulációs módszert, mint a küszöbérték megadás, alkalmazni fognak a pretabulációs módszer mellett. A rekordcsere ténylegesen két hasonló háztartás rekordjainak cseréjét jelenti ugyanazon földrajzi területen belül. A módszert egyébként az Egyesült Államokban is vizsgálták. Az Egyesült Királyság helyhatósági körzetekre (HHK) van felosztva, amelyek nagysága változó, de kb. 50 ezer háztartást fednek le. A rekord csere minden esetben egy HHK-ra vonatkozott. A rekordcserével megmarad az adatok belső konzisztenciája és földrajzi szinten biztosítja az adatok struktúrájának megőrzését is. A rekord csere a HHK-nál kisebb területeket hasonlatosabbá teszi az egész HHK-hoz, emiatt az annál homogénebb területek kevésbé homogénné, a heterogénebbek pedig kevésbé heterogénné válnak. A vizsgálatot az 199l-es cenzus adataiból egy 73 509 háztartást tartalmazó HHK-ra végezte el a hivatal, legfeljebb négyszemélyes háztartásokra bontva. A HHK 17 feldolgozási egységre volt felbontva, amelyek mindegyike 25 számlálókörzetből állt. A feldolgozási egységek 3500-5000 háztartást tartalmaztak. 5 feldolgozási egységet és 3 számlálókörzetet elemeztek 175