NÉPSZÁMLÁLÁS AZ EZREDFORDULÓN 3. / Tanulmányok (2000)

Erdei Virág - Sánta József: A statisztikai adatok védelmének nemzetközi szabályozása, módszertani kérdései

- az aggregálás, - a perturbáció, amikor a számokat véletlenszerűen kis mértékben megváltoztat­ják (pl. ± 1 hozzáadással), - véletlen kerekítés (elsősorban százalékos adatok esetén), - maszkolás (cell supression), amikor egy cellát üresen hagynak, vagy speciális jellel töltenek ki. A maszkolandó cellák két halmazba sorolhatók. Az első halmazba azok a cellák tartoz­nak, amelyek érzékeny adatokat tartalmaznak. Altalánosságban ez az az eset, amikor egy cellába kisszámú válaszadó esik. Az ilyen üresen hagyott vagy speciális jellel feltöltött cellákat elsődle­gesen maszkolt celláknak nevezzük. Egyedül az elsődlegesen maszkolt cellák nem minden esetben védik meg a szenzitív adatokat, ezért további cellákat is maszkolni kell olyan módon, hogy a szenzitív cellák értékeinek egyikét se lehessen származtatni a közölt adatokból. Ezeket a biztonságot eredményező cellákat nevezzük másodlagosan maszkolt celláknak. Nyilvánvaló, hogy a nem érzékeny cellák maszkolása a felhasználó számára információ­veszteséggel jár. Mivel a táblák publikálásának fő célja az információszolgáltatás, fontos lenne a cellák maszkolásával elvesztett információ teljes értékének minimalizálása. Ez azt jelenti, hogy a maszkolási probléma úgy írható le, mint a kiegészítő (másodlagosan maszkolt) cellák súlyának minimalizálása, ahol egy cella súlya annak az információnak az értékét reprezentálja, melyet a cella tartalmaz. Eljutottunk tehát egy min-max problémához: maximális biztonság ­minimális információvesztéssel. Ismeretes, hogy az ilyen típusú problémák általában nagy ma­tematikai apparátust igényelnek, vannak esetek amikor a problémát pontosan nem lehet megol­dani, csak a valós problémát gyakorlatilag tökéletesen közelítő problémának van pontos megol­dása. Gondoljunk pl. a kerekítésre, amely általánosságban elméletileg megoldhatatlan. A Német Szövetségi Statisztikai Hivatalban összehasonlító vizsgálatot végeztek a világ­ban elérhető maszkoló szoftverekre. 4 A vizsgálat idején a hivatali gyakorlat szerint valamennyi közölt táblázatot cellamasz­kolással védtek. Az adatvédelem manuálisan történt. Ez az eljárás rendkívül időigényes, vagyis költséges, másrészt nem ad tökéletes biztonságot, mert esetlegesen a maszkolt adatok bonyolult 4 Giessing, S.: Transferable software for automated secondary cell supression, International Seminar on Exchange of Technology and Know-how, Prága, 1999. 170

Next

/
Thumbnails
Contents