NÉPSZÁMLÁLÁS AZ EZREDFORDULÓN 3. / Tanulmányok (2000)
Erdei Virág - Sánta József: A statisztikai adatok védelmének nemzetközi szabályozása, módszertani kérdései
- az aggregálás, - a perturbáció, amikor a számokat véletlenszerűen kis mértékben megváltoztatják (pl. ± 1 hozzáadással), - véletlen kerekítés (elsősorban százalékos adatok esetén), - maszkolás (cell supression), amikor egy cellát üresen hagynak, vagy speciális jellel töltenek ki. A maszkolandó cellák két halmazba sorolhatók. Az első halmazba azok a cellák tartoznak, amelyek érzékeny adatokat tartalmaznak. Altalánosságban ez az az eset, amikor egy cellába kisszámú válaszadó esik. Az ilyen üresen hagyott vagy speciális jellel feltöltött cellákat elsődlegesen maszkolt celláknak nevezzük. Egyedül az elsődlegesen maszkolt cellák nem minden esetben védik meg a szenzitív adatokat, ezért további cellákat is maszkolni kell olyan módon, hogy a szenzitív cellák értékeinek egyikét se lehessen származtatni a közölt adatokból. Ezeket a biztonságot eredményező cellákat nevezzük másodlagosan maszkolt celláknak. Nyilvánvaló, hogy a nem érzékeny cellák maszkolása a felhasználó számára információveszteséggel jár. Mivel a táblák publikálásának fő célja az információszolgáltatás, fontos lenne a cellák maszkolásával elvesztett információ teljes értékének minimalizálása. Ez azt jelenti, hogy a maszkolási probléma úgy írható le, mint a kiegészítő (másodlagosan maszkolt) cellák súlyának minimalizálása, ahol egy cella súlya annak az információnak az értékét reprezentálja, melyet a cella tartalmaz. Eljutottunk tehát egy min-max problémához: maximális biztonság minimális információvesztéssel. Ismeretes, hogy az ilyen típusú problémák általában nagy matematikai apparátust igényelnek, vannak esetek amikor a problémát pontosan nem lehet megoldani, csak a valós problémát gyakorlatilag tökéletesen közelítő problémának van pontos megoldása. Gondoljunk pl. a kerekítésre, amely általánosságban elméletileg megoldhatatlan. A Német Szövetségi Statisztikai Hivatalban összehasonlító vizsgálatot végeztek a világban elérhető maszkoló szoftverekre. 4 A vizsgálat idején a hivatali gyakorlat szerint valamennyi közölt táblázatot cellamaszkolással védtek. Az adatvédelem manuálisan történt. Ez az eljárás rendkívül időigényes, vagyis költséges, másrészt nem ad tökéletes biztonságot, mert esetlegesen a maszkolt adatok bonyolult 4 Giessing, S.: Transferable software for automated secondary cell supression, International Seminar on Exchange of Technology and Know-how, Prága, 1999. 170