NÉPSZÁMLÁLÁS AZ EZREDFORDULÓN 3. / Tanulmányok (2000)
Erdei Virág - Sánta József: A statisztikai adatok védelmének nemzetközi szabályozása, módszertani kérdései
amelyek részproblémákra bontással, particionálással oldhatók meg, ami befolyásolja az optimalizálást. Valamennyi programnál az a cél, hogy kizárják a pontos felfedés vagy nagyon pontos becslés lehetőségét a védett adatokra. Azonban nincs garancia arra, hogy a felhasználók plusz speciális ismeretekkel esetleg ne tudnának adatokat felfedni, vagy legalább pontos becsléseket adni a rejtett adatokra. Ettől a kockázattól eltekintve van egy másik kockázat is, ami a particionálásból adódik. Ugyanis lehetséges, hogy valamennyi résztáblát (partíciót) egyenként védünk felfedés ellen, de amikor a teljes táblát létrehozzuk a partíciókból előfordulhat, hogy a partíciók közötti általános összefüggések lehetővé tesznek új felfedéseket. Statisztikai táblák felhasználói, vagy éppen kihasználói lineáris programozással elő tudnak állítani felső és alsó korlátokat a maszkolt adatokra. Ezt maszkolási intervallumnak vagy bizonytalansági intervallumnak hívják. Valamennyi program biztosítja, hogy ezek az intervallumok elég nagyok legyenek. Másfelől viszont ezek az intervallumok ne legyenek nagyobbak a szükségesnél, hogy elkerüljük a felesleges maszkolásokat. A vizsgált programok figyelembe veszik ezt a kritériumot is. Az összes programot nagyság adatok felfedés elleni védelmére készítették. Gyakorisági adatoknál kisebb gyakoriság esetén nincs kellő adatbiztonság. További értékelési szempontok arra irányultak, hogy milyen környezetet biztosítanak a programok a felhasználók számára. Ilyenek a következők: - felhasználóipárbeszéd-követelmények: nagy tábláknál, ami általában jellemző a népszámlálásokra, előnyös az előkészítő fázisban, ha a program emberi beavatkozás nélkül is futtatható, - ha a táblaterv nincs rögzítve, a felhasználó esetleg interaktív módon maszkolhat cellákat vagy átkódolhat értékeket, - a jó dokumentáció szükséges követelmény, beleértve az algoritmusok leírását is, emellett az is szükséges, hogy a program elegendő adatot, listát készítsen az egyes futásokról, lehetővé téve a felhasználó számára, hogy megértse, miért kellett pl. egy adott cellát maszkolni. Azt a következtetést lehetett levonni, hogy mind az öt szoftver megfelelően oldja meg a másodlagos cella maszkolást. A maszkolások elfogadhatók mind a felfedést, mind pedig az információ veszteséget tekintve. Az egyik legígéretesebb rendszer a tau-ARGUS. Ami a beszerezhetőséget illeti, a CONFID, az USBCSUP és a tau-ARGUS ingyen beszerezhető, bár az 172