NÉPSZÁMLÁLÁS AZ EZREDFORDULÓN 3. / Tanulmányok (2000)

Erdei Virág - Sánta József: A statisztikai adatok védelmének nemzetközi szabályozása, módszertani kérdései

amelyek részproblémákra bontással, particionálással oldhatók meg, ami befolyásolja az optima­lizálást. Valamennyi programnál az a cél, hogy kizárják a pontos felfedés vagy nagyon pontos becslés lehetőségét a védett adatokra. Azonban nincs garancia arra, hogy a felhasználók plusz speciális ismeretekkel esetleg ne tudnának adatokat felfedni, vagy legalább pontos becsléseket adni a rejtett adatokra. Ettől a kockázattól eltekintve van egy másik kockázat is, ami a particionálásból adódik. Ugyanis lehetséges, hogy valamennyi résztáblát (partíciót) egyenként védünk felfedés ellen, de amikor a teljes táblát létrehozzuk a partíciókból előfordulhat, hogy a partíciók közötti általános összefüggések lehetővé tesznek új felfedéseket. Statisztikai táblák felhasználói, vagy éppen kihasználói lineáris programozással elő tud­nak állítani felső és alsó korlátokat a maszkolt adatokra. Ezt maszkolási intervallumnak vagy bizonytalansági intervallumnak hívják. Valamennyi program biztosítja, hogy ezek az interval­lumok elég nagyok legyenek. Másfelől viszont ezek az intervallumok ne legyenek nagyobbak a szükségesnél, hogy elkerüljük a felesleges maszkolásokat. A vizsgált programok figyelembe veszik ezt a kritériumot is. Az összes programot nagyság adatok felfedés elleni védelmére készítették. Gyakorisági adatoknál kisebb gyakoriság esetén nincs kellő adatbiztonság. További értékelési szempontok arra irányultak, hogy milyen környezetet biztosítanak a programok a felhasználók számára. Ilyenek a következők: - felhasználóipárbeszéd-követelmények: nagy tábláknál, ami általában jellemző a nép­számlálásokra, előnyös az előkészítő fázisban, ha a program emberi beavatkozás nél­kül is futtatható, - ha a táblaterv nincs rögzítve, a felhasználó esetleg interaktív módon maszkolhat cel­lákat vagy átkódolhat értékeket, - a jó dokumentáció szükséges követelmény, beleértve az algoritmusok leírását is, emellett az is szükséges, hogy a program elegendő adatot, listát készítsen az egyes futásokról, lehetővé téve a felhasználó számára, hogy megértse, miért kellett pl. egy adott cellát maszkolni. Azt a következtetést lehetett levonni, hogy mind az öt szoftver megfelelően oldja meg a másodlagos cella maszkolást. A maszkolások elfogadhatók mind a felfedést, mind pedig az in­formáció veszteséget tekintve. Az egyik legígéretesebb rendszer a tau-ARGUS. Ami a besze­rezhetőséget illeti, a CONFID, az USBCSUP és a tau-ARGUS ingyen beszerezhető, bár az 172

Next

/
Oldalképek
Tartalom