Körmendy Lajos: Elektronikus iratok és levéltár. [Budapest,] 2017.
7 A fájlok (megőrzési) formátumai
40 ha fejlesztési ciklus része, akkor visszamenőleges kompatibilitást kell biztosítania (stability); lehetőleg nem szabad jogilag védettnek lennie (intellectual property), mert az akadályozza a szabad használatot és költséges is lehet. A kritériumok az egyes formátumoknál keveredhetnek. A PDF pl. elterjedt, de jogvédett, ugyanakkor publikált, lehet komplex és egyszerű, strukturált és nem strukturált. A Microsoft DOC-fájlai rendkívül elterjedtek, jogvédettek de nem (illetve csak részlegesen) publikáltak. A sok millió iratot tároló őrző intézményeknek tekintettel kell lenniük a tárhelyigényre is. Egyes iratok, főként a képek, de méginkább a mozgóképek fájlai nagyon terjedelmesek. A tárolási igény csökkentésére és az adatátvitel könnyítésére számos tömörítési eljárás született, amelyek alapvetően két csoportra oszthatók: 1) adatveszteség nélküli tömörítési eljárásokra, ilyen például az LZW (Lemple-Zif-Welch) vagy az RLE (Run Length Encoding) eljárás, amelyek pl. a TIFF-formátumú képek helyigényét képesek csökkenteni; 2) adatvesztéses tömörítési eljárásra, közülük a legismertebbek a különböző fokozatú JPEG-tömörítések (Joint Photographics Experts Group). Az adatveszteség nélküli tömörítések jellemzően csak kevésbé csökkentik a fájl méretét, viszont, – mint ahogy az elnevezésük is mutatja – a fájl minősége nem károsodik. Az adatvesztéses tömörítéseknél a rendkívül jó méretcsökkenés árát pl. a képek finomabb részleteinek elvesztésével kell megfizetni. Ha viszont ismételten tömörítünk, akkor már komoly veszteség állhat elő. Az 1990-es években az őrző intézményekben még általános volt a tömörítésektől való idegenkedés, a digitális iratok robbanásszerű növekedése viszont óhatatlanul kompromisszumra kényszerített több intézményt. A londoni The National Archives pl. a kiadott útmutatójában (2008) elfogadhatónak tartja a veszteséges tömörítést, a mester- (tehát a napi használatban nem használt) példányoknál is, ha a minőségromlás a képeknél vizuálisan nem észlelhető. Ugyancsak tolerálja a veszteséges tömörítést olyan e-iratok esetében, ahol rendelkezésre áll a papír eredeti is.44 Nincs egyöntetű vélemény a komplex vs. egyszerű formátumokat illetően. Az egyszerű formátumban kevesebb a hibalehetőség, ami hosszú távon – pl. konvertálások során – csökkenti a fájl sérülését vagy hozzáférhetetlenségét, viszont a bonyolult e-iratok informá- 44 Lásd Image Compression (Digital Preservation Guidance, note 5) 10. old. Elérhető: http://www.nationalarchives.gov.uk/documents/information-management/image-compression.pdf, illetve Digitization at The National Archives (2013), 9. old. Elérhető: http://www.nationalarchives.gov.uk/documents/informationmanagement/digitisation-at-the-national-archives.pdf