Kóta Péter: Digitális forráskiadás. Gondolatok alapvető kérdésekről. Turul, 88. (2015) 4. 130–143.
140 kigyűjtését és összehasonlítását. Alaposan kidolgozott, a diszciplína klasszikus eredményeit maximálisan respektáló elvek szerint épül föl. Alapját egy relációs adatbázis képezi, amely a hatékony keresés eszköze. Jelenleg már több középkori projekt háttér-infrastruktúrájaként szolgál.44 44 http://www.digipal.eu/ . 45 http://gamera.informatik.hsnr.de/ . 46 http://liris.cnrs.fr/graphem/ „No data. This website was purged due to wordpress vulnerabilities. ” „Nincs adat. A webhelyet eltávolították a wordpress sebezhetősége miatt.” C ’est la vie (KP). 47 http://tapor.uvic.ca/~mholmes/image_markup/ . 48 TEI P5 Gidelines, chap. 11 Representation of Primary Sources, http:// www.tei-c.org/release/doc/tei-p5-doc/en/html/PH.html. 49 A British Library honlapján: http://britishlibrary.typepad.co.uk/digitalscholarship/2014/06/text-to-image-linking-tool-tilt.html. 50 https://www.w3.org/community/openannotation/ . 51 http://iiif.io/model/shared-canvas/LO/index.html . 52 http://hridigital.shef.ac.uk/virtual-vellum . Gamera: A Johns Hopkins egyetem és a Hochschule Niederrhein együttműködésével alakuló projekt. Célja: egy dokumentum-feldolgozó, optikai karakterfelismerő rendszer elemeinek kifejlesztése. Azért az elemekre, nem pedig a monolit programra koncentrál, hogy a funkcionálisan önálló, de összerakható komponensekből egy variálható, módosítható, finomhangolható, testre szabható rendszert építhessen -bárki, aki egy kicsit is motivált abban, hogy a saját igényeinek megfelelő szoftvert használjon, azazhogy állítson össze a modulokból.45 az annotációk kezeléséhez szükséges szoftver környezetet. Kimenete alapjában véve egy a TEI P5 ajánlásnak megfelelő szövegfájl: Graphem: Mintegy csattanóként, a paleográfiai projektek ABC-szerinti sorában leghátulra került a francia ANR GRAPHEM-projektje. Ennek a nagyigényű négy éves projektnek (2008-12), amely digitalizált képek alapján a szövegben történő keresést valósított meg, egyfajta alakfelismerő, „Content-Based-Image-Retrieval” rendszerként, a honlapján ma már csak egy meglehetősen barátságtalan lapidáris mondat tudósít arról, hogy elérhetetlen.46 Még szerencse, hogy évekkel korábban sikerült letölteni néhány prezentációt az egyébként lenyűgöző munkáról. Szöveg és kép összekapcsolásának megvalósítását egy szerény próbálkozással szeretném illusztrálni. A képernyőkép egy az Image Markup Tool-lal 47 készített weblapot jelenít meg. Látható a fakszimile, a kijelölt második, és a soron következő (szaggatott vonallal kijelölt) harmadik sor, egy kis ablakban az átírás, jobb oldalt navigációs eszköz, stb. Ennek az interaktív honlapnak az elkészítéséhez az IMT adja az eszközöket: a kép annotációkkal ellátásához, Megfigyelhető, hogyan lokalizálja a fakszimile területeit és felelteti meg azokat az átírt szövegnek a rendszer. Ez a megoldás teljesen szabványos, az elméleti hátteret a TEI konzorcium szolgáltatja, amelynek ajánlásaiban egész fejezet foglalkozik az eredeti és az átírás kapcsolatának kérdésével.48 Az IMT ezek alapján a kettőből: fakszimile+átírás egy gombnyomásra elkészíti a html, css, js, etc. fájlokat, amelyek együtt alkotják a képernyőn „megelevenedő” átírt forrást. A szoftver leginkább didaktikus célra használható, az alapelvek illusztrálására mindenképpen alkalmas, de teljes értékű - az itt bemutatottnál sokkal kreatívabb - végeredmény is kihozható belőle. Ennél csak nagyobb teljesítményű, egyúttal persze bonyolultabb szoftverek léteznek; a TILT például automatikusan választja és jelöli ki a kézirat sorait, nekünk csak az átírást, vagy kommentárt kell hozzáfűznünk.49 Az annotálás divatos téma mostanság, és nem is szorítkozik a fakszimilék kommentálására, hanem általában mindenféle tartalomhoz fűzött megjegyzés készítését értik alatta. Az Open Annotation Community Group 50 egy általános, web-ontológiai (RDF) alapú specifikáció bármiféle digitális tartalom megjegyzésekkel való ellátására. Ezt a modellt használja a SharedCanvas51 modell, amelyet kimondottan digitális fakszimilék, audiovizuális, tehát nem szöveges adatok leírására fejlesztettek. A VirtualVellum a Sheffieldi Egyetemen 2006-ban lezajlott projekt avval a céllal, hogy eszközöket adjon a humán tudományos kutatók kezébe. Főleg a rendkívül nagy felbontású (jellemzően 8000 x 6000 pixel méretű) képek kezelése és jelölése a cél. Konkrét tárgya a Froissartkézirat feldolgozása volt, de a hozzá kifejlesztett munkakörnyezet használható bármely hasonló jellegű digitális képgyűjtemény munkálataihoz.52