Kóta Péter: Digitális forráskiadás. Gondolatok alapvető kérdésekről. Turul, 88. (2015) 4. 130–143.

138 pontos mását, mint ahányan a kvázi-szabvány TEI-ajánlások követésére.36 36 Sőt, éppen a TEI folyóiratában érvelnek az ellen; Joel Fredell et al.: TEI P5 and Special Characters Outside Unicode. Journal of the Text Encoding Initiative Online, Issue 4 March 2013., bár a szerkesztők nem hagyták szó nélkül az ott elmondottakat, http://jtei.revues.org/727 . Lásd még António Emiliano: Issues in the typographic representation of medieval primary sources. In: Corpus-based Analysis and Diachronic Linguistics. (Ed.: Yuji Kawaguchi et al.) Amsterdam, 2011. (Tokyo University of Foreign Studies, 3) 153-173. 37 Magyarul ez - Nyelvről, nyelvészetről - emberközelben, Simonyi Zsig­mond, Gombocz Zoltán, Pais Dezső, Antal László, Papp Ferenc nyomdo­kain. http://forum.index.hu/Article/showArticle?go=75035082&t=9004879 . 38 Király Péter: Kritikai kiadás és XML. In: Septuagesimo Anno humanissime peracto. Tanulmányok Kulcsár Péter 70. születésnapjára. Publicationes Universitatis Miskolcinensis. Sectio Philosophica tóm. 9 fasc. 4 (2004) 119-149. Hozzá kell azonban tenni, hogy némely ponton az idő túl­lépett az ott leírtakon; a TEI jelenleg érvényes verziója a P5, a szabványos kódolás ajánlása pedig a Unicode. 39 TEI P5 Guidelines, chap. 20 Non-hierarchical Structures http://www. teic.org/release/doc/tei-p5- doc/en/html/NH.html. Arra, hogy a mégoly kitűnő betűkészlet letöltése, beágya­zása, stb. esetleg nem járható út sok felhasználónak, (ennek számos oka lehet, például műszaki analfabetizmus - ebben sokan osztozunk; nem tetszik - ez ízlés kérdése; hiányoznak a rendszergazdai jogosítványok - ezt talán meg lehet oldani), az ezt az utat népszerűsítők nemigen gondolnak. A digitális forrásközlés egyik legnagyobb lehetőségét, a különböző elektronikus archívumokból összegyűjtött anyag egységes kezelését, a többféle: nyomtatott és/vagy képernyős kimenet produkálását akadályozza a kódolás és a megjelení­tés problémáinak összevegyítése. Az pedig, hogy a karakterkészletek szabványai és aján­lásai (a Unicode, a MUFI, a SmuFL, a ...) állandó fejlődés, azaz változás állapotában vannak, ugyancsak nem javítja a Langzeitarchivierung és az interoperability esélyeit. Személyes vélemény: körülményessége, bonyolultsága, helypazarló volta ellenére még mindig a TEI által ajánlott körülírás tűnik a legmegbízhatóbbnak. Főleg nyelvtörténészek körében dúl szűnni nem akaró vita a jelhűség és a helyes­írás viszonya tárgyában,37 a filológusokat valójában a szöveg érdekli, számukra a paleográfia segédtudomány, a paleográ­­fusnak viszont a jelek formájának a vizsgálatakor nem ele­gendő a legprecízebb vagy -esztétikusabb karakteres megje­lenítés sem, neki a dokumentum hű képével kell dolgoznia. Manapság nem lehet sem műszaki, sem anyagi ellenérvet fel­hozni a fakszimile elektronikus közlése ellen. Annál köze­lebb jutni a forráshoz, már csak az eredeti fizikai megvizs­gálásával lehet. Bármennyire is hosszúnak tűnt ez az áttekintés a szöveg­megjelenítés problémáiról, mégsem kimerítő. A karakterek kezeléséhez szükséges ismeretek elsajátítására nem kevés energiát kell áldozni, de másként aligha lehetünk képesek arra, hogy eszközeinket hatékonyan és hibamentesen hasz­náljuk. Mi jöhet még! Ha már a betűkre ennyi energiát kellett pazarolni, mi mindent kell elmondani a szövegről, a for­rás komplex egészéről! A továbbiakban sokkal szűkszavúb­ban fogunk beszélni a téma részleteiről, abban a reményben, hogy - érdeklődés esetén - akár több folytatásban kifejthet­jük a szükséges tudnivalókat. A szövegek elkészítése régóta digitális eszközökön zaj­lik, de a nyomtatási képtől való elszakadás nem ment köny­­nyen a személyi számítógépek korában sem. A felhasz­nálók kedvét kereső szoftverfejlesztők a szövegszerkesztés eszközeit a „nyomdai-szerű” output előállítására csábító szolgáltatásokkal vegyítették. Ez nem vált javára sem a tipo­gráfiai gondosságnak, sem a felhasználók köztudatában a szö­veg és annak képe közti fogalmi különbségtételnek. A nyom­tatási funkciókkal bíró szövegszerkesztők mind a saját adatformátumukat propagálták, a valójában nem is szöveg­­hanem bináris formátumú irományok nehezen, vagy korlá­tozottan léphettek egymással kapcsolatba. Ez volt az egyik ok, hogy kialakítsanak egy olyan szövegformátumot, amely szabványos, mindenki által használható, a más formátumra konvertálás veszteségeit kiküszöböli (legalábbis a szöveg - a lényeg! - szintjén). Elméleti alapjait az SGML, majd annak alapján a közismert HTML, az XML, és annak „nyelvjárása” a TEI alkotta. Ezekről a technikai részletekről az érdeklődő olvasót a rendelkezésre álló szakirodalomhoz utaljuk, sőt azt hisszük, nem is szorulnak magyarázatra. A TEI alkalmazá­sáról máig Király Péter írása adja a legjobb bevezető áttekin­tést.38 A jelölőnyelvek technológiáját a számítógépipar érlelte ki, nem elsősorban humán tudományos kutatások céljaira, ezért van az, hogy néhány, sajátosan műszaki jellegű korlá­tozás nehezíti a bölcsészek általi használatát. A technológia az ún. környezetfüggetlen nyelvtan modelljében találta meg az egyensúlyt a már elegendően gazdag kifejezőerő és a még elviselhető számítási erőforrásigény között. A TEI első nép­szerűsítői ennek a modellnek alapján alakították ajánlásaikat, még egy betűszót is alkottak: OHCO, azaz Ordered Hierarchy Of Content Objects. A gond akkor van, amikor ezt a modellt nem csak a jelölőnyelvre, hanem magára a jelöltre is rávetít­jük. Adatbázisok esetén ez a modell tökéletesen használható, az emberiség történetében létrejött kulturális objektumokra viszont nem. Pár év alatt tudatosult a digitális humanisták körében, hogy a természetes nyelvi alkotások nem szigorú hierarchia szerint szerveződnek. Jelenleg intenzív kutatás folyik, elsősorban az „átfedési probléma” megoldására (ez akkor áll elő, ha a szöveg tagolása többféleképpen is elvégez­hető, például mondatonként, soronként, oldalanként. Semmi nem garantálja, hogy a felsorolt tagolások határai egybees­nek). A kísérletek többé vagy kevésbé csorbítják a TEI XML szabályait, ennek mértéke szerint csoportosíthatjuk őket:39 TEI-konform megoldási kísérletek a többszörös hierarchia problémájának kezelésére: 1. Egyazon szöveg többszörös jelölése. A szöveget jelöl­jük egyszer formai, például sorok, vagy versszakok, másszor tartalmi, vagy szintaktikai egységenként. így sokszorozva a szöveget, sokszorozódnak a gondjaink is, hiszen a többfé­leképpen jelölt szöveg egyes verzióinak kapcsolatát is bizto­sítani kell.

Next

/
Oldalképek
Tartalom