Kóta Péter: Digitális forráskiadás. Gondolatok alapvető kérdésekről. Turul, 88. (2015) 4. 130–143.
137 LML31 SMuFL32 maxima e21e E930 - E93333 longa ef50 E934 - E937 brevis e201 semibrevis e202 E938 - E93B minima e203 E93C - E93F 34 http://www.tei-c.org/release/doc/tei-p5-doc/en/html/WD.html . 35 http://www.manuscriptorium.com/?q=hu . Amíg a képernyőn jelenítjük meg a szövegeket, addig nincs is gond, hiszen a műszaki háttér gondoskodik a megjelenítésről. Mihelyt azonban egymás mellé kerül két digitális forrás, például ha egy Unicode kódolású értekezés szövegébe akarunk beemelni egy idézetet a zenei lexikonból, már nem magától értetődő a dolog, a szövegrészletek egymás mellé helyezése nagy-nagy odafigyelést kíván. A japán írás egykor gazdag jelkészlete sem fér bele a Unicode ez idő szerint használt táblázataiba. A nevek, fogalmak írására használt kanji írásnak azon jelei és -változatai, amelyeknek nincs Unicode megfelelőjük, a „gaiji” névre hallgatnak, és mivel a jelenség nem ismeretlen más íráskultúrákban sem, a Text Encoding Initiative erre a névre keresztelte a probléma kezelésére kifejlesztett modulját.34 A módszer lényege a nem-standard karakterek szöveges leírása. A gaiji modul eszközkészlete gondoskodik a renitens jelek képének és használati módjának meghatározásáról, a szabványos jelekre való leképezéséről. így kissé bőbeszédűen ugyan, de mindenki számára érthető, elfogadott mechanizmussal kezelhetővé teszi azokat. A Manuscriptorium35 projekt ezt az ajánlást követi a speciális karakterek használatához. Alapelve, hogy a Unicode UTF-8-at, mégpedig a rögzített kódpontokat használja mindenki, ahol csak lehetséges. Ahol nem, ott felajánlja a gaiji Bank szolgáltatását: a PUA területére elhelyezett karakterek adatainak lekérését. Egy barátságos felhasználói felület megmutatja a karakterkép-adatbázis tartalmát, amelyből kikereshető a szükséges karakter. A táblázat csoportosítva jeleníti meg a karaktereket, mint például központozási, vagy rövidítési jelek, ékezetek, stb., gyorsítván a megfelelő karakter megtalálását. Annak képére kattintva megkapjuk szöveges leírását, ami nem más, mint egy XML szintaxisú egyed-leírás. Ezt azután a szerkesztendő TEI-szövegbe a vágólapról beszúrhatjuk. <char xml:id=”e8bf ”> <desc>LATIN SMALL LETTER Q LIGATED WITH FINAL ET</desc> <charProp> <localName>entity</localName> < value > q3 app </ value > </charProp> <mapping type=”MUFI” subtype=”Unicode”>K</ mapping> <r Vegyük észre, hogy a szövegszerkesztő által használt font nem jeleníti meg a Unicode karakter képét! <mapping type=”MUFI” subtype=”PUA”>U+E8BF</ mapping> <■ Ez a karakter Unicode kódpontja (hexadecimális számrendszerben). <mapping type=”standardized”>que</mapping> <- Ez a rövidítés feloldása - szerintem (KP)! <graphic url=”images/e8bf.png7> Szükség esetén ezt a képet lehet beilleszteni a szövegbe (például a facsimiléből). </char> A szövegben történő kereséshez ezt az egyedleírást le kell képezni ún. „standard map”-ra, vagyis kicserélni az ASCII-táblázatban szereplő betűvel átírt helyettesítőre. Ennek során a ligatúrákat elemeire kell szétválasztani, a diakritikus jeleket pedig külön, a módosított karakter után tenni. Azért van erre szükség, hogy - amennyiben értjük a rendszer logikáját - legyen mód bármilyen keresőkifejezés bevitelére akár a legegyszerűbb billentyűzettel is. Kicsit olyan, mintha az egykarakteres rövidítések feloldását itt adnánk meg... persze jobban tesszük, ha a szövegben. Arra is van lehetőség, hogy egy True Type formátumú font készletéből, mint az előbb emlegetett Andron Scriptor Web, vegyük a megjelenítendő betűket, ehhez azonban a betűkészlet - akár egy web-font, akár a kliens gépére telepített font - elérhetőségét kell biztosítani, jogi értelemben is. Nehézséget jelenthet, hogy a megjelenítők, azaz böngészőprogramok nem azonos szinten támogatják a szükséges műveleteket és tulajdonságokat, illetve hogy a felhasználó gépén nem biztos, hogy egyáltalán létezik a szükséges betűkészlet. A kiadó által elképzelt megjelenés tehát nem garantálható - mondja a TEL A fent említett példák azonban azt tanúsítják, hogy a fontoknak a kliens-gépre való letöltése nélkül is megvalósítható a kívánt karakterkép. Olybá tűnik, mintha többen törekednének a digitális betűtechnika alkalmazásával képernyőre varázsolni a forrás