Kóta Péter: Digitális forráskiadás. Gondolatok alapvető kérdésekről. Turul, 88. (2015) 4. 130–143.

137 LML31 SMuFL32 maxima e21e E930 - E93333 longa ef50 E934 - E937 brevis e201 semibrevis e202 E938 - E93B minima e203 E93C - E93F 34 http://www.tei-c.org/release/doc/tei-p5-doc/en/html/WD.html . 35 http://www.manuscriptorium.com/?q=hu . Amíg a képernyőn jelenítjük meg a szövegeket, addig nincs is gond, hiszen a műszaki háttér gondoskodik a megjelenítés­ről. Mihelyt azonban egymás mellé kerül két digitális forrás, például ha egy Unicode kódolású értekezés szövegébe aka­runk beemelni egy idézetet a zenei lexikonból, már nem ma­gától értetődő a dolog, a szövegrészletek egymás mellé helye­zése nagy-nagy odafigyelést kíván. A japán írás egykor gazdag jelkészlete sem fér bele a Uni­code ez idő szerint használt táblázataiba. A nevek, fogalmak írására használt kanji írásnak azon jelei és -változatai, ame­lyeknek nincs Unicode megfelelőjük, a „gaiji” névre hallgat­nak, és mivel a jelenség nem ismeretlen más íráskultúrákban sem, a Text Encoding Initiative erre a névre keresztelte a prob­léma kezelésére kifejlesztett modulját.34 A módszer lényege a nem-standard karakterek szöveges leírása. A gaiji modul eszközkészlete gondoskodik a renitens jelek képének és hasz­nálati módjának meghatározásáról, a szabványos jelekre való leképezéséről. így kissé bőbeszédűen ugyan, de mindenki szá­mára érthető, elfogadott mechanizmussal kezelhetővé teszi azokat. A Manuscriptorium35 projekt ezt az ajánlást követi a spe­ciális karakterek használatához. Alapelve, hogy a Unicode UTF-8-at, mégpedig a rögzített kódpontokat használja min­denki, ahol csak lehetséges. Ahol nem, ott felajánlja a gaiji Bank szolgáltatását: a PUA területére elhelyezett karakterek adatainak lekérését. Egy barátságos felhasználói felület meg­mutatja a karakterkép-adatbázis tartalmát, amelyből kike­reshető a szükséges karakter. A táblázat csoportosítva jele­níti meg a karaktereket, mint például központozási, vagy rövidítési jelek, ékezetek, stb., gyorsítván a megfelelő karakter megtalálását. Annak képére kattintva megkapjuk szöveges leírását, ami nem más, mint egy XML szintaxisú egyed-leírás. Ezt azután a szerkesztendő TEI-szövegbe a vágólapról beszúr­hatjuk. <char xml:id=”e8bf ”> <desc>LATIN SMALL LETTER Q LIGATED WITH FINAL ET</desc> <charProp> <localName>entity</localName> < value > q3 app </ value > </charProp> <mapping type=”MUFI” subtype=”Unicode”>K</ mapping> <r Vegyük észre, hogy a szövegszerkesztő által használt font nem jeleníti meg a Unicode karakter képét! <mapping type=”MUFI” subtype=”PUA”>U+E8BF</ mapping> <■ Ez a karakter Unicode kódpontja (hexa­decimális számrendszerben). <mapping type=”standardized”>que</mapping> <- Ez a rövidítés feloldása - szerintem (KP)! <graphic url=”images/e8bf.png7> Szükség esetén ezt a ké­pet lehet beilleszteni a szövegbe (például a facsimiléből). </char> A szövegben történő kereséshez ezt az egyedleírást le kell ké­pezni ún. „standard map”-ra, vagyis kicserélni az ASCII-táb­­lázatban szereplő betűvel átírt helyettesítőre. Ennek során a ligatúrákat elemeire kell szétválasztani, a diakritikus jele­ket pedig külön, a módosított karakter után tenni. Azért van erre szükség, hogy - amennyiben értjük a rendszer logikáját - legyen mód bármilyen keresőkifejezés bevitelére akár a leg­egyszerűbb billentyűzettel is. Kicsit olyan, mintha az egyka­­rakteres rövidítések feloldását itt adnánk meg... persze job­ban tesszük, ha a szövegben. Arra is van lehetőség, hogy egy True Type formátumú font készletéből, mint az előbb emlegetett Andron Scriptor Web, vegyük a megjelenítendő betűket, ehhez azonban a betűkész­let - akár egy web-font, akár a kliens gépére telepített font - elérhetőségét kell biztosítani, jogi értelemben is. Nehézsé­get jelenthet, hogy a megjelenítők, azaz böngészőprogramok nem azonos szinten támogatják a szükséges műveleteket és tulajdonságokat, illetve hogy a felhasználó gépén nem biz­tos, hogy egyáltalán létezik a szükséges betűkészlet. A kiadó által elképzelt megjelenés tehát nem garantálható - mondja a TEL A fent említett példák azonban azt tanúsítják, hogy a fontoknak a kliens-gépre való letöltése nélkül is megvaló­sítható a kívánt karakterkép. Olybá tűnik, mintha többen törekednének a digitális betűtechnika alkalmazásával képernyőre varázsolni a forrás

Next

/
Thumbnails
Contents