Körmendy Lajos: Levéltári informatika. In: Körmendy Lajos (szerk.): Levéltári kézikönyv. Budapest, 2009, Osiris – Magyar Országos Levéltár, 637–732.
7. LEVÉLTÁRI INFORMATIKA • SZERK. KÖRMENDY LAJOS - 7.3. LEVÉLTÁRI INFORMÁCIÓ ÉS LEÍRÁS • KÖRMENDY LAJOS - 7.3.2. A levéltári leírás - 7.3.23. Az EAD
7.3. Levéltári információ és leírás ■ 663 A három nyelv közül elsőként az SGML-1 (Standard Generalized Markup Language, azaz szabványos, általános kijelölő nyelv) fejlesztették ki, 1986-ban lett szabvány (ISO 8879), később ebből alakították ki a HTML-1 (Hypertext Markup Language, azaz hipertext-kijelölő nyelv), majd az XML-t (Extensible Markup Language, azaz kiterjeszthető kijelölő nyelv). Ezt a nyelvcsaládot szoftverfüggetlennek is nevezik, mert nincsenek benne olyan vezérlő karakterek (például a bekezdéseket, a margókat, az aláhúzásokat vezérlők), amelyeket csak megfelelő alkalmazási szoftver ért. Egy SGML- vagy HTML-dokumentum a vezérlő karaktereket a felhasználó számára is érthető „beszélő címkékkel”, tagekkel helyettesíti. A három nyelv közül messze a HTML a legegyszerűbb, ezért - bár az EAD-hoz éppen neki nincs sok köze - érdemes ezzel kezdeni a magyarázatot. A HTML-iratok olyan szövegfájlok, amelyek a szövegtől elválasztva, de abba beágyazva utasításokat (tageket) - szövegformázó utasításokat, valamint megjelenítendő objektumokra történő hivatkozásokat - tartalmaznak. Az utasítások, illetve hivatkozások mindig csúcsos zárójelek (< >) között vannak, és mindig megelőzik a szövegnek azt a részét, amelyre vonatkoznak. Egy tag hatását annak záró utasításpárja szünteti meg, amely formailag majdnem megegyezik a nyitóutasítással, csak az utasítást „/” jel vezeti be. A tageket, pontosabban szólva, a bennük lévő utasításokat HTML-fájlokat olvasni képes böngészőprogramok értelmezik és hajtják végre, azaz megformázzák az iratot, és létrehozzák a kapcsolatokat (linkek). Lássunk néhány taget (magyarázattal ellátva): <HTML> itt kezdődik a HTML-fájl <HEAD> fejléc kezdete, </HEAD> fejléc vége <BODY> dokumentumtörzs kezdete <TITLE> az oldal címe, ezt a szöveget láthatjuk a böngésző címsorában, </TITLE> a cím vége <b> félkövér betű kezdete, </b> félkövér betű vége <i> dőlt betű kezdete, </i> dőlt betű vége </BODY> dokumentumtörzs vége </HTML> itt végződik a HTML-fájl Tehát például a <HEAD> </HEAD> tagek közötti szöveg lesz a fejléc, a <b> </b> tagek közötti szöveg pedig félkövér betűkkel lesz szedve. Fontos megjegyezni, hogy a HTML túlnyomórészt a tartalom megjelenítésére, azaz szövegformázásra szolgál (hasonlóképpen, mint a szövegszerkesztők), nem pedig szemantikai elemzésre. A tartalom, illetve jelentés szerinti besorolás viszont a levéltári iratoknál feltétlenül szükséges, mert csak így lehet strukturálni az információt, ami az adatok megjelenítésénél, csoportosításánál, keresésénél elengedhetetlen. Erre az SGML és az XML alkalmas eszköz. (Az XML lényegében egyszerűsített SGML.) A szakirodalom kétféle kijelölést (markupot) különböztet meg: eljárásit (procedural markup) és leírót (descriptive markup). A fenti HTML-példában szereplő formázó tagek mind az eljárási markup kategóriájába tartoznak. Adatok strukturá-