Körmendy Lajos: Levéltári informatika. In: Körmendy Lajos (szerk.): Levéltári kézikönyv. Budapest, 2009, Osiris – Magyar Országos Levéltár, 637–732.

7. LEVÉLTÁRI INFORMATIKA • SZERK. KÖRMENDY LAJOS - 7.3. LEVÉLTÁRI INFORMÁCIÓ ÉS LEÍRÁS • KÖRMENDY LAJOS - 7.3.2. A levéltári leírás - 7.3.23. Az EAD

7.3. Levéltári információ és leírás ■ 663 A három nyelv közül elsőként az SGML-1 (Standard Generalized Markup Lan­guage, azaz szabványos, általános kijelölő nyelv) fejlesztették ki, 1986-ban lett szabvány (ISO 8879), később ebből alakították ki a HTML-1 (Hypertext Markup Language, azaz hipertext-kijelölő nyelv), majd az XML-t (Extensible Markup Lan­guage, azaz kiterjeszthető kijelölő nyelv). Ezt a nyelvcsaládot szoftverfüggetlennek is nevezik, mert nincsenek benne olyan vezérlő karakterek (például a bekezdése­ket, a margókat, az aláhúzásokat vezérlők), amelyeket csak megfelelő alkalmazási szoftver ért. Egy SGML- vagy HTML-dokumentum a vezérlő karaktereket a fel­használó számára is érthető „beszélő címkékkel”, tagekkel helyettesíti. A három nyelv közül messze a HTML a legegyszerűbb, ezért - bár az EAD-hoz éppen neki nincs sok köze - érdemes ezzel kezdeni a magyarázatot. A HTML-ira­­tok olyan szövegfájlok, amelyek a szövegtől elválasztva, de abba beágyazva utasítá­sokat (tageket) - szövegformázó utasításokat, valamint megjelenítendő objektu­mokra történő hivatkozásokat - tartalmaznak. Az utasítások, illetve hivatkozások mindig csúcsos zárójelek (< >) között vannak, és mindig megelőzik a szövegnek azt a részét, amelyre vonatkoznak. Egy tag hatását annak záró utasításpárja szün­teti meg, amely formailag majdnem megegyezik a nyitóutasítással, csak az utasí­tást „/” jel vezeti be. A tageket, pontosabban szólva, a bennük lévő utasításokat HTML-fájlokat olvasni képes böngészőprogramok értelmezik és hajtják végre, azaz megformázzák az iratot, és létrehozzák a kapcsolatokat (linkek). Lássunk néhány taget (magyarázattal ellátva): <HTML> itt kezdődik a HTML-fájl <HEAD> fejléc kezdete, </HEAD> fejléc vége <BODY> dokumentumtörzs kezdete <TITLE> az oldal címe, ezt a szöveget láthatjuk a böngésző címsorában, </TITLE> a cím vége <b> félkövér betű kezdete, </b> félkövér betű vége <i> dőlt betű kezdete, </i> dőlt betű vége </BODY> dokumentumtörzs vége </HTML> itt végződik a HTML-fájl Tehát például a <HEAD> </HEAD> tagek közötti szöveg lesz a fejléc, a <b> </b> tagek közötti szöveg pedig félkövér betűkkel lesz szedve. Fontos megjegyez­ni, hogy a HTML túlnyomórészt a tartalom megjelenítésére, azaz szövegformázásra szolgál (hasonlóképpen, mint a szövegszerkesztők), nem pedig szemantikai elem­zésre. A tartalom, illetve jelentés szerinti besorolás viszont a levéltári iratoknál fel­tétlenül szükséges, mert csak így lehet strukturálni az információt, ami az adatok megjelenítésénél, csoportosításánál, keresésénél elengedhetetlen. Erre az SGML és az XML alkalmas eszköz. (Az XML lényegében egyszerűsített SGML.) A szakirodalom kétféle kijelölést (markupot) különböztet meg: eljárásit (proce­dural markup) és leírót (descriptive markup). A fenti HTML-példában szereplő formázó tagek mind az eljárási markup kategóriájába tartoznak. Adatok strukturá-

Next

/
Oldalképek
Tartalom