LEVÉLTÁRI ANYAG NYILVÁNTARTÁSAI
Általános - Boross István – Dr. Juhász Zoltán: A raktári jegyzék elektronikus megjelenítése és kezelése. Veszprém, 2014. - 5 Az XML adatleíró nyelv - 5.1 Az XML szintaxis alapjai
30 is. Ezek egyik fontos következménye, hogy az XML ún. metaadat leíró nyelvek kialakítására is alkalmas, ami tanulmányunk szempontjából nagy jelentőséggel bír. Mivel az XML dokumentumok elsősorban számítógépes feldolgozás céljából készülnek, fontos, hogy a dokumentum leírása precíz, egyértelmű és hibamentes legyen, hiszen bármilyen kis fogalmi vagy tartalmi hiba megállíthatja a számítógépes feldolgozás menetét. Az XML szabvány garantálja ezt az egyértelműséget, illetve a szabályok pontos betartatásával a leírás hibamentességét is. 5.1 A Z XML SZINTAXIS ALAPJA I Az XML dokumentumok elemekből (element) állnak. Egy elem egy adategység címkékkel (tag-ekkel) megjelölt egysége. Mivel az XML hierarchikus felépítésű, az elemek csoportosíthatók és egymás alá is kapcsolhatók. Minden XML dokumentumnak csak egy kiindulási eleme lehet, ezt angolul root elemnek hívják. Ez nem azt jelenti, hogy ez az elem címkéje. Az elem bármilyen címkét használhat, a root logikai szerepet jelent – kiindulási elem. Az alábbi egyszerű példa segítségével mutatjuk be az XML legfontosabb szintaktikai szabályait. A példa egy könyv leíró adatait foglalja egységbe. Az érthetőség kedvéért magyar nyelvű címkéket használunk, de meg kell jegyeznünk, hogy bár az XML megengedi tetszőleges nyelvű címkék használatát, a számítógépes feldolgozás megbízhatósága érdekében célszerűbb angol címkeneveket használni. <könyv> <cím>A levéltári segédletek </cím> <szerző>Ember Győző </szerző> <kiadó>Akadémiai K iadó </kiadó> <év>1 958 </év> </könyv> 13. ábra Egy könyv adatainak XML formátumú leírása. Példa XML dokumentumunk kiindulási eleme, ami egyben a dokumentum egyetlen eleme is, a könyv. Ez több további elemet tartalmaz, eggyel alacsonyabb szerkezeti szinten, egy konkrét könyv leírására (cím, szerző, kiadó, év). Egy elemet kötelezően egy címke pár és megjelölendő adat alkot, pl. <cím>A levéltári segédletek</cím>. A címkét mindig a kisebb-nagyobb jelekből alkotott zárójelpárok azonosítják <>. Az elem lezáró címkéje esetén kötelező a címke szó előtti per jel - / - használata. A számítógépes feldolgozás során a gép ezeket a zárójeleket keresi a szövegben, ezek alapján tudja logikai egységekre bontani a tartalmat, illetve azonosítani az egyes elemek jelentését. Az elemek nevei érzékenyek a kis- és nagy betűkre, a kezdő címkének betűhelyesen meg kell egyeznie a záró címkével. Például, a <szerző>Ember Győző</szerző> címke pár helyes, míg a <szerző>Ember Győző</Szerző> vagy a <SZERZŐ>Ember Győző</szerző> pár hibás elemnek számít. Az egyes elemek tartalmazhatnak kiegészítő adatokat is, amelyeket attribútumoknak nevezünk. Ezek a nyitó címke zárójelén belül helyezkedhetnek el a következő példán bemutatott módon: <könyv id = "122" > ... </könyv> Az attribútumok tipikusan olyan kiegészítő információk tárolására alkalmasak, amelyek a végfelhasználó számára érdektelenek, de a feldolgozás irányításában fontos szerepük lehet. Itt például az id paraméter a könyv feldolgozás során használt azonosítója, amit a felhasználó számára nem kell megjelenítenünk. Ha viszont az ISBN szám könyv azonosítóra gondolunk, azt már önálló címkeként és nem attribútumként kell elhelyeznünk a könyv adatai között.