LEVÉLTÁRI ANYAG NYILVÁNTARTÁSAI

Általános - Boross István – Dr. Juhász Zoltán: A raktári jegyzék elektronikus megjelenítése és kezelése. Veszprém, 2014. - 4 Digitális adatok tárolása - 4.1 Tárolási alapelvek

23 4.1 TÁROLÁSI ALAPELVEK A digitális dokumentumok alapegysége a már fent említett bit. Bár a tároló eszköz biteket tárol, a dokumentumunk leírása során magasabb szintű egységeket használunk. Amint látni fogjuk, a digitális dokumentumoknak bonyolult, többnyire hierarchikus struktúrája van, amit a tárolás során figyelembe kell vennünk. Nyolc bit alkotja a következő szint egységét, a byte-ot (használható a magyarosított bájt forma is). A 7. ábrán a 10-es szám bináris reprezentációját látjuk. A felső 0-7 számok a bitek helyiértékét jelzik. Ez a kettes számrendszerben a 2 kitevőinek felel meg, így kapjuk meg az egyes bit értékkel ábrázolt számot. A szám végleges értéke az egyes helyiértéken lévő bitekből kapott számok összege, a példánkon ez 0·20 + 1·21 + 0·22 + 1·23 + 0·24 + 0·25 + 0·26 + 0·27 + = 0·1 + 1·2 + 0·4 + 1·8 + 0·16 + 0·32 + 0·64 = 10. 00001010 01234567 27 26 25 24 23 22 21 20 7. ábra Egy byte adat (8 bit) bináris ábrázolása kettes számrendszerben. Az adatok ezen a bináris reprezentációs szinten byte-ok sorozataként jelennek meg. Honnan tudjuk azonban, hogy ezek a byte-ok mit jelentenek? Számokat, szavakat? Ezt az adatok kódolása és a digitális állomány szerkezete adja meg. Tegyük fel, hogy 0-64 közötti számokat kívánunk tárolni egy állományban (file-ban). Mivel egy byte 0-255 közötti számokat reprezentálhat (20 – 28-1), a tárolt byte sorozat elemei egyértelműen megfeleltethetők a számoknak. Amennyiben nagyobb számokat is szeretnénk tárolni, amik már nem ábrázolhatók egy byte-on, több byte-ból álló egységeket kell alkotnunk. Használhatunk pl. 2, 4 vagy 8 byte-ból álló egész és lebegőpontos (tizedes tört alakú) számreprezentációkat. Ekkor azonban tudnunk kell, hogy a tárolandó egymás utáni számok egész vagy tört reprezentációt, 2, 4 vagy több byte-os egységet használnak-e. Ha ezt nem tudjuk, a byte-okból nem tudjuk újra előállítani az eredeti számot. 2 4 6 8 0 1 2 3 2560 2561 2562 2563 8. ábra Nagy számok ábrázolása több byte felhasználásával. Több byte-os ábrázolásnál további problémát jelent a byte-ok sorrendje. Vannak rendszerek, ahol a legalacsonyabb helyiértékű byte-ot tároljuk először, majd az eggyel magasabb helyiértékű következik. Más rendszerek fordított sorrendet használnak, előbb a legmagasabb helyiértékű byte kerül tárolásra. Ha ugyanazt a dokumentumot egyik rendszerről átmásoljuk a másikra, értelmetlen adathalmazt kapunk a byte sorrend megváltozása miatt! A 8. ábrán látható 4 byte-os szám például a két különböző byte sorrendben 33 818 120 vagy 134 611 970 értéket ad (8·1 + 6·256 + 4·2562 + 2·2563 vagy 2·1 + 4·256 + 6·2562 + 8·2563). Hasonló bonyodalmakat okoz a szöveges karakterek tárolása is. Az eredeti karakterábrázolási szabvány az ún. ASCII kódrendszert használta, amelyben minden angol betűt egy egy byte-on tárolható szám ábrázolt. Amennyiben szöveget tárolunk és tudjuk, hogy ASCII kódrendszert használ a dokumentum, a visszaolvasott byte értékeket meg tudjuk feleltetni az eredeti karaktereknek. Azok a nyelvek, amelyek több karaktert használnak, mint az angol ábécé (mint pl. a magyar), más kódrendszert kénytelenek használni. Az egyértelmű visszaolvashatóság érdekében ezért célszerű a kódtábla információt is együtt tárolni a dokumentummal.

Next

/
Thumbnails
Contents