Drótos László – Kőrös Kata: Adattármustra. Levéltári iratok. Tudományos és Műszaki Tájékoztatás, 56. (2009) 9. 422–439.

Drótos L. - Kőrös K.: Adattármustra. Levéltári iratok zisnál nagyon fontos lenne a kereső szintaxisá­nak pontos leírása, mert csak annak ismereté­ben lehet bonyolultabb kereséseket hatékonyan elvégezni. • A kereső jó tulajdonsága, hogy automatikusan megőrzi a korábbi kérdéseket (egy-egy cookie ­ban tárolva a felhasználó gépén) és ezek egy kisablakban átnevezhetők, törölhetők vagy újra átemelhetők az űrlapba. Vannak azért furcsasá­gok ebben a kisablakban is, mert nem mindig frissül magától; és jó volna, ha időrendben vagy betűrendben lehetne rendezni a keresőkérdése­ket. • A találatok rendszerint gyorsan megjelennek, de ezek sorrendje nem világos és nem állítható be (5. ábra). Számuk a lista tetején látható, elég szerencsétlenül kiírva: Találatok: 37 találat. Vi­szont az indexablakokhoz képest egy sokkal ügyesebb, kétszintű lapozómenü van hozzájuk, amivel egy nagyobb halmaz is könnyen bejárha­tó. Kevésbé jó, hogy hiába kattintunk ösztönösen egy tételre a listában, valójában a szöveggel azonos kinézetű sorszámon van az a hivatkozás, ami a dokumentumhoz visz. És azt sem látjuk, hogy mely találatokat néztünk már meg, mert az ugrópontok nem váltanak színt. A keresett sza­vak viszont jól láthatóan ki vannak emelve a lis­tában (6. ábra), sőt még magukon a PDF képol­dalakon is (itt sajnos olvashatatlanul, és ezen csak a Windows beállításai között, az „Asz­­tal/Kijelölt elemek” színének átállításával tudunk segíteni). 5. ábra A mutatók egyik találati listája és az ablakkezelő ablak Tartalom, minőség • Az adatbázis az 1861 és 1990 közötti időszakból tartalmaz digitalizált dokumentumokat: főrendi­házi, felsőházi, képviselőházi, nemzetgyűlési, or­szággyűlési naplókat és irományokat, a lehető leghitelesebb forrásból: az Országgyűlési Könyv­tár állományából. Hogy ez a lefedett időszak és dokumentumhalmaz mennyire teljes, vagyis hogy vannak-e hiányok az eredeti gyűjtemény­ben vagy a digitalizált anyagban, az sajnos nem derül ki, mint ahogy az sem nyilvánvaló a külső felhasználóknak, hogy nem minden kötethez ké­szültek mutatók. A nyitólapon levő tájékoztató csak annyit közöl, hogy mintegy 600 ezer oldalt digitalizáltak, ez nagyjából helyes is, mert a do­­kumentumkeresö űrlapon egy * karaktert beírva a tesztelés időpontjában 587 412 találat volt (és ebben még a mutatókötetek feltehetően nincse­nek is benne). Viszont az a tény, hogy az iromá­nyok mutatóiban böngészve elég sok tételnél nincs kattintható hivatkozás a teljes szövegre, vagy azt jelzi, hogy nem teljes a (digitális) állo­mány, vagy hibák történtek a linkelésnél. 6. ábra A teljes szövegű kereső egyik találati listája • A teljes szöveg és a mutatók is OCR-es, vagyis géppel felismertetett szöveget tartalmaznak, ezért soronként 1-2 hibával számolni kell, erre figyelmeztetnek is a feliratok, de csak az index­ablakokban, a keresőűrlapokon nem. Hogy mennyire hibás egy dokumentum szövege, azt vágólapon át való kimásolással (7. ábra), vagy a legtöbb Readerben a Reflow ikon (Ctrl/4 billen­tyű) megnyomásával ellenőrizhetjük. Ezek a hi­bák természetesen befolyásolják a keresések pontosságát. Hogy a keresés szempontjából fon­tosabb mutatóköteteket valamennyire javították-e a karakterfelismerés után, azt szintén nem tudni, de a helyesírásellenőrrel gyorsan lehet találni ezekben a tárgyszóindexekben is hibákat (pl. 426

Next

/
Thumbnails
Contents