A Fővárosi Szabó Ervin Könyvtár évkönyve 2002-2003-2004

TANULMÁNYOK - Murányi Péter: A Fővárosi Szabó Ervin Könyvtár szociológiai adatbázisáról egy kívülálló szemével

A táblázat abban a sorrendben sorolja fel a mezőket, ahogyan azok az adatbázisban szerepelnek. Az adatbázis ismertetése szerint az csaknem 112.000 bibliográfiai tételt tar­talmaz, egyes mezőkben ehhez közelálló értéket kaptunk, a Dokumentumtípus, Cím és Szavak mezőjében még sokkal magasabb értéket találhatunk. A három 116.000 feletti mező közül a dokumentumtípus az, amelyhez korlátozott számú érték kapcsolódik, összesen ötféle dokumentumtípust különböztetnek meg. Hogyan tudjuk megállapítani, hogy melyik a valós szám? A szociológiai adatbázisban található öt dokumentumtípus tételszámai az adatbázis különböző' változataiban. 1984-1994 1980-1998 1977-200/1 1970-2000 SzocioWeb 1970-2004 Cikk 31693 44337 59275 72275 92610 Cikksorozat 775 1116 1564 1954 2438 Könyv 6058 8179 10794 12882 16726 Periodika 1626 1922 2290 2550 3735 Többkötetes 289 382 473 571 719 Az 5 dokumentumtípus közül 4 olyan van, amely a feldolgozott szakirodalmi közle­ményeket tartalmazza, a Periodika feldolgozott (vagy feldolgozandó) források adatait. Ennek adatai bekerülnek a Cím és a Szavak mezőbe is, azért kapunk majdnem meg­egyező értéket a három mezőre. A dokumentumtípus 5-tel magasabb értéke hibás tételekre utal. Az adatbázis lehetőségeinek köszönhetően ezek is könnyen kiszűrhetőek. Ha a másik négy dokumentumtípust vagy logikai operátorral összekapcsoljuk, akkor 112493 találatot kapunk, ez az érték közel van ahhoz, amit a Tárgyszónál és a Témakör­nél találhatunk. Ha ezeket kölcsönösen kizárjuk egymásból, akkor nem csak a tárgysza­vaknál kapunk plusz találatokat, hanem a kevesebb tételszámot tartalmazó témakörnél is (20-at), vagyis van olyan 20 olyan tétel, amelyben a témakör meg van adva, de nem szerepel tárgyszó, tehát az adatbázisban feldolgozott közlemények száma a Tárgyszónál látható értéket is meghaladja, ugyanakkor egyesekben kisebb hiányosságokat tapasztal­hatunk. Más mezők értéke természetszerűen kisebb, nem minden rekordban van megnevez­hető szerző, a nyelvként a magyart csak akkor adják meg, ha többnyelvű dokumentum­ról van szó, ez a nemzetközi adatbázisokban is bevett gyakorlat, csak ott nem a magyar, hanem az angol nyelvre vonatkozik ez. A dokumentumtípuson belül található Periodika mellett a Tezaurusz mező is olyan, amelyben nem a feldolgozott dokumentumok találhatók. Ennek ellenére ez a mező is folyamatos növekedést mutat, ami azt jelzi, hogy folyamatosan fejlesztik a tárgyi feltáráshoz használt fogalmakat (nevek is szerepelnek itt). 203

Next

/
Oldalképek
Tartalom