AZ ORSZÁGOS SZÉCHÉNYI KÖNYVTÁR ÉVKÖNYVE 1972. Budapest (1975)

II. A könyvtári munka elvi és gyakorlati kérdései - Horváth Tibor: A könyvtári szolgáltatások rendszere

kiíratják. E vektorok tulajdonsága még, hogy súlyozásra nyílik alkalom aszerint, hogy mennyire gyakori a szó, milyen a környezete (pl. ismétlődő szóasszociációk találhatók-e), sőt automatikusan még hierarchikus kapcsolatokat is létesítenek és ezeket bizonyos „fogalmi fákban" írják fel. A vektorok képzésénél mindezt figyelembe veszik. De behasonlíthatok a dokumentum szavai előző szövegelemzé­sek alkalmával kapott szólistákba is. (A SMART rendszer túl bonyolult ahhoz, hogy e helyen ismertetésére sor kerüljön. Később még egy alkalommal vissza kell térni rá.) A visszakereső rendszerek értékelésére vonatkozó eddigi legnagyobb sza­bású kísérlet, az említett cranfieldi II. jelentés éppen azt vizsgálta egyebek mel­lett, hogy a teljesen természetes nyelvű állapotban levő kifejezésekkel végzett osztályozás hatékonyságát hogyan módosítja az a körülmény, ha mindig egy újabb szempont szerint elvégzik az elemzéseket. így összesen olyan 33 osztályo­zási rendszert nyertek, amelyekben mindegyik csak egyetlen tulajdonságban tér el az előzőtől. Pl. az első osztályozás: háborítatlan természetes nyelv. A második: az előbbiben összevonják a ragozott alakokat. Harmadik: az elsőben összevonják a ragozott alakokat és kizárják a szinonimákat, és így tovább. A jelentés a termé­szetes nyelvű osztályozásokat találta hatékonyabbnak, bár nem nagy különbség­gel az „ellenőrzött kifejezések" osztályozási nyelvével (1. 1.12.2 pont bevezetését). Azon az alapon, hogy a kiindulásul választott természetes nyelv milyen mér­tékű elemzés alá esett, az alábbi fő típusokat lehet elkülöníteni: — természetes nyelvű kulcsszavas kifejezésekkel működő rendszerek, — természetes nyelv lexikográfiái szintű elemzéssel, — szabványosított kifejezések (= előbbiek és szemantikai elemzés, tehát mi­nimálisan a szinonimákra és homonimakra kiterjedő elemzés), — szabványosított kifejezések logikai elemzéssel (hierarchia bevezetése va­lamely fokozatig az előbbiek mellett), — szabványosított kifejezések összetett elemzéssel (előbbiek mellett egyéb elemzésekkel, pl. asszociációk, súlyozás stb.). A fenti sor úgy épül fel, a soron következő mindig az előzőt, és még egy elem­zéssel többet foglal magába. Deszkriptoros osztályozásnak — bár a kifejezéssel nehezen lehet egyetérteni — az utolsó kettőt lehet nevezni, lazán értelmezve valamennyi szabványosított kife­jezésrendszert, hiszen a tezauruszok eredetileg szinonima szótárak voltak. A „szabványosított" jelző nem azt jelenti, hogy valamely állam, vagy nem­zetközi szervezet szabványaként jelenik meg, hanem csak azt, hogy szabályozott kifejezésekről van szó. f) felosztás: a kivitelezés szerint Aszerint, hogy a tárolási ismérvek megállapítása, a dokumentumokra jel­lemző ismérvek megállapítása emberi úton vagy számítógéppel megy végbe, automatikus és nem automatikus ismrévrendszerek lehetségesek. De attól, hogy a kifejezések gyűjtése pl. automatikusan ment végbe, az osztályozás (indexelés) még lehet emberi. Az automatikus rendszereknek célkitűzése az indexelés intellek­tuális tevékenységének automatizálása volt. Ez két úton mehet végbe: a tárolt dokumentumok szövegéből nyert releváns szavak egyelőre — szintén hasonló 79

Next

/
Oldalképek
Tartalom