AZ ORSZÁGOS SZÉCHÉNYI KÖNYVTÁR ÉVKÖNYVE 1972. Budapest (1975)
II. A könyvtári munka elvi és gyakorlati kérdései - Horváth Tibor: A könyvtári szolgáltatások rendszere
kiíratják. E vektorok tulajdonsága még, hogy súlyozásra nyílik alkalom aszerint, hogy mennyire gyakori a szó, milyen a környezete (pl. ismétlődő szóasszociációk találhatók-e), sőt automatikusan még hierarchikus kapcsolatokat is létesítenek és ezeket bizonyos „fogalmi fákban" írják fel. A vektorok képzésénél mindezt figyelembe veszik. De behasonlíthatok a dokumentum szavai előző szövegelemzések alkalmával kapott szólistákba is. (A SMART rendszer túl bonyolult ahhoz, hogy e helyen ismertetésére sor kerüljön. Később még egy alkalommal vissza kell térni rá.) A visszakereső rendszerek értékelésére vonatkozó eddigi legnagyobb szabású kísérlet, az említett cranfieldi II. jelentés éppen azt vizsgálta egyebek mellett, hogy a teljesen természetes nyelvű állapotban levő kifejezésekkel végzett osztályozás hatékonyságát hogyan módosítja az a körülmény, ha mindig egy újabb szempont szerint elvégzik az elemzéseket. így összesen olyan 33 osztályozási rendszert nyertek, amelyekben mindegyik csak egyetlen tulajdonságban tér el az előzőtől. Pl. az első osztályozás: háborítatlan természetes nyelv. A második: az előbbiben összevonják a ragozott alakokat. Harmadik: az elsőben összevonják a ragozott alakokat és kizárják a szinonimákat, és így tovább. A jelentés a természetes nyelvű osztályozásokat találta hatékonyabbnak, bár nem nagy különbséggel az „ellenőrzött kifejezések" osztályozási nyelvével (1. 1.12.2 pont bevezetését). Azon az alapon, hogy a kiindulásul választott természetes nyelv milyen mértékű elemzés alá esett, az alábbi fő típusokat lehet elkülöníteni: — természetes nyelvű kulcsszavas kifejezésekkel működő rendszerek, — természetes nyelv lexikográfiái szintű elemzéssel, — szabványosított kifejezések (= előbbiek és szemantikai elemzés, tehát minimálisan a szinonimákra és homonimakra kiterjedő elemzés), — szabványosított kifejezések logikai elemzéssel (hierarchia bevezetése valamely fokozatig az előbbiek mellett), — szabványosított kifejezések összetett elemzéssel (előbbiek mellett egyéb elemzésekkel, pl. asszociációk, súlyozás stb.). A fenti sor úgy épül fel, a soron következő mindig az előzőt, és még egy elemzéssel többet foglal magába. Deszkriptoros osztályozásnak — bár a kifejezéssel nehezen lehet egyetérteni — az utolsó kettőt lehet nevezni, lazán értelmezve valamennyi szabványosított kifejezésrendszert, hiszen a tezauruszok eredetileg szinonima szótárak voltak. A „szabványosított" jelző nem azt jelenti, hogy valamely állam, vagy nemzetközi szervezet szabványaként jelenik meg, hanem csak azt, hogy szabályozott kifejezésekről van szó. f) felosztás: a kivitelezés szerint Aszerint, hogy a tárolási ismérvek megállapítása, a dokumentumokra jellemző ismérvek megállapítása emberi úton vagy számítógéppel megy végbe, automatikus és nem automatikus ismrévrendszerek lehetségesek. De attól, hogy a kifejezések gyűjtése pl. automatikusan ment végbe, az osztályozás (indexelés) még lehet emberi. Az automatikus rendszereknek célkitűzése az indexelés intellektuális tevékenységének automatizálása volt. Ez két úton mehet végbe: a tárolt dokumentumok szövegéből nyert releváns szavak egyelőre — szintén hasonló 79