Tudományszervezési Tájékoztató, 1964
3-4. szám - Szemle
venni. Bizonyos szöveggyűjtemény vizsgálata ugyanis azzal az eredménnyel járt, hogy az esetek 85 ^-ában a bekezdés első mondata tartalmazta a legtöbb információt, 7 'foát pedig az utolsó mondat. Egy másik álláspont szerint csak a prepoziciós kitételeket kell kiszűrni, mivel az ilyen kifejezés-egységek funkciójuk szempontjából a legrugalmasabbak s feltehetően pontosabban tükrözik valamely tanulmány tartalmát mint bármely más egyszerű konstrukció. Ezenkívül a prepoziciós kitételek főnevei és melléknevei a szakanyag hozzáférhetővé tétele szempontjából gyakran jellegzetes kifejezések. Más kutatók szerint a szó-előfordulás gyakorisága magában véve nem kielégítő ismérv az indexkártyák elkészítéséhez. A "s z ó - s u 1 у о z á s n а к" is megvan a maga jelentősége. Valamely dokumentum kulcsszavai azok, amelyek a várhatónál is gyakrabban fordulnak elő. Az a módszer, amely az indexelést a "viszonylagos gyakoriság" elve alapjàç közeliti meg, csekély jelentőseget tulajdonit a dokumentumokban normális körülmények között ritkán előforduló, továbbá a gyakran használt szavaknak. Annál fontosabbnak tartja azokat az egyébként ritkán előforduló szavakat, amelyeket valamely dokumentumban gyakran használnak. Ez az eljárás minden szaktéma szókincsét az előfordulás gyakoriságának sorrendjében állítja össze. A számológép a jellegzetes szavakat először általános szókincsével veti össze, s ennek alapján jelzi, hogy a dokumentum valamely általánosabb kategóriába, — pl. fizika -- tartozik. A jellegzetes szavakat azután a gyakorisági sorrendben megszerkesztett szó jegyzékkel hasonlítja össze és indexkártyára azokat a szavakat veszi, amelyek gyakrabban fordulnak elő, mint ahogy fizika-tanulmány okban szokásos. Még erősebben súlyozhatok azok a szavak, amelyek valamely dokumentum kulcsszemelvényeiben fordulnak elő. Luhn a dokumentumok terminológiája "fogalomcsoportokba"- való felbontásának, a fogalmi profil kialakításának a hive. DOKUMENTUMUK INDEXKÍRTYÁINAK GÉPI KIJELÖLÉSE Az előbbi eljárás azzal foglalkozott, hogy a dokumentumokban található kifejezésekből miként kell azokat kiemelni, amelyek imtexezésre alkalmasak. Dolgoznak azonban azon a feladaton is, hogy-az egyes dokumentumok megfelelő indexkártyákat gépi uton jelöljék ki. Ez feltételezi, hogy valamely anyag-gyűjtemény témacimeit előzetesen rnár osztályozták vagy jegyzékbe foglalták. A gépi indexelés ebben az esetben azt jelenti, hogy a dokumentum szövegét átfésülik és szóanyaga alapján az osztályozás megfelejő kategóriájába sorolják. Az e területen folytatott kutatás során átvizsgálták egy kisérleti dokumentum-gyűjtemény anyagát, s ezt követően az emberi indexelők minden egyes dokumentumot az osztályozás megfelelő kategóriájába soroltak. A következő lépés abban állt, hogy 414-