Tudományszervezési Tájékoztató, 1964

3-4. szám - Szemle

venni. Bizonyos szöveggyűjtemény vizsgálata ugyanis azzal az eredménnyel járt, hogy az esetek 85 ^-ában a bekezdés első mondata tartalmazta a legtöbb információt, 7 'fo­át pedig az utolsó mondat. Egy másik álláspont szerint csak a prepoziciós kitételeket kell kiszűrni, mivel az ilyen kifejezés-egységek funkciójuk szempontjából a legrugalmasabbak s fel­tehetően pontosabban tükrözik valamely tanulmány tartalmát mint bármely más egyszerű konstrukció. Ezenkívül a prepoziciós kitételek főnevei és melléknevei a szakanyag hozzáférhetővé tétele szempontjából gyakran jellegzetes kifejezések. Más kutatók szerint a szó-előfordulás gyakorisága magában véve nem kielé­gítő ismérv az indexkártyák elkészítéséhez. A "s z ó - s u 1 у о z á s n а к" is megvan a maga jelentősége. Valamely dokumentum kulcsszavai azok, amelyek a várható­nál is gyakrabban fordulnak elő. Az a módszer, amely az indexelést a "viszonylagos gyakoriság" elve alapjàç közeliti meg, csekély jelentőseget tulajdonit a dokumentu­mokban normális körülmények között ritkán előforduló, továbbá a gyakran használt szavaknak. Annál fontosabbnak tartja azokat az egyébként ritkán előforduló szavakat, amelyeket valamely dokumentumban gyakran használnak. Ez az eljárás minden szaktéma szókincsét az előfordulás gyakoriságának sorrendjében állítja össze. A számológép a jellegzetes szavakat először általános szókincsével veti össze, s ennek alapján jel­zi, hogy a dokumentum valamely általánosabb kategóriába, — pl. fizika -- tartozik. A jellegzetes szavakat azután a gyakorisági sorrendben megszerkesztett szó jegyzékkel hasonlítja össze és indexkártyára azokat a szavakat veszi, amelyek gyakrabban fordul­nak elő, mint ahogy fizika-tanulmány okban szokásos. Még erősebben súlyozhatok azok a szavak, amelyek valamely dokumentum kulcsszemelvényeiben fordulnak elő. Luhn a dokumentumok terminológiája "fogalomcsoportokba"- való felbontásának, a fogalmi profil kialakításának a hive. DOKUMENTUMUK INDEXKÍRTYÁINAK GÉPI KIJELÖLÉSE Az előbbi eljárás azzal foglalkozott, hogy a dokumentumokban található ki­fejezésekből miként kell azokat kiemelni, amelyek imtexezésre alkalmasak. Dolgoznak azonban azon a feladaton is, hogy-az egyes dokumentumok megfelelő indexkár­tyákat gépi uton jelöljék ki. Ez feltételezi, hogy valamely anyag-gyűjtemény témacimeit előzetesen rnár osztályozták vagy jegyzékbe foglalták. A gépi indexelés ebben az esetben azt jelenti, hogy a dokumentum szövegét átfésülik és szóanyaga alapján az osztályozás megfelejő kategóriájába sorolják. Az e területen folytatott kutatás során átvizsgálták egy kisérleti dokumen­tum-gyűjtemény anyagát, s ezt követően az emberi indexelők minden egyes dokumentumot az osztályozás megfelelő kategóriájába soroltak. A következő lépés abban állt, hogy 414-

Next

/
Thumbnails
Contents