Tudományszervezési Tájékoztató, 1964
3-4. szám - Szemle
az egyes kategóriákat alkotó dokumentumokban megszámlálták a szóelőfordulások gyakoriságát. A továbbiéiban ezt az előfordulás sorrendjeben kialakitott szóaiyagot elemezték, hogy kiemeljenek egyes szavakat, amelyek jó kulcsszavak lehetnek abból a szempontból, hogy "előrejelzik" az egyes kategóriákat, A csupán mondattani szerepet játszó szavakat azonnal kiküszöbölik, ugyanigy az általános témakörben közhasználatú szavakat. Az anyaggyüjteményben ritkán szereplő szavakat is elhagyják, mert akármilyen fontosak is egyes okiratok anyagának hozzáférhetővé tétele szempontjából, nem alkalmasak arra, hogy egymással összefüggő dokumentum csoportokat kutassanak fel. A fennmaradó kifejezésekből ki lehet emelni néhány olyant, amely egy-egy külön kategóriában gyakran, másokban pedig ritkán fordul elő. Ezeket választják aztán ki kulosszavakként a kategória "előjelzésére". Ezt az eljárást számológép alkalmazásával egy másik anyaggyüjteményen is kipróbálták; a kísérlet — az emberi besoroláshoz viszonyitva — 50 $-os eredménnyel járt. Ugyancsak 50 eredményt ért el Harold Borko a Systems Development Corporation munkatársa ennek a módszernek egy valamivel haladottabb változatával. AUTOMATIKUS KIVONATOLÁS Az automatikus kivonatolásra javasolt eljárás sokban hasonlít ahhoz, amelyet az automatikus indexelés esetéhen alkalmaztak. A közhasználatú szavak és ugyanazon azó különböző alakzatainak kiszűrése után a dokumentumok fennmaradó azóanyagát az elóforduláa gyakoriságának sorrendjében csoportosítják; jellegzetesnek a bizonyos határértéken felül előforduló szavakat tekintik. TELJES SZÖVEGEK HOZZÁFÉRHETŐVÉ TÉTELE Az említett kísérletek mind a dokumentumgyűjtemény anyagának sűrítésével járnak, a céljuk indexkártyák vagy kivonatok készítése. Az információ egy. része azonban a legkiválóbb sürités esetén ia veszendőbe megy vagy mehet. Ezért fontolóra vették annak a lehetóaégét is, hogy az ezt igénylők számára valamely dokumentumgyűjtemény teljes anyagát hozzáférhetővé tegyék. A szöveget lyukkártyákról mágne•es szalagra viszik át; a közhasználatú szavakat, valamint ugyanannak a szónak a különböző alakzatait kihúzzák, a fennmaradó azóanyagot betűrendben csoportosítják, éa egy azómutató szalagot állítanak eló, amely jelzi, hogy minden egyes szó az egész gyűjteményben hol éa hányszor /mely dokumentumban illetve mondatban stb./ fordul elő. Ha a teljes anyagot kell átnézni, a kutató a rendszerhez, saját megfogalmazáaéban ia intézhet kérdéseket, amelyeket aztán a számjegyea /digitália/ számológép nyelvére ültetnek át az egész gyűjtemény anyagával történő összevetés céljára. A kuV 415