Tudományszervezési Tájékoztató, 1964

3-4. szám - Szemle

az egyes kategóriákat alkotó dokumentumokban megszámlálták a szóelőfordulások gya­koriságát. A továbbiéiban ezt az előfordulás sorrendjeben kialakitott szóaiyagot ele­mezték, hogy kiemeljenek egyes szavakat, amelyek jó kulcsszavak lehetnek abból a szempontból, hogy "előrejelzik" az egyes kategóriákat, A csupán mondattani szerepet játszó szavakat azonnal kiküszöbölik, ugyanigy az ál­talános témakörben közhasználatú szavakat. Az anyaggyüjteményben ritkán szereplő szavakat is elhagyják, mert akármilyen fontosak is egyes okiratok anyagának hozzáfér­hetővé tétele szempontjából, nem alkalmasak arra, hogy egymással összefüggő dokumen­tum csoportokat kutassanak fel. A fennmaradó kifejezésekből ki lehet emelni néhány olyant, amely egy-egy külön kategóriában gyakran, másokban pedig ritkán fordul elő. Ezeket választják aztán ki kulosszavakként a kategória "előjelzésére". Ezt az eljá­rást számológép alkalmazásával egy másik anyaggyüjteményen is kipróbálták; a kísér­let — az emberi besoroláshoz viszonyitva — 50 $-os eredménnyel járt. Ugyancsak 50 eredményt ért el Harold Borko a Systems Development Corporation munkatársa ennek a módszernek egy valamivel haladottabb változatával. AUTOMATIKUS KIVONATOLÁS Az automatikus kivonatolásra javasolt eljárás sokban hasonlít ahhoz, ame­lyet az automatikus indexelés esetéhen alkalmaztak. A közhasználatú szavak és ugyan­azon azó különböző alakzatainak kiszűrése után a dokumentumok fennmaradó azóanyagát az elóforduláa gyakoriságának sorrendjében csoportosítják; jellegzetesnek a bizonyos határértéken felül előforduló szavakat tekintik. TELJES SZÖVEGEK HOZZÁFÉRHETŐVÉ TÉTELE Az említett kísérletek mind a dokumentumgyűjtemény anyagának sűrítésével járnak, a céljuk indexkártyák vagy kivonatok készítése. Az információ egy. része azon­ban a legkiválóbb sürités esetén ia veszendőbe megy vagy mehet. Ezért fontolóra vet­ték annak a lehetóaégét is, hogy az ezt igénylők számára valamely dokumentumgyűjtemény teljes anyagát hozzáférhetővé tegyék. A szöveget lyukkártyákról mágne­•es szalagra viszik át; a közhasználatú szavakat, valamint ugyanannak a szónak a kü­lönböző alakzatait kihúzzák, a fennmaradó azóanyagot betűrendben csoportosítják, éa egy azómutató szalagot állítanak eló, amely jelzi, hogy minden egyes szó az egész gyűjteményben hol éa hányszor /mely dokumentumban illetve mondatban stb./ fordul elő. Ha a teljes anyagot kell átnézni, a kutató a rendszerhez, saját megfogalma­záaéban ia intézhet kérdéseket, amelyeket aztán a számjegyea /digitália/ számológép nyelvére ültetnek át az egész gyűjtemény anyagával történő összevetés céljára. A ku­V 415

Next

/
Thumbnails
Contents