Az Eszterházy Károly Tanárképző Főiskola Tudományos Közleményei. 2003. Oktatástechnológia. (Acta Academiae Paedagogicae Agriensis : Nova series ; Tom. 26)

LENGYELNÉ MOLNÁR TÜNDE: Hatékonyságnövelés a könyvtárakban szóstatisztikai eljárások alkalmazásával

hez a súlyok alapján, és a legmagasabb számértékkel rendelkező mondatokat, vagy bekezdéseket adjuk vissza eredményként. Nehézségek a gépi kivonatkészítés során - Gondot okoz a szópárok, szóhármasok keresése, hiszen az eredeti szövegben nem feltétlenül lesznek egymás mellett a releváns párok, mert triviális sza­vak elválasztják őket egymástól. A lépés automatizálása megoldható, hiszen már ma is létezik több olyan szoftver, amely lehetővé teszi, hogy a számító­gép képes legyen az egymástól néhány szónyi távolságra lévő kifejezések keresésére. - Sok mondatban az alany megjelölése az előző mondatokban kiírt sze­mélyiekbe, esemény(ek)re történő utalás formájában jelenik meg. Ezek ke­zeléséhez a szövegtan eredményeit kell felhasználnunk. - A tökéletesebb eredmények eléréséhez szükséges a statisztikai vizsgálatokat kiterjeszteni, és figyelembe venni, a szignifikáns szavak első előfordulását, és ezt súlyozással jutalmazni. - További fejlesztések közé tartozna, ha nemcsak a szavakat vizsgálnánk, ha­nem figyelembe vennénk a mondat elhelyezkedését is a bekezdésen belül. Ugyanis a szerzők a bekezdés első mondataiban általában megjelölik mon­danivalójuk tárgyát, záró mondatában pedig adnak egy összegzést. Ezek hasznos mondatok, így megéri a súlyozásnál ezt is figyelembe venni. A gondolatmenetet folytatva a bekezdés helyét is hasonló okokból vizsgálhat­nánk. - Nagymértékben csökkenti a hatékonyságot, ha a szerző igyekszik változatos kifejezéseket használni, és ugyanazt a dolgot, vagy személyt különböző el­nevezésekkel illeti. Összegzés Befejezésül hangsúlyoznám, hogy ez az eljárás csak diszkurzív szövegek esetén használható, amikor is a szöveg egy témakört tárgyal, és azt tényközlő megállapítá­sokkal teszi, nem pedig a legváltozatosabb irodalmi stílust használva, továbbá a szerző következetes a szóhasználatban és mondanivalójának tagolásában. Általános­ságban elmondhatjuk, hogy a Luhn-féle módszer hatékonyabban alkalmazható a tudományos közlések, jelentések esetén, mint egy választékos irodalmi stílussal megírt mű esetén. Magyarországon eddig nem jelent meg automatikus referátumkészítő program, eddig csupán az igény tapasztalható. 136

Next

/
Thumbnails
Contents