Életünk, 2011 (49. évfolyam, 1-12. szám)

2011 / 3-4. szám - Juhász Zoltán: Gépi adatbányászat a Czuczor-Fogarasi-szótárban

Igaz ugyanakkor, hogy még így is maradt 604-144=460 felismeretlen gyök, me­lyek azért nem akadtak horogra, mert folytatásuk entrópiája még 0,3-nál is ki­sebbnek adódott. Ilyen pl. a „tűn” gyök, mivel csak kétféle szóban fordul elő a vizs­gált szövegben (tünemény, tündér). Hiányzik viszont pl. a tünde, tündöklik, tünedez, tünékeny, tüntet - ezekkel már bőven a kritikus érték fölé nőne az ent­rópia. A gyökök rejtőzködésének okát tehát a vizsgált szöveg viszonylagos kicsi­ségében kereshetjük, és joggal bizakodhatunk abban, hogy a szövegtest jelentős nö­velésével ezek zöme is felbukkanna a marslakó listáján. Összegezve: Marslakónk nyelvismeret nélkül, pusztán információelméleti alapon keresett értelmes háromtagú hangsorokat magyar szavak elején. Találatai nemcsak hogy valóban értelmes szavak, de a statisztikai arányt jelentősen felülmúló szám­ban CzF.-féle gyökök is egyben. A szöveg méretbeli korlátáit is figyelembe véve ebből arra következtethetünk, hogy a magyar szavak elején előforduló értelmes hanghármasok valóban mind a CzF. által azonosított gyökök. Hogy megfordítva, minden CzF.-gyök értelmességét is tudná-e igazolni információ-elméleti alapon a marslakó, nem tudjuk, de jogosan bízunk abban, hogy sokkal nagyobb szöveg­testek elemzésével a gyökök zöméről ez derülne ki. Lehet, hogy Czuczor és Fogarasi is marslakó volt? Vagy csak tudtak magyarul? Vagy a marslakók is tudnak? A Czuczor-Fogarasi szótár „külhasonlításai” is a gyökrendre épülnek. A magyar sza­vak rokonait általában gyökük alapján keresik, 44 nyelvben kutatva módszeresen tar­talmi és alaki hasonlóság után. Az eredményt érzékelhetően mindenféle külső szem­pontot kizárva, előszűrés nélkül közlik, nem könnyítve meg ezzel a valamilyen prekoncepcióhoz igazolást kereső olvasó dolgát. Az „ész” szóról pl. ezt közlik: „Esz:... Rokonul tekinthető a szanszkrit aszú s őszien (am. lehelet, száj), továbbá a hel­len ishmi v. isami, s német wissen. Csagataj nyelven isz v. sz (Abuska). Finnül aisti. A török üsz-lü am. eszes. ” Elég reménytelennek tűnik ezek alapján a magyar nyelv rokonságáról zajló vitá­ban állást foglalni valamelyik oldalon. Sőt, felmerül a kérdés, vajon juthatunk-e el­vileg és egyáltalán valamilyen következtetésre a CzF. ehhez hasonló szó-rokoní- tásainak kuszaságából. Ha azonban derűlátóan mégiscsak nekilátunk az adatok elemzésének, tanulságos eredményekre jutunk. A fentihez hasonló rokonításokból meghatározható például, hogy hányszor roko­nit a szótár magyar szavakat egyszerre finn és török szavakkal. A vizsgálódást mind a 44 nyelv összes lehetséges párosítására kiterjesztve egy 44*44-es méretű adat-mát­rixot kapunk. Az adatokból kiszámíthatjuk bármelyik nyelv-páros rokonsági fokát - ez a szám 1-hez közelít, ha a két nyelvben nagyon gyakran található rokona ugyanannak a magyar szónak, és 0-hoz tart, ha a közös magyar rokonság igen ritka (Czakó-Juhász, 2010). (Hangsúlyozzuk, hogy itt is, és a tanulmányban végig a ma­gyar szókészlettel kapcsolatot tartó idegen szavakról beszélünk, hiszen minden 105

Next

/
Thumbnails
Contents