Életünk, 2011 (49. évfolyam, 1-12. szám)
2011 / 3-4. szám - Juhász Zoltán: Gépi adatbányászat a Czuczor-Fogarasi-szótárban
- Szétválasztja viszont egymástól e két nagy csoportot.- A szláv nyelvek szétszórtsága azt mutatja, hogy a magyarral rokon szavaik nem alkotnak egységes csoportot. E szavak rokoni kapcsolatai más nyelvekhez erősen szórtak. Ugyanezzel a módszerrel megrajzolhatjuk a nyelvek kapcsolati hálóját a Történeti Etimológia Szótár alapján készült Magyar Etimológiai Szótár (MESz.) adatai alapján is. így kapjuk a 4. ábrát, melyen világosan elkülönülő négy csoportot látunk: törököt, finnugort, szlávot és germán-latint. A görög és a latin nyelv ebben a képben elveszti híd szerepét, és beépül a germán-latin tömbbe. A MESz. adatai szerint a szláv nyelvek CzF. szerinti szórtsága teljesen eltűnik, szorosan összekapcsolódó szláv csoportot látunk az ábrán. Germán - latin 4. ábra. A magyarral kapcsolatos nyelvek kapcsolati rendszere a MESz. adatai alapján A két szótár tehát jelentősen eltérő képet fest a magyarral kapcsolatban álló idegen nyelvek egymás közti viszonyairól. Az okokat nyilván a konkrét szavak roko- nításainak eltérő módszereiben kell keresnünk, ezért érdemes összevernünk néhány nyelv CzF. és MESz. szerint számított rokonági „spektrumait”. Az 5. ábra a török spektrumot mutatja a CzF. (fönt) és a MESz. (lent) szerint. A két szótár együtt már összesen 59 nyelvvel keres kapcsolatokat, ezeket az ábra vízszintes tengelyén tüntettük fel. Az oszlopok magassága a rokon magyar-török szavak gyakoriságát mutatja a többi nyelvben. Például a 31. sz. finn oszlop magassága a felső spektrumban azt jelzi, hogy a CzF. igen gyakran talál magyar szavakhoz egyszerre török és finn megfelelőt. Ezzel szöges ellentétben, az alsó spektrum megfelelő helyén 0 értéket találunk: a MESz. tehát szinte sohasem talál finn megfelelőt rokon magyar-török szavakhoz. 107