Nyelvtudományi Közlemények 75. kötet (1973)
Tanulmányok - Papp Ferenc: Tőszókincsünk etimológiai rétegenkénti hangstatisztikája. cirill 3
TŐSZÓKINCSÜNK ETIMOLÓGIAI RÉTEGENKÉNT! HANGSTATISZTIKÁJA 5 egy ezzel (is) fogadni a TESz. utolsó kötetének megjelentét, hogy azután a TESz. eredményeire is összegezve visszapillantsunk; esetleg összevetéseket eszközöljünk a SfcófSz. és a TESz: nyújtotta kép között stb. — Ennek a célnak és a használt forrásoknak felel meg feldolgozásunk pontossága (inkább: pontatlansága?) is. Nyilván eléggé viszonylagos anyagunk körülhatárolása: ,,az ErtSz.-ban foglalt kétségtelen tőszavak", több okból is. Először: csak a mai állapotot tekintve is él még az ÉrtSz.-on kívül is nem egy tőszó — ha pontosan nem is tudjuk, mennyi (tájnyelv, szaknyelvek stb,). Továbbá: vajon az arc vitathatatlan tőszó-e (ma már nyilván az), vajon a gitár és a citera két külön tőszó-e (nyilván így igaz), vajon a szinkronciklofazotron is a jelzett vitathatatlan magyar tőszavak közé tartozik-e (nem oda tartozn ék : szerencsére nem szerepel az ÉrtSz.-ban) stb.? Annyit mindenesetre mondhatunk, hogy hatezer-egynéhány tőszót vizsgáltunk át (a pontos szám éppenséggel megvan a NytudÉrt. i. h; — de ne nézze meg az olvasó, nincs szüksége akkora pontosságra), ez közel harmincezer hangot jelentett (a pontos szám megvan itt az 1. táblázat végén). Természetes, hogy ez nem a magyar tőszavak összessége, mint ahogy az egyes etimológiai rétegek sem véglegesek, sőt még csak nem is tükrözik egészen pontosan a SzófSz. képviselte helyzetet, saját apparátusunk pontatlanságai (az emberi beavatkozás) miatt. Vegye úgy az olvasó, hogy az ErtSz.—SzófSz. forráspárból itt egy jó nagy mintát kap — ez a minta megközelíti a forráspár teljes anyagát, arányai is rendkívül közel állnak a forráspárban meglevő objektív arányokhoz. Bizonytalannak talán a század százalékokat kell tekintenünk az 1. táblázaton; tulajdonképpen valószínűleg még ez is túlzott és csupán látszólagos pontosság a premisszák említett gyengesége miatt. (A TESz. eredményei már pontosabbak lesznek, de ott a premisszák is erősebbek.) 2. Ezek után közreadom az 1. táblázatot. Ugy kell olvasni, mint egyéb hasonló táblázatokat: A ,,0", ,,8" és ,,9" jelentésére a bal szélső oszlopban vö. fentebb, 1. alatt. Az egyes sorokban, illetőleg oszlopokban középen elhelyezett álló kurrens számok abszolút értékek. Például: fgr. tőszavaink összességében 175-ször fordult elő az a hang, 72-szer az á, 24-szer a b stb.; illetőleg, egyetlen oszlop mentén haladva: az a 1431-szer fordult elő a SzófSz.ban nem szereplő tőszavak között, 175-ször a fgr. tőszavak között, 226-szor a magyar belső keletkezésűek között stb. Az abszolút számok fölött jobbra írt dőlt szám százalékos érték; 100,00 = az adott etimológiai rétegben előforduló összes hang. Tehát, példáinknál maradva: az összes fgr. tőszóban előforduló összes hang 8,19%-a, a, 3,37%-a, á, 1,12%-a, b stb. Az abszolút számok alatt balra elhelyezett dőlt számok esetében viszont 100,00 = az adott hang összes előfordulása a tőszókincs egészén belül. Tehát: az összes előforduló a-k 46,75%-Sb a SzófSz.-ban nem szereplő tőszavakban áll, 5,72%-a, a fgr-ok között, 7,38 %-a a magyar belsők között stb. A táblázat ,,szólein' (a legalsó sorban és a legutolsó oszlopban) a vizsgált tőszókincs egészére vonatkozó adatok találhatók. Eszerint tehát a vizsgált tőszókincs egész hangállományának 10,40%-SÍ volt a, 3,90%-8b á, 2,60%-a, b stb.; másrészt a vizsgált hangállomány 45,97%-át adták a SzófSz.-ban nem szereplő elemek, 7,2^%-át a fgr-ok, 7,76%-éüt a magyar belsők stb. (Ezek az arányok eltérnek a NytudÉrt. 58: 521 alatt közölt táblázatéitól: azok az adatok a szavak számára vonatkoznak, míg az itt közöltek a hangokéra. Például: tőszókincsünk 10,10%-a, fgr., minden tizedik szó tőszókincsünkben fgr. — ám