Szabómihály Gizella - Lanstyák István (szerk.): Magyarok Szlovákiában VII. Nyelv - Magyarok Szlovákiában 7. (Somorja, 2011)
Tanulmányok - A magyar nyelv szlovákiai változatainak jellemzői
170 Pintér Tibor nyelvváltozatokkal (a lejegyzett anyag nagysága természetesen nem elegendő messzemenő következtetések levonására). A lejegyzett hanganyag nem része a Magyar nemzeti szövegtárnak, így lekérdezni sem lehet - sajnos nem rendelkezik lekérdezőfelülettel. A meglévő anyagot (a hanganyagot és az átiratot egyaránt) bővíteni kellene - főként a teljesség igénye, azaz a megállapodott szerkezeti és minőségi tulajdonságok felé. A fejlesztésnek ki kellene terjednie felhasználhatóság megkönnyítésére is: a használatot nagyban megkönnyítené egy lekérdező program kifejlesztése. Mindez azonban elsősorban pályázati lehetőségek és pénz kérdése, ám remélhetően a közeljövőben a fejlesztések ebbe az irányba is elindulnak. A jelenleg elérhető szlovákiai magyar beszélt nyelvi korpusz a következő statisztikai tulajdonságokkal rendelkezik: (magyar-szlovák). Az elkészült szójegyzékek egyrészt a Gramma Nyelvi Iroda partnerintézményeivel közösen indított projektek párhuzamosított listáiként (egynyelvűek), másrészt speciálisan a szlovákiai magyar beszélőközösség számára készültek (többnyelvüek). A szójegyzékek között sajátos szlovákiai magyar értéket képviselnek a többnyelvű, speciális szólisták, amelyek a szlovákiai magyar felhasználóknak készültek (szlovákról magyarra fordítva készültek el). Ezek kidolgozását elsősorban valós igények kezdeményezték, így fokozatos bővülésük is a felmerülő igények fényében valósul majd meg. A szójegyzékek anyagát nemcsak a szélesebb közönség, hanem a készülő szlovák-magyar nagyszótár is felhasználja. Az elkészült két- és háromnyelvű szójegyzékek megtalálhatók a Gramma Nyelvi Iroda honlapján a „Szójegyzékek” menüpont hanganyag kódja xml-kódolt szószám összes hang lejegyzett hang GR001 5860 61.16 32.24 GR002 5682 64.33 31.25 GR003 5499 51.22 36.17 GR004 3976 56.37 28.54 GR005 4011 54.20 23.59 GR006 6570 61.37 33.06 GR007 5305 84.54 11.40 GR008 7064 51.57 43.32 GR009 4966 81.01 32.25 GR010 7636 54.34 46.00 GR011 5086 28.50 28.50 GR012 4295 65.05 25.55 GR013 5118 52.50 39.35 GR014 4308 68.39 26.29 75376 kb. 14 óra kb. 7 óra TEMATIKUS, EGY- ÉS TÖBBNYELVŰ SZÓJEGYZÉKEK A Gramma Nyelvi Iroda adatbázis-építő tevékenységének másik ága — az annotált korpuszok - mellett, a néhány száz vagy ezer szóból (tokenből) álló kisebb méretű szójegyzékek elkészítése, valamint adatbázisba rendezése. A különféle témakörökben készült és folyamatosan bővülő szójegyzékek közt megtalálhatóak úgy az egynyelvűek, mint a kétnyelvüek alatt. A közzétett szójegyzékek a következő témákban készültek el: papír-írószer (szerkesztője Szabómihály Gizella), bank és pénzügy (szerkesztője Szabómihály Gizella), közigazgatási-jogi terminológia (szerkesztője Szabómihály Gizella), dísznövények, kerti növények (szerkesztője Szabómihály Gizella), foglalkozásnevek szójegyzéke (szerkesztője Misad Katalin), valamint a régiónkban honos madarak szlovák-latin-magyar szójegyzéke (szerkesztője Szabómihály Gizella).