193211. lajstromszámú szabadalom • Eljárás szintetikus hangsorok előállítására hallásvizsgálatokhoz

Ismeretes továbbá az is, hogy egy hangsort egy hallási károsodásban szenvedő egyén annál inkább ért meg (észlel) teljes egészé­ben, mennél több akusztikai információt tar­talmaznak a hangsort felépítő elemek. Ha te­hát sikerül olyan szintetikus hangsorokat elő­állítani, amelyek jó hangzásúak, akusztikai szerkezetük kevéssé tér el a természetestől, de az alkotó összetevőket csak egy vagy néhány frekvenciasávra koncentráljuk, akkor ezek akusztikai tartalmuknál fogva lehetővé te­szik a hallástartomány bizonyos mértékű fel­­térképezését és ennek alapján bölcsődés, óvo­dás korú gyermekek vizsgálatánál igen meg­bízható diagnosztikai megállapításokat tehe­tünk, A találmány szerinti eljárás során elő­ször az adott nyelv beszédhangjairól és hang­kapcsolatairól gördülő spektrumot készítünk, és annak képéről minden 10 ms-os időpillanat­ban kimérjük a hang, illetve hangkapcsolat (továbbiakban hang) összes frekvenciaössze­tevőit, formánsait. Meghatározzuk a hang energia-idő függvényét is. A gördülő spektrumból kimért adatokat (frekvencia, idő, intenzitás) átkonvertáljuk formáns elven működő beszédszintetizátort vezérlő adatokká, amikorrs a spektrális mé­résből nyert frekvenciaadatokat a szintetizá­tor frekvencia lépés táblázatában megadott ér­tékekhez igazítjuk. Az energia-idő függvény­nek a tisztán zöngés gerjesztésű hangokra, illetve hangsorrészekre vonatkoztatott függ­vényértékeit úgy alakítjuk át szintetizátort vezérlő kódokká, hogy az ezekkel a kódokkal szintetikusan előállított hang energia-idő függ­vény értékei legfeljebb 5 dB-nyit térjenek el az eredeti idő-függvény ugyanazon pontján mért függvényértékektől. Az energia-idő függ­vény további, zörejes gerjesztésű hangokra, illetve hangsorrészekre vonatkoztatott függ­vényértékeit úgy alakítjuk át szintetizátort vezérlő kódokká, hogy a zörejes gerjesztésű szintetizált hang intenzitását kialakító kó­dot (okát) először egy kiinduló paraméter­­értékre állítjuk be, és ezzel állítjuk elő a han­got (hangsorrészt), majd azt hosszabb hang­sorba helyezve meghallgatásos vizsgálatnak vetjük alá, és a vizsgálat eredményétől füg­gően változtatjuk az intenzitásparaméter ér­tékét. Azt az értéket fogadjuk el végleges­nek, amelyiknél a meghallgatásos vizsgálat során a kérdéses hangot a vizsgálati alanyok legmagasabb százalékban azonosították he­lyesnek. Az így előállított szintetizátor vezér­lő paraméterekkel a kívánt hangsort szinte­tikusan előállítjuk, majd ezután elkészítjük a szintetikus hangsor gördülő spektrumát, és összehasonlítjuk az eredeti hangsor gördülő spektrumával. Ha a mért eredmények elté­rést mutatnak, akkor korrigáljuk a szinteti­zátort vezérlő bemenő frekvenciaadatokat mindaddig, amíg a két spektrum, illetve ener­gia-idő függvény megegyezik. Ezután a redundáns információt hordozó építőelemek csökkentését hajtjuk végre úgy, 3 hogy a szintetizátor vezérlésére szolgáló pa­raméterek közül a zöngés hangok képzésé­hez a második F2 formáns feletti formánsokat megvalósító paramétereket állandó fix érté­kűre állítjuk be (jó gyakorlati értékek: F3 = 2700 Hz, F4 = 3500 Hz, Fs = 4500 Hz) és csak az első F, formáns és a második F2 formáns paraméterét hagyjuk meg. mozgat­hatónak. Ezen felül a formánsokat létrehozó nagy energiájú felharmonikus csoportokban jelenlévő felharmonikusok számát csökkent­jük úgy, hogy az F, és F2 formánsokat képző szűrő meredekségét 30 — 50 dB/oktáv közé állítjuk be (törekedve a minél nagyobb mere­dekségre), és Af sávszélességüket a y— = = 0,5 — 1 képlet szerinti értékre állítjuk be, ahol F a megfelelő formánst létrehozó szűrő középfrekvenciája. Ezen felül a zörejhangok előállításában szerepet játszó zörejformáns áramkörök vezérlési paramétereit úgy állít­juk be, hogy azok lehetőleg 1, maximum 2 frekvenciaértékre koncentrálják a hang épí­tőelemeit (az elfogadható jó hangzás bizto­sítása mellett), majd az így módosított beme­nő paraméterekkel a hangsort újból előállítjuk, és meghallgatásos vizsgálatnak vetjük alá. A továbbiakban a meghallgatásos vizsgálat eredményétől függően — az általunk koráb­ban meghatározott korlátokon belül — addig korrigáljuk a szintetizátort vezérlő bemenő adatokat, amíg a készített szóra a megértési százalék a legmagasabb értéket nem éri el. Mindezeket az adott nyelv minden hang­kapcsolatára elvégezzük, és így olyan be­menő adatokat kapunk, amelyekkel szavakat építhetünk fel, és ezen szintetikus szavak akusztikai szerkezete csak a legszükségesebb (vagy ahhoz közel álló számú) akusztikai építőelemeket fogják tartalmazni. Az ilyen hangsorok jellemzője továbbá, hogy pontosan tudjuk, hogy a hangsor egyes hangjaiban és a hangok kapcsolódásainál milyen frekvenciakomponensek vannak jelen a hangsorban, így a lejátszásukra adott válasz esetleges eltéréséből (hogy a válasz mely he­lyén van eltérés) vissza tudunk következtetni arra, hogy mely alkotóelemeket (frekvencia­komponenseket) nem hallott meg jól a vizsgált személy. A hangsorok másik lényeges jellem­zője, hogy azok akárhányszor minőségvál­tozás nélkül az adatokból reprodukálhatók. Ügy találtuk, hogy a számítógéppel ilyen módon elkészített szintetizált hangsorok fel­használhatók kisgyermekek hallásának méré­sére, továbbá a beszédmegértési szintjükre is következtetni lehet. A kisgyermekek hallásvizsgálatának ered­ményét bizonytalanná tevő tényezők mindenek­előtt a gyermekek életkori sajátosságaiból fakadnak, egyszersmind abból, hogy ugyan­olyan feladatmegoldásra kell késztetnünk őket, mint a felnőtteket. Sok esetben ugyanis könnyebb az elhang­zott hangsor ismétlésére késztetni a kisgyer­meket, mint arra, hogy jelezzen a szinuszos-, 3 1932 5 10 15 20 25 30 35 40 45 50 55 60 65

Next

/
Oldalképek
Tartalom