193211. lajstromszámú szabadalom • Eljárás szintetikus hangsorok előállítására hallásvizsgálatokhoz | Könyvtár

193211. lajstromszámú szabadalom • Eljárás szintetikus hangsorok előállítására hallásvizsgálatokhoz

Ismeretes továbbá az is, hogy egy hangsort egy hallási károsodásban szenvedő egyén annál inkább ért meg (észlel) teljes egészében, mennél több akusztikai információt tartalmaznak a hangsort felépítő elemek. Ha tehát sikerül olyan szintetikus hangsorokat előállítani, amelyek jó hangzásúak, akusztikai szerkezetük kevéssé tér el a természetestől, de az alkotó összetevőket csak egy vagy néhány frekvenciasávra koncentráljuk, akkor ezek akusztikai tartalmuknál fogva lehetővé teszik a hallástartomány bizonyos mértékű feltérképezését és ennek alapján bölcsődés, óvodás korú gyermekek vizsgálatánál igen megbízható diagnosztikai megállapításokat tehetünk, A találmány szerinti eljárás során először az adott nyelv beszédhangjairól és hangkapcsolatairól gördülő spektrumot készítünk, és annak képéről minden 10 ms-os időpillanatban kimérjük a hang, illetve hangkapcsolat (továbbiakban hang) összes frekvenciaösszetevőit, formánsait. Meghatározzuk a hang energia-idő függvényét is. A gördülő spektrumból kimért adatokat (frekvencia, idő, intenzitás) átkonvertáljuk formáns elven működő beszédszintetizátort vezérlő adatokká, amikorrs a spektrális mérésből nyert frekvenciaadatokat a szintetizátor frekvencia lépés táblázatában megadott értékekhez igazítjuk. Az energia-idő függvénynek a tisztán zöngés gerjesztésű hangokra, illetve hangsorrészekre vonatkoztatott függvényértékeit úgy alakítjuk át szintetizátort vezérlő kódokká, hogy az ezekkel a kódokkal szintetikusan előállított hang energia-idő függvény értékei legfeljebb 5 dB-nyit térjenek el az eredeti idő-függvény ugyanazon pontján mért függvényértékektől. Az energia-idő függvény további, zörejes gerjesztésű hangokra, illetve hangsorrészekre vonatkoztatott függvényértékeit úgy alakítjuk át szintetizátort vezérlő kódokká, hogy a zörejes gerjesztésű szintetizált hang intenzitását kialakító kódot (okát) először egy kiinduló paraméterértékre állítjuk be, és ezzel állítjuk elő a hangot (hangsorrészt), majd azt hosszabb hangsorba helyezve meghallgatásos vizsgálatnak vetjük alá, és a vizsgálat eredményétől függően változtatjuk az intenzitásparaméter értékét. Azt az értéket fogadjuk el véglegesnek, amelyiknél a meghallgatásos vizsgálat során a kérdéses hangot a vizsgálati alanyok legmagasabb százalékban azonosították helyesnek. Az így előállított szintetizátor vezérlő paraméterekkel a kívánt hangsort szintetikusan előállítjuk, majd ezután elkészítjük a szintetikus hangsor gördülő spektrumát, és összehasonlítjuk az eredeti hangsor gördülő spektrumával. Ha a mért eredmények eltérést mutatnak, akkor korrigáljuk a szintetizátort vezérlő bemenő frekvenciaadatokat mindaddig, amíg a két spektrum, illetve energia-idő függvény megegyezik. Ezután a redundáns információt hordozó építőelemek csökkentését hajtjuk végre úgy, 3 hogy a szintetizátor vezérlésére szolgáló paraméterek közül a zöngés hangok képzéséhez a második F2 formáns feletti formánsokat megvalósító paramétereket állandó fix értékűre állítjuk be (jó gyakorlati értékek: F3 = 2700 Hz, F4 = 3500 Hz, Fs = 4500 Hz) és csak az első F, formáns és a második F2 formáns paraméterét hagyjuk meg. mozgathatónak. Ezen felül a formánsokat létrehozó nagy energiájú felharmonikus csoportokban jelenlévő felharmonikusok számát csökkentjük úgy, hogy az F, és F2 formánsokat képző szűrő meredekségét 30 — 50 dB/oktáv közé állítjuk be (törekedve a minél nagyobb meredekségre), és Af sávszélességüket a y— = = 0,5 — 1 képlet szerinti értékre állítjuk be, ahol F a megfelelő formánst létrehozó szűrő középfrekvenciája. Ezen felül a zörejhangok előállításában szerepet játszó zörejformáns áramkörök vezérlési paramétereit úgy állítjuk be, hogy azok lehetőleg 1, maximum 2 frekvenciaértékre koncentrálják a hang építőelemeit (az elfogadható jó hangzás biztosítása mellett), majd az így módosított bemenő paraméterekkel a hangsort újból előállítjuk, és meghallgatásos vizsgálatnak vetjük alá. A továbbiakban a meghallgatásos vizsgálat eredményétől függően — az általunk korábban meghatározott korlátokon belül — addig korrigáljuk a szintetizátort vezérlő bemenő adatokat, amíg a készített szóra a megértési százalék a legmagasabb értéket nem éri el. Mindezeket az adott nyelv minden hangkapcsolatára elvégezzük, és így olyan bemenő adatokat kapunk, amelyekkel szavakat építhetünk fel, és ezen szintetikus szavak akusztikai szerkezete csak a legszükségesebb (vagy ahhoz közel álló számú) akusztikai építőelemeket fogják tartalmazni. Az ilyen hangsorok jellemzője továbbá, hogy pontosan tudjuk, hogy a hangsor egyes hangjaiban és a hangok kapcsolódásainál milyen frekvenciakomponensek vannak jelen a hangsorban, így a lejátszásukra adott válasz esetleges eltéréséből (hogy a válasz mely helyén van eltérés) vissza tudunk következtetni arra, hogy mely alkotóelemeket (frekvenciakomponenseket) nem hallott meg jól a vizsgált személy. A hangsorok másik lényeges jellemzője, hogy azok akárhányszor minőségváltozás nélkül az adatokból reprodukálhatók. Ügy találtuk, hogy a számítógéppel ilyen módon elkészített szintetizált hangsorok felhasználhatók kisgyermekek hallásának mérésére, továbbá a beszédmegértési szintjükre is következtetni lehet. A kisgyermekek hallásvizsgálatának eredményét bizonytalanná tevő tényezők mindenekelőtt a gyermekek életkori sajátosságaiból fakadnak, egyszersmind abból, hogy ugyanolyan feladatmegoldásra kell késztetnünk őket, mint a felnőtteket. Sok esetben ugyanis könnyebb az elhangzott hangsor ismétlésére késztetni a kisgyermeket, mint arra, hogy jelezzen a szinuszos-, 3 1932 5 10 15 20 25 30 35 40 45 50 55 60 65

Oldalképek

Tartalom