A Híd, 2003. július-december (3. évfolyam, 109-134. szám)

2003-10-03 / 122. szám

I 2003. OKTÓBER 3. TUDOMÁNY A HÍD 13 H Beszédfelismerésen tiilmutató audiovizuális projektek SZÁJRÓL OLVASVA \ pszichológusok már ötven éve megállapították, hogy sokkal jobban értjük a beszéli zemélyt, ha nemcsak hallgatjuk, de latjuk is. Több kutatóközpontban, különböze zakterületek - mesterséges látás, beszédfelismerés, egy-két esetben a gépi fordítás ■ zintézisével próbálják ugyanezt az elvet számítógépes közegre alkalmazni. Október 1. Logikus lépés az audiovizuális beszéd­­felismerés - állítja Ian Matthews, a Camegie Mellon Egyetem Robotikai Inté­zetének kutatója. Nemcsak logikus, de szükséges is, hiszen hiába fejlődtek oly so­kat a személyi számítógépek, a velük törté­nő kommunikáció módja mit sem válto­zott az utóbbi évtizedekben. Ellenére an­nak, hogy a rendszerek egyre jobban értik a hangot, változadanul a billentyűzet és az egér a legfontosabb interfészek. Ráadásul a hangfelismerés még távolról sem tökéletes: nemcsak zajos környezet­ben, de ideális körülmények között is adódnak problémák. A gépek egyszerűen képtelenek megkülönböztetni az emberi beszéd finom árnyalatait. Csendben talán nem, de taxiban, vasútállomáson könnyen elvétik a majdnem azonos kiejtésű, viszont teljesen más jelentésű szavakat (például a “bókot” és a “pókot”, stb.). Ritkábban té­vednének, ha a beszélőt hallanák és lámák is, azaz tudnának szájról olvasni. Az IBM Thomas J. Watson Kutatóköz­pontjában (Yorktown Heights, New York állam) dolgozó Chalapathy Neti már négy éve fejleszt audiovi­zuális beszédfelismerő technológiá­kat. Az emberre hivatkozik ő is: “az auditív és a vizuális ér­zékelést egyesítve döntünk az elmondottakról.” Szimul­tán használjuk fülünket és szemünket. A komputerek szintén megtaníthatok ugyanerre a feladatra - fűzi hozzá. A folyamat elején a számítógép és a ka­mera bőrszínhez hasonló szí­nű pixeleket keres, majd sta­tisztikai modellek segítségével választja ki az archoz hasonló formákat, lokalizálja a beszé­lőt. A látásért felelős algorit­musok nemcsak a szájra, ha­nem annak környékére is össz­pontosítanak. Becsléseket vé­geznek a különböző jegyek - például az ajkak központja, sarkaik - elhelyezkedéséről. Ha a kamera csak a szájat nézné, mindössze tizenkettő­­tizennégy hangot ismerne fel vizuálisan. Ezért tágították látómezejét, ami azt eredményezte, hogy többfajta mozgást érzékel: az állka­pocsét, az alsó orcáét, a nyelvét, valamint a fogak helyzetét is. Végül egyesítik a vizuális és az audiomintákat. Az egyesített anyagot (új­fent) statisztikai mo­dellek elemzik, s meg­határozzák, mit mon­dott a beszélő. Neti és társai többször, el­térő körülmé­nyek között - csendben, gyen­ge és erős háttérzajjal - tesztel­ték a rendszert. Sokkal jobb Mágnessel az érékeiéért Október 2. A pulzáló mágneses mezővel végzett stimulációs terápia csökkenteni képes számos pácieas erekciós zavarait. A kezelés a vegetatív idegrendszerre hat és javítja a szervek oxigénellátását, közölte Wolfgang Greul, Bad Füssing klinikájának főorvosa. A német Bundeswehr müncheni klinikáján kimutatták, hogy az erekciós zavarokban szenve­dők 80 százaléka kezelhető ezzel az eljárással. Becslések szerint Németországban mintegy 4,5 millió férfi szenved erekciós zavarokban, a 40 és 70 év közötti férfiak kö­zül csaknem minden második. Organikus eredetű impotencia esetén az. előidéző többnyire a nemi szerv vérellátási zavara, állapította meg Greul. A cukorbaj, a magas vérnyomás, a magas koleszterinszínt, valamint az erős dohányzás és sok szeszesital fo­gyasztása számos esetben erekciós zavarokat idézhet elő. .Akadályozhatja az erekciót a tesztoszteron hiánya és hasonló mellékhatása lehet bizonyos depresszióellenes gyógyszereknek is. Greul sze­m v* w ■’■"T rint a pulzáló mágneses rezo­nancia összességében élénkíti az anyagcserét és elősegíti az egész test lényegesen jobb vérellátását. A szóban forgó terápiánál mágneses mezőt alkalmaznak, amelynek pul­­zálását a páciens szívritmusa határozza meg. A véráramlás javulása vizsgálattal kimutat­ható, idézte az AP jelentése Greul főorvost. eredményeket kaptak, mint a csak audiokísérletek során. A zajon kívül egyéb zavaró, a laborató­riumok falain kívül mindennapos ténye­zőkkel is számolnak: a beszélő nem néz a kamerába, elfordítja a fejét, rosszak a látási viszonyok. Ezek ellensúlyozására fejleszte­nek egy audiovizuális headsetet, apró ka­merával a mikrofonon. A kamera, függet­lenül a fej és a test mozgásától, állandóan látná a szájat. Kiegészítésként, jelenleg a száj környékének állandó infravörös meg­világítást biztosító pirinyó szerkezettel kí­sérleteznek. A másik megoldás a látá­si feltételeket vizsgáló visz­­szacsatoló rendszer lenne. A megbízhatósági szint alap­ján döntené el, hogy hasz­nálható-e a vizuális infor­máció: ha magas a szint, ak­kor igen, ha alacsony - pél­dául amikor a beszélő elfor­dítja a fejét -, akkor nem. Az Intelnél a beszédet audiovizuális alapon elemző szoftvert fejlesztettek, s teszteltek kínaiul és angolul egyaránt. Biztatóak a zajos közegben szüle­tett eredmények: a rendszer öt szóból né­gyet felismert. Hang és kép fúziójára, a beszéd vizualizálására tett kí­sérlet az Egyesült Államok negyedik leggyakrabban használt nyelvét, a süke­­tek/süketnémák kommuni­kációját biztosító, francia ere­detű (!) ASL-re (American Sign Language) vonatkozó fejlesztés is. A chicagói DePaul Egyetemhez tartozó Számítógép-tudományi, Te­lekommunikáció és Informá­ciós Rendszerek Iskolájában Rosalee Wolfe irányításával az elmondott szöveget automatikusan ASL nyelvre for­dító rendszeren dolgoznak. Az ASL legalább annyira különbözik az angoltól, mint bármely más beszélt nyelv. Önálló mondattannal, jelentéstannal ren­delkezik. Egységeket képező jegyek, úgy­nevezett cherémák (cheremes, görögül: kéz) különböztetik meg egymástól a jele­ket: a kézmozgás, a kéz formája (egyenes, kicsavart), a fej orientációja, a nem-manuá­lis elemek (például az arckifejezések) az ala­pok. A beszéd e jegyek különböző kombi­nációjából épül fel. Egy-egy jel egész mon­datot, vág)' csak egy szót fejez ki. A fordítóprogram a verbális kommuni­kációt animált vizuális információvá ala­kítja. Az inputot egy ASL-szekvenciákat generáló mesterséges közvetítő nyelvre, interlinguára konvertálja. Ezután, a kerémák és más elemek felhasználásával dolgozza ki a vizuális jeleket, melyeket Paula, egy animált figura tolmácsol élet­hűen a nézőnek. A megértést könnyíten­dő, Paula kezét és fejét szokatlanul nagy­ra tervezték. Wolfe és munkatársai eredetileg csak re­pülőtéri biztonsági alkalmazásra gondol­tak, később viszont már szélesebb körben (oktatásban, kereskedelemben, egészség­ügyben) használható eszköz kivitelezését jelölték meg célként. Mellékprojektként a repülőtéri munka gördülékenységét, illet­ve a süketek/süketnémák biztonságérzetét fokozó modulokat terveznek. Röviden Rákkeltő anyagok miatt PERELIK AZ IBM-ET Szeptember 29. A világ legnagyobb számí­tástechnikai konszernjét amerikai sajtóérte­sülések szerint rákkeltő vegyi anyagok alkal­mazása miatt citálták bíróság elé. Négy egy­kori munkatárs ügyvédei azt róják fel a válla­latnak, hogy tudatosan tette ki az alkalmazot­tait rákkeltő anyagok hatásának. A négy munkatárs egyike még 1991-ben, 36 éves ko­rában rákban hunyt el. Az IBM adatokat gyűjtött több mint 30 ezer néhai alkalmazott­ja halálának okairól, és eközben ijesztően ma­gas volt a rákos megbetegedések aránya, állít­ják a felperesek. A vállalat visszautasítja a vá­dakat, és a beadvány elutasítását kérte a bíró­ságtól. A per egyébként egyike a volt alkal­mazottak által az IBM ellen indított 250 eljá­rásnak. Szakértők arra emlékeztetnek, hogy az ügy; kimenetele hatással lehet a teljes infor­matikai és chipgvártó ágazatra. Fél év házi őrizet a Hulk-kalóznak Október 1. New Yorkban hat hónap házi őrizetre és három év felfüggesztett börtön­re ítéltek egv férfit, amiért a Hulk című fil­met engedély nélküli másolat formájában kitette az internetre. A 24 éves Kerry Gonzales ezen kívül 2000 dollár pénzbün­tetést illetve 5000 dollár kártérítést is köte­les fizetni az Universal filmstúdiónak. Amerikai sajtóértesülések szerint Gonzales a film félkész változatát egy barátjától kap­ta meg. A digitalizált változat a hivatalos bemutató előtt két héttel online elérhetővé vált. Az eset azért keltett nagy feltűnést, mert rendszerint csak a bemutatásuk után jutnak ki a filmek az internetre. Online vásárlók számára KERESŐT FEJLESZT AZ AMAZON Október 1. Az Amazon internetes könyváru­ház internetes bevásárlásra használható kere­sőt fejleszt. Az alkalmazás célja, hogy az internetes felhasználók számára egyszerűbbé váljon a termékek összehasonlítása. Még nem ismert, hogy mikorra várható az ideiglenesen A9 név alatt emlegetett kereső beindítása. Az Amazon ezzel a lépéssel a keresőoldalak pia­cáért folyó versenybe száll be. A terület leg­fontosabb szereplője a Google és a Yahoo. Nemzetbiztonsági kockázatot jelent a Microsoft? Szeptember 28. .Amerikai számítógépbizton­sági szakértők szerdán nyilvánosságra hozott jelentése szerint a széles körben elterjedt Microsoft-szoftverek veszélyeztetik az Egye­sült Államok és más országok céges és állami hálózatainak biztonságát. Ä Microsoft operá­ciós rendszerei és szoftverei a vírusirtók és hackerek első számú célpontjai. A monokul­túra megszüntetése a valódi cél" - erre a vég­következtetésre jutott az amerikai számítás­­technikai ipar szereplőit tömörítő CC1A wa­shingtoni éves közgyűlésén szerdán ismerte­tett vitairat. A Cyberinsecurity: The Cost of Monopoly (rossz informatikai biztonság: a monopólium ára) címet viselő irat szerzői a Microsoftot nevezik meg a vírusírók fő cél­pontjaként. A CCIA nem - meglepő módon - a Microsoft konkurenseit tömöríti. Az irat szerzői ugyanakkor független szakértők, akik utalnak arra. hogy a Microsoft szoftvereinek bonyolultsága jelentősen növeli azok sebez­hetőségét.

Next

/
Thumbnails
Contents