Világszerte egyedülálló beszédfelismerő rendszert fejlesztettek

A Nextent Informatika Zrt. által vezetett konzorcium a Széchenyi 2020 „K+F versenyképességi és kiválósági együttműködések” (GINOP 2.2.1) című felhívásra 2017-ben benyújtott pályázatával 607,63 millió forint vissza nem térítendő európai uniós támogatásban részesült. A kutatás-fejlesztési projekt célja a magyar call centerek számára készült hangbányászati rendszer nemzetköziesítése volt, intonált kifejezések azonosítására alkalmas technológia kifejlesztésével. A megvalósításban részt vett az Xdroid Kft., a SCI-Hálózat Zrt., és a Szegedi Tudományegyetem is.

A négy fős konzorcium 2021. március 31-én sikeresen lezárta a „Voxindex” nevű projektjét, mely keretében egy olyan, intonált kifejezések valós idejű azonosítására alkalmas nyelvfüggetlen, telefonos közegben működő, minta alapú beszédfelismerő rendszert fejlesztettek ki, mely a világ vezető beszédfelismerő technológiáitól eltérően alkalmas egy-egy új nyelven való azonnali alkalmazásra, és egyúttal képes kezelni az egyes emberek eltérő intonációjából adódó különbségeket.

 

A nemzetközi versenytársak jelenleg szinte kizárólag nyelvfüggő beszédfelismerő technológiákat használnak és legfeljebb a piacaik szerinti legfontosabb 10-15 nyelvet fedik le, amely a Föld populációjának - beszélt nyelv szerint - csak a 20-25%-át teszi ki. Ezek a megoldások nem képesek megbirkózni a speciális kiejtéssel, a ritka kifejezésekkel, a rosszabb beszédminőséggel, valamint telefonos közegben a jóval alacsonyabb hangminőség miatt nem működnek.

 

A fejlesztés eredményeként így a kettős célt - a gyors nyelvi bővítést és a rosszul intonált beszéd felismerésének problematikáját - egyszerre sikerült megoldani. A rendszer különbséget tud tenni azonos tartalmú, de különböző intonációjú kifejezések között, például megkülönböztetni egy dühös ügyfél elköszönését egy elégedett ügyfél elköszönésétől, vagy az éneklést a szavalástól, a suttogó beszédet a kiabálástól. A nyelvterületi célcsoportok mellett fontos értékesítési célt képeznek az idős, panaszokkal küzdő emberek felügyeletét ellátó úgynevezett care centerek diszpécser szolgálatai is. Ezen emberek hangját a beszédfelismerő rendszerek nehezen ismerik fel, hiszen állapottól függő intonációs és akusztikus kilengések övezik a beszédüket. Itt jön elő a minta alapú rendszer előnye, azaz, hogy hangminta alapon lehet benne keresni.

 

Az innovációs eredményeket egy, az adott terület országosan és világszinten is elismert kutatóiból álló szakmai csapat együttműködése biztosította. A több mint 20 fős kutató csapatban találhatóak mesterséges intelligencia, beszédtechnológiai szakértők, nyelvészek, fonológusok, és termékfejlesztési szakemberek is. A projekt az alábbi telephelyeken valósult meg: a Nextent kutató-fejlesztő laboratóriumaként működő miskolci telephelyén, a SCI-Hálózat jobbágyi fióktelepén, az Xdroid szegedi kutatási központjában, illetve az SZTE Bölcsészettudományi Karán.

 
 
 

Kapcsolódó cikkek

 

Belépés

 

 

Regisztráció