Egy új fejlesztés lehetővé teszi, hogy a beszédzavarral élő emberek a monoton géphang helyett egyedi és testreszabott beszédhangok segítségével kommunikálhassanak.

Életminőség-javító, akadálymentesítő innovációval rukkolt elő az okostelefonokat és egyéb intelligens eszközöket gyártó Xiaomi. A cég mesterséges intelligencia (AI) laboratóriumában létrehozott, fejlett algoritmusokra és saját fejlesztésű beszédtechnológiára épülő alkalmazásban a szöveget beszédhanggá alakítani képes Text-To-Speech technológiát használják, amivel egyedi és testreszabott hangot lehet generálni a beszédzavarral élők számára. A projektet előkészítő csapatnak van egy beszédzavarral élő tagja is, hogy minél pontosabban megértsék a célcsoport szükségleteit.
Az érintett felhasználók a jövőben már a „saját hangjukat” használva, nem pedig géphangon kommunikálhatnak másokkal. Ez a kezdeményezés a Xiaomi „Own My Voice” projektjét előkészítő kutatásainak és a „Tech for Good” kampányának a része. Utóbbi célja, hogy az innovatív technológia segítségével mindannyiunk élete jobb legyen.
„Adományozott hangokra” alapozhattak a fejlesztésnél
A legmegfelelőbb és a legjobban személyre szabott tónusok létrehozatala érdekében a projektcsapat több mint 200, a cégnél dolgozó önkéntest kért fel arra, hogy kölcsönözze a hangját a kezdeményezéshez.
Egy hanglenyomat-megfeleltető algoritmus segítségével vetették össze az önkéntesek által adományozott hangokat az adott felhasználó hangjának jellemzőivel. Így találták meg azt a legmegfelelőbb hangszínt, ami referencia lehet a felhasználó számára.
A személyre szabás érdekében a kiválasztott hangot úgy módosították, hogy abból egy új és eredeti, a befogadó hangszínéhez közelítő tónus keletkezzen. Ezután az élőbeszédhez hasonló stílusú, a szöveget beszédhanggá alakítani képes Text-to-Speech technológiát hívták segítségül a mesterségesintelligencia-modell betanításához is, hogy az így létrehozott beszédnek emberi érzelmek kifejezésére is alkalmas természetes ritmusa és intonációja legyen.