Přístupnostní navigace
Přejít k obsahu
|
Přejít k hlavnímu menu
VUT
Menu
Život na VUT
Submenu
Atmosféra VUT
Prostory školy
Koleje
Stravování
Sport na VUT
Studentský život
Brno
Pro uchazeče
Submenu
Proč na VUT
Studijní programy
Dny otevřených dveří
Aktivity pro juniory
Celoživotní vzdělávání
Zpracování osobních údajů uchazečů o studium
E-přihláška
Pro studenty
Submenu
Studium
Předměty
Studijní programy
Harmonogram akademického roku
Závěrečné práce
Celouniverzitní doktorská škola
Legislativa a předpisy
Studijní předpisy
Poplatky za studium
Zpracování osobních údajů studentů
Zahraničí
Studium a stáže v zahraničí
Uznání zahraničního vzdělání
Podpora při studiu
Stipendia
Knihovny
(externí odkaz)
Doktorský příjem
Sociální bezpečí
Studium bez bariér
Podpora podnikání
Věda a výzkum
Submenu
Věda a výzkum na VUT
Podpora excelence
Mezinárodní vědecká rada
Systém zajišťování kvality výzkumu
Výzkumné infrastruktury
Transfer znalostí
Open Science
Projekty
Projekty ze strukturálních fondů
Specifický výzkum
Spolupráce
Submenu
Firemní spolupráce
Zahraniční spolupráce
Spolupráce se školami
Služby univerzity
Mezinárodní dohody
Univerzitní sítě
O univerzitě
Submenu
O univerzitě
Profil univerzity
Udržitelná univerzita
Podnikavá univerzita / ContriBUTe
Bezpečná univerzita
Vyznamenání
Organizační struktura
Legislativní a úřední záležitosti
Úřední deska
Ochrana osobních údajů
Kariéra a pracovní prostředí
Pracovní příležitosti
(externí odkaz)
Rovné příležitosti
Sociální bezpečí
HR Award
Ostatní
Kontakty
Pro média
Absolventi
(externí odkaz)
Fakulty a vysokoškolské ústavy
Fakulta stavební
Fakulta strojního inženýrství
Fakulta elektrotechniky a komunikačních technologií
Fakulta architektury
Fakulta chemická
Fakulta podnikatelská
Fakulta výtvarných umění
Fakulta informačních technologií
Ústav soudního inženýrství
Centrum sportovních aktivit
Středoevropský technologický institut (CEITEC VUT)
Součásti
Centrum informačních služeb
Centrum vzdělávání a poradenství
Koleje a menzy
Nakladatelství VUTIUM
Ústřední knihovna
České polovodičové centrum
Rektorát
EN
Přihlásit se
Přihlásit se
Web VUT
Intraportál
Studis
Teacher
Vavis
Elearning
Hledat
EN
Vyhledávání
Vyhledat
Zavřít
VUT
Udržitelnost
Co děláme
Lidé
Oceněný student ze soutěže Brno Ph.D. Talent chce překročit hranice neurálních konverzačních systémů
Udržitelná univerzita
Úvod
Co děláme
Udržitelná univerzita
Inspirujeme
Kontakty
Oceněný student ze soutěže Brno Ph.D. Talent chce překročit hranice neurálních konverzačních systémů
Holistické modelování dialogu s využitím voicebota, který dokáže komunikovat s uživatelem v krizových situacích – to má umožnit výzkum Alexandra Poloka z FIT VUT. Doktorand působí ve skupině pro zpracování řeči
BUTspeech@FIT
a jeho ambiciózní projekt získal ocenění i v patnáctém ročníku soutěže Brno Ph.D. Talent. Zaměřit se chce na zlepšení modelování přirozených a kontextuálních procesů při používání neurálních konverzačních systémů.
Alexandra Poloka k výzkumu motivují omezení aktuálně rozšířených konverzačních systémů, které mají komponentně sestavenou architekturu. Systémy si vedou poměrně dobře v interakcích založených na jednoduchých úkolech, selhávají však v situacích, kdy mají využít delší kontext konverzace a poskytnout přirozený zážitek z dialogu.
Ve výzkumu se proto Polok chce zaměřit na efektivní trénování modelů pro rozpoznání řeči, konverzační jazykové modelování a syntézu řeči. Cílem je integrovat tyto modely do jednoho celku. Sníží se tak informační ztráta při interakci mezi modely, zmenší se velikost výsledného modelu a zkrátí se celková reakční doba. Vzniknout by tak mohl konverzační systém, který najde využití například v
projektu využívajícím voicebota
pro příjem tísňových volání na linky 150 a 112.
„Snažíme se vyvinout agenta, který dokáže s uživateli komunikovat v případě rozsáhlé katastrofy. Tísňové telefonní linky by v takové krizové situaci byly přetížené, proto chceme vyvinout podpůrný systém k plošnému nasazení. Dokázal by nejen informovat uživatele, ale odpovídat mu také na otázky a současně zpracovávat jeho odpovědi,“ vysvětluje Polok.
Projekt, se kterým doktorand uspěl i v soutěži Brno Ph.D. Talent, je aktuálně rozdělený na 3 fáze. „První je automatické rozpoznávání řeči, kdy potřebujeme mluvenou řeč dostat do podoby psaného textu. Následuje spojení automatického rozpoznávače řeči s jazykovým modelem, abychom dokázali odpovídat a generovat odpovědi na to, co uživatel říká. Třetím krokem je pak přidání syntetizátoru řeči,“ popisuje Polok.
„Řeč je velmi bohatá, a pokud ji převedeme na text, nutně přijdeme o nějakou informaci – ať už melodii řeči či emoční tonalitu. Já se zaměřuji na to, jak tuto informaci neztratit, ale rovnou ji integrovat do jazykového modelu a syntetyzátoru řeči. Výsledkem by tak měla být méně monotónní syntetická řeč,“ dodává.
„Informace v konverzačním systému proplouvají mezi automatickým rozpoznávačem řeči a jazykovým modelem – to je moment, kdy dochází ke ztrátě informace. Přecházíme z informačně bohaté řeči obsahující desítky tisíc bitů za sekundu na text, které obsahuje stovky bitů za sekundu. Já vezmu automatický rozpoznávač řeči, odstraním z něj dekodér, který produkuje text, a ponechám jenom část modelující vstupní signál. Ta je následně transformována tak, aby ležela v prostoru blízko reprezentacím, na kterých byl původně učen jazykový model. Celý systém je následně dotrénován. Informace je tedy předána jazykovému modelu v podobě velké matice čísel a tu model dále zpracuje zase do podoby čísel,“ popisuje práci s neuronovými sítěmi doktorand. Nedochází tak k významné kompresi informace, jako se to děje u standardních komponentně založených systémů. Emoční složka řeči je pak ve výsledku stále zachována.
Výzkum se právě nachází v první fázi. Voicebot připravený pro aplikaci na tísňové linky by měl být hotov do konce roku 2026.
(mar)
Publikováno
13.05.2024 08:30
Odkaz
https://www.vut.cz/udrzitelnost/co-delame/f38102/d256947
Fakulta informačních technologií
studenti
studentská soutěž
Brno Ph.D. talent
Odpovědnost:
Bc. Tereza Kučerová
Nahoru