Přístupnostní navigace
E-přihláška
Vyhledávání Vyhledat Zavřít
diplomová práce
Autor práce: Bc. Josef Macek
Ak. rok: 2025/2026
Vedoucí: Ing. Daniel Kováč, Ph.D.
Oponent: Ing. Richard Ladislav
Cílem této diplomové práce je ověřit využitelnost interpretovatelných řečových biomarkerů a hlubokých řečových reprezentací pro automatickou klasifikaci osob s Parkinsonovou nemocí a zdravých kontrol. Práce vychází z předpokladu, že Parkinsonova nemoc ovlivňuje řečovou produkci, zejména v souvislosti s hypokinetickou dysartrií, a že tyto změny lze zachytit pomocí akustických a hlubokých řečových příznaků. Experimentální část je založena na databázi spontánních monologů. Využity jsou upravené interpretovatelné řečové biomarkery a x-vektorové reprezentace extrahované pomocí předtrénovaného modelu ECAPA-TDNN. Pro klasifikaci byly navrženy a porovnány tři způsoby kombinace obou typů příznaků: pozdní fúze, časná fúze a hybridní fúze. Biomarkerové modely a modely časné a hybridní fúze využívají algoritmus XGBoost s laděním hyperparametrů pomocí Optuny, zatímco x-vektorová větev a meta-model pozdní fúze jsou založeny na logistické regresi. Finální vyhodnocení bylo provedeno metodou vynechání jednoho vzorku. Dosažené výsledky ukazují, že x-vektorové reprezentace poskytují výraznější diskriminační informaci než samostatné interpretovatelné biomarkery. Samostatný x-vektorový model založený na logistické regresi dosáhl přesnosti 0,7519 a hodnoty AUC 0,8045, zatímco biomarkerový model s algoritmem XGBoost dosáhl přesnosti 0,6589 a hodnoty AUC 0,6878. Fúzní přístupy umožnily propojit výkonnost hlubokých reprezentací s informací obsaženou v interpretovatelných biomarkerech, jejich přínos však závisel na konkrétním způsobu kombinace příznaků. Z fúzních přístupů byla nejúspěšnější hybridní fúze, která dosáhla přesnosti 0,7597 a hodnoty AUC 0,8117. Výsledky potvrzují potenciál automatické analýzy řeči pro hodnocení řečových projevů Parkinsonovy nemoci, zároveň je však nutné interpretovat je s ohledem na omezenou velikost datového souboru, použitý validační protokol a možný vliv individuálních rozdílů mezi mluvčími.
ECAPA-TDNN, fúze příznaků, hypokinetická dysartrie, Optuna, Parkinsonova nemoc, řečový biomarker, XGBoost, x-vektor
Termín obhajoby
11.06.2026
Výsledek obhajoby
obhájeno (práce byla úspěšně obhájena)
Klasifikace
A
Průběh obhajoby
Student prezentoval výsledky své práce a komise byla seznámena s posudky. Student obhájil diplomovou práci a odpověděl na otázky členů komise a oponenta. Otázky oponenta: Čím si vysvětlujete zlepšení výsledků při využití principu hybridní fúze v porovnání s principy časné a pozdní fúze?
Jazyk práce
čeština
Fakulta
Fakulta elektrotechniky a komunikačních technologií
Ústav
Ústav telekomunikací
Studijní program
Audio inženýrství (MPC-AUD)
Specializace
Zvuková produkce a nahrávání (AUDM-ZVUK)
Složení komise
prof. Ing. Zdeněk Smékal, CSc. (předseda) Ing.MgA. Edgar Mojdl, Ph.D. (místopředseda) Dr. Ing. Libor Husník (člen) Ing. Václav Mach, Ph.D. (člen) Ing. Matěj Ištvánek, Ph.D. (člen)
Posudek vedoucíhoIng. Daniel Kováč, Ph.D.
Známka navržená vedoucím: A
Posudek oponentaIng. Richard Ladislav
Známka navržená oponentem: A
Odpovědnost: Mgr. et Mgr. Hana Odstrčilová