diplomová práce

Diferenciální analýza typů mírné kognitivní poruchy pomocí akustických a lingvistických biomarkerů

Text práce 2.59 MB Příloha 11.98 MB

Autor práce: Bc. Petr Dvořák

Ak. rok: 2025/2026

Vedoucí: prof. Ing. Jiří Mekyska, Ph.D.

Oponent: Ing. Kryštof Novotný

Abstrakt:

Mírná kognitivní porucha (MCI) představuje klinický stav charakterizovaný kognitivním poklesem přesahujícím běžné stárnutí, který však ještě nedosahuje úrovně demence. U části pacientů může být prodromálním stadiem neurodegenerativního onemocnění. Jelikož dochází ke změnám v řeči již v raných stádiích MCI, je možné tyto změny sledovat a neinvazivně tak odhalovat vývoj poruchy. Motivací práce je prozkoumat možnosti akustické a lingvistické analýzy pro diferenciaci různých typů mírné kognitivní poruchy. Cílem práce je identifikovat klíčové rozdíly v řečových a jazykových projevech u zdravých osob, pacientů s amnestickou MCI, MCI s Lewyho tělísky a pacientů s Parkinsonovou nemocí s MCI. V rámci analýzy byla použita databáze obsahující nahrávky spontánní řeči a čtení textu zdravých jedinců i pacientů diagnostikovaných s MCI. Z nahrávek byly extrahovány akustické a lingvistické parametry, které byly následně využity ve statistické a klasifikační analýze. Analýza ukázala odlišnosti mezi jednotlivými zdravými i poruchou postiženými pacienty, a to jak  v akustických vlastnostech, tak i v lingvistické tvorbě řeči. Součástí klasifikační části bylo testování modelů strojového učení založených na ručně vybraných biomarkerech, příznacích vybraných pomocí statistického testu a jejich rozšíření o audio a textové embeddingy. Výsledky ukázaly, že mezi nejvýznamnější řečové biomarkery patřily zejména parametry související s pauzami v řeči. Některé biomarkery vykazovaly signifikantní vztah ke klinickým škálám a kovariátům, což naznačuje možnou souvislost s klinickým stavem osob. Klasifikační analýza ukázala, že nejlepších výsledků bylo dosaženo zejména při diagnostice PD-MCI, zatímco rozlišení ostatních skupin bylo méně spolehlivé. Kombinace akustických, lingvistických a embeddingových příznaků poskytla určitý diskriminační potenciál, avšak výsledky nebyly dostatečně robustní pro spolehlivou automatickou diferenciaci. Práce tak poukazuje na potenciál řečových biomarkerů při analýze MCI a na potřebu větších a vyváženějších datových souborů.

Klíčová slova:

Mírná kognitivní porucha, amnestická mírná kognitivní porucha, mírná kognitivní porucha s Lewyho tělísky, Alzheimerova nemoc, Parkinsonova nemoc, analýza řeči, akustická analýza, lingvistická analýza, akustické biomarkery, lingvistické biomarkery, embedding, zpracování přirozeného jazyka, spontánní řeč, řečové biomarkery, statistická analýza, klinické škály, strojové učení, klasifikační analýza.

Termín obhajoby

11.06.2026

Výsledek obhajoby

obhájeno (práce byla úspěšně obhájena)

znamkaCznamka

Klasifikace

C

Průběh obhajoby

Student prezentoval výsledky své práce a komise byla seznámena s posudky. Otázky oponenta a komise: Můžete podrobně popsat, jaké akustické embeddingy byly v práci použity, z jakých modelů byly získány a jak byly dále zpracovány před vstupem do klasifikační analýzy? Jakým způsobem byl získán počet slabik pro výpočet parametru NSR? Jak byla provedena segmentace řeči pro určení parametrů týkajících se pauz? Co je to MCC? Co je to korelace? Student obhájil diplomovou práci s výhradami a odpověděl na otázky členů komise a oponenta.

Jazyk práce

čeština

Fakulta

Ústav

Studijní program

Audio inženýrství (MPC-AUD)

Specializace

Zvuková produkce a nahrávání (AUDM-ZVUK)

Složení komise

PhDr. Aleš Dvořák (člen)
prof. Ing. Jiří Mekyska, Ph.D. (předseda)
doc. Ing. MgA. Mgr. Dan Dlouhý, Ph.D. (místopředseda)
Ing. Miroslav Balík, Ph.D. (člen)
Ing. Michal Švento (člen)

Diplomová práce se zabývá diferenciální analýzou typů mírné kognitivní poruchy pomocí akustických a lingvistických biomarkerů. Práce poskytuje zajímavé výsledky, zejména v oblasti identifikace řečových parametrů souvisejících s pauzami v řeči a jejich možného vztahu ke klinickým škálám, současně však ukazuje, že automatická diferenciace jednotlivých skupin pacientů zatím není dostatečně robustní. Prezentační úroveň technické zprávy je dobrá a rozsah práce odpovídá řešenému tématu, nicméně některé části mohly být zpracovány úsporněji a s větší interpretační hloubkou. Formální úprava a jazyková úroveň jsou celkově přijatelné. Student pracoval s relevantní odbornou literaturou a výsledky zasadil do kontextu současného poznání. Využitelnost výsledků spatřuji především v jejich návaznosti na další výzkum řečových biomarkerů u mírné kognitivní poruchy a neurodegenerativních onemocnění. Student nebyl příliš aktivní a výsledky konzultoval až ke konci semestru, nicméně výsledná práce splnila stanovené cíle a představuje solidní odborný výstup. Výsledný počet bodů navržený vedoucím: 85

Známka navržená vedoucím: B

Soubor vložený vedoucím Velikost
Posudek vedoucího práce [.pdf] 114,22 kB

Posudek oponenta
Ing. Kryštof Novotný

Student ve své práci analyzoval rozdíly v řeči a jazyce mezi zdravými kontrolami a pacienty s různými typy mírné kognitivní poruchy. To obnášelo nastudování problematiky, extrakci akustických a lingvistických parametrů, provedení explorativní analýzy a následné využití vybraných příznaků v klasifikačních experimentech. Zadání práce tak bylo rámcově naplněno.

Pozitivně hodnotím zahrnutí statistické i klasifikační části a snahu kombinovat akustické, lingvistické a embeddingové deskriptory. Zároveň však práce vykazuje výrazné metodické a prezentační nedostatky. Chybí teoretický úvod k analyzované skupině PD-MCI, přestože je tato skupina součástí zpracovávaného datasetu. Nedostatečně je popsán také postup získání některých parametrů, například NSR, kde není jasné, jak byl určen počet slabik, nebo metrik popisujících pauzy, kde není dostatečně vysvětlen způsob segmentace řeči. Práce dále zmiňuje využití akustických a textových embeddingů, ale jejich extrakce, zpracování a zapojení do analýz nejsou popsány v potřebné míře. Nejasné zůstávají také některé lingvistické ukazatele.

Dokument je místy výrazně nekonzistentní. Objevuje se nejednotné zavádění a používání zkratek, různé způsoby označování parametrů, anglické výrazy bez českých ekvivalentů a rozdílná terminologie pro podobné veličiny (variační koeficient vs. relativní směrodatná odchylka). Některé části práce uvádějí odlišné sady parametrů či modelů, takže úvodní teoretické části, metodika a implementace nepůsobí zcela provázaně. V textu se také objevují faktické nepřesnosti (například u popisu souřadicích spojení a jejich charakteristických spojek) a řada informací se opakuje.

Formální stránka dále snižuje celkový dojem. Sudé a liché strany mají odlišné okraje/zarovnání sazby, citace více zdrojů jsou často uváděny odděleně a grafy jsou opakovaně v rastrové podobě tam, kde by bylo vhodnější použít grafiku vektorovou. Text je místy rozvleklý, obsahuje obecné pasáže, které nejsou dále využity v metodice, a zároveň naopak chybí podrobnější vysvětlení klíčových implementačních kroků. Přestože je struktura práce obecně srozumitelná, celkově dokument působí nejednotně a nedotaženě. Otázky k obhajobě:
  1. Můžete podrobně popsat, jaké akustické embeddingy byly v práci použity, z jakých modelů byly získány a jak byly dále zpracovány před vstupem do klasifikační analýzy?
  2. Jakým způsobem byl získán počet slabik pro výpočet parametru NSR?
  3. Jak byla provedena segmentace řeči pro určení parametrů týkajících se pauz?
Výsledný počet bodů navržený oponentem: 70

Známka navržená oponentem: C

Odpovědnost: Mgr. et Mgr. Hana Odstrčilová