Master's Thesis

Differential analysis of mild cognitive impairment types using acoustic and linguistic biomarkers

Final Thesis 2.59 MB Appendix 11.98 MB

Author of thesis: Bc. Petr Dvořák

Acad. year: 2025/2026

Supervisor: prof. Ing. Jiří Mekyska, Ph.D.

Reviewer: Ing. Kryštof Novotný

Abstract:

Mild cognitive impairment (MCI) is a clinical condition characterized by cognitive decline exceeding normal aging, while not yet reaching the level of dementia. In some patients, it may represent a prodromal stage of a neurodegenerative disease. Since speech changes can occur already in the early stages of MCI, these changes can be monitored and used for non-invasive detection of disorder progression. The motivation of this thesis is to explore the possibilities of acoustic and linguistic analysis for differentiating between different types of mild cognitive impairment. The aim of the thesis is to identify key differences in speech and language manifestations among healthy individuals, patients with amnestic MCI, patients with MCI with Lewy bodies, and patients with Parkinson’s disease with MCI. The analysis used a database containing recordings of spontaneous speech and text reading from healthy individuals and patients diagnosed with MCI. Acoustic and linguistic parameters were extracted from the recordings and subsequently used in statistical and classification analyses. The analysis revealed differences between healthy individuals and patients affected by cognitive impairment, both in acoustic properties and in linguistic aspects of speech production. The classification part included testing machine learning models based on manually selected biomarkers, features selected using statistical testing, and their extension with audio and text embeddings. The results showed that the most important speech biomarkers included mainly parameters related to pauses in speech. Some biomarkers showed a significant relationship with clinical scales and covariates, suggesting a possible association with the clinical condition of the subjects. The classification analysis showed that the best results were achieved mainly in the diagnosis of PD-MCI, while the differentiation of the other groups was less reliable. The combination of acoustic, linguistic, and embedding-based features provided some discriminatory potential; however, the results were not robust enough for reliable automatic differentiation. The thesis therefore highlights the potential of speech biomarkers in the analysis of MCI and the need for larger and more balanced datasets.

Keywords:

Mild cognitive impairment, amnestic mild cognitive impairment, mild cognitive impairment with Lewy bodies, Alzheimer's disease, Parkinson's disease, speech analysis, acoustic analysis, linguistic analysis, acoustic biomarkers, linguistic biomarkers, embedding, natural language processing, spontaneous speech, speech biomarkers, statistical analysis, clinical scores, machine learning, classification analysis.

Date of defence

11.06.2026

Result of the defence

Defended (thesis was successfully defended)

znamkaCznamka

Grading

C

Process of defence

Student prezentoval výsledky své práce a komise byla seznámena s posudky. Otázky oponenta a komise: Můžete podrobně popsat, jaké akustické embeddingy byly v práci použity, z jakých modelů byly získány a jak byly dále zpracovány před vstupem do klasifikační analýzy? Jakým způsobem byl získán počet slabik pro výpočet parametru NSR? Jak byla provedena segmentace řeči pro určení parametrů týkajících se pauz? Co je to MCC? Co je to korelace? Student obhájil diplomovou práci s výhradami a odpověděl na otázky členů komise a oponenta.

Language of thesis

Czech

Faculty

Department

Study programme

Audio Engineering (MPC-AUD)

Specialization

Audio Production and Recording (AUDM-ZVUK)

Composition of Committee

PhDr. Aleš Dvořák (člen)
prof. Ing. Jiří Mekyska, Ph.D. (předseda)
doc. Ing. MgA. Mgr. Dan Dlouhý, Ph.D. (místopředseda)
Ing. Miroslav Balík, Ph.D. (člen)
Ing. Michal Švento (člen)

Supervisor’s report
prof. Ing. Jiří Mekyska, Ph.D.

Diplomová práce se zabývá diferenciální analýzou typů mírné kognitivní poruchy pomocí akustických a lingvistických biomarkerů. Práce poskytuje zajímavé výsledky, zejména v oblasti identifikace řečových parametrů souvisejících s pauzami v řeči a jejich možného vztahu ke klinickým škálám, současně však ukazuje, že automatická diferenciace jednotlivých skupin pacientů zatím není dostatečně robustní. Prezentační úroveň technické zprávy je dobrá a rozsah práce odpovídá řešenému tématu, nicméně některé části mohly být zpracovány úsporněji a s větší interpretační hloubkou. Formální úprava a jazyková úroveň jsou celkově přijatelné. Student pracoval s relevantní odbornou literaturou a výsledky zasadil do kontextu současného poznání. Využitelnost výsledků spatřuji především v jejich návaznosti na další výzkum řečových biomarkerů u mírné kognitivní poruchy a neurodegenerativních onemocnění. Student nebyl příliš aktivní a výsledky konzultoval až ke konci semestru, nicméně výsledná práce splnila stanovené cíle a představuje solidní odborný výstup. Points proposed by supervisor: 85

Grade proposed by supervisor: B

File inserted by supervisor Size
Posudek vedoucího práce [.pdf] 114,22 kB

Reviewer’s report
Ing. Kryštof Novotný

Student ve své práci analyzoval rozdíly v řeči a jazyce mezi zdravými kontrolami a pacienty s různými typy mírné kognitivní poruchy. To obnášelo nastudování problematiky, extrakci akustických a lingvistických parametrů, provedení explorativní analýzy a následné využití vybraných příznaků v klasifikačních experimentech. Zadání práce tak bylo rámcově naplněno.

Pozitivně hodnotím zahrnutí statistické i klasifikační části a snahu kombinovat akustické, lingvistické a embeddingové deskriptory. Zároveň však práce vykazuje výrazné metodické a prezentační nedostatky. Chybí teoretický úvod k analyzované skupině PD-MCI, přestože je tato skupina součástí zpracovávaného datasetu. Nedostatečně je popsán také postup získání některých parametrů, například NSR, kde není jasné, jak byl určen počet slabik, nebo metrik popisujících pauzy, kde není dostatečně vysvětlen způsob segmentace řeči. Práce dále zmiňuje využití akustických a textových embeddingů, ale jejich extrakce, zpracování a zapojení do analýz nejsou popsány v potřebné míře. Nejasné zůstávají také některé lingvistické ukazatele.

Dokument je místy výrazně nekonzistentní. Objevuje se nejednotné zavádění a používání zkratek, různé způsoby označování parametrů, anglické výrazy bez českých ekvivalentů a rozdílná terminologie pro podobné veličiny (variační koeficient vs. relativní směrodatná odchylka). Některé části práce uvádějí odlišné sady parametrů či modelů, takže úvodní teoretické části, metodika a implementace nepůsobí zcela provázaně. V textu se také objevují faktické nepřesnosti (například u popisu souřadicích spojení a jejich charakteristických spojek) a řada informací se opakuje.

Formální stránka dále snižuje celkový dojem. Sudé a liché strany mají odlišné okraje/zarovnání sazby, citace více zdrojů jsou často uváděny odděleně a grafy jsou opakovaně v rastrové podobě tam, kde by bylo vhodnější použít grafiku vektorovou. Text je místy rozvleklý, obsahuje obecné pasáže, které nejsou dále využity v metodice, a zároveň naopak chybí podrobnější vysvětlení klíčových implementačních kroků. Přestože je struktura práce obecně srozumitelná, celkově dokument působí nejednotně a nedotaženě. Topics for thesis defence:
  1. Můžete podrobně popsat, jaké akustické embeddingy byly v práci použity, z jakých modelů byly získány a jak byly dále zpracovány před vstupem do klasifikační analýzy?
  2. Jakým způsobem byl získán počet slabik pro výpočet parametru NSR?
  3. Jak byla provedena segmentace řeči pro určení parametrů týkajících se pauz?
Points proposed by reviewer: 70

Grade proposed by reviewer: C

Responsibility: Mgr. et Mgr. Hana Odstrčilová