Master's Thesis

Linguistic speech parameters for patients' cognitive state classification

Final Thesis 2.37 MB Appendix 329.43 kB

Author of thesis: Bc. Anar Davaajargal

Acad. year: 2025/2026

Supervisor: Ing. Kryštof Novotný

Reviewer: prof. Ing. Jiří Mekyska, Ph.D.

Abstract:

Mild cognitive impairment is a clinical condition characterized by cognitive decline that exceeds the expected boundaries of normal aging, and is associated with an elevated risk of developing dementia. Speech alterations may serve as early indicators of this decline. The aim of this study is to design and validate a set of linguistic parameters for a machine learning model that automatically assesses cognitive status from speech transcripts. Recordings of spontaneous monologues and descriptions of the Cookie Theft picture from healthy individuals and patients with various forms of mild cognitive impairment were analyzed. Linguistic features were extracted from automated transcripts and classified using an XGBoost model. Statistical analysis revealed significant deviations in speech production, which manifested as specific patterns across individual disease subtypes, such as an overall reduction in speech volume, simplification of syntax, or a decline in information content. Binary classification of mild cognitive impairment in Parkinson's disease against healthy controls based on the picture description achieved a balanced accuracy of 63% and a sensitivity of 70%. The results of this study confirm that automatic linguistic analysis offers the potential to identify specific cognitive deficits and represents a promising tool for the objective screening of neurodegenerative diseases in clinical practice.

Keywords:

mild cognitive impairment, linguistic analysis, natural language processing, linguistic parameters, dementia, Alzheimer's disease, Parkinson's disease, dementia with Lewy bodies, machine learning

Date of defence

11.06.2026

Result of the defence

Defended (thesis was successfully defended)

znamkaAznamka

Grading

A

Process of defence

Student prezentoval výsledky své práce a komise byla seznámena s posudky. Otázky oponenta a komise: Odůvodněte návrh vzorce pro výpočet indexu deskriptivnosti. Student obhájil diplomovou práci a odpověděl na otázky členů komise a oponenta.

Language of thesis

Czech

Faculty

Department

Study programme

Audio Engineering (MPC-AUD)

Specialization

Audio Production and Recording (AUDM-ZVUK)

Composition of Committee

PhDr. Aleš Dvořák (člen)
prof. Ing. Jiří Mekyska, Ph.D. (předseda)
doc. Ing. MgA. Mgr. Dan Dlouhý, Ph.D. (místopředseda)
Ing. Miroslav Balík, Ph.D. (člen)
Ing. Michal Švento (člen)

Supervisor’s report
Ing. Kryštof Novotný

Student se ve své práci zabýval návrhem, implementací a experimentálním ověřením lingvistických parametrů řeči pro klasifikaci kognitivního stavu pacientů. To obnášelo nastudování interdisciplinární problematiky (subtypy mírné kognitivní poruchy, jejich projevy v řeči, metody zpracování přirozeného jazyka...). Na základě rešerše student navrhl a implementoval rozsáhlou sadu parametrů zastupujících různé jazykové roviny, provedl jejich statistické vyhodnocení a následně je využil v klasifikačních experimentech. Tím byly naplněny všechny cíle práce.

Student se tématu věnoval velmi aktivně, pravidelně konzultoval výsledky i další postup a ve významné míře přispíval vlastními myšlenkami. Kladně hodnotím zejména výbornou práci s odbornou literaturou, vysokou míru samostatnosti, schopnost inovace a mimořádně kvalitní interpretaci dosažených výsledků. Student prokázal velmi dobré porozumění širším souvislostem mezi kognitivním stavem, jazykovým projevem a možnostmi automatické analýzy řeči.

Práce je po odborné stránce na velmi vysoké úrovni. Výsledky jsou přehledně zpracovány, vhodně diskutovány a budou sloužit jako kvalitní základ pro další výzkum v této oblasti. Pokud bych měl práci něco vytknout, jednalo by se spíše o dílčí nedostatek v podobě méně podrobného popisu některých použitých metod zpracování přirozeného jazyka a jejich vnitřního fungování. Tento nedostatek je nicméně plně kompenzován rozsáhlým popisem jiných oblastí a vysokou kvalitou celé práce, takže nijak zásadně nesnižuje její hodnotu. Points proposed by supervisor: 99

Grade proposed by supervisor: A

Diplomová práce se zabývá aktuální a vysoce interdisciplinární problematikou lingvistické analýzy řeči v kontextu mírné kognitivní poruchy a neurodegenerativních onemocnění. Student splnil zadání práce v plném rozsahu. Technická zpráva je na velmi vysoké prezentační úrovni, její rozsah je adekvátní a struktura logicky uspořádaná. Jazyková úroveň práce je rovněž vysoká, formální zpracování je velmi dobré, přestože se ojediněle vyskytují drobné formální nedostatky, například nesprávné umístění názvu tabulky. Student intenzivně pracuje se zahraniční odbornou literaturou zejména z oblasti neurologie, lingvistiky a zpracování přirozeného jazyka. Po odborné stránce je práce na vysoké úrovni; oceňuji zejména vyčerpávající přehled používaných digitálních biomarkerů, velmi kvalitní klinickou interpretaci dosažených výsledků a návrh vlastních lingvistických parametrů. Práce má významný aplikační potenciál v oblasti neurologie, jelikož přispívá k objasnění patofyziologických mechanismů spojených s mírnou kognitivní poruchou a může podpořit budoucí vývoj systémů pro screening neurodegenerativních onemocnění. Topics for thesis defence:
  1. Odůvodněte návrh vzorce pro výpočet indexu deskriptivnosti.
Points proposed by reviewer: 99

Grade proposed by reviewer: A

Responsibility: Mgr. et Mgr. Hana Odstrčilová