Přístupnostní navigace
E-application
Search Search Close
Master's Thesis
Author of thesis: Bc. Jiří Vahalík
Acad. year: 2025/2026
Supervisor: Ing. Kryštof Novotný
Reviewer: Ing. Richard Ladislav
This thesis investigates the use of linguistic representations extracted from pre-trained encoder models for assessing the cognitive state of patients based on transcripts of spontaneous speech. Automatic speech recognition is using Whisper large-v3, embedding extraction via RoBERTa, DistilBERT and DistilRoBERTa, and classification using SVM, XGBoost and MLP are combined into a reproducible pipeline evaluated on the DementiaBank corpus. The effect of the classifier, embedding model and pooling strategy on the ability to distinguish normal condition group from subjects with mild cognitive impairment is systematically examined. The best combination achieved an average AUC of 0.737.
speech processing; embeddings; semantic similarity; ASR; Alzheimer's disease (AD); Mild Cognitive Impairment (MCI); linguistic biomarkers; neurodegeneration; BERT; RoBERTa; DementiaBank; Support Vector Machine (SVM); XGBoost; Multilayer Perceptron (MLP)
Date of defence
11.06.2026
Result of the defence
Defended (thesis was successfully defended)
Grading
A
Process of defence
Student prezentoval výsledky své práce a komise byla seznámena s posudky. Otázky oponenta a komise: V práci reportujete nejlepší průměrnou agregační metodu jako kombinaci mezikvartilního intervalu a mediánu. Jak byste tento fakt interpretovali? U algoritmu XGBoost je ve vaší práci možné pozorovat vysokou variabilitu výpočetního času. Který z hyperparametrů považujete za největší zdroj této nekonzistentnosti? Popište praktické provedení experimentů ve Vaší práci a Váš přínos (implementaci, strukturalizaci, testování...). Student obhájil diplomovou práci a odpověděl na otázky členů komise a oponenta.
Language of thesis
Czech
Faculty
Fakulta elektrotechniky a komunikačních technologií
Department
Department of Telecommunications
Study programme
Audio Engineering (MPC-AUD)
Specialization
Audio Production and Recording (AUDM-ZVUK)
Composition of Committee
PhDr. Aleš Dvořák (člen) prof. Ing. Jiří Mekyska, Ph.D. (předseda) doc. Ing. MgA. Mgr. Dan Dlouhý, Ph.D. (místopředseda) Ing. Miroslav Balík, Ph.D. (člen) Ing. Michal Švento (člen)
Supervisor’s reportIng. Kryštof Novotný
Grade proposed by supervisor: A
Reviewer’s reportIng. Richard Ladislav
Grade proposed by reviewer: A
Responsibility: Mgr. et Mgr. Hana Odstrčilová