Bachelor's Thesis

Identification of hypokinetic dysarthria based on automated parameter extraction using neural networks

Final Thesis 10.28 MB Appendix 23.15 kB

Author of thesis: Bc. Mikuláš Sedlák

Acad. year: 2024/2025

Supervisor: Ing. Zoltán Galáž, Ph.D.

Reviewer: Ing. Kryštof Novotný

Abstract:

This bachelor’s thesis focuses on the identification of one of the most common symptoms of Parkinson’s disease, hypokinetic dysarthria, using machine learning. It focuses on comparing audio embeddings extractors and evaluating their suitability for identifying dysarthria.
The first two chapters provide a theoretical introduction to dysarthria and machine learning. The third chapter describes an experiment in which are five different publicly available audio feature extractors compared using cosine similarity, t-SNE visualization, and other methods. It also includes a description of training a Random Forest classifier and optimizing its parameters.
The final chapter presents and evaluates the results of this experiment.

Keywords:

Hypokinetic dysarthria, Parkinson’s disease, neural networks, feature extractors, embeddings, contextual vectors, classifier, random forest

Date of defence

19.06.2025

Result of the defence

Defended (thesis was successfully defended)

znamkaCznamka

Grading

C

Process of defence

Student prezentoval výsledky své práce a komise byla seznámena s posudky. V práci zmiňujete využití metody t-SNE pro vizualizaci rozložení extrahovaných dat. Použil jste při těchto analýzách více různých kombinací vstupních parametrů? Pokud ano, jak se jednotlivé výsledky lišily, a podle jakých kritérií jste zvolil finální podobu vizualizace? Mohl byste podrobněji vysvětlit, co přesně znázorňuje obrázek 4.1? Student obhájil diplomovou práci s výhradami a odpověděl na otázky členů komise a oponenta.

Language of thesis

Czech

Faculty

Department

Study programme

Audio Engineering (BPC-AUD)

Specialization

Audio Production and Recording (AUDB-ZVUK)

Composition of Committee

prof. Ing. Zdeněk Smékal, CSc. (předseda)
MgA. Michal Indrák, Ph.D. (místopředseda)
Ing. MgA. Jana Jelínková (člen)
Ing. Ladislav Káňa (člen)
Ing. Jan Dvořák, Ph.D. (člen)

Supervisor’s report
Ing. Zoltán Galáž, Ph.D.

Bakalářská práce se zaměřuje na velmi aktuální téma identifikace hypokinetické dysartrie pomocí moderních technik umělé inteligence. Metodologie je na solidní úrovni a vychází z dostatečného studia vědecké literatury. Samotná práce je členěna logicky, ačkoliv si dokážu představit určitá vylepšení. Poskytuje stručný úvod do problematiky, popis metodologie a prezentuje výsledky. Tyto výsledky jsou následně diskutovány a student se pokusil o jejich interpretaci. Z formálního a jazykového hlediska je práce na adekvátní úrovni. Z odborného hlediska bych si dokázal představit podrobnější analýzu a rozsáhlejší experimentování. Nicméně, považuji ji za dostatečnou. Stejně jako u semestrálního projektu, i zde studentovi vytýkám práci na poslední chvíli, z čehož pramení i poněkud horší kvalita. Student má potenciál na víc. Výsledky bakalářské práce jsou dle mého názoru využitelné pro další experimentování. Celkově hodnotím práci 75 body a známkou C. Points proposed by supervisor: 75

Grade proposed by supervisor: C

Reviewer’s report
Ing. Kryštof Novotný

Student se ve své práci zabýval využitelností předtrénovaných audio modelů v kontextu detekce hypokinetické dysartrie. To obnášelo nastudování dané problematiky, extrakci a následné zpracování reprezentací zkoumaných audio nahrávek pomocí rozdílných modelů,  analýzu dvourozměrných vizualizací extrahovaných vektorů a natrénování klasifikátoru. Tím byly naplněny všechny cíle práce.

Z odborného hlediska hodnotím práci spíše jako průměrnou. Teoretická část je nedostatečně rozpracovaná. Chybí relevantní přehled současných studií, které se zabývají obdobnou klasifikací pacientů s Parkinsonovou nemocí nebo hypokinetickou dysartrií pomocí předtrénovaných audio modelů. Dále postrádám popis architektur použitých neuronových sítí, což ztěžuje interpretaci výsledků a srovnání jednotlivých přístupů. Také analýza výsledků by mohla být podrobnější, především pak postrádám diskuzi nad jednotlivými experimenty.

Po formální stránce obsahuje práce řadu nedostatků – od nesrozumitelných vět s opakováním sloves, přes nedodržování citačního stylu až po použití rastrové grafiky tam, kde by bylo vhodnější použít grafiku vektorovou. Struktura dokumentu je jinak logická a práce čitelná, ale celkový dojem snižuje nepečlivost v provedení.

Přes uvedené výtky má práce určitý potenciál jako odrazový můstek pro navazující experimenty. Výsledky jsou konzistentní s cíli a metodologie je na základní úrovni dostačující. Topics for thesis defence:
  1. V práci zmiňujete využití metody t-SNE pro vizualizaci rozložení extrahovaných dat. Použil jste při těchto analýzách více různých kombinací vstupních parametrů? Pokud ano, jak se jednotlivé výsledky lišily, a podle jakých kritérií jste zvolil finální podobu vizualizace?
  2. Mohl byste podrobněji vysvětlit, co přesně znázorňuje obrázek 4.1?
Points proposed by reviewer: 69

Grade proposed by reviewer: D

Responsibility: Mgr. et Mgr. Hana Odstrčilová