Bachelor's Thesis

Stress detection from multimodal data

Final Thesis 4.22 MB Appendix 3.04 MB

Author of thesis: Filip Sedlár

Acad. year: 2025/2026

Supervisor: Ing. Andrea Němcová, Ph.D.

Reviewer: Ing. Enikö Vargová

Abstract:

This bachelor’s thesis addresses automated stress detection using multimodal physiological data in an office environment. Such detection is deemed necessary given the health and economic impacts of mental stress. The theoretical framework examines the physiological mechanisms of the stress response and evaluates the biosignals, algorithms, and methodologies best suited for unobtrusive monitoring.
In the practical part, a data processing pipeline was developed using the SWELL-KW dataset. Raw electrocardiogram (ECG) and electrodermal activity (EDA) signals were synchronised, segmented, and pre-processed using a custom artefact correction, convex optimisation-based EDA decomposition, and subject-specific Z-score normalisation. From this, a comprehensive set of time, frequency, and non-linear features was extracted.
To combat high dimensionality, a non-parametric Kruskal-Wallis filter combined with Minimum Redundancy Maximum Relevance (mRMR) and Random Forest (RF) algorithms filtered an optimal subset of 3 key features. A granular ablation study mathematically validated an expansion towards 4 key features, proving that this dimensionality is optimal and that excessive features provide negligible predictive gains while introducing unnecessary computational load which would drain wearable devices.
A RF ensemble utilising the mRMR feature subset emerged as the final deployable winning model due to its high computational efficiency and resistance to overfitting. Under a strict subject-independent protocol, it achieved an Accuracy of 82.93%, Sensitivity of 79.04%, and a Specificity of 88.25% on the unseen Test set. Ultimately, this thesis demonstrates that a compact, mathematically validated set of non-linear features enables highly reliable stress detection without requiring complex deep learning architectures.

Keywords:

Stress detection, multimodal biosignals, SWELL-KW, ECG, EDA, HRV, feature selection, machine learning, mRMR, random forest (RF), support vector machine (SVM), subject-independent validation

Date of defence

16.06.2026

Result of the defence

Defended (thesis was successfully defended)

znamkaAznamka

Grading

A

Process of defence

Student prezentoval výsledky své práce a komise byla seznámena s posudky. Ing. Smital položil otázku, zda student pracoval s více databázemi, jakým způsobem byl v použité databázi vyvoláván stres a zda byla součástí experimentu také fyzická aktivita. Ing. Jakubíčková položila otázku, v jakém programovacím jazyce byla práce realizována. Student obhájil bakalářskou práci a odpověděl na otázky členů komise a oponenta.

Language of thesis

English

Faculty

Department

Study programme

Biomedical Technology and Bioinformatics (BPC-BTB)

Composition of Committee

doc. Ing. Petr Kudrna, Ph.D. (předseda)
Ing. Markéta Jakubíčková, Ph.D. (místopředseda)
MUDr. Zuzana Nováková, Ph.D. (člen)
Ing. Lukáš Smital, Ph.D. (člen)
Ing. Vratislav Harabiš, Ph.D. (člen)
Ing. Larisa Chmelíková, Ph.D. (člen)

Supervisor’s report
Ing. Andrea Němcová, Ph.D.

Bakalářská práce Filipa Sedlára se zabývá detekcí stresu z multimodálních dat, což je stále aktuální a nedořešené téma. Teoretická část práce obsahuje adekvátní literární rešerši. Velmi oceňuji komplexní tabulku obsahující přehled metod detekce stresu a jejich výsledků. Výborné je i blokové schéma shrnující praktickou část práce. Jen bych ho z teoretické části přesunula na začátek praktické. Praktická část práce je velmi podrobně a pečlivě popsaná a ilustrovaná. Jednotlivé kroky na sebe logicky navazují a jsou řádně zdůvodněné, k čemuž slouží řada dílčích analýz. Práce obsahuje rozsáhlou diskuzi výsledků a limitace navržených metod. Práce je srovnatelná s uvedenou literaturou. Zadání práce je jednoznačně splněno. Z formálního hlediska je práce na výborné úrovni. Je psaná anglicky, jasně a čtivě a od úvodu po závěr čítá 65 stran. Student využil celkem 32 literárních zdrojů a k práci s literaturou nemám výhrady. Student pracoval systematicky a usilovně během celého roku a využíval konzultací. Celkově považuji práci za velmi zdařilou a na úrovni BP nadprůměrnou. Points proposed by supervisor: 99

Grade proposed by supervisor: A

Reviewer’s report
Ing. Enikö Vargová

Student se ve své bakalářské práci zabývá automatickou detekcí stresu s využitím multimodálních fyziologických dat. Téma je aktuální a má praktický potenciál.
Teoretická část práce čítá odpovídající rozsah a je přehledná. Obsahově je pro bakalářskou práci plně dostačující. V praktické části student pracuje s databází SWELL-KW. Pro detekci využívá signály EKG a EDA, které byly synchronizovány, segmentovány a řádně předzpracovány. Následně byla provedena extrakce několika příznaků. Student dále provedl jejich statistickou analýzu, selekci a standardizaci pomocí Z-score normalizace. Je však nutné upozornit, že Z-score normalizace je prováděna na úrovni subjektu a vůči třídě „neutral“, což může ovlivnit přenositelnost modelu do reálného nasazení.
Na základě provedené selekce byla identifikována optimální podmnožina čtyř příznaků, na kterých byl následně trénován klasifikační model. Student experimentoval s více klasifikačními algoritmy a jako výsledný model byl zvolen Random Forest ensemble, který dosahuje na testovací sadě dobrých výsledků.
V práci mi chybí detailnější specifikace některých metodických kroků, zejména volby prahu pro mRMR selekci a přesnější popis cross-validace včetně zajištění subject-independent rozdělení dat při CV. Současně je vhodné zmínit, že rozdíl ve výkonnosti mezi trénovací a testovací sadou naznačuje možnost mírného přeučení modelu. Tato skutečnost by si zasloužila podrobnější analýzu.
Z formálního hlediska se v práci objevují drobné nedostatky (překlepy a místy nejednoznačné formulace), nekonzistentní používání některých zkratek (např. ML), které jsou sice v textu zavedeny, ale dále nejsou systematicky využívány. Přesto je práce po formální stránce zpracována velmi kvalitně. Oceňuji, že je text psán v anglickém jazyce.

Celkově lze konstatovat, že zadání bylo splněno a práci doporučuji k obhajobě. Topics for thesis defence:
  1. Jak bude Váš model fungovat v praxi, pokud bude nasazen na nového uživatele, u kterého ještě nejsou k dispozici „neutral“ segmenty pro výpočet Z-score normalizace? Je v takovém případě nutné provést kalibrační měření? Jak zajistíte, že se bude skutečně jednat o "neutral" měření?
Points proposed by reviewer: 97

Grade proposed by reviewer: A

Responsibility: Mgr. et Mgr. Hana Odstrčilová