Bachelor's Thesis

Stress detection using biological and environmental data

Final Thesis 2.09 MB Appendix 40.12 kB

Author of thesis: Miroslava Valoušková

Acad. year: 2025/2026

Supervisor: Ing. Martin Vítek, Ph.D.

Reviewer: Ing. Enikö Vargová

Abstract:

This bachelor thesis focuses on the objective detection of psychological stress through the analysis of physiological signals from wearable sensors. The theoretical part describes the psychophysiology of the stress response, particularly the activation of the sympatho-adreno-medullary (SAM) and hypothalamo-pituitary-adrenal (HPA) axes, and their manifestation in biological markers such as heart rate variability (HRV), electrodermal activity (EDA), and respiratory parameters. For the experimental part, the multimodal WESAD database was selected, containing synchronized data from the RespiBAN chest strap and the Empatica E4 wrist device.
The practical part includes signal preprocessing using Butterworth filters and the subsequent extraction of more 47 features. Statistical analysis using t-test identified 26 significant markers showing significant differences between stress and rest phases. From this group, a final set of 17 independent predictors was subsequently selected on correlation analysis (threshold R >0,85). For classification, Random Forest, SVM, and XGBoost models were compared, with all achieving comparable performance (average accuracy exceeding 90 %). The Random Forest algoritm was chosen for further analysis, primarily due to its high resistence to noice and transparent interpretability of its features. The proposed system was validated using the Leave-One-Subject-Out method and tested on the independent WAUC dataset, where it reached an accuracy of 80.58 % after applying transfer learning with 20% calibration.

Keywords:

Stress, biological signals, environmental signals, multimodal data, detection, biological markers, WESAD, WAUC, Random Forest. XGBoost, SVM

Date of defence

16.06.2026

Result of the defence

Defended (thesis was successfully defended)

znamkaCznamka

Grading

C

Process of defence

Studentka prezentovala výsledky své práce a komise byla seznámena s posudky. Ing. Smital položil otázku, které příznaky se ukázaly jako nejvýznamnější pro hodnocení míry stresu a jak důležité byly parametry získané z respiračního pásu. Studentka obhájila bakalářskou práci s výhradami a odpověděl na otázky členů komise a oponenta.

Language of thesis

Czech

Faculty

Department

Study programme

Biomedical Technology and Bioinformatics (BPC-BTB)

Composition of Committee

doc. Ing. Petr Kudrna, Ph.D. (předseda)
Ing. Markéta Jakubíčková, Ph.D. (místopředseda)
MUDr. Zuzana Nováková, Ph.D. (člen)
Ing. Lukáš Smital, Ph.D. (člen)
Ing. Vratislav Harabiš, Ph.D. (člen)
Ing. Larisa Chmelíková, Ph.D. (člen)

Supervisor’s report
Ing. Martin Vítek, Ph.D.

Studentka se ve své práci věnovala problematice detekce stresu s využitím biologických a environmentálních dat. V teoretické části práce studentka popsala psychofyziologii stresu, dostupné databáze a známé metody pro detekci stresu. Pro další práci si zvolila databáze WESAD a WAUC. V praktické části práce se potom věnovala návrhu a analýze 47 různých příznaků ze třech různých modalit, což vyústilo ve volbu 17 finálních příznaků pro navazující práci. Studentka navrhla a na databázích otestovala celkem 3 různé klasifikační modely. Úspěšnost klasifikace na databázi WESAD přesahuje u všech tří modelů 90 %. Přímý přenos modelů na databázi WAUC však selhal a odhalil tak přílišnou odlišnost těchto databází. Studentka problém částečně vyřešila pomocí sady kalibračních dat. Dosažená úspěšnost klasifikace na databázi WAUC tak vzrostla nad 80 %. Dosažené výsledky studentka v práci podrobně rozebírá a srovnává je s výsledky jiných zahraničních studií. Zadání bakalářské práce tak považuji za splněné v plném rozsahu. Po formální stránce je práce na dobré úrovni. Od úvodu po závěr má práce solidních 44 stran textu, z čehož je více než polovina věnována praktické části. Práce obsahuje 41 zdrojů převážně zahraniční literatury. Po odborné stránce je práce také na dobré úrovni. Veškeré výsledky jsou jasně prezentovány přehlednými tabulkami a obrázky a jsou podrobně rozebrány. Studentka svoji práci průběžně konzultovala a zapracovala veškeré připomínky vedoucího práce. Celkově práci hodnotím stupněm výborně/A. Points proposed by supervisor: 90

Grade proposed by supervisor: A

Reviewer’s report
Ing. Enikö Vargová

Studentka se ve své bakalářské práci zaměřuje na detekci stresu z biologických signálů. Teoretická část práce čítá 12 stran a poskytuje přehled fyziologických mechanismů souvisejících se stresem, používaných biosignálů a současných přístupů k automatické detekci stresu. Součástí je rovněž představení databází využitelných pro danou problematiku.
V praktické části studentka pracuje s databázemi WESAD a WAUC. Realizovala kompletní pipeline zahrnující předzpracování signálů, extrakci příznaků, jejich statistickou analýzu, výběr a následnou klasifikaci do 2 tříd. Z původně navržené sady 47 příznaků vybrala finální množinu 17 příznaků a následně porovnala několik klasifikačních modelů (Random Forest, SVM a XGBoost). Modely byly validovány metodou Leave-One-Subject-Out a na databázi WESAD dosahovaly velmi dobrých výsledků s přesností přesahující 90 %. Součástí práce bylo rovněž ověření přenositelnosti modelů na nezávislou databázi WAUC, kde se až po využití kalibračních dat podařilo dosáhnout přesnosti přes 80 %.
Pozitivně hodnotím zejména snahu studentky řešit problematiku generalizace modelů mezi různými databázemi. Na druhou stranu mi v práci chybí některé metodické detaily. Zejména bych uvítala podrobnější popis databáze WAUC, například počet záznamů na jednotlivé subjekty, zda je délka a předzpracování segmentů stejné jako u WESAD aj.  Dále mi chybí podrobnější informace o zastoupení jednotlivých tříd v použitých datasetech a jejich vyváženosti. Není například zřejmé, zda byly jednotlivé třídy zastoupeny rovnoměrně a zda byla případná nevyváženost dat nějakým způsobem zohledněna při trénování a vyhodnocování modelů. Podobně není zcela zřejmé, jakým způsobem byly nastavovány a optimalizovány hyperparametry jednotlivých klasifikačních modelů, případně zda byly ponechány jejich výchozí hodnoty.
Pro finální model a jeho testování na databázi WAUC bych ocenila detailnější rozbor dosažených výsledků. Diskuse se zaměřuje především na výslednou přesnost klasifikace, avšak zajímavé by bylo například analyzovat případy, ve kterých model selhává. Současně bych uvítala uvedení výsledků dosažených na trénovacích datech, což by umožnilo posoudit případné přeučení modelu.
V práci se rovněž objevují drobné formální nedostatky, například opakované vysvětlování již dříve zavedených zkratek (např. SCL nebo SCR).
Přes uvedené připomínky považuji zadání práce za splněné. Topics for thesis defence:
  1. 1. Kolik záznamů připadá na jeden subjekt v databázi WAUC? Pokud má jeden subjekt více záznamů, bylo při vytváření kalibrační a testovací množiny zajištěno, aby se data stejného subjektu nevyskytovala současně v obou částech datasetu?
  2. 2. Jaké bylo zastoupení jednotlivých tříd v databázích WESAD a WAUC? Byla případná nevyváženost tříd nějakým způsobem zohledněna při trénování klasifikačních modelů?
  3. 3. V práci je využívána standardizace prováděná individuálně pro každý subjekt. Jak by navržený systém fungoval při nasazení na nového uživatele, pro kterého nejsou k dispozici normalizační parametry?
Points proposed by reviewer: 80

Grade proposed by reviewer: B

Responsibility: Mgr. et Mgr. Hana Odstrčilová