Bachelor's Thesis

Detection of Premature Contractions in PPG Signals

Final Thesis 33.43 MB Appendix 1.61 MB

Author of thesis: Matouš Balner

Acad. year: 2025/2026

Supervisor: Ing. Enikö Vargová

Reviewer: Ing. Andrea Němcová, Ph.D.

Abstract:

This bachelor's thesis addresses the problem of automatic detection of premature contractions from photoplethysmographic (PPG) signals using machine learning methods. The theoretical part describes cardiac activity, the characteristics of atrial and ventricular extrasystoles, and the diagnostically significant features of the PPG signal. Annotated data from the MIMIC database and a synthetic dataset derived from the CPSC2018 database via a PPG simulator were used for this purpose.
The practical part covers the design and implementation of a systolic peak detector, a morphological filter for spurious extrasystolic waves, and a pipeline for onset-to-onset segmentation and feature extraction. From an initial set of 23 features, 13 were selected for modelling based on visual separability analysis and correlation checks. The classifier was trained exclusively on the synthetic dataset and evaluated on real patient data, with splits performed strictly at the patient level to prevent data leakage.
The classification task was formulated as binary detection of premature contractions (ES class versus normal rhythm). Three machine learning algorithms were compared: Random Forest, XGBoost, and Support Vector Machine with an RBF kernel. Optimal feature subsets were identified by ablation study and hyperparameters were tuned using stratified group cross-validation. The final model, a tuned Random Forest using six temporal and amplitude ratio features, achieves an F1-score of 0.798, sensitivity of 0.807, and specificity of 0.994 on the test set. As a post-hoc analysis, model performance was evaluated separately for atrial and ventricular extrasystoles. Sensitivity reached 83.9 % for atrial and 58.9 % for ventricular extrasystoles, with the lower detection rate for ventricular extrasystoles attributable to insufficient morphological coverage of this arrhythmia type in the synthetic training dataset.

Keywords:

PPG, extrasystoles, premature atrial contractions (PAC), premature ventricular contractions (PVC), arrhythmia detection, extrasystole classification, pulse peak detection, biosignal processing

Date of defence

17.06.2026

Result of the defence

Defended (thesis was successfully defended)

znamkaAznamka

Grading

A

Process of defence

Student prezentoval výsledky své práce a komise byla seznámena s posudky. Doc. Sedlář položil otázku: Co dělí v diagramu barvy? Doc. Gumulec položil otázku: Využil byste metodu v klinice pro detekci? Student obhájil bakalářskou práci a odpověděl na otázky členů komise a oponenta.

Language of thesis

Czech

Faculty

Department

Study programme

Biomedical Technology and Bioinformatics (BPC-BTB)

Composition of Committee

Doc. MUDr. Jaromír Gumulec, Ph.D. (předseda)
doc. Mgr. Ing. Karel Sedlář, Ph.D. (místopředseda)
Ing. Jan Odstrčilík, Ph.D. (člen)
Ing. Jiří Sekora, MBA (člen)
Ing. Andrea Němcová, Ph.D. (člen)
Ing. Roman Jakubíček, Ph.D. (člen)

Supervisor’s report
Ing. Enikö Vargová

Student se ve své práci zabývá detekcí extrasystol v PPG signálech. Teoretická část práce o rozsahu přibližně 30 stran je velmi kvalitně zpracována a poskytuje čtenáři potřebný přehled o řešené problematice. Za zdařilou považuji zejména část věnovanou přehledu příznaků využitelných pro detekci extrasystol z PPG signálu.
Praktická část práce má rozsah přibližně 55 stran. Student nejprve navrhl a otestoval vlastní detektor systolických peaků, který představuje klíčový krok pro následnou detekci extrasystol. Jeho funkčnost byla ověřena na několika databázích s velmi dobrými výsledky. Následně byla provedena analýza reálných dat z databáze MIMIC obsahujících extrasystoly. Vzhledem k omezenému množství anotovaných dat student vhodně využil také rozsáhlý syntetický PPG dataset vytvořený na základě reálných klinických dat od více než 700 pacientů. Po segmentaci jednotlivých srdečních cyklů z PPG student provedl extrakci a výběr relevantních příznaků a následně natrénoval, otestoval a systematicky porovnal několik klasifikačních algoritmů včetně ladění jejich hyperparametrů.
Velmi pozitivně hodnotím zejména systematický přístup k řešení problému a množství doplňkových analýz, které významně zvyšují úroveň práce. Za přínosné považuji zejména ablační studii zaměřenou na výběr optimální sady příznaků, analýzu vlivu jednotlivých kroků předzpracování na výslednou výkonnost modelu, rozbor problematických pacientských záznamů a srovnání dosažených výsledků s publikovanými pracemi.
Oceňuji také kritické zhodnocení dosažených výsledků, kvalitně zpracovanou diskusi a jasně formulované limity navrženého řešení i možné směry dalšího výzkumu.
Celkově hodnotím práci jako nadstandardně zpracovanou a doporučuji ji k obhajobě. Points proposed by supervisor: 98

Grade proposed by supervisor: A

Reviewer’s report
Ing. Andrea Němcová, Ph.D.

Bakalářská práce Matouš Balnera se zabývá aktuálním a vědecky i prakticky hodnotným tématem detekce extrasystol ve fotopletysmografických záznamech. Teoretická část práce je velmi pečlivě sepsána a tvoří perfektní základ pro praktickou část. Praktická část řeší dva na sebe navazující úkoly: 1) detekci peaků v PPG a 2) samotnou klasifikaci PPG beatů. Detekce peaků je řešena poměrně jednoduchou a přímou metodou. Algoritmus je testován na dvou databázích a úspěšností je srovnatelný se současnými nejlepšími detektory, v případě přítomnosti patologií je dokonce předčí. Pro klasifikaci PPG beatů student používá přístup extrakce příznaků a strojového učení. Celá metodika je pečlivě popsána a jednotlivé kroky na sebe logicky navazují. Všechny postupy jsou řádně zdůvodněny. Celkem bylo extrahováno 23 příznaků, použity 3 metody strojového učení a 2 databáze (jedna pro trénování a druhá pro validaci a testování). Mám pouze několik drobných výtek, např.: 1) u výpočtu PR není jasné, jak byl signál předzpracován, 2) v kapitole 7.2.1 by se hodila ilustrace signálů a anotací, 3) čísla v obrázku 10.2 (F1 ES) neodpovídají tabulce 10.6. Zadání práce je jednoznačně splněno a velmi kvalitně. Po obsahové stránce je práce na výborné úrovni a má vědeckou hodnotu. Formální stránka práce je rovněž nadprůměrná. Práce je psaná čtivě a srozumitelně. Vytknout snad můžu jen ne vždy správné používání zkratek a nekonzistentní seznam literatury. Od úvodu po závěr práce čítá 86 stran a obsahuje 38 literárních zdrojů. Topics for thesis defence:
  1. Proč se detekce peaků v PPG hodnotí u MIMIC DB po segmentech a u CapnoBase DB nikoli?
  2. V obr. 8.6 jsou body (peaky PPG) detekované jedním z nejlepších PPG peak detektorů qppgfast velmi blízko sebe. Byl detektor dobře nastaven? Nebo jak si to vysvětlujete?
  3. Proč se krok morfologické filtrace nepoužije u umělého datasetu?
Points proposed by reviewer: 97

Grade proposed by reviewer: A

Responsibility: Mgr. et Mgr. Hana Odstrčilová