Master's Thesis

Detection of Selected Arrhythmias in ECG

Final Thesis 4.82 MB Appendix 1.08 MB

Author of thesis: Bc. Tomáš Šoltés

Acad. year: 2025/2026

Supervisor: Ing. Marina Filipenská, Ph.D.

Reviewer: Ing. Radovan Smíšek, Ph.D.

Abstract:

This diploma thesis is continuation of previous bachelor thesis and again focuses on chosen arrhythmias and their methods of detection by using either conventional methods or by utilizing machine and deep learning techniques. The theoretical part focuses on brief review of cardiovascular system, description of selected arrhythmia, current methods of detection, and theoretical background for the practical part. In practical part, a classifier model for selected arrhythmias was implemented by utilizing leads V1 and II, DWT decomposition and combining them in two branch CNN model with architecture and parameter optimization using GA algorithm.

Keywords:

Arrhythmias, bundle branch block, premature ventricular complex, detection, convolutional neural network, wavelet transform, continuous wavelet transform, scalogram, entropy, filtering, genetic algorithm, residual connections

Date of defence

15.06.2026

Result of the defence

Defended (thesis was successfully defended)

znamkaEznamka

Grading

E

Process of defence

Student prezentoval výsledky své práce a komise byla seznámena s posudky. Prof. Provazník položila otázku: Proč jste nevyužil databázi z ÚBMI? Ing. Jakubíček, Ph.D. položil otázku: Jak děláte fúzi dvou větví? Jaké hodnoty se průměrují? Kterou metodu využíváte? Čím jste se inspiroval při vytváření architektury? Jak jste postupoval v rámci návrhu pipeline? Proč se metoda rozdělena na dvě větve? Kolik práce by bylo s rozšířením databáze s danou pipeline? Ing. Němcová, Ph.D. položila otázku: Proč není provedena binární klasifikace? Student obhájil diplomovou práci s výhradami a odpověděl na otázky členů komise a oponenta.

Language of thesis

English

Faculty

Department

Study programme

Biomedical Engineering and Bioinformatics (MPC-BTB)

Composition of Committee

doc. RNDr. David Šafránek, Ph.D. (předseda)
prof. Ing. Valentýna Provazník, Ph.D. (místopředseda)
Ing. Markéta Jakubíčková, Ph.D. (člen)
Ing. Roman Jakubíček, Ph.D. (člen)
Ing. Andrea Němcová, Ph.D. (člen)

Supervisor’s report
Ing. Marina Filipenská, Ph.D.

Diplomová práce se zabývá detekcí vybraných srdečních arytmií (LBBB, RBBB a PVC) z EKG signálu pomocí metod hlubokého učení. Jedná se o aktuální téma na pomezí biomedicínského inženýrství, zpracování biosignálů a umělé inteligence, které má potenciál praktického využití v oblasti automatizované analýzy EKG. Student samostatně nastudoval problematiku zpracování EKG signálů a moderních metod detekce arytmií a vypracoval rozsáhlou rešerši. Pozitivně hodnotím návrh vlastního klasifikačního postupu kombinujícího časovou a frekvenční reprezentaci signálu, využití pokročilé architektury hluboké neuronové sítě a genetického algoritmu pro optimalizaci vybraných parametrů modelu. Student implementoval dvoustupňovou klasifikaci a věnoval značné úsilí řešení problému nevyváženosti tříd a redukci modelu pomocí tzv. pruning technik. Za hlavní slabinu práce považuji oblast práce s daty a interpretace dosažených výsledků. Přestože bylo správně použito inter-patient rozdělení dat, práce neobsahuje podrobnější analýzu distribuce jednotlivých arytmií na úrovni pacientů v trénovací a testovací množině. Vzhledem k omezenému počtu pacientů s některými diagnózami v databázi MIT-BIH by taková analýza mohla významně přispět k interpretaci dosažených výsledků, zejména u tříd LBBB a RBBB. Rozdělení databáze podle de Chazal et al., kterým se student inspiroval, bylo původně navrženo pro klasifikaci jiných typů arytmií. Není proto zřejmé, zda je rozdělení pacientů a tříd optimální i pro předloženou práci. Diskutabilní je také přístup k řešení nevyváženosti dat. Student využívá techniky na úrovni modelu, avšak neaplikuje jednodušší opatření na úrovni dat, například omezení počtu normálních komplexů u pacientů s jejich výraznou převahou. Po odborné stránce je navržená architektura klasifikátoru moderní a odpovídá současným trendům v oblasti klasifikace EKG signálů. Pozitivně hodnotím využití dvou paralelních větví zpracovávajících surový EKG signál a koeficienty diskrétní vlnkové transformace. Chybí však srovnání s modelem bez druhé větve, takže nelze jednoznačně posoudit, zda skutečně přispívá ke zlepšení klasifikační úspěšnosti, nebo pouze zvyšuje složitost modelu. Dále chybí podrobnější analýza chyb první, binární klasifikační fáze, zejména vyhodnocení, jaká část jednotlivých arytmií byla nesprávně klasifikována jako normální a nedostala se tak do druhé fáze zpracování a jak to ovlivnilo průběh trénování a kvalitu detekce ve druhé fázi. Diskusní část práce postrádá systematičtější porovnání dosažených výsledků s výsledky publikovanými v odborné literatuře. Student věnoval značné úsilí návrhu a optimalizaci poměrně komplexního modelu, zatímco menší pozornost byla věnována analýze samotných dat. Přitom právě důkladnější rozbor distribuce arytmií a příčin nízké úspěšnosti klasifikace některých tříd mohl vést k úpravě použitého rozdělení na trénovací a testovací množinu nebo k volbě vhodnější databáze, což mohlo být pro výsledky práce přínosnější než další zvyšování složitosti modelu. Po formální a jazykové stránce hodnotím práci jako průměrnou. Text je sice celkově přehledný a srozumitelný, avšak v práci se vyskytují dílčí nedostatky, jako je místy nejednotné formátování odstavců, chybějící odkazy na některé obrázky v textu nebo drobné nekonzistence v terminologii. Rozšířený abstrakt, který má být zpracován v českém jazyce, obsahuje řadu nevhodně použitých anglických i českých výrazů.
Student během řešení diplomové práce pracoval převážně samostatně. Konzultace probíhaly spíše nepravidelně a často s delšími časovými odstupy. Přes uvedené připomínky hodnotím práci jako odborně přínosnou. Student prokázal schopnost samostatně řešit náročný problém z oblasti zpracování biomedicínských signálů a metod hlubokého učení. Předložená práce splňuje požadavky zadání, a proto ji doporučuji k obhajobě s hodnocením E – 58 bodů. Points proposed by supervisor: 58

Grade proposed by supervisor: E

Reviewer’s report
Ing. Radovan Smíšek, Ph.D.

Student se ve své diplomové práci zabývá detekcí vybraných srdečních arytmií - komorových extrasystol (PVC) a blokád levého a pravého Tawarova raménka (LBBB, RBBB) - z EKG záznamů s využitím konvolučních neuronových sítí. 

Teoretická část (kapitola 1) je rozsáhlá a poskytuje dostatečný základ pro pochopení práce. Oceňuji šíři přehledu, který pokrývá anatomii a převodní systém srdce, popis sledovaných arytmií i konvenční, strojové a hluboké metody detekce, vždy s uvedením jejich výhod a omezení. Některé pasáže jsou však hůře srozumitelné nebo věcně nepřesné. Například u obrázku 6 je uvedena hodnota HRV 67 ms, není však vysvětleno, co tato hodnota představuje ani jak byla vypočtena.

Závažnější je nesoulad mezi úvodem a vlastní realizací. Především úvod, ale také klíčová slova a „Theory necessary for practical part“ uvádějí, že detekce je realizována pomocí 2D škálogramu spojité vlnkové transformace (CWT), praktická část však žádný škálogram ani CWT nevyužívá a pracuje s diskrétní vlnkovou transformací (DWT). 

V praktické části (kapitola 2) autor uvádí, že rozdělení dat do trénovací a testovací sady zcela zabraňuje výskytu téhož pacienta v obou sadách, což neplatí - záznamy 201 a 202 pocházejí od téhož subjektu a jsou rozděleny mezi trénovací a testovací sadu. Databáze MIT-BIH navíc obsahuje 48 záznamů, zatímco použito je 44 (2×22); vyřazení čtyř záznamů (pravděpodobně se stimulovanými stahy) není v textu vysvětleno. Autor dále použil pouze záznamy obsahující svody II a V1, neuvádí však, kolik a které záznamy tím vyřadil. Z práce tedy není zřejmé kolik záznamů a od kolika pacientů vlastně bylo použito.

V rámci předzpracování byla aplikována dolní propust 45 Hz. Po této filtraci ovšem detailní vlnková pásma D1 (90–180 Hz) a D2 (45–90 Hz) prakticky neobsahují užitečný signál, což dokládají i obrázky 20 a 21 (nulová energie těchto pásem). Tato pásma jsou nicméně dále přiváděna do modelu a genetický algoritmus dokonce pásmo D1 svodu II označil za informativní (tab. 3), což je v rozporu s jeho fyzikální podstatou. U obrázků 20 a 21 není definováno, co znamená „normalizovaná energie", ani zda jde o průměr, medián nebo jinou metriku přes QRS dané třídy. 

Segmentační okno o délce 300 ms (±150 ms kolem R-kmitu) vyřezává P a T vlnu, přestože autor tyto vlny v teoretické části sám uvádí jako diagnostické znaky sledovaných arytmií (opačná polarita T vlny a absence P vln u PVC, ST-T změny u LBBB).

Vlastní metoda (kapitola 2.3) je komplexní a její popis je vhodně doplněn schématy (obrázky 14 a 22). V práci však není nikde definována validační množina, ačkoli se na ni opakovaně odkazuje (validační ztráta, „best epoch", předčasné zastavení, fitness GA). Není proto zřejmé, zda byl výběr modelu prováděn na samostatné validační sadě, nebo na testovací sadě DS2, na níž jsou prezentovány výsledky. 

Výsledky (kapitola 2.4) jsou přehledně vyjádřeny maticemi záměn, metrikami pro jednotlivé třídy a ROC křivkami; kladně hodnotím rovněž poctivě provedenou analýzu prořezávání. V textu však není explicitně uvedeno, že výsledky jsou vyhodnoceny na testovací sadě DS2 (lze to pouze odvodit z počtů v maticích záměn). Hlavní úloha pro třídu LBBB v podstatě selhává. Vážené F1 = 0,8051 by mělo být doplněno o makro F1, které věrněji vystihuje skutečnou schopnost systému napříč všemi třídami; tato hodnota je v práci zmíněna pouze okrajově.

V diskusi a závěru (kapitola 3) autor věcně a poctivě rozebírá příčiny slabých výsledků a empiricky dokládá, že omezení tkví v dostupnosti dat, nikoli v kapacitě modelu (asymetrická reakce obou stupňů na prořezávání). Tuto sebekritickou analýzu hodnotím kladně. V práci však chybí kvantitativní srovnání dosažených výsledků s pracemi jiných autorů.

Nejvýznamnějším problémem práce je využití velmi malého počtu pacientů. Autor sice uvádí docela velké počty QRS, tyto počty ale nejsou relevantní, protože u pacienta s RBBB (případně LBBB) jsou QRS podobné a jestli mám od jednoho pacienta 10 nebo 1000 komplexů QRS tedy není příliš významné. Použití složitých neuronových sítí s velkým množstvím parametrů není vhodné, pokud je takto málo dat. Dokonce i zadání práce obsahuje povinnost využít databázi dostupnou na DBME, což autor neudělal. V dnešní době jsou ale k dispozici veřejně dostupné rozsáhlé databáze, které by šlo využít i bez přístupu k privátní databázi.

Samotný návrh neuronové sítě, která kombinuje větev se surovým EKG a větev se signálem odvozeným z vlnkové transformace hodnotím kladně. Kdyby bylo použito více dat, tak má tato metoda šanci dosáhnout dobrých výsledků.

Z formálního a jazykového hlediska je práce na kolísavé úrovni. Jednotlivé části na sebe logicky navazují. Seznam literatury je místy nekonzistentní - část záznamů používá českou zkratku „č." (např. [26], [28], [29]), zatímco zbytek anglické „no.". Odkazy na literaturu nejsou seřazeny ani dle abecedy ani dle výskytu v textu ani dle žádné zřejmé standardní posloupnosti. V textu praktické části je rovněž chybně odkazováno na „Figure 16" namísto schématu pipeline (Figure 14). Číslování obrázků je narušeno - označení „Figure 9" i „Figure 10" je v textu použito opakovaně pro různé obrázky.

Zadání práce je splněno s výjimkou bodu 2, který požaduje prozkoumání záznamů z databáze dostupné na ÚBMI a z relevantních veřejně dostupných databází, autor využil výhradně databázi MIT-BIH a databázi ÚBMI nijak nezmiňuje.

Navrhuji známku E, 52 bodů. Topics for thesis defence:
  1. V práci se opakovaně odkazujete na validační ztrátu, výběr nejlepší epochy a fitness genetického algoritmu, nikde však nedefinujete validační množinu. Na jakých datech probíhal výběr modelu (předčasné zastavení, GA) a byla tato data pacientsky oddělena od testovací sady DS2, na níž uvádíte výsledky?
  2. Podle bodu 2 zadání měla práce vycházet i z databáze dostupné na ÚBMI. Z jakého důvodu nebyla tato databáze použita?
  3. Vstupní signál filtrujete dolní propustí 45 Hz, přesto do modelu přivádíte i detailní vlnková pásma nad 45 Hz (D1, D2), která po této filtraci neobsahují užitečný signál. Genetický algoritmus navíc pásmo D1 svodu II vybral jako informativní (tab. 3). Jak si tento výběr vysvětlujete?
Points proposed by reviewer: 52

Grade proposed by reviewer: E

Responsibility: Mgr. et Mgr. Hana Odstrčilová