Bachelor's Thesis

Modern tools for medical image segmentation

Final Thesis 21.08 MB Appendix 55.56 kB

Author of thesis: Vladyslav Hnitii

Acad. year: 2025/2026

Supervisor: Ing. Roman Jakubíček, Ph.D.

Reviewer: Ing. Kateřina Krejčí

Abstract:

Medical image segmentation is a fundamental step in computer-aided diagnosis and clinical research. This thesis compares specialist and generalist approaches to medical image segmentation, contrasting the fully supervised nnU-Net framework against prompt-based generalist models such as MedSAM and BiomedParse. The evaluation covers multiple imaging modalities and anatomical structures using publicly available datasets. Targeted experiments assess model robustness, sensitivity to prompt design, generalization without additional training, and the effect of volumetric context on segmentation quality. The results highlight the trade-offs between specialist and generalist models in terms of accuracy, data requirements, and practical usability, and identify key factors relevant to clinical deployment.

Keywords:

Medical image segmentation, Deep learning, nnU-Net, Foundation models, Prompt-based segmentation, Retinal vessels, Pancreas, Spleen, Polyps

Date of defence

17.06.2026

Result of the defence

Defended (thesis was successfully defended)

znamkaAznamka

Grading

A

Process of defence

Student prezentoval výsledky své práce a komise byla seznámena s posudky. Doc. Kolář se doptal na objektivní hodnocení výsledků. Student obhájil bakalářskou práci a odpověděl na otázky členů komise a oponenta.

Language of thesis

English

Faculty

Department

Study programme

Biomedical Technology and Bioinformatics (BPC-BTB)

Composition of Committee

doc. Ing. Petr Kudrna, Ph.D. (předseda)
Ing. Markéta Jakubíčková, Ph.D. (místopředseda)
MUDr.Ing. Richard Ředina (člen)
Ing. Martin Králík (člen)
Ing. Jiří Vitouš (člen)
doc. Ing. Radim Kolář, Ph.D. (člen)

Supervisor’s report
Ing. Roman Jakubíček, Ph.D.

Student pracoval na bakalářské práci velmi aktivně po celý semestr a pravidelně konzultoval svůj postup. Konzultace byly věcné a efektivní, student na nich průběžně prezentoval dosažený progres. Z práce je patrné, že se problematice věnoval systematicky a dokázal si poradit s jednotlivými dílčími problémy.
Práce je psána v anglickém jazyce na dobré úrovni, text je čtivý a logicky strukturovaný. Teoretická část poskytuje odpovídající základ pro praktickou část. V praktické části student implementoval a otestoval tři vybrané segmentační nástroje a navrhl vlastní experimenty nad více datasety. Některé experimenty by bylo možné ještě doplnit nebo doladit a výhradu lze mít i k objektivnosti a porovnatelnosti výsledků, nicméně se jedná o složitý úkol a v rámci bakalářské práce je řešení na velmi dobré úrovni. Student podrobně popisuje jednotlivé kroky návrhu i implementace, včetně diskutovaných problémů a jejich řešení, někdy až příliš rozsáhle.
Student v práci prokazuje velmi dobré porozumění řešené problematice a schopnost se v ní orientovat. Diskuze výsledků je věcná, i když místy formulované závěry působí poměrně silně vzhledem k rozsahu experimentů, což lze přičíst přirozené menší zkušenosti na bakalářské úrovni.
Celkově se jedná o kvalitní práci odpovídající požadavkům bakalářského studia, zadání považuji za splněné. Hodnotím stupněm A – 93 bodů. Points proposed by supervisor: 93

Grade proposed by supervisor: A

Reviewer’s report
Ing. Kateřina Krejčí

Předložená bakalářská práce se zabývá porovnáním frameworku nnU-Net s generalistickými modely MedSAM a BiomedParse z hlediska různorodých experimentů a testování robustnosti modelů. Práce je psána na vysoké odborné úrovni a zároveň velmi čtivou formou s vhodně rozvrženými kapitolami v angličtině. Student provedl v rámci teoretické části literární rešerši segmentačních technik, architektur neuronových sítí pro segmentační účely a metod vyhodnocování úspěšnosti modelů.

V praktické části student použil zmíněné frameworky pro iniciální trénování modelů na dvou datasetech a využil dodatečně další dva dostupné datasety pro navazující experimenty. Celkem byly provedeny 4 experimenty na testování citlivosti a robustnosti modelů. Zároveň student vhodně diskutoval i technické aspekty, jako dobu trénování modelů a nároky na hardware. Výsledky experimentů jsou vhodně vizualizovány.

Po odborné i formální stránce považuji práci za velmi zdařilou. Práce obsahuje pouze minimum formálních nedostatků, jako například jedno nechronologické řazení (dříve je citován zdroj 17 před zdrojem 16) a nesjednocený počet desetinných míst v tabulce 4.1.. Zkratka FC je nadbytečná (protože se vyskytuje v textu pouze jednou) a zkratka MAE se v textu vůbec nevyskytuje (není potřeba uvádět v seznamu zkratek). U grafů na obrázcích 4.3. a 4.4. by bylo vhodné pokrýt celou osu s DSC v rozsahu 0.0 – 1.0. Práce cituje celkem 42 položek literatury, výběr článků je pro účely bakalářské práce kvalitní. Přiložené zdrojové kódy jsou přehledné a vhodně komentované v rámci přílohy práce.

Celkově hodnotím práci známkou výborně (A – 95 bodů) a doporučuji ji k obhajobě. Topics for thesis defence:
  1. Vyzkoušel jste vliv počtu epoch na trénování jednotlivých modelů v iniciální fázi experimentů? Jaký přínos nebo jaké nevýhody by změna epoch mohla mít ve smyslu trénování?
  2. V praktické části zmiňujete, že jste využil neparametrický Wilcoxonův párový test. Ověřil jste předtím normalitu dat? Z jakého důvodu jste nevyužil parametrický párový t-test?
  3. Z jakého důvodu byl počet epoch u porovnání 2D a 3D modelů snížen pouze na 50? Lze vykreslit, jak vypadá průběh trénovacích křivek nnU-Netu v porovnání 50 a 100 epoch? Lze objektivně říci, že je 50 epoch dostačujících?
  4. Kvantitativní vyhodnocení úspěšnosti modelů s různou úrovní šumu jste porovnával pouze z hlediska DSC. Zvažoval jste porovnání i z hlediska Hausdorffovy vzdálenosti (HD95)?
Points proposed by reviewer: 95

Grade proposed by reviewer: A

Responsibility: Mgr. et Mgr. Hana Odstrčilová