Master's Thesis

Sledování objektů ve videu

Final Thesis 5.28 MB

Author of thesis: Ing. Eva Mičánková

Acad. year: 2024/2025

Supervisor: Ing. Michal Hradiš, Ph.D.

Reviewer: prof. Ing. Adam Herout, Ph.D.

Abstract:

This thesis focuses on object segmentation in image data and object tracking in video sequences using state-of-the-art deep learning models. The core part of the work is dedicated to the design and implementation of an interactive segmentation solution for colorectal polyps, based on the SAM2 model fine-tuned on a proprietary datasets provided by MAIA Labs. The fine-tuned models were experimentally compared with traditional segmentation methods, including U-Net architectures and a tracking-by-detection system. The results demonstrated that SAM2 achieves significantly better performance, particularly in video segmentation, and that it shows strong potential for practical applications – for instance, in accelerating and improving the annotation of new data.

Keywords:

interactive segmentation, interactive tracking, XMem, Cutie, SAM, SAM2, MedSAM-2, U-Net, fine-tuning, colonoscopy, colorectal cancer, intestinal polyps

Date of defence

24.06.2025

Result of the defence

Defended (thesis was successfully defended)

znamkaAznamka

Grading

A

Process of defence

Studentka nejprve prezentovala výsledky, kterých dosáhla v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Studentka následně odpověděla na otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studentky na položené otázky rozhodla práci hodnotit stupněm A.

Topics for thesis defence

  1. Jak si mám představit uživatelskou práci s vaším řešením? 
  2. Proč jste se rozhodla pro češtinu? 

Language of thesis

Czech

Faculty

Department

Study programme

Information Technology and Artificial Intelligence (MITAI)

Specialization

Computer Vision (NVIZ)

Composition of Committee

prof. Ing. Martin Čadík, Ph.D. (předseda)
doc. Ing. Vítězslav Beran, Ph.D. (člen)
prof. RNDr. Alexandr Meduna, CSc. (člen)
Ing. Tomáš Milet, Ph.D. (člen)
Ing. Zdeněk Materna, Ph.D. (člen)
Ing. David Bařina, Ph.D. (člen)

Supervisor’s report
Ing. Michal Hradiš, Ph.D.

Studentka pracovala aktivně a systematicky. Zvolila si náročný a zajímavý způsob řešení, se kterým si dobře poradila. Velmi oceňuji, že se nenechala odradit ve chvílích, kdy z experimentů vycházely beznadějně špatné výsledky a systematickou prací se nakonec dokázala dostat ke kvalitním výsledkům.

Evaluation criteria Verbal classification
Informace k zadání

Jednalo se o náročné téma potřebou nestandardního trénování složitých a velkých neuronových sítí, náročností experimentů, i potřebou zpracovat a připravit datové sady videí, které nebyly specificky anotovány pro tento účel. Studentka se nezalekla náročné varianty řešení, systematicky přistupovala k experimentům a dokázala získat zajímavé poznatky i natrénovat kvalitní neuronové sítě.

Aktivita při dokončování

Studentka práci dokončovala v poměrně klidném tempu. Text, výsledky, i závěry dobře konzultovala.

Publikační činnost, ocenění

Studentka práci prezentovala na Excel@FIT 2025.

Práce s literaturou

Studentka si aktivně vyhledala potřebné zdroje zachycující aktuální stav poznání v dané oblasti a dokázala je v práci dobře využít.

Aktivita během řešení, konzultace, komunikace

Studentka pracovala aktivně, pravidelně konzultovala postup a průběžné výsledky.

Points proposed by supervisor: 95

Grade proposed by supervisor: A

Reviewer’s report
prof. Ing. Adam Herout, Ph.D.

Práce je výzkumného charakteru. Řešitelka nastudovala opravdu nejmodernější a nejlepší dostupné modely pro řešení zadané úlohy a provedla nad nimi věrohodné a užitečné experimenty a srovnání. Technická zpráva je sepsána velice pečlivě a může sloužit jako velice kvalitní text, který někomu pomůže proniknout do řešené problematiky.


Práce byla prezentována na studentské konferenci Excel@FIT.

Evaluation criteria Verbal classification Points
Rozsah splnění požadavků zadání

Evaluation level: zadání splněno

Rozsah technické zprávy

Evaluation level: je v obvyklém rozmezí

Prezentační úroveň technické zprávy

Textová zpráva je sepsaná výborně – neobsahuje zbytečné pasáže a zároveň pokrývá všechno podstatné. Text je sepsaný promyšleně, velice kvalitním a srozumitelným jazykem. V textu je také použito velké množství vizuálů (převážně obrázků) a matematického zápisu, který vhodně doplňuje textové sdělení.

95
Formální úprava technické zprávy

Po formální stránce je technická zpráva zpracována velice pečlivě. V některých místech unikly drobnosti (odkazy na kapitoly v kapitole 1 jsou pouze číslem, někde jsou použity nesprávné uvozovky, obrázky 3.2, 3.3 jsou nesprávně oříznuté, ...). Některé (vzácné) jazykové formulace jsou poněkud toporné a naznačují možné (nezvládnuté) použití strojového překladu (paměť "zadržuje", atd.).

89
Práce s literaturou

Řešitelka vyšla z nejaktuálnějších a hodně složitých modelů hlubokého strojového učení. Použité metody dobře nastudovala a opravdu kvalitně popsala ve svém textu. Je také patrné, že dobře ovládla proces strojového učení, práci s datovými sadami a způsob vyhodnocování natrénovaných modelů.

95
Realizační výstup

Realizačním výstupem je sada skriptů pro práci s datovými sadami, pro trénování modelů strojového učení a pro vyhodnocování výsledků. Systém skritpů je adekvátně strukturovaný a zdrojový kód je velice kvalitní a znovupoužitelný.

95
Využitelnost výsledků

Řešitelka provedla řadu experimentů, které vrhají světlo na použitelnost dostupných nejmodernějších modelů pro segmentaci pro konkrétní úlohy segmentace a sledování objektů v medicínských datech. Práce byla řešena pro konkrétní firmu, která jistě může z dodaných výsledků čerpat hodnotu.

Náročnost zadání

Evaluation level: obtížnější zadání

Práce využívá nejnovějších a hodně sofistikovaných modelů strojového učení pro počítačové vidění. Řešitelka nastudovala a pochopila nejvýkonnější dostupné modely pro segmentaci a sledování objektů ve videu. Při řešení také ovládla pokročilé nástroje pro strojové učení, způsoby vyhodnocování a interpretace výsledků a práci s datovými sadami.

Points proposed by reviewer: 90

Grade proposed by reviewer: A

Responsibility: Mgr. et Mgr. Hana Odstrčilová