Přístupnostní navigace
E-application
Search Search Close
Master's Thesis
Author of thesis: Ing. Eva Mičánková
Acad. year: 2024/2025
Supervisor: Ing. Michal Hradiš, Ph.D.
Reviewer: prof. Ing. Adam Herout, Ph.D.
This thesis focuses on object segmentation in image data and object tracking in video sequences using state-of-the-art deep learning models. The core part of the work is dedicated to the design and implementation of an interactive segmentation solution for colorectal polyps, based on the SAM2 model fine-tuned on a proprietary datasets provided by MAIA Labs. The fine-tuned models were experimentally compared with traditional segmentation methods, including U-Net architectures and a tracking-by-detection system. The results demonstrated that SAM2 achieves significantly better performance, particularly in video segmentation, and that it shows strong potential for practical applications – for instance, in accelerating and improving the annotation of new data.
interactive segmentation, interactive tracking, XMem, Cutie, SAM, SAM2, MedSAM-2, U-Net, fine-tuning, colonoscopy, colorectal cancer, intestinal polyps
Date of defence
24.06.2025
Result of the defence
Defended (thesis was successfully defended)
Grading
A
Process of defence
Studentka nejprve prezentovala výsledky, kterých dosáhla v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Studentka následně odpověděla na otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studentky na položené otázky rozhodla práci hodnotit stupněm A.
Topics for thesis defence
Language of thesis
Czech
Faculty
Fakulta informačních technologií
Department
Department of Computer Graphics and Multimedia
Study programme
Information Technology and Artificial Intelligence (MITAI)
Specialization
Computer Vision (NVIZ)
Composition of Committee
prof. Ing. Martin Čadík, Ph.D. (předseda) doc. Ing. Vítězslav Beran, Ph.D. (člen) prof. RNDr. Alexandr Meduna, CSc. (člen) Ing. Tomáš Milet, Ph.D. (člen) Ing. Zdeněk Materna, Ph.D. (člen) Ing. David Bařina, Ph.D. (člen)
Supervisor’s reportIng. Michal Hradiš, Ph.D.
Studentka pracovala aktivně a systematicky. Zvolila si náročný a zajímavý způsob řešení, se kterým si dobře poradila. Velmi oceňuji, že se nenechala odradit ve chvílích, kdy z experimentů vycházely beznadějně špatné výsledky a systematickou prací se nakonec dokázala dostat ke kvalitním výsledkům.
Jednalo se o náročné téma potřebou nestandardního trénování složitých a velkých neuronových sítí, náročností experimentů, i potřebou zpracovat a připravit datové sady videí, které nebyly specificky anotovány pro tento účel. Studentka se nezalekla náročné varianty řešení, systematicky přistupovala k experimentům a dokázala získat zajímavé poznatky i natrénovat kvalitní neuronové sítě.
Studentka práci dokončovala v poměrně klidném tempu. Text, výsledky, i závěry dobře konzultovala.
Studentka práci prezentovala na Excel@FIT 2025.
Studentka si aktivně vyhledala potřebné zdroje zachycující aktuální stav poznání v dané oblasti a dokázala je v práci dobře využít.
Studentka pracovala aktivně, pravidelně konzultovala postup a průběžné výsledky.
Grade proposed by supervisor: A
Reviewer’s reportprof. Ing. Adam Herout, Ph.D.
Práce je výzkumného charakteru. Řešitelka nastudovala opravdu nejmodernější a nejlepší dostupné modely pro řešení zadané úlohy a provedla nad nimi věrohodné a užitečné experimenty a srovnání. Technická zpráva je sepsána velice pečlivě a může sloužit jako velice kvalitní text, který někomu pomůže proniknout do řešené problematiky.
Práce byla prezentována na studentské konferenci Excel@FIT.
Evaluation level: zadání splněno
Evaluation level: je v obvyklém rozmezí
Textová zpráva je sepsaná výborně – neobsahuje zbytečné pasáže a zároveň pokrývá všechno podstatné. Text je sepsaný promyšleně, velice kvalitním a srozumitelným jazykem. V textu je také použito velké množství vizuálů (převážně obrázků) a matematického zápisu, který vhodně doplňuje textové sdělení.
Po formální stránce je technická zpráva zpracována velice pečlivě. V některých místech unikly drobnosti (odkazy na kapitoly v kapitole 1 jsou pouze číslem, někde jsou použity nesprávné uvozovky, obrázky 3.2, 3.3 jsou nesprávně oříznuté, ...). Některé (vzácné) jazykové formulace jsou poněkud toporné a naznačují možné (nezvládnuté) použití strojového překladu (paměť "zadržuje", atd.).
Řešitelka vyšla z nejaktuálnějších a hodně složitých modelů hlubokého strojového učení. Použité metody dobře nastudovala a opravdu kvalitně popsala ve svém textu. Je také patrné, že dobře ovládla proces strojového učení, práci s datovými sadami a způsob vyhodnocování natrénovaných modelů.
Realizačním výstupem je sada skriptů pro práci s datovými sadami, pro trénování modelů strojového učení a pro vyhodnocování výsledků. Systém skritpů je adekvátně strukturovaný a zdrojový kód je velice kvalitní a znovupoužitelný.
Řešitelka provedla řadu experimentů, které vrhají světlo na použitelnost dostupných nejmodernějších modelů pro segmentaci pro konkrétní úlohy segmentace a sledování objektů v medicínských datech. Práce byla řešena pro konkrétní firmu, která jistě může z dodaných výsledků čerpat hodnotu.
Evaluation level: obtížnější zadání
Práce využívá nejnovějších a hodně sofistikovaných modelů strojového učení pro počítačové vidění. Řešitelka nastudovala a pochopila nejvýkonnější dostupné modely pro segmentaci a sledování objektů ve videu. Při řešení také ovládla pokročilé nástroje pro strojové učení, způsoby vyhodnocování a interpretace výsledků a práci s datovými sadami.
Grade proposed by reviewer: A
Responsibility: Mgr. et Mgr. Hana Odstrčilová