Přístupnostní navigace
E-přihláška
Vyhledávání Vyhledat Zavřít
diplomová práce
Autor práce: Ing. Eva Mičánková
Ak. rok: 2024/2025
Vedoucí: Ing. Michal Hradiš, Ph.D.
Oponent: prof. Ing. Adam Herout, Ph.D.
Tato diplomová práce se zabývá segmentací objektů v obrazových datech a sledováním objektů ve videosekvencích s využitím nejmodernějších modelů hlubokého učení. Hlavní část práce je věnována návrhu a realizaci řešení interaktivní segmentace střevních polypů, vycházejícího z modelu SAM2, který byl doladěn na proprietárních datových sadách poskytnutých společností MAIA Labs. Experimentálně byly dotrénované modely porovnány s tradičními segmentačními metodami, včetně architektur U-Net a systému tracking-by-detection. Výsledky experimentů prokázaly, že SAM2 dosahuje výrazně lepších výsledků, zejména v oblasti video segmentace, a vykazuje značný potenciál pro praktické využití, např. pro zrychlení a zpřesnění procesu anotace nových dat.
interaktivní segmentace, interaktivní tracking, XMem, Cutie, SAM, SAM2, MedSAM-2, U-Net, fine-tunování, kolonoskopie, kolorektální karcinom, střevní polypy
Termín obhajoby
24.06.2025
Výsledek obhajoby
obhájeno (práce byla úspěšně obhájena)
Klasifikace
A
Průběh obhajoby
Studentka nejprve prezentovala výsledky, kterých dosáhla v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Studentka následně odpověděla na otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studentky na položené otázky rozhodla práci hodnotit stupněm A.
Otázky k obhajobě
Jazyk práce
čeština
Fakulta
Fakulta informačních technologií
Ústav
Ústav počítačové grafiky a multimédií
Studijní program
Informační technologie a umělá inteligence (MITAI)
Specializace
Počítačové vidění (NVIZ)
Složení komise
prof. Ing. Martin Čadík, Ph.D. (předseda) doc. Ing. Vítězslav Beran, Ph.D. (člen) prof. RNDr. Alexandr Meduna, CSc. (člen) Ing. Tomáš Milet, Ph.D. (člen) Ing. Zdeněk Materna, Ph.D. (člen) Ing. David Bařina, Ph.D. (člen)
Posudek vedoucíhoIng. Michal Hradiš, Ph.D.
Studentka pracovala aktivně a systematicky. Zvolila si náročný a zajímavý způsob řešení, se kterým si dobře poradila. Velmi oceňuji, že se nenechala odradit ve chvílích, kdy z experimentů vycházely beznadějně špatné výsledky a systematickou prací se nakonec dokázala dostat ke kvalitním výsledkům.
Jednalo se o náročné téma potřebou nestandardního trénování složitých a velkých neuronových sítí, náročností experimentů, i potřebou zpracovat a připravit datové sady videí, které nebyly specificky anotovány pro tento účel. Studentka se nezalekla náročné varianty řešení, systematicky přistupovala k experimentům a dokázala získat zajímavé poznatky i natrénovat kvalitní neuronové sítě.
Studentka práci dokončovala v poměrně klidném tempu. Text, výsledky, i závěry dobře konzultovala.
Studentka práci prezentovala na Excel@FIT 2025.
Studentka si aktivně vyhledala potřebné zdroje zachycující aktuální stav poznání v dané oblasti a dokázala je v práci dobře využít.
Studentka pracovala aktivně, pravidelně konzultovala postup a průběžné výsledky.
Známka navržená vedoucím: A
Posudek oponentaprof. Ing. Adam Herout, Ph.D.
Práce je výzkumného charakteru. Řešitelka nastudovala opravdu nejmodernější a nejlepší dostupné modely pro řešení zadané úlohy a provedla nad nimi věrohodné a užitečné experimenty a srovnání. Technická zpráva je sepsána velice pečlivě a může sloužit jako velice kvalitní text, který někomu pomůže proniknout do řešené problematiky.
Práce byla prezentována na studentské konferenci Excel@FIT.
Stupeň hodnocení: zadání splněno
Stupeň hodnocení: je v obvyklém rozmezí
Textová zpráva je sepsaná výborně – neobsahuje zbytečné pasáže a zároveň pokrývá všechno podstatné. Text je sepsaný promyšleně, velice kvalitním a srozumitelným jazykem. V textu je také použito velké množství vizuálů (převážně obrázků) a matematického zápisu, který vhodně doplňuje textové sdělení.
Po formální stránce je technická zpráva zpracována velice pečlivě. V některých místech unikly drobnosti (odkazy na kapitoly v kapitole 1 jsou pouze číslem, někde jsou použity nesprávné uvozovky, obrázky 3.2, 3.3 jsou nesprávně oříznuté, ...). Některé (vzácné) jazykové formulace jsou poněkud toporné a naznačují možné (nezvládnuté) použití strojového překladu (paměť "zadržuje", atd.).
Řešitelka vyšla z nejaktuálnějších a hodně složitých modelů hlubokého strojového učení. Použité metody dobře nastudovala a opravdu kvalitně popsala ve svém textu. Je také patrné, že dobře ovládla proces strojového učení, práci s datovými sadami a způsob vyhodnocování natrénovaných modelů.
Realizačním výstupem je sada skriptů pro práci s datovými sadami, pro trénování modelů strojového učení a pro vyhodnocování výsledků. Systém skritpů je adekvátně strukturovaný a zdrojový kód je velice kvalitní a znovupoužitelný.
Řešitelka provedla řadu experimentů, které vrhají světlo na použitelnost dostupných nejmodernějších modelů pro segmentaci pro konkrétní úlohy segmentace a sledování objektů v medicínských datech. Práce byla řešena pro konkrétní firmu, která jistě může z dodaných výsledků čerpat hodnotu.
Stupeň hodnocení: obtížnější zadání
Práce využívá nejnovějších a hodně sofistikovaných modelů strojového učení pro počítačové vidění. Řešitelka nastudovala a pochopila nejvýkonnější dostupné modely pro segmentaci a sledování objektů ve videu. Při řešení také ovládla pokročilé nástroje pro strojové učení, způsoby vyhodnocování a interpretace výsledků a práci s datovými sadami.
Známka navržená oponentem: A
Odpovědnost: Mgr. et Mgr. Hana Odstrčilová