diplomová práce

Sledování objektů ve videu

Text práce 5.28 MB

Autor práce: Ing. Eva Mičánková

Ak. rok: 2024/2025

Vedoucí: Ing. Michal Hradiš, Ph.D.

Oponent: prof. Ing. Adam Herout, Ph.D.

Abstrakt:

Tato diplomová práce se zabývá segmentací objektů v obrazových datech a sledováním objektů ve videosekvencích s využitím nejmodernějších modelů hlubokého učení. Hlavní část práce je věnována návrhu a realizaci řešení interaktivní segmentace střevních polypů, vycházejícího z modelu SAM2, který byl doladěn na proprietárních datových sadách poskytnutých společností MAIA Labs. Experimentálně byly dotrénované modely porovnány s tradičními segmentačními metodami, včetně architektur U-Net a systému tracking-by-detection. Výsledky experimentů prokázaly, že SAM2 dosahuje výrazně lepších výsledků, zejména v oblasti video segmentace, a vykazuje značný potenciál pro praktické využití, např. pro zrychlení a zpřesnění procesu anotace nových dat.

Klíčová slova:

interaktivní segmentace, interaktivní tracking, XMem, Cutie, SAM, SAM2, MedSAM-2, U-Net, fine-tunování, kolonoskopie, kolorektální karcinom, střevní polypy

Termín obhajoby

24.06.2025

Výsledek obhajoby

obhájeno (práce byla úspěšně obhájena)

znamkaAznamka

Klasifikace

A

Průběh obhajoby

Studentka nejprve prezentovala výsledky, kterých dosáhla v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Studentka následně odpověděla na otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studentky na položené otázky rozhodla práci hodnotit stupněm A.

Otázky k obhajobě

  1. Jak si mám představit uživatelskou práci s vaším řešením? 
  2. Proč jste se rozhodla pro češtinu? 

Jazyk práce

čeština

Fakulta

Ústav

Studijní program

Informační technologie a umělá inteligence (MITAI)

Specializace

Počítačové vidění (NVIZ)

Složení komise

prof. Ing. Martin Čadík, Ph.D. (předseda)
doc. Ing. Vítězslav Beran, Ph.D. (člen)
prof. RNDr. Alexandr Meduna, CSc. (člen)
Ing. Tomáš Milet, Ph.D. (člen)
Ing. Zdeněk Materna, Ph.D. (člen)
Ing. David Bařina, Ph.D. (člen)

Posudek vedoucího
Ing. Michal Hradiš, Ph.D.

Studentka pracovala aktivně a systematicky. Zvolila si náročný a zajímavý způsob řešení, se kterým si dobře poradila. Velmi oceňuji, že se nenechala odradit ve chvílích, kdy z experimentů vycházely beznadějně špatné výsledky a systematickou prací se nakonec dokázala dostat ke kvalitním výsledkům.

Kritérium hodnocení Slovní hodnocení
Informace k zadání

Jednalo se o náročné téma potřebou nestandardního trénování složitých a velkých neuronových sítí, náročností experimentů, i potřebou zpracovat a připravit datové sady videí, které nebyly specificky anotovány pro tento účel. Studentka se nezalekla náročné varianty řešení, systematicky přistupovala k experimentům a dokázala získat zajímavé poznatky i natrénovat kvalitní neuronové sítě.

Aktivita při dokončování

Studentka práci dokončovala v poměrně klidném tempu. Text, výsledky, i závěry dobře konzultovala.

Publikační činnost, ocenění

Studentka práci prezentovala na Excel@FIT 2025.

Práce s literaturou

Studentka si aktivně vyhledala potřebné zdroje zachycující aktuální stav poznání v dané oblasti a dokázala je v práci dobře využít.

Aktivita během řešení, konzultace, komunikace

Studentka pracovala aktivně, pravidelně konzultovala postup a průběžné výsledky.

Výsledný počet bodů navržený vedoucím: 95

Známka navržená vedoucím: A

Práce je výzkumného charakteru. Řešitelka nastudovala opravdu nejmodernější a nejlepší dostupné modely pro řešení zadané úlohy a provedla nad nimi věrohodné a užitečné experimenty a srovnání. Technická zpráva je sepsána velice pečlivě a může sloužit jako velice kvalitní text, který někomu pomůže proniknout do řešené problematiky.


Práce byla prezentována na studentské konferenci Excel@FIT.

Kritérium hodnocení Slovní hodnocení Body
Rozsah splnění požadavků zadání

Stupeň hodnocení: zadání splněno

Rozsah technické zprávy

Stupeň hodnocení: je v obvyklém rozmezí

Prezentační úroveň technické zprávy

Textová zpráva je sepsaná výborně – neobsahuje zbytečné pasáže a zároveň pokrývá všechno podstatné. Text je sepsaný promyšleně, velice kvalitním a srozumitelným jazykem. V textu je také použito velké množství vizuálů (převážně obrázků) a matematického zápisu, který vhodně doplňuje textové sdělení.

95
Formální úprava technické zprávy

Po formální stránce je technická zpráva zpracována velice pečlivě. V některých místech unikly drobnosti (odkazy na kapitoly v kapitole 1 jsou pouze číslem, někde jsou použity nesprávné uvozovky, obrázky 3.2, 3.3 jsou nesprávně oříznuté, ...). Některé (vzácné) jazykové formulace jsou poněkud toporné a naznačují možné (nezvládnuté) použití strojového překladu (paměť "zadržuje", atd.).

89
Práce s literaturou

Řešitelka vyšla z nejaktuálnějších a hodně složitých modelů hlubokého strojového učení. Použité metody dobře nastudovala a opravdu kvalitně popsala ve svém textu. Je také patrné, že dobře ovládla proces strojového učení, práci s datovými sadami a způsob vyhodnocování natrénovaných modelů.

95
Realizační výstup

Realizačním výstupem je sada skriptů pro práci s datovými sadami, pro trénování modelů strojového učení a pro vyhodnocování výsledků. Systém skritpů je adekvátně strukturovaný a zdrojový kód je velice kvalitní a znovupoužitelný.

95
Využitelnost výsledků

Řešitelka provedla řadu experimentů, které vrhají světlo na použitelnost dostupných nejmodernějších modelů pro segmentaci pro konkrétní úlohy segmentace a sledování objektů v medicínských datech. Práce byla řešena pro konkrétní firmu, která jistě může z dodaných výsledků čerpat hodnotu.

Náročnost zadání

Stupeň hodnocení: obtížnější zadání

Práce využívá nejnovějších a hodně sofistikovaných modelů strojového učení pro počítačové vidění. Řešitelka nastudovala a pochopila nejvýkonnější dostupné modely pro segmentaci a sledování objektů ve videu. Při řešení také ovládla pokročilé nástroje pro strojové učení, způsoby vyhodnocování a interpretace výsledků a práci s datovými sadami.

Výsledný počet bodů navržený oponentem: 90

Známka navržená oponentem: A

Odpovědnost: Mgr. et Mgr. Hana Odstrčilová