Přístupnostní navigace
E-přihláška
Vyhledávání Vyhledat Zavřít
diplomová práce
Autor práce: Ing. Gregor Karetka
Ak. rok: 2024/2025
Vedoucí: Ing. Jakub Špaňhel, Ph.D.
Oponent: Ing. Marek Vaško
Nekonvenčné metódy osobnej biometrie sa stávajú čoraz obľúbenejšie nielen v akademickej sfére, ale aj na komerčné použite. Táto práca sa zameriava na ľudské ucho ako možnú biometrickú modalitu a sústredí sa na súčasné trendy v rozpoznávaní ucha. Následne sú predstavené súčasné trendy v počítačovom videní, modely hlbokého učenia, kriteriálne funkcie a datasety na rozpoznávanie uší. Taktiež v tejto práci predstavujeme novú metódu na generovanie syntetických datasetov na rozpoznávanie ucha. Natrénovali sme niekolko modelov hlbokého učenia na rozpoznávanie uší, predstavili sme nastavenie a výsledky experimentov, ktoré sme následne porovnali s momentálne najlepšími modelmi na spracovanie ľudského ucha pre potreby biometrie.
biometria, netradičná biometria, rozpoznávanie uší, spracovanie obrazu, hlboké učenie, konvolučné neurónové siete, transformer
Termín obhajoby
24.06.2025
Výsledek obhajoby
obhájeno (práce byla úspěšně obhájena)
Klasifikace
A
Průběh obhajoby
Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm A.
Otázky k obhajobě
Jazyk práce
angličtina
Fakulta
Fakulta informačních technologií
Ústav
Ústav počítačové grafiky a multimédií
Studijní program
Informační technologie a umělá inteligence (MITAI)
Specializace
Strojové učení (NMAL)
Složení komise
prof. Dr. Ing. Jan Černocký (předseda) doc. Ing. Lukáš Burget, Ph.D. (člen) doc. Ing. Vladimír Janoušek, Ph.D. (člen) Ing. Michal Hradiš, Ph.D. (člen) Ing. Jaroslav Rozman, Ph.D. (člen) Ing. František Grézl, Ph.D. (člen)
Posudek vedoucíhoIng. Jakub Špaňhel, Ph.D.
V průběhu řešení práce student aktivně přícházel s nápady, které by chtěl v práci vyzkoušet. Navržené přístupy k problematice byly následně implentovány a řádně evaluovány. Sekce s experimenty koresponduje s evolucí metody identifikace v průběhu řešení práce. Vzhledem k aktivitě studenta v průběhu řešení diplomové práce a jeho zapojení do konference Excel@FIT hodnotím práci stupněm A.
Student měl za úkol prozkoumat netradiční metody biometrie. Na začátku řešení práce bylo upřesněno její zaměření na problematiku identifikace osob na základě biometrie ucha. Vzhledem k omezeným zdrojům jak na straně literatury, tak na straně datasetů, považuji zadání za obtížnější.
Práce byla dokončena v předstihu s dostatečnou rezervou na psaní textu. Text byl nasdílen vedoucímu práce a při dokončování práce byl k textu vícekrát poskytnutý feedback.
Student svoji práci prezentoval v rámci studentské konference Excel@FIT 2025.
Student si sám dohledal potřebné zdroje a literaturu ve formě konferenčních či časopisových článků.
Student byl v průběhu řešení práce velice aktivní. O téma se aktivně zajímal od samého začátku řešení práce a první experimenty prováděl velmi brzy. Na konzultace chodil pravidelně a vždy řádně připraven.
Známka navržená vedoucím: A
Posudek oponentaIng. Marek Vaško
Celkovo je práca veľmi obsiahla, z pohľadu experimentov autor dodal veľké množstvo výsledkov, z ktorých sú jasné možnosti zlepšenia tréningu modelov pre identifikáciu osôb pomocou uší.
Celkovo hodnotím prácu veľmi pozitívne a je jasné množstvo úsilia, ktoré do implementácie a výskumu autor vložil.
Mierne negatívne hodnotím niektoré formálne nedostatky textu práce, popísané v predošlých sekciách. V kontexte dosiahnutých výsledkov tieto nedostatky ovplyvňujú hodnotenie len mierne.
Pre prácu navrhujem známku na pomedzí A/B.
Stupeň hodnocení: zadání splněno
Zadanie je splnené v plnom rozsahu a zároveň autor preskúmal značne bod 6. "Experimentujte s vaší implementací a případně navrhněte vlastní modifikace metod."
Rozsah riešenia v tomto bode je silnou stránkou tejto práce, kde autor vyskúšal rôzne architektúry neurónových sietí, spôsoby tréningu, spôsoby pred-trénovania a všetko zhrnul v rozsiahlom porovnaní.
Z tohto pohľadu je zadanie splnené aj mierne nad rámec popísaných bodov.
Stupeň hodnocení: je v obvyklém rozmezí
Práca sa dobre číta avšak samotná štruktúra má zopár nedostatkov.
Celkovo je jasné, čo je cieľom práce a to ako to dosiahnuť, ale práca obsahuje len 3 pomerne rozsiahle kapitoly (vynechajúc Úvod a Záver).
Z pohľadu delenia negatívne hodnotím, že teoretický úvod je celý zhrnutý v jednej kapitole s názvom "Machine Learning for personal identification", čo z názvu invokuje skôr úvod do obecnej biometrickej problematiky. Kapitola však obsahuje všetko od úvodu do identifikácie osôb pomocou ucha, cez prehľad obecných architektúr sietí, obecný prehľad spôsobov tréningu až po dátové sady a zarovnávanie obrazu.
Podobnú výhradu mám aj ku kapitole "Unconventional biometrics", ktorá obsahuje všetko ohľadom návrhu riešenia. Kapitola je teda veľmi rozsiahla, a zároveň jej názov je príliš obecný. Práca je zameraná "len" na identifikáciu pomocou ucha, v tejto kapitole je popísané ako generovanie syntetických dát tak a aj implementácia a konfigurácia trénovacích skriptov.
Z jazykového hľadiska je práca písaná dobrou angličtinou, s menším množstvom formálnych chýb.
Z typografického hľadiska hodnotím pozitívne vizualizácie a množstvo dodaných tabuliek. Mierne typografické výhrady sú k popisom a formátovaniu tabuliek. Napríklad tabuľky 4.9 a 4.11, z prvého stĺpcu nie je priamo jasné, čo hodnoty za názvami znamenajú.
Podobne mám aj výhradu ku niekedy mätúcim popisom vyhodnocovacích metrík v texte a obsahom tabuliek. Príklad je sekcia 4.2 kde v "Datasets" a "Evaluation metrics" sú spomenuté metriky plochy pod verifikačnou ROC krivkou a top-k presnosť, tabuľka 4.7 však obsahuje iba AUC a úplne iné metriky.
Autor pracuje s literatúrou veľmi dobre, zdroje sú primárne dobré hodnotené konferencie a žurnály, prípadne autor cituje pre-print verzie článkov. Všetky využívané metódy sú z posledných rokov a predstavujú aktuálny state-of-the-art.
Práca kombinuje hlavne existujúce prístupy a získava unikátne výsledky na špecifickom probléme identifikácie osôb pomocou uší.
Z pohľadu citačnej etiky je jasné, ktoré myšlienky boli autorom prevzaté a aký je ich pôvod.
Spôsob, akým autor využívania literatúru hodnotím veľmi pozitívne.
Odovzdané zdrojové kódy sú zdokumentované a rozdelené do modulov, z README je jasné ako spustiť tréning a inferenciu.
Odovzdané sú taktiež aj pred-trénované modely spomenuté v práci, z pohľadu dokumentácie je jasné ako dosiahnuté výsledky zreplikovať.
Jedná sa o prácu kompilačného charakteru, autor aplikuje metódy používané v oblasti počítačového videnia na problém identifikácie osôb pomocou ucha.
Vo výsledkoch práce je prezentovaný aj autorom vytvorený model, ktorý dosahuje lepšie výsledky ako porovnávané state-of-the-art modely zo súťaže UERC 2023.
Práca bola autorom prezentovaná aj na konferencii Excel@FIT, a dosiahnuté poznatky sú aplikovateľné aj v praxi.
Stupeň hodnocení: obtížnější zadání
Práca je zameraná na biometriu v málo preskúmanej oblasti uší. Pre splnenie zadania musel riešiteľ preskúmať rôzne metódy využívané pre tréning hlbokých neurónových sietí, spôsoby vyhodnocovania dosiahnutých výsledkov, metódy pre spracovanie obrazu a prístupy pre generovanie syntetických fotiek.
Hlavne z pohľadu toho aká je problematika počítačového videnia rozsiahla, je práca mierne nad obsahom magisterského študijného programu, jedná sa teda o obtiažnejšie zadanie.
Známka navržená oponentem: B
Odpovědnost: Mgr. et Mgr. Hana Odstrčilová