Přístupnostní navigace
E-application
Search Search Close
Master's Thesis
Author of thesis: Ing. Gregor Karetka
Acad. year: 2024/2025
Supervisor: Ing. Jakub Špaňhel, Ph.D.
Reviewer: Ing. Marek Vaško
Unconventional methods of personal biometrics are gaining popularity not only in academic circles but also in the commercial sphere. This thesis focuses on the human ear as a possible biometric modality and explores the current trends in the field of ear recognition. Furthermore, current trends in computer vision are explored, mainly deep learning models, loss functions, and datasets for ear recognition. In this thesis, we present a novel method for generating a dataset for ear recognition. Also, we trained deep learning models for ear recognition, presented the experiment setup, obtained results, and compared them with the current state-of-the-art methods for ear recognition.
biometry, unconventional biometry, ear recognition, image recognition, deep learning, convolutional neural networks, transformers
Date of defence
24.06.2025
Result of the defence
Defended (thesis was successfully defended)
Grading
A
Process of defence
Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm A.
Topics for thesis defence
Language of thesis
English
Faculty
Fakulta informačních technologií
Department
Department of Computer Graphics and Multimedia
Study programme
Information Technology and Artificial Intelligence (MITAI)
Specialization
Machine Learning (NMAL)
Composition of Committee
prof. Dr. Ing. Jan Černocký (předseda) doc. Ing. Lukáš Burget, Ph.D. (člen) doc. Ing. Vladimír Janoušek, Ph.D. (člen) Ing. Michal Hradiš, Ph.D. (člen) Ing. Jaroslav Rozman, Ph.D. (člen) Ing. František Grézl, Ph.D. (člen)
Supervisor’s reportIng. Jakub Špaňhel, Ph.D.
V průběhu řešení práce student aktivně přícházel s nápady, které by chtěl v práci vyzkoušet. Navržené přístupy k problematice byly následně implentovány a řádně evaluovány. Sekce s experimenty koresponduje s evolucí metody identifikace v průběhu řešení práce. Vzhledem k aktivitě studenta v průběhu řešení diplomové práce a jeho zapojení do konference Excel@FIT hodnotím práci stupněm A.
Student měl za úkol prozkoumat netradiční metody biometrie. Na začátku řešení práce bylo upřesněno její zaměření na problematiku identifikace osob na základě biometrie ucha. Vzhledem k omezeným zdrojům jak na straně literatury, tak na straně datasetů, považuji zadání za obtížnější.
Práce byla dokončena v předstihu s dostatečnou rezervou na psaní textu. Text byl nasdílen vedoucímu práce a při dokončování práce byl k textu vícekrát poskytnutý feedback.
Student svoji práci prezentoval v rámci studentské konference Excel@FIT 2025.
Student si sám dohledal potřebné zdroje a literaturu ve formě konferenčních či časopisových článků.
Student byl v průběhu řešení práce velice aktivní. O téma se aktivně zajímal od samého začátku řešení práce a první experimenty prováděl velmi brzy. Na konzultace chodil pravidelně a vždy řádně připraven.
Grade proposed by supervisor: A
Reviewer’s reportIng. Marek Vaško
Celkovo je práca veľmi obsiahla, z pohľadu experimentov autor dodal veľké množstvo výsledkov, z ktorých sú jasné možnosti zlepšenia tréningu modelov pre identifikáciu osôb pomocou uší.
Celkovo hodnotím prácu veľmi pozitívne a je jasné množstvo úsilia, ktoré do implementácie a výskumu autor vložil.
Mierne negatívne hodnotím niektoré formálne nedostatky textu práce, popísané v predošlých sekciách. V kontexte dosiahnutých výsledkov tieto nedostatky ovplyvňujú hodnotenie len mierne.
Pre prácu navrhujem známku na pomedzí A/B.
Evaluation level: zadání splněno
Zadanie je splnené v plnom rozsahu a zároveň autor preskúmal značne bod 6. "Experimentujte s vaší implementací a případně navrhněte vlastní modifikace metod."
Rozsah riešenia v tomto bode je silnou stránkou tejto práce, kde autor vyskúšal rôzne architektúry neurónových sietí, spôsoby tréningu, spôsoby pred-trénovania a všetko zhrnul v rozsiahlom porovnaní.
Z tohto pohľadu je zadanie splnené aj mierne nad rámec popísaných bodov.
Evaluation level: je v obvyklém rozmezí
Práca sa dobre číta avšak samotná štruktúra má zopár nedostatkov.
Celkovo je jasné, čo je cieľom práce a to ako to dosiahnuť, ale práca obsahuje len 3 pomerne rozsiahle kapitoly (vynechajúc Úvod a Záver).
Z pohľadu delenia negatívne hodnotím, že teoretický úvod je celý zhrnutý v jednej kapitole s názvom "Machine Learning for personal identification", čo z názvu invokuje skôr úvod do obecnej biometrickej problematiky. Kapitola však obsahuje všetko od úvodu do identifikácie osôb pomocou ucha, cez prehľad obecných architektúr sietí, obecný prehľad spôsobov tréningu až po dátové sady a zarovnávanie obrazu.
Podobnú výhradu mám aj ku kapitole "Unconventional biometrics", ktorá obsahuje všetko ohľadom návrhu riešenia. Kapitola je teda veľmi rozsiahla, a zároveň jej názov je príliš obecný. Práca je zameraná "len" na identifikáciu pomocou ucha, v tejto kapitole je popísané ako generovanie syntetických dát tak a aj implementácia a konfigurácia trénovacích skriptov.
Z jazykového hľadiska je práca písaná dobrou angličtinou, s menším množstvom formálnych chýb.
Z typografického hľadiska hodnotím pozitívne vizualizácie a množstvo dodaných tabuliek. Mierne typografické výhrady sú k popisom a formátovaniu tabuliek. Napríklad tabuľky 4.9 a 4.11, z prvého stĺpcu nie je priamo jasné, čo hodnoty za názvami znamenajú.
Podobne mám aj výhradu ku niekedy mätúcim popisom vyhodnocovacích metrík v texte a obsahom tabuliek. Príklad je sekcia 4.2 kde v "Datasets" a "Evaluation metrics" sú spomenuté metriky plochy pod verifikačnou ROC krivkou a top-k presnosť, tabuľka 4.7 však obsahuje iba AUC a úplne iné metriky.
Autor pracuje s literatúrou veľmi dobre, zdroje sú primárne dobré hodnotené konferencie a žurnály, prípadne autor cituje pre-print verzie článkov. Všetky využívané metódy sú z posledných rokov a predstavujú aktuálny state-of-the-art.
Práca kombinuje hlavne existujúce prístupy a získava unikátne výsledky na špecifickom probléme identifikácie osôb pomocou uší.
Z pohľadu citačnej etiky je jasné, ktoré myšlienky boli autorom prevzaté a aký je ich pôvod.
Spôsob, akým autor využívania literatúru hodnotím veľmi pozitívne.
Odovzdané zdrojové kódy sú zdokumentované a rozdelené do modulov, z README je jasné ako spustiť tréning a inferenciu.
Odovzdané sú taktiež aj pred-trénované modely spomenuté v práci, z pohľadu dokumentácie je jasné ako dosiahnuté výsledky zreplikovať.
Jedná sa o prácu kompilačného charakteru, autor aplikuje metódy používané v oblasti počítačového videnia na problém identifikácie osôb pomocou ucha.
Vo výsledkoch práce je prezentovaný aj autorom vytvorený model, ktorý dosahuje lepšie výsledky ako porovnávané state-of-the-art modely zo súťaže UERC 2023.
Práca bola autorom prezentovaná aj na konferencii Excel@FIT, a dosiahnuté poznatky sú aplikovateľné aj v praxi.
Evaluation level: obtížnější zadání
Práca je zameraná na biometriu v málo preskúmanej oblasti uší. Pre splnenie zadania musel riešiteľ preskúmať rôzne metódy využívané pre tréning hlbokých neurónových sietí, spôsoby vyhodnocovania dosiahnutých výsledkov, metódy pre spracovanie obrazu a prístupy pre generovanie syntetických fotiek.
Hlavne z pohľadu toho aká je problematika počítačového videnia rozsiahla, je práca mierne nad obsahom magisterského študijného programu, jedná sa teda o obtiažnejšie zadanie.
Grade proposed by reviewer: B
Responsibility: Mgr. et Mgr. Hana Odstrčilová