diplomová práce

Netradiční metody biometrie osob

Text práce 4.75 MB Příloha 3.99 MB

Autor práce: Ing. Gregor Karetka

Ak. rok: 2024/2025

Abstrakt:

Nekonvenčné metódy osobnej biometrie sa stávajú čoraz obľúbenejšie nielen v akademickej sfére, ale aj na komerčné použite. Táto práca sa zameriava na ľudské ucho ako možnú biometrickú modalitu a sústredí sa na súčasné trendy v rozpoznávaní ucha. Následne sú predstavené súčasné trendy v počítačovom videní, modely hlbokého učenia, kriteriálne funkcie a datasety na rozpoznávanie uší. Taktiež v tejto práci predstavujeme novú metódu na generovanie syntetických datasetov na rozpoznávanie ucha. Natrénovali sme niekolko modelov hlbokého učenia na rozpoznávanie uší, predstavili sme nastavenie a výsledky experimentov, ktoré sme následne porovnali s momentálne najlepšími modelmi na spracovanie ľudského ucha pre potreby biometrie.

Klíčová slova:

biometria, netradičná biometria, rozpoznávanie uší, spracovanie obrazu, hlboké učenie, konvolučné neurónové siete, transformer

Termín obhajoby

24.06.2025

Výsledek obhajoby

obhájeno (práce byla úspěšně obhájena)

znamkaAznamka

Klasifikace

Průběh obhajoby

Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm A.

Otázky k obhajobě

Čo znamená "unlabeled data" pri self-learning experimentoch? O akú dátovú sadu sa jedná?
Pri self-training nie sú na "teacher" vetvu aplikované žiadne augmentácie, využívate pri optimalizácii "student" modelu pred-počítané vektory?
Aký je postup aplikovania jednotlivých ténovacích krokov pre model EVA02-B, ktorý vychádza najlepšie vo finálnom porovnaní?
Model EVA02-G vychádza z pohľadu AUC najlepšie v porovnaní VIT modelov, čo viedlo k tomu, že nie je využívaný v ďalších experimentoch?

Jazyk práce

angličtina

Fakulta

Fakulta informačních technologií

Ústav

Ústav počítačové grafiky a multimédií

Studijní program

Informační technologie a umělá inteligence (MITAI)

Specializace

Strojové učení (NMAL)

Složení komise

prof. Dr. Ing. Jan Černocký (předseda)
doc. Ing. Lukáš Burget, Ph.D. (člen)
doc. Ing. Vladimír Janoušek, Ph.D. (člen)
Ing. Michal Hradiš, Ph.D. (člen)
Ing. Jaroslav Rozman, Ph.D. (člen)
Ing. František Grézl, Ph.D. (člen)

Posudek vedoucího
Ing. Jakub Špaňhel, Ph.D.

V průběhu řešení práce student aktivně přícházel s nápady, které by chtěl v práci vyzkoušet. Navržené přístupy k problematice byly následně implentovány a řádně evaluovány. Sekce s experimenty koresponduje s evolucí metody identifikace v průběhu řešení práce. Vzhledem k aktivitě studenta v průběhu řešení diplomové práce a jeho zapojení do konference Excel@FIT hodnotím práci stupněm A.

Kritérium hodnocení	Slovní hodnocení
Informace k zadání	Student měl za úkol prozkoumat netradiční metody biometrie. Na začátku řešení práce bylo upřesněno její zaměření na problematiku identifikace osob na základě biometrie ucha. Vzhledem k omezeným zdrojům jak na straně literatury, tak na straně datasetů, považuji zadání za obtížnější.
Aktivita při dokončování	Práce byla dokončena v předstihu s dostatečnou rezervou na psaní textu. Text byl nasdílen vedoucímu práce a při dokončování práce byl k textu vícekrát poskytnutý feedback.
Publikační činnost, ocenění	Student svoji práci prezentoval v rámci studentské konference Excel@FIT 2025.
Práce s literaturou	Student si sám dohledal potřebné zdroje a literaturu ve formě konferenčních či časopisových článků.
Aktivita během řešení, konzultace, komunikace	Student byl v průběhu řešení práce velice aktivní. O téma se aktivně zajímal od samého začátku řešení práce a první experimenty prováděl velmi brzy. Na konzultace chodil pravidelně a vždy řádně připraven.

Výsledný počet bodů navržený vedoucím: 95

Známka navržená vedoucím: A

Posudek oponenta
Ing. Marek Vaško

Celkovo je práca veľmi obsiahla, z pohľadu experimentov autor dodal veľké množstvo výsledkov, z ktorých sú jasné možnosti zlepšenia tréningu modelov pre identifikáciu osôb pomocou uší.

Celkovo hodnotím prácu veľmi pozitívne a je jasné množstvo úsilia, ktoré do implementácie a výskumu autor vložil.

Mierne negatívne hodnotím niektoré formálne nedostatky textu práce, popísané v predošlých sekciách. V kontexte dosiahnutých výsledkov tieto nedostatky ovplyvňujú hodnotenie len mierne.

Pre prácu navrhujem známku na pomedzí A/B.

Kritérium hodnocení	Slovní hodnocení	Body
Rozsah splnění požadavků zadání	Stupeň hodnocení: zadání splněno Zadanie je splnené v plnom rozsahu a zároveň autor preskúmal značne bod 6. "Experimentujte s vaší implementací a případně navrhněte vlastní modifikace metod." Rozsah riešenia v tomto bode je silnou stránkou tejto práce, kde autor vyskúšal rôzne architektúry neurónových sietí, spôsoby tréningu, spôsoby pred-trénovania a všetko zhrnul v rozsiahlom porovnaní. Z tohto pohľadu je zadanie splnené aj mierne nad rámec popísaných bodov.
Rozsah technické zprávy	Stupeň hodnocení: je v obvyklém rozmezí
Prezentační úroveň technické zprávy	Práca sa dobre číta avšak samotná štruktúra má zopár nedostatkov. Celkovo je jasné, čo je cieľom práce a to ako to dosiahnuť, ale práca obsahuje len 3 pomerne rozsiahle kapitoly (vynechajúc Úvod a Záver). Z pohľadu delenia negatívne hodnotím, že teoretický úvod je celý zhrnutý v jednej kapitole s názvom "Machine Learning for personal identification", čo z názvu invokuje skôr úvod do obecnej biometrickej problematiky. Kapitola však obsahuje všetko od úvodu do identifikácie osôb pomocou ucha, cez prehľad obecných architektúr sietí, obecný prehľad spôsobov tréningu až po dátové sady a zarovnávanie obrazu. Podobnú výhradu mám aj ku kapitole "Unconventional biometrics", ktorá obsahuje všetko ohľadom návrhu riešenia. Kapitola je teda veľmi rozsiahla, a zároveň jej názov je príliš obecný. Práca je zameraná "len" na identifikáciu pomocou ucha, v tejto kapitole je popísané ako generovanie syntetických dát tak a aj implementácia a konfigurácia trénovacích skriptov.	70
Formální úprava technické zprávy	Z jazykového hľadiska je práca písaná dobrou angličtinou, s menším množstvom formálnych chýb. Z typografického hľadiska hodnotím pozitívne vizualizácie a množstvo dodaných tabuliek. Mierne typografické výhrady sú k popisom a formátovaniu tabuliek. Napríklad tabuľky 4.9 a 4.11, z prvého stĺpcu nie je priamo jasné, čo hodnoty za názvami znamenajú. Podobne mám aj výhradu ku niekedy mätúcim popisom vyhodnocovacích metrík v texte a obsahom tabuliek. Príklad je sekcia 4.2 kde v "Datasets" a "Evaluation metrics" sú spomenuté metriky plochy pod verifikačnou ROC krivkou a top-k presnosť, tabuľka 4.7 však obsahuje iba AUC a úplne iné metriky.	75
Práce s literaturou	Autor pracuje s literatúrou veľmi dobre, zdroje sú primárne dobré hodnotené konferencie a žurnály, prípadne autor cituje pre-print verzie článkov. Všetky využívané metódy sú z posledných rokov a predstavujú aktuálny state-of-the-art. Práca kombinuje hlavne existujúce prístupy a získava unikátne výsledky na špecifickom probléme identifikácie osôb pomocou uší. Z pohľadu citačnej etiky je jasné, ktoré myšlienky boli autorom prevzaté a aký je ich pôvod. Spôsob, akým autor využívania literatúru hodnotím veľmi pozitívne.	98
Realizační výstup	Odovzdané zdrojové kódy sú zdokumentované a rozdelené do modulov, z README je jasné ako spustiť tréning a inferenciu. Odovzdané sú taktiež aj pred-trénované modely spomenuté v práci, z pohľadu dokumentácie je jasné ako dosiahnuté výsledky zreplikovať.	98
Využitelnost výsledků	Jedná sa o prácu kompilačného charakteru, autor aplikuje metódy používané v oblasti počítačového videnia na problém identifikácie osôb pomocou ucha. Vo výsledkoch práce je prezentovaný aj autorom vytvorený model, ktorý dosahuje lepšie výsledky ako porovnávané state-of-the-art modely zo súťaže UERC 2023. Práca bola autorom prezentovaná aj na konferencii Excel@FIT, a dosiahnuté poznatky sú aplikovateľné aj v praxi.
Náročnost zadání	Stupeň hodnocení: obtížnější zadání Práca je zameraná na biometriu v málo preskúmanej oblasti uší. Pre splnenie zadania musel riešiteľ preskúmať rôzne metódy využívané pre tréning hlbokých neurónových sietí, spôsoby vyhodnocovania dosiahnutých výsledkov, metódy pre spracovanie obrazu a prístupy pre generovanie syntetických fotiek. Hlavne z pohľadu toho aká je problematika počítačového videnia rozsiahla, je práca mierne nad obsahom magisterského študijného programu, jedná sa teda o obtiažnejšie zadanie.

Otázky k obhajobě:

Čo znamená "unlabeled data" pri self-learning experimentoch? O akú dátovú sadu sa jedná?
Pri self-training nie sú na "teacher" vetvu aplikované žiadne augmentácie, využívate pri optimalizácii "student" modelu pred-počítané vektory?
Aký je postup aplikovania jednotlivých ténovacích krokov pre model EVA02-B, ktorý vychádza najlepšie vo finálnom porovnaní?
Model EVA02-G vychádza z pohľadu AUC najlepšie v porovnaní VIT modelov, čo viedlo k tomu, že nie je využívaný v ďalších experimentoch?

Výsledný počet bodů navržený oponentem: 88

Známka navržená oponentem: B

Odpovědnost: Mgr. et Mgr. Hana Odstrčilová

VUT

Fakulty a vysokoškolské ústavy

Součásti

Netradiční metody biometrie osob