bakalářská práce

Techniky anonymizace pro systémy rozpoznávání obličeje

Text práce 7.23 MB Příloha 17.37 kB

Autor práce: Oliver Fridrich

Ak. rok: 2025/2026

Vedoucí: M.Sc. Sara Ricci, Ph.D.

Oponent: Ing. Minh Tran

Abstrakt:

Biometrické údaje obličeje jsou ze své podstaty citlivé a pokroky v umělé inteligenci způ-
sobily, že jednoduché metody obfuskace jsou nedostatečné proti moderním systémům
reidentifikace. Tato práce implementuje a porovnává šest anonymizačních metod ze tří
rodin v jednotné webové aplikaci Flask: prostorová obfuskace (Gaussovské rozmazání,
pixelizace), diferenciálně privátní perturbace (pixelový Laplaceův šum přes DiffPrivLib,
perturbace eigenfaces přes PEEP) a generativní nahrazení identity (GANonymization,
geometricky řízený face swap). Experimenty na 450 snímcích z datových sad FACES,
JAFFE a Yale Faces ukazují, že PEEP nabízí nejpříznivější formálně podložený kompro-
mis s přibližně pětinásobně vyšší kvalitou obrazu než DiffPrivLib při shodné přesnosti.
Face swap navzdory vizuální věrohodnosti neposkytuje ochranu proti strukturálním kla-
sifikátorům (99,3 % přesnost), čímž zdůrazňuje nezbytnost automatizovaného testování
reidentifikace.

Klíčová slova:

Strojové učení, Ochrana soukromí dat, Diferencialní soukromí, Generativní adversarialní síť, Eigenfaces, Prostorová Obfuskace

Termín obhajoby

16.06.2026

Výsledek obhajoby

obhájeno (práce byla úspěšně obhájena)

znamkaCznamka

Klasifikace

C

Průběh obhajoby

Student prezentoval výsledky své práce a komise byla seznámena s posudky. Student obhájil bakalářskou práci s výhradami a odpověděl na otázky členů komise a oponenta. Otázky: 1) Klasifikátor je trénován i vyhodnocován na stejné množině 450 snímků bez oddělené testovací sady. Jak by se naměřené přesnosti změnily, kdyby byl model vyhodnocen na snímcích, které při trénování neviděl? 2) Metoda PEEP je v kódu implementována dvěma odlišnými způsoby, které dávají odlišné výsledky. Která z variant odpovídá popisu metody v práci a čím je rozdíl mezi nimi způsoben? 3) Jaký byl přínos Vaší práce?

Jazyk práce

angličtina

Fakulta

Ústav

Studijní program

Informační bezpečnost (BPC-IBE)

Složení komise

doc. Ing. Jan Jeřábek, Ph.D. (předseda)
doc. Ing. Ivo Lattenberg, Ph.D. (místopředseda)
Mgr. Martin Erlebach (člen)
Ing. Eva Holasová, Ph.D. (člen)
Ing. Petr Ilgner, Ph.D. (člen)
Ing. Kryštof Zeman, Ph.D. (člen)
Ing. Martin Rusz (člen)

Posudek vedoucího
M.Sc. Sara Ricci, Ph.D.

Práce se zaměřuje na návrh a vyhodnocení metod pro ochranu soukromí při rozpoznávání obličejů v autentizačních systémech. Student zkoumal techniky anonymizace biometrických dat a hodnotil jejich dopad na výkonnost modelů strojového učení a na možnost zpětné identifikace osob. Dále student implementoval demonstrační aplikaci ověřující navržené řešení. Student splnil zadání. Rozsah práce odpovídá očekávanému rozsahu bakalářské práce, přestože porovnání a vyhodnocení maskovacích metod, zejména z hlediska kompromisu mezi ochranou soukromí a užitnou hodnotou dat (privacy–utility trade-off), mohlo být zpracováno podrobněji. Text práce je celkově na dobré úrovni, s několika drobnými formálními nedostatky. Oceňuji také, že práce je napsána v anglickém jazyce. Práce s odbornou literaturou je na dobré úrovni. Student své aktivity pravidelně konzultoval. Pokrok mezi jednotlivými konzultacemi však byl někdy omezený a doporučení vedoucího nebyla vždy plně zohledněna. Přesto je praktická část práce, včetně implementované aplikace, na uspokojivé úrovni. Celkově hodnotím práci i dosažené výsledky jako kvalitní a doporučuji ji k obhajobě s hodnocením B / 80 bodů. Výsledný počet bodů navržený vedoucím: 80

Známka navržená vedoucím: B

Posudek oponenta
Ing. Minh Tran

Bakalářská práce se zabývá ochranou soukromí biometrických dat obličeje. Student do jednotné webové aplikace ve frameworku Flask integroval šest anonymizačních metod ze tří rodin a na sadě 450 snímků je automatizovaným benchmarkem porovnal proti klasifikátoru na bázi PCA a SVM. Zadání považuji za splněné, požadavek na porovnání více učících algoritmů však jen částečně, neboť byl reálně použit jediný klasifikátor.
Silnou stránkou je samotný evaluační rámec, který staví heterogenní metody na společnou metrickou základnu, a funkční proof-of-concept aplikace s benchmarkovacím enginem a žebříčkem, kterou student vystavěl nad existujícím repozitářem.
Hlavním nedostatkem je absence rozdělení dat na trénovací a testovací množinu. Klasifikátor je trénován i vyhodnocován na týchž snímcích, takže stoprocentní výchozí přesnost odráží přeučení a absolutní hodnoty jsou optimistické. Dalším nedostatkem je nekonzistentní implementace metody PEEP, jejíž výsledky se v benchmarku a v aplikaci rozcházejí.
Po formální stránce je text na dobré úrovni, vyskytují se v něm pouze drobné překlepy a duplicitní citace. Práci doporučuji k obhajobě s celkovým hodnocením 78 bodů / C. Otázky k obhajobě:
  1. Klasifikátor je trénován i vyhodnocován na stejné množině 450 snímků bez oddělené testovací sady. Jak by se naměřené přesnosti změnily, kdyby byl model vyhodnocen na snímcích, které při trénování neviděl?
  2. Metoda PEEP je v kódu implementována dvěma odlišnými způsoby, které dávají odlišné výsledky. Která z variant odpovídá popisu metody v práci a čím je rozdíl mezi nimi způsoben?
Výsledný počet bodů navržený oponentem: 78

Známka navržená oponentem: C

Odpovědnost: Mgr. et Mgr. Hana Odstrčilová