Bachelor's Thesis

Anonymization Technniques for Facial Recognition Systems

Final Thesis 7.23 MB Appendix 17.37 kB

Author of thesis: Oliver Fridrich

Acad. year: 2025/2026

Supervisor: M.Sc. Sara Ricci, Ph.D.

Reviewer: Ing. Minh Tran

Abstract:

Facial biometric data are inherently sensitive, and AI advances have rendered simple
obfuscation insufficient against modern re-identification systems. This work implements
and compares six anonymisation methods from three families in a Flask-based web ap-
plication: spatial obfuscation (Gaussian blur, pixelization), differentially private per-
turbation (pixel-level Laplace noise via DiffPrivLib, eigenface perturbation via PEEP),
and generative identity replacement (GANonymization, geometry-driven face swapping).
Benchmarking across 450 images from the FACES, JAFFE, and Yale Faces datasets
shows PEEP achieves the best formally-grounded privacy–utility trade-off, preserving ap-
proximately five times higher image quality than DiffPrivLib at matched accuracy. Face
swapping, despite visual plausibility, provides no protection against structural classifiers
(99.3% accuracy), highlighting the necessity of automated re-identification testing.

Keywords:

Machine Learning, Data Privacy, Differential Privacy, Generative Adversarial Network, Eigenfaces, Spatial Obfuscation

Date of defence

16.06.2026

Result of the defence

Defended (thesis was successfully defended)

znamkaCznamka

Grading

C

Process of defence

Student prezentoval výsledky své práce a komise byla seznámena s posudky. Student obhájil bakalářskou práci s výhradami a odpověděl na otázky členů komise a oponenta. Otázky: 1) Klasifikátor je trénován i vyhodnocován na stejné množině 450 snímků bez oddělené testovací sady. Jak by se naměřené přesnosti změnily, kdyby byl model vyhodnocen na snímcích, které při trénování neviděl? 2) Metoda PEEP je v kódu implementována dvěma odlišnými způsoby, které dávají odlišné výsledky. Která z variant odpovídá popisu metody v práci a čím je rozdíl mezi nimi způsoben? 3) Jaký byl přínos Vaší práce?

Language of thesis

English

Faculty

Department

Study programme

Information Security (BPC-IBE)

Composition of Committee

doc. Ing. Jan Jeřábek, Ph.D. (předseda)
doc. Ing. Ivo Lattenberg, Ph.D. (místopředseda)
Mgr. Martin Erlebach (člen)
Ing. Eva Holasová, Ph.D. (člen)
Ing. Petr Ilgner, Ph.D. (člen)
Ing. Kryštof Zeman, Ph.D. (člen)
Ing. Martin Rusz (člen)

Supervisor’s report
M.Sc. Sara Ricci, Ph.D.

Práce se zaměřuje na návrh a vyhodnocení metod pro ochranu soukromí při rozpoznávání obličejů v autentizačních systémech. Student zkoumal techniky anonymizace biometrických dat a hodnotil jejich dopad na výkonnost modelů strojového učení a na možnost zpětné identifikace osob. Dále student implementoval demonstrační aplikaci ověřující navržené řešení. Student splnil zadání. Rozsah práce odpovídá očekávanému rozsahu bakalářské práce, přestože porovnání a vyhodnocení maskovacích metod, zejména z hlediska kompromisu mezi ochranou soukromí a užitnou hodnotou dat (privacy–utility trade-off), mohlo být zpracováno podrobněji. Text práce je celkově na dobré úrovni, s několika drobnými formálními nedostatky. Oceňuji také, že práce je napsána v anglickém jazyce. Práce s odbornou literaturou je na dobré úrovni. Student své aktivity pravidelně konzultoval. Pokrok mezi jednotlivými konzultacemi však byl někdy omezený a doporučení vedoucího nebyla vždy plně zohledněna. Přesto je praktická část práce, včetně implementované aplikace, na uspokojivé úrovni. Celkově hodnotím práci i dosažené výsledky jako kvalitní a doporučuji ji k obhajobě s hodnocením B / 80 bodů. Points proposed by supervisor: 80

Grade proposed by supervisor: B

Reviewer’s report
Ing. Minh Tran

Bakalářská práce se zabývá ochranou soukromí biometrických dat obličeje. Student do jednotné webové aplikace ve frameworku Flask integroval šest anonymizačních metod ze tří rodin a na sadě 450 snímků je automatizovaným benchmarkem porovnal proti klasifikátoru na bázi PCA a SVM. Zadání považuji za splněné, požadavek na porovnání více učících algoritmů však jen částečně, neboť byl reálně použit jediný klasifikátor.
Silnou stránkou je samotný evaluační rámec, který staví heterogenní metody na společnou metrickou základnu, a funkční proof-of-concept aplikace s benchmarkovacím enginem a žebříčkem, kterou student vystavěl nad existujícím repozitářem.
Hlavním nedostatkem je absence rozdělení dat na trénovací a testovací množinu. Klasifikátor je trénován i vyhodnocován na týchž snímcích, takže stoprocentní výchozí přesnost odráží přeučení a absolutní hodnoty jsou optimistické. Dalším nedostatkem je nekonzistentní implementace metody PEEP, jejíž výsledky se v benchmarku a v aplikaci rozcházejí.
Po formální stránce je text na dobré úrovni, vyskytují se v něm pouze drobné překlepy a duplicitní citace. Práci doporučuji k obhajobě s celkovým hodnocením 78 bodů / C. Topics for thesis defence:
  1. Klasifikátor je trénován i vyhodnocován na stejné množině 450 snímků bez oddělené testovací sady. Jak by se naměřené přesnosti změnily, kdyby byl model vyhodnocen na snímcích, které při trénování neviděl?
  2. Metoda PEEP je v kódu implementována dvěma odlišnými způsoby, které dávají odlišné výsledky. Která z variant odpovídá popisu metody v práci a čím je rozdíl mezi nimi způsoben?
Points proposed by reviewer: 78

Grade proposed by reviewer: C

Responsibility: Mgr. et Mgr. Hana Odstrčilová