Master's Thesis

Use of Zero-Knowledge Proofs in Machine Learning

Final Thesis 1.33 MB

Author of thesis: Ing. Michal Vaňo

Acad. year: 2025/2026

Supervisor: Ing. Martin Perešíni

Reviewer: doc. Ing. Ivan Homoliak, Ph.D.

Abstract:

Federated learning (FL) enables collaborative model training without directly sharing data, but it often relies on strong assumptions about honest behavior by both clients and the server. As a result, standard FL protocols provide only limited guarantees regarding client-side computation and results, the integrity of submitted information, and the correctness of server-side aggregation. This thesis examines the use of zero-knowledge proof systems (ZKPs), together with supporting methods, to establish trust in FL environments.

After introducing FL and ZKPs, the thesis reviews existing ZKP tools and their use in the context of FL. Based on this analysis, it proposes a categorization of existing ZK-based FL approaches, structured primarily around the goals of each system. After identifying potential areas for improvement, the thesis introduces a verifiable weighted aggregation protocol in which each accepted contribution is linked to an authorized influence value, an admissible hidden update, a consistent weighted input, and a publicly recomputable final model update. The protocol was implemented as an end-to-end prototype with real cryptographic components. This prototype is later evaluated.

Keywords:

federated learning, zero-knowledge proofs, secure aggregation, privacy-preserving machine learning, SNARK, Groth16, PLONK, Bulletproofs, STARK

Date of defence

23.06.2026

Result of the defence

Defended (thesis was successfully defended)

znamkaAznamka

Grading

A

Process of defence

Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm A.

Topics for thesis defence

  1. Overhead ZK časti Vášho riešenia je rádovo desiatky až stovky tisíc krát vyšší než pri čistom federatívnom učení. Aké ďalšie možnosti optimalizácie tohto overheadu považujete za najperspektívnejšie?
  2. Ak by ste chceli navrhnutú schému rozšíriť o post-kvantovú odolnosť, ktoré ZK schémy by ste zvažovali a aké by boli ich hlavné výhody a nevýhody?

Language of thesis

English

Faculty

Department

Study programme

Information Technology and Artificial Intelligence (MITAI)

Specialization

Cybersecurity (NSEC)

Composition of Committee

doc. Mgr. Kamil Malinka, Ph.D. (předseda)
doc. Ing. Ivan Homoliak, Ph.D. (místopředseda)
Ing. Vojtěch Havlena, Ph.D. (člen)
doc. Ing. Ondřej Ryšavý, Ph.D. (člen)
Ing. Vladimír Veselý, Ph.D. (člen)
Ing. Tomáš Goldmann, Ph.D. (člen)

Supervisor’s report
Ing. Martin Perešíni

Prácu hodnotím ako výbornú, známka A. Téma je mimoriadne náročná a zahŕňa viacero komplexných a aktuálnych oblastí kryptografie a strojového učenia. Študent definitívne preukázal schopnosť pracovať samostatne, aktívne a systematicky. Dosiahnuté výsledky sú v súlade so zadaním. Študent navrhol a implementoval funkčný end-to-end overiteľný protokol váženej federatívnej agregácie s autorizovaným vplyvom, skrytou aktualizáciou, konzistenciou váženého vstupu, bezpečnou agregáciou a verejne prepočítateľným výsledným globálnym modelom. Oceňujem mimoriadnu poctivosť práce. Práca je na vysokej úrovni, a má reálny potenciál pre budúcu publikačnú činnosť.

Evaluation criteria Verbal classification
Informace k zadání

Úlohou bolo oboznámiť sa a použiť dôkazy s nulovou znalosťou (ZKP) vo federatívnom učení (FL) s cieľom dosiahnuť overiteľný tréning modelu bez odhalenia súkromných dát klientov a korektnú agregáciu globálneho modelu od klientov. Téma sa pohybuje na rozhraní dvoch náročných a mimoriadne aktuálnych oblastí, a to pokročilej kryptografie a strojového učenia (najmä FL). Vzhľadom na to hodnotím zadanie ako mimoriadne náročné. Dosiahnuté výsledky sú v súlade so zadaním, hoci by sa dali ešte rozšíriť (priame porovnávacie meranie, väčšia mierka, viac agregovaných politík). Všetky body zadania boli splnené.

Aktivita při dokončování

Teoretické, prehľadové a návrhové časti práce boli naštudované a spracované v predstihu. Komplexná implementácia prototypu a experimentálne vyhodnotenie prebiehali v druhom semestri. Finálna textová časť bola dolaďovaná na záver. Študent zapracovával pripomienky priebežne. Prácu odovzdal v dobrej kvalite a v stanovenom termíne.

Publikační činnost, ocenění

Publikačná činnosť zatiaľ nie je známa. Študent však k práci pripravil a sprístupnil dva výstupy: samotný funkčný prototyp, a doplnkový vzdelávací materiál (sprievodcu matematikou pre ZKP dôkazy). Práca má solídny odborný základ, zapadá do výskumného smeru, a slúži ako veľmi dobrý základ pre budúcu vedeckú publikáciu.

Práce s literaturou

Práca s literatúrou patrí k veľmi silným stránkam práce. Študent preukázal vysokú mieru samostatnosti pri vyhľadávaní najnovších vedeckých článkov. Výsledkom je rozsiahly a aktuálny prehľad (cez 50 zdrojov, mnohé z rokov 2024-2026). Cenné je, že študent zdroje nielen zhrnul, ale aj kriticky spracoval. Vytvoril taktiež 7 kategóriovú taxonómiu prístupov na priesečníku FL a ZKP a z toho odvodil dve nepokryté medzery. Toto zasadenie do odborného kontextu poskytuje pevný základ pre návrhovú a implementačnú časť.

Aktivita během řešení, konzultace, komunikace

Študent bol počas riešenia samostatný a iniciatívny a postup priebežne konzultoval. Téme sa venoval dlhodobo a do hĺbky. Na konzultácie prichádzal pripravený, s konkrétnymi návrhmi a problémami, ktoré následne diskutoval. Komunikácia prebiehala bez problémov.

Points proposed by supervisor: 95

Grade proposed by supervisor: A

Reviewer’s report
doc. Ing. Ivan Homoliak, Ph.D.

Celkovo hodnotím prácu stupňom A - výborne. Študent preukázal schopnosť naštudovať rozsiahlu problematiku, pracovať s aktuálnou literatúrou, identifikovať relevantný problém a navrhnúť vlastné riešenie.


Silnou stránkou práce je jasná motivácia, kvalitná analýza existujúcich prístupov, návrh protokolu pre autorizovaný vplyv klienta a jeho funkčná proof-of-concept implementácia. Oceňujem aj rozsiahly sprievodný materiál k moderným ZK dokazovacím systémom.


Medzi slabšie stránky patrí najmä centralizovaný credential issuer ako single point of failure, vysoký výpočtový overhead ZK časti, obmedzená evaluácia škálovateľnosti a horšia čitateľnosť niektorých obrázkov. Celkovo však ide o kvalitne spracovanú diplomovú prácu s jasným výskumným prínosom.

Evaluation criteria Verbal classification Points
Rozsah splnění požadavků zadání

Evaluation level: zadání splněno

Zadanie považujem za splnené. Študent spracoval princípy federatívneho učenia a ZKP, analyzoval existujúce prístupy a identifikoval problém autorizovaného vplyvu klientov vo váženej FL agregácii.

Motivácia práce je dobre zvolená: vážené FL prináša vyššiu presnosť vďaka zohľadneniu významu a množstva dát od klientov, no zároveň umožňuje manipuláciu s váhami. Nevýhodou neváženého FL je strata výhod váženia a teda presnosti trénovaného modelu. Navrhnuté riešenie tento problém adresuje pomocou overiteľného vplyvu klienta.

Slabším miestom je centralizovaný credential issuer, ktorý predstavuje single point of failure a musí byť dôveryhodný. Práca mohla podrobnejšie diskutovať alternatívy ako TEE alebo decentralizované multiparty protokoly.

Rozsah technické zprávy

Evaluation level: je v obvyklém rozmezí

Technická správa má primeraný rozsah (95 normostrán + 7 normostrán obrázkov podľa app.fit.vut.cz/theses-checker) a obsahuje všetky potrebné časti: teoretické pozadie, analýzu existujúcich riešení, návrh protokolu, implementáciu aj experimentálne vyhodnotenie.

Za nadštandard považujem sprievodný materiál k systémom Groth16, PLONK, Bulletproofs a STARK, ktorý má približne 500 strán a obsahuje aj praktické príklady. Pri jeho tvorbe boli využité aj nástroje generatívnej AI, čo je v práci transparentne uvedené.

Prezentační úroveň technické zprávy

Práca je logicky štruktúrovaná a kapitoly na seba dobre nadväzujú. Čitateľ je postupne vedený od základov federatívneho učenia a ZKP až k návrhu a evaluácii vlastného riešenia.

Pozitívne hodnotím jasnú motiváciu práce a prepojenie analýzy existujúcich riešení s navrhnutým protokolom.

85
Formální úprava technické zprávy

Po formálnej stránke je práca spracovaná na dobrej úrovni. Text je písaný odborným štýlom, používa primeranú terminológiu a vo všeobecnosti pôsobí konzistentne. 

Výhrady mám najmä k niektorým vizuálnym prvkom. Časť obrázkov je menej čitateľná a miestami nie je ich zarovnanie alebo umiestnenie v rámci strany optimálne. 

90
Práce s literaturou

Práca s literatúrou je jednou zo silných stránok práce. Literatúra obsahuje 56 referencií. Študent pracuje s relevantnými zdrojmi z oblasti federatívneho učenia, verifikovateľného strojového učenia, bezpečnej agregácie a dôkazov s nulovou znalosťou. Študent sa snažil zachytiť aktuálny stav poznania v rýchlo sa vyvíjajúcej oblasti.

99
Realizační výstup

Realizačným výstupom je proof-of-concept implementácia overiteľnej váženej federatívnej agregácie, ktorá rieši medzeru v existujúcich riešeniach. Študent navrhuje vlastné riešenie a protokol, ktoré v rámci možnosti aj evaluuje. 

Experimenty potvrdzujú funkčnosť riešenia, no zároveň ukazujú vysoký overhead ZK časti. Škálovateľnosť bola overená len obmedzene, maximálne pre päť klientov. Vzhľadom na náročnosť výpočtov a obmedzené experimentálne prostredie je to prijateľné.

92
Využitelnost výsledků

Práca má predovšetkým výskumný charakter. Navrhnutý protokol môže slúžiť ako základ pre ďalší výskum v oblasti verifikovateľného federatívneho učenia (s váhovaním), najmä pri skúmaní kompromisov medzi dôveryhodnosťou, súkromím, škálovateľnosťou a výpočtovou náročnosťou. 

Náročnost zadání

Evaluation level: značně obtížné zadání

Zadanie diplomovej práce považujem za náročné až nadštandardne náročné. Práca kombinuje viacero technicky zložitých a zároveň aktuálnych oblastí: federatívne učenie, kryptografické dôkazy s nulovou znalosťou, bezpečnú agregáciu, mechanizmy ochrany súkromia a verifikovateľnosť výpočtov v distribuovanom prostredí.

Náročnosť zvyšuje aj skutočnosť, že riešená oblasť je stále výskumne otvorená a neexistuje jednoznačný štandardný postup, ktorý by bolo možné jednoducho prevziať a implementovať. Študent preto musel skombinovať poznatky z viacerých oblastí a aplikovať ich na konkrétny problém overiteľnej agregácie ZKP vo federatívnom učení.

Topics for thesis defence:
  1. Overhead ZK časti Vášho riešenia je rádovo desiatky až stovky tisíc krát vyšší než pri čistom federatívnom učení. Aké ďalšie možnosti optimalizácie tohto overheadu považujete za najperspektívnejšie?
  2. Ak by ste chceli navrhnutú schému rozšíriť o post-kvantovú odolnosť, ktoré ZK schémy by ste zvažovali a aké by boli ich hlavné výhody a nevýhody?
Points proposed by reviewer: 92

Grade proposed by reviewer: A

Responsibility: Mgr. et Mgr. Hana Odstrčilová