Master's Thesis

Klasifikace šifrovaného provozu v počítačových sítích s využitím technologie FPGA

Final Thesis 3.43 MB

Author of thesis: Ing. Lukáš Nevrkla

Acad. year: 2025/2026

Supervisor: doc. Ing. Tomáš Martínek, Ph.D.

Reviewer: doc. Ing. Jan Kořenek, Ph.D.

Abstract:

Network traffic encryption makes certain network management tasks infeasible, which has given rise to the field of encrypted traffic classification. This field employs machine learning methods to analyze and classify traffic without the need to decrypt it. A specific case is online classification, which uses the resulting decisions to actively manipulate individual flows (e.g., blocking, prioritization, or other mechanisms ensuring quality of service). However, deploying such classifiers on high-speed links poses a considerable challenge. The aim of this work is to design an artificial neural network tailored for online traffic classification and to accelerate it in a smart network interface card equipped with an FPGA. Specifically, a recurrent neural network enabling incremental classification of network flows was designed. To conserve FPGA resources, optimizations of embedding tables and methods for compressing state information were proposed. Subsequently, the high configurability of the FPGA was leveraged to implement an accelerator specialized for this neural network and its parameters. The resulting solution outperforms some of the best existing online classifiers of encrypted traffic (the N3IC, Kaleidoscope, and FENIX systems) in terms of classification accuracy, FPGA resource consumption, latency, throughput, and state information size.

Keywords:

Encrypted traffic classification, recurrent neural networks, FPGA

Date of defence

23.06.2026

Result of the defence

Defended (thesis was successfully defended)

znamkaAznamka

Grading

A

Process of defence

Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm A.

Topics for thesis defence

  1. Jaké úpravy navrženého řešení by byly potřeba pro nasazení v reálném prostředí vysokorychlostních sítí s propustností 100 Gb/s a více?
  2. Které části navržené architektury považujete za nejvýznamnější z pohledu dosaženého zlepšení oproti systémům N3IC, Kaleidoscope a FENIX?
  3. Jaké další směry výzkumu nebo rozšíření navrženého řešení považujete za nejperspektivnější z hlediska budoucího zvýšení přesnosti nebo efektivity klasifikace?
  4. Jak je možné klasifikovat šifrovaný provoz? 

Language of thesis

Czech

Faculty

Department

Study programme

Information Technology and Artificial Intelligence (MITAI)

Specialization

Machine Learning (NMAL)

Composition of Committee

doc. Ing. Vítězslav Beran, Ph.D. (předseda)
prof. Ing. Hynek Heřmanský, Dr. Eng. (místopředseda)
doc. Ing. Ondřej Lengál, Ph.D. (člen)
doc. Ing. František Zbořil, Ph.D. (člen)
doc. Ing. Michal Bidlo, Ph.D. (člen)
RNDr. Marek Rychlý, Ph.D. (člen)

Diplomová práce byla vypracována velmi kvalitně a student v ní prokázal tvůrčí přístup při analýze dané problematiky, návrhu modelu pro klasifikaci šifrovaného provozu a jeho efektivní implementaci v FPGA. S ohledem na značnou obtížnost zadání, rozsáhlou experimentální činnost, precizní metodické zpracování a excelentní dosažené výsledky s publikačním potenciálem navrhuji hodnocení stupněm výborně (A) a doporučuji komisi zvážit případná další ocenění této práce.

Evaluation criteria Verbal classification
Informace k zadání

Cílem diplomové práce bylo navrhnout vhodný model neuronové sítě pro klasifikaci šifrovaného provozu v počítačových sítích. Důležitým požadavkem bylo vytvořit takový model, který by bylo možné efektivně implementovat v programovatelných čipech s technologií FPGA. Současně bylo požadováno, aby model dosahovat co nejvyšší přesnosti klasifikace a také co nejnižší latence inference. Toto zadání považuji za značně obtížné, jelikož student musel nastudovat a propojit znalosti hned z několika různých oblastí. Práce byla náročná i z pohledu různých experimentů včetně nalezení a natrénování vhodného modelu neuronové sítě. Student toto zadání splnil ve všech bodech a vytvořil výstupy, které svou kvalitou významně přesahují původních očekávání. Student např. experimentálně vyzkoušel velké množství různých modelů a optimalizačních technik. Oproti původnímu zadání také dotáhl implementaci modelu až na úroveň hardware a srovnal se s nejlepšími existujícími řešeními v této oblasti, které překonal jak z pohledu přesnosti klasifikace, tak i latence inference. 

Aktivita při dokončování

Práce byla dokončena v předstihu a její obsah byl průběžně a dostatečně konzultován.

Publikační činnost, ocenění

V rámci této práce nevznikly dodatečné publikační výstupy, avšak student dosáhl výsledků, které významně převyšují existující řešení v této oblasti. Vytvořené výsledky proto budou zaslány k publikaci.

Práce s literaturou

Student získával studijní materiály iniciativně a využíval je v dostatečné míře. Zejména pak kvalitní konferenční a časopisecké publikace z oblasti klasifikace šifrovaného provozu a implementace neuronových sítí v FPGA.

Aktivita během řešení, konzultace, komunikace

Student přistupoval k řešení diplomové práce velmi aktivně. Konzultoval řešenou problematiku v dostatečné míře a na konzultace byl vždy řádně připraven.

Points proposed by supervisor: 100

Grade proposed by supervisor: A

Reviewer’s report
doc. Ing. Jan Kořenek, Ph.D.

Cílem práce bylo navrhnout a implementovat systém pro klasifikaci šifrovaného síťového provozu založený na neuronových sítích s důrazem na efektivní implementaci v FPGA. Cíl práce byl splněn a dosažené výsledky výrazně převyšují běžná očekávání kladená na diplomovou práci. Autor prokázal schopnost samostatně řešit náročný problém na pomezí počítačových sítí, strojového učení a návrhu digitálních systémů. Za největší přínos práce považuji kombinaci vysoké odborné úrovně zpracování, rozsáhlého experimentálního ověření a dosažených výsledků, které překonávají několik publikovaných state-of-the-art řešení. Práce tak podle mého názoru významně převyšuje standardní úroveň diplomových prací a představuje výzkumný výstup s významným praktickým i vědeckým přínosem. Proto navrhuji hodnocení stupněm A (výborně). Současně se domnívám, že práce je vhodným kandidátem na cenu děkana a doporučuji ji rovněž k nominaci do soutěže IT SPY.

Evaluation criteria Verbal classification Points
Rozsah splnění požadavků zadání

Evaluation level: zadání splněno a práce obsahuje podstatná rozšíření

Student splnil všechny body zadání v plném rozsahu. Práce obsahuje podrobnou analýzu existujících přístupů ke klasifikaci šifrovaného provozu, návrh vlastní neuronové sítě vhodné pro implementaci v FPGA, její natrénování a experimentální vyhodnocení. Součástí práce je rovněž návrh FPGA akcelerátoru a detailní analýza jeho parametrů z pohledu spotřeby zdrojů, latence a propustnosti. Práce přitom svým rozsahem i kvalitou dosažených výsledků výrazně přesahuje požadavky zadání. Autor provedl rozsáhlou experimentální evaluaci a systematické porovnání s několika významnými publikovanými systémy. Dosažené výsledky podle prezentovaných dat překonávají dosavadní state-of-the-art přístupy, což považuji za mimořádně hodnotný výsledek s praktickým i vědeckým přínosem.

Rozsah technické zprávy

Evaluation level: je v obvyklém rozmezí

Rozsah technické zprávy odpovídá požadavkům kladeným na diplomovou práci. Práce obsahuje všechny podstatné části v odpovídající hloubce a rozsahu, přičemž si zachovává dobrou přehlednost a čtivost.

Prezentační úroveň technické zprávy

Technická zpráva je zpracována na velmi vysoké úrovni. Práce má logickou strukturu, jednotlivé kapitoly na sebe přirozeně navazují a text je dobře čitelný i přes značnou odbornou náročnost řešené problematiky. Popis je podpořen vhodně zvolenými obrázky, tabulkami a experimentálními výsledky.

100
Formální úprava technické zprávy

Práce je po formální stránce zpracována velmi pečlivě. Jazyková i typografická úroveň odpovídá standardům odborných technických prací. Grafy, tabulky a obrázky jsou přehledné a vhodně doplňují text.

100
Práce s literaturou

Student prokázal velmi dobrou orientaci v řešené problematice. Použitá literatura zahrnuje relevantní odborné články z oblasti klasifikace síťového provozu, strojového učení i FPGA akcelerace. Z rozsahu a kvality citovaných zdrojů je patrné, že autor důkladně nastudoval současný stav poznání a vhodně jej využil při návrhu vlastního řešení.

100
Realizační výstup

Realizační výstup považuji za mimořádně kvalitní. Student navrhl vlastní řešení pro klasifikaci šifrovaného síťového provozu a současně prokázal jeho praktickou realizovatelnost prostřednictvím implementace v FPGA. Oceňuji zejména komplexnost zpracování, která zahrnuje celý proces od návrhu neuronové sítě přes její optimalizaci až po hardwarovou implementaci a experimentální ověření. Dosažené výsledky podle prezentovaných dat překonávají několik významných publikovaných řešení a představují významný přínos jak z vědeckého, tak z aplikačního hlediska.

100
Využitelnost výsledků

Výsledky práce mají vysoký aplikační i vědecký potenciál. Navržené řešení je přímo využitelné v oblasti síťové bezpečnosti, zejména pro klasifikaci síťového provozu na základě prvních paketů komunikace, kde může významně přispět ke snížení zátěže bezpečnostních zařízení. Dosažené výsledky navíc překonávají několik publikovaných state-of-the-art řešení. Práce má proto podle mého názoru jednoznačný publikační potenciál.

Náročnost zadání

Evaluation level: značně obtížné zadání

Zadání práce považuji za značně obtížné. Student se musel seznámit s několika odbornými oblastmi, konkrétně s problematikou klasifikace šifrovaného síťového provozu, strojového učení, návrhu neuronových sítí a jejich kvantizace a optimalizace pro implementaci v FPGA. Současně bylo nutné porozumět problematice vysokorychlostního zpracování síťového provozu a praktickým požadavkům online klasifikace. Náročnost práce dále zvyšuje skutečnost, že neřeší pouze návrh modelu strojového učení, ale také jeho hardwarovou realizaci a rozsáhlé experimentální vyhodnocení dosažených výsledků ve srovnání s existujícími state-of-the-art přístupy.

Topics for thesis defence:
  1. Které části navržené architektury považujete za nejvýznamnější z pohledu dosaženého zlepšení oproti systémům N3IC, Kaleidoscope a FENIX?
  2. Jaké další směry výzkumu nebo rozšíření navrženého řešení považujete za nejperspektivnější z hlediska budoucího zvýšení přesnosti nebo efektivity klasifikace?
  3. Jaké úpravy navrženého řešení by byly potřeba pro nasazení v reálném prostředí vysokorychlostních sítí s propustností 100 Gb/s a více?
Points proposed by reviewer: 100

Grade proposed by reviewer: A

Responsibility: Mgr. et Mgr. Hana Odstrčilová