Master's Thesis

Optimization of Methods for Automated Password-Mangling Rule Creation

Final Thesis 841.64 kB

Author of thesis: Ing. Viktor Rucký

Acad. year: 2025/2026

Supervisor: Ing. Radek Hranický, Ph.D.

Reviewer: doc. Ing. Ondřej Ryšavý, Ph.D.

Abstract:

This thesis tackles the problems faced by modern password mangling rule generation approaches and tools. More concretely, the high memory requirements of Affinity Propagation (AP) and Hierarchical Agglomerative Clustering (HAC) in the tool RuleForge. Investigated are ways to solve this problem by studying existing optimised version of these algorithms, and then implementing a bespoke version of them optimised for memory efficiency and working with passwords. Attained are memory saving of 93% for AP while providing comparable or better clustering results than standard AP. For HAC, memory savings of 99.9% are achieved while providing the same clustering output as the original HAC implementation.

Keywords:

password cracking, password mangling rules, clustering methods, affinity propagation, hierachical agglomerative clustering

Date of defence

22.06.2026

Result of the defence

Defended (thesis was successfully defended)

znamkaBznamka

Grading

B

Process of defence

Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm B.

Topics for thesis defence

  1. Ve své práci jste implementoval a experimentálně vyhodnotil několik optimalizovaných variant algoritmu Affinity Propagation. Jaké jsou hlavní kompromisy mezi kvalitou výsledného shlukování, časovou složitostí a paměťovou náročností jednotlivých přístupů?
  2. Můžete okomentovat prezentovanou rovnici?
  3. Můžete okomentovat prezentovanou tabulku s evaluací?
  4. Kde jste získal takto rozsáhlou datovou sadu?

Language of thesis

English

Faculty

Department

Study programme

Information Technology and Artificial Intelligence (MITAI)

Specialization

Software Verification and Testing (NVER)

Composition of Committee

doc. Mgr. Adam Rogalewicz, Ph.D. (předseda)
doc. RNDr. Milan Češka, Ph.D. (místopředseda)
Ing. Martin Hrubý, Ph.D. (člen)
Ing. Aleš Smrčka, Ph.D. (člen)
Dr. Ing. Petr Peringer (člen)
Ing. Jaroslav Rozman, Ph.D. (člen)

Supervisor’s report
Ing. Radek Hranický, Ph.D.

Celkově práci hodnotím jako odborně velmi kvalitní a silně technicky přínosnou. Pan Rucký řešil nadprůměrně náročné téma z oblasti forenzní analýzy digitálních dat, v rámci kterého se věnoval optimalizaci shlukovacích algoritmů pro účely automatizované tvorby pravidel pro modifikaci hesel. Oceňuji vlastní implementaci optimalizovaných variant algoritmů AP a HAC i výrazné (a experimentálně doložené) snížení paměťových nároků. Slabší stránkou práce je omezenější rozsah technické zprávy a především diskuse získaných poznatků, zejména v širších souvislostech forenzní analýzy.


I přes zmíněné nedostatky v technické zprávě považuji diplomovu práci pana Ruckého za výzkumně velmi silnou. S ohledem na náročnost zadání, aktivitu studenta a pulikační činnost, hodnotím jako "lepší B".

Evaluation criteria Verbal classification
Informace k zadání

Práce souvisí s oblastí lámání hesel, řešené výzkumnou skupinou NES@FIT. Tématicky navazuje na starší projekty pro MV jako Sec6Net a TARZAN. Řešení probíhalo za konzultace s experty z Kriminalistického ústavu Policie ČR.

Zadání bylo koncipováno poměrně volně a student měl tedy dostatek prostoru pro volbu způsobu řešení. Pan Rucký zvolil náročnou cestu vyžadující detailní pochopení vnitřního fungování algoritmů Affinity Propagation, Sparse AP, FastAP, FujiwaraAP, HAC/SLINK a implementaci vlastních optimalizovaných variant.

Aktivita při dokončování

Implementační práce i experimenty byly dokončeny ve výraznémé předstihu před odevzdáním. Při finalizaci technické zprávy však student mírně podcenil time management a na detailnější diskusi poznatků tak nezbylo tolik prostoru. Finální obsah se mnou však diskutoval.

Publikační činnost, ocenění

Část práce související s DP byla v roce 2025 publikována v článku:

HRANICKÝ, R.; ŠÍROVÁ, L.; RUCKÝ, V. Beyond the Dictionary Attack: Enhancing Password Cracking Efficiency through Machine Learning-Induced Mangling Rules. Forensic Science International: Digital Investigation, 2025, vol. 52, iss. 1, p. 1-10. ISSN: 2666-2817.

Žurnál je hodnocen jako Q1 v "Information Systems".

Pan Rucký jako spoluautor měl na vytvořeném dílu významný podíl a článek již získal 4 citace.

Práce s literaturou

Práce s literaturou byla vzorová. Student nejen využil nejen doporučených zdrojů, ale průběžně si dohledával další relevantní odborné články, které velmi poctivě studoval.

Aktivita během řešení, konzultace, komunikace

Student byl během řešení nadprůměrně aktivní a velmi samostatný. Především sám dobře identifikoval nedostatky zvolených přístupů a systematicky zkoumal možnosti jejich řešení.

Points proposed by supervisor: 88

Grade proposed by supervisor: B

Práce představuje kvalitní diplomovou práci s nadprůměrně náročným zadáním. Autor prokázal schopnost samostatně studovat odbornou literaturu, analyzovat existující algoritmy, navrhnout vlastní řešení, implementovat je a experimentálně vyhodnotit. Výsledky mají praktický přínos a jsou podloženy rozsáhlým testováním. Kratší délka práce, jazykové nedostatky a chybějící dokumentace realizační části lehce snižují celkovou kvalitu práce.

Evaluation criteria Verbal classification Points
Rozsah splnění požadavků zadání

Evaluation level: zadání splněno

Autor navíc provedl kritickou analýzu jednoho z publikovaných algoritmů a identifikoval potenciální chybu v jeho teoretickém odvození, což lze považovat za rozšíření nad rámec původního zadání.

Rozsah technické zprávy

Evaluation level: téměř splňuje minimální požadavky

Podle nástroje pro výpočet normostran vytvořeného na FIT má práce méně než 50 normostran. Na druhou stranu je text informačně bohatý a dostatečně popisuje řešenou problematiku.

Prezentační úroveň technické zprávy

Práce má logickou strukturu, která odpovídá řešenému problému. Teoretická část postupně uvádí čtenáře do problematiky, následují analýza optimalizačních přístupů, implementační část a experimentální vyhodnocení. Jednotlivé kapitoly na sebe dobře navazují.

Pozitivně hodnotím zejména podrobné vysvětlení algoritmů AP a HAC včetně matematického rozboru a zdůraznění navrhovaných optimalizací. Text je technicky přesný a je patrné, že autor problematice rozumí.

Některé části, zejména úvod a závěr, bývají obvykle obsáhlejší než je tomu u této práce.

80
Formální úprava technické zprávy

Práce je po formální stránce na dobré úrovni. Text je přehledně členěn, obsahuje odpovídající obrázky, algoritmy a odkazy na literaturu.

V práci se však objevují drobné jazykové a typografické nedostatky:

  • několik překlepů („mitagions“, „algorirthm“, apod.),
  • občasná stylistická neobratnost,
  • místy ne zcela konzistentní terminologie,
  • poděkování působí příliš neformálně vzhledem k charakteru diplomové práce.
75
Práce s literaturou

Autor pracuje s relevantní odbornou literaturou pokrývající jak oblast password crackingu, tak clusteringových algoritmů. Citovány jsou původní práce autorů AP, DBSCAN, HAC i novější publikace zabývající se generováním mangling pravidel. Bibliografie zahrnuje akademické články, diplomové a bakalářské práce i technickou dokumentaci. Také množství citovaných prací je pro diplomovou práci a řešené téma odpovídající.

Velmi pozitivně hodnotím, že autor nepřebírá publikované výsledky nekriticky, ale analyzuje jejich předpoklady a upozorňuje na možnou nekonzistenci v publikovaném algoritmu FujiwaraAP.

Nenašel jsem známky porušení citační etiky.

90
Realizační výstup

Výstupem práce jsou funkční nástroje implementující různé klastrovací algoritmy určené pro automatizovanou tvorbu pravidel pro modifikaci hesel. Realizační část je na dobré technické úrovni a je doplněna rozsáhlou sadou experimentů sloužících k vyhodnocení navržených metod.

Za nedostatek považuji absenci dokumentace, například alespoň souboru README obsahujícího základní informace o architektuře implementace, způsobu sestavení a použití jednotlivých nástrojů, jak je u podobných projektů běžné. 

75
Využitelnost výsledků

Výsledky jsou přímo využitelné v nástroji RuleForge a řeší jeho reálný problém – vysoké paměťové nároky při použití AP a HAC. Implementované optimalizace přinášejí významné úspory paměti.

Náročnost zadání

Evaluation level: obtížnější zadání

Práce kombinuje několik oblastí: analýzu nástrojů pro lámání hesel, studium pokročilých shlukovacích algoritmů, návrh vlastních optimalizací a jejich implementaci a experimentální vyhodnocení. Autor musel porozumět nejen problematice generování mangling pravidel, ale i méně obvyklým shlukovacím algoritmům.

Topics for thesis defence:
  1. Ve své práci jste implementoval a experimentálně vyhodnotil několik optimalizovaných variant algoritmu Affinity Propagation. Jaké jsou hlavní kompromisy mezi kvalitou výsledného shlukování, časovou složitostí a paměťovou náročností jednotlivých přístupů?
Points proposed by reviewer: 80

Grade proposed by reviewer: B

Responsibility: Mgr. et Mgr. Hana Odstrčilová