Master's Thesis

Generating Passwords from a Suspect's Profile

Final Thesis 1.64 MB

Author of thesis: Ing. Lucia Šírová

Acad. year: 2025/2026

Supervisor: Ing. Radek Hranický, Ph.D.

Reviewer: doc. Ing. Ondřej Ryšavý, Ph.D.

Abstract:

In a criminal investigation, investigators often encounter cases where a password protects evidence belonging to the suspect. Since this piece of inaccessible evidence could be essential to the given investigation case, it is necessary to recover the suspect’s password. Users tend to use passwords that are easy to remember, which in many cases results in passwords containing their personal information. This master’s thesis describes the design and implementation of a tool for generating password candidates based on information known about a given suspect. The tool first constructs a structural model from previously observed passwords of users and subsequently uses this model to generate new password candidates tailored to a specific suspect. Based on the experimental evaluation conducted in this thesis, which compares password recovery efficiency with selected state-of-the-art approaches, the proposed system achieves comparable or better results, particularly for smaller wordlist sizes.

Keywords:

Password cracking, Dictionary attack, Personal information, Forensic

Date of defence

23.06.2026

Result of the defence

Defended (thesis was successfully defended)

znamkaAznamka

Grading

A

Process of defence

Studentka nejprve prezentovala výsledky, kterých dosáhla v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Studentka následně odpověděla na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studentky na položené otázky rozhodla práci hodnotit stupněm A.

Topics for thesis defence

  1. Jaké dopady může mít použití syntetických dat na validitu experimentálních výsledků a jakým způsobem by bylo možné ověřit přenositelnost dosažených výsledků na reálné forenzní případy?
  2. Nebylo by možné udělat analýzu nad již uniklými hesly?

Language of thesis

English

Faculty

Department

Study programme

Information Technology and Artificial Intelligence (MITAI)

Specialization

Machine Learning (NMAL)

Composition of Committee

doc. Ing. Vítězslav Beran, Ph.D. (předseda)
prof. Ing. Hynek Heřmanský, Dr. Eng. (místopředseda)
doc. Ing. Ondřej Lengál, Ph.D. (člen)
doc. Ing. František Zbořil, Ph.D. (člen)
doc. Ing. Michal Bidlo, Ph.D. (člen)
RNDr. Marek Rychlý, Ph.D. (člen)

Supervisor’s report
Ing. Radek Hranický, Ph.D.

Slečna Šírová navrhla, implementovala a experimentálně ověřila užitečný nástroj pro generování kandidátních hesel při zohlednění profilu podezřelého. Nástroj doplnila o modelování struktur hesel, jazykově specifické rozšiřování osobních údajů, deterministický režim i uživatelské rozhraní. Experimenty ukazují, že studentkou navržený přístup je zvláště účinný při menších slovnících a cílených scénářích, kde jsou dostupné osobní informace o podezřelém. Výsledky jsou zdokumentovány v rozsáhlé technické zprávě.


Dle mého názoru se jedná o velmi kvalitní dílo. Oceňuji především proaktivní přístup studentky, praktickou orientaci díla, spolupráci s odborníky z řad Policie ČR a podíl na související žurnálové publikaci.


Celkově práci hodnotím jako výbornou (A).

Evaluation criteria Verbal classification
Informace k zadání

Práce souvisí s oblastí lámání hesel, řešené výzkumnou skupinou NES@FIT. Tématicky navazuje na starší projekty pro MV jako Sec6Net a TARZAN. Řešení probíhalo za konzultace s experty z Kriminalistického ústavu Policie ČR.

S nápadem na zadání studentka přišla sama na základě rozhovorů s policejními experty. Cílem bylo adresovat praktický problém kriminalistů, jak efektivně hádat hesla podezřelých, o kterých je předem znám jejich profil, dříve použitá hesla apod.

Aktivita při dokončování

Práce byla dokončena v předstihu před termínem odevzdáním, její obsah jsem komentoval a mé připomínky studentka následně zapracovala.

Publikační činnost, ocenění

Studentka měla významný podíl na publikaci:

HRANICKÝ, R.; ŠÍROVÁ, L.; RUCKÝ, V. Beyond the Dictionary Attack: Enhancing Password Cracking Efficiency through Machine Learning-Induced Mangling Rules. Forensic Science International: Digital Investigation, 2025, vol. 52, iss. 1, p. 1-10. ISSN: 2666-2817.

Publikace úzce souvisí s řešeným tématem. Byť těžištěm článku jsou mírně odlišné techniky, řešený problém je prakticky totožný. Žurnál je hodnocen jako Q1 v "Information Systems" a článek již získal 4 citace.

Slečna Šírová také zveřejnila kompletní zdrojový kód svého díla, včetně experimentů a datových sad, na portálu GitHub: https://github.com/LuciSirr/TargetPasswordGuesser_Masters_Thesis.

Práce s literaturou

Studentka využila doporučené literatury a další relevantní zdroje si samostatně dohledala.

Aktivita během řešení, konzultace, komunikace

Aktivita studentky byla příkladná. Práci průběžně konzultovala jak se mnou, tak se zástupci Policie ČR. Podobu práce například osobně diskutovala se specialisty na oblast prolamování hesel na semináři CYBERWORKSHOP 2025, pořádané Kriminalistickým ústavem Policie ČR. Dohodnuté termíny plnila.

Points proposed by supervisor: 100

Grade proposed by supervisor: A

Diplomová práce se zabývá aktuální a prakticky významnou problematikou cíleného generování hesel na základě profilu podezřelého pro potřeby digitální forenzní analýzy. Studentka prokázala schopnost samostatně nastudovat rozsáhlou odbornou problematiku, navrhnout vlastní řešení inspirované moderními přístupy k obnově hesel, implementovat funkční software a jeho vlastnosti experimentálně ověřit. Oceňuji zejména vytvoření vlastního pravděpodobnostního modelu využívajícího sémantické informace, realizaci vícejazyčné podpory, vytvoření syntetické datové sady pro experimenty a porovnání s existujícími metodami. Práce je logicky strukturovaná, dobře zpracovaná po odborné i formální stránce a dosažené výsledky mají potenciál pro další využití. 

Evaluation criteria Verbal classification Points
Rozsah splnění požadavků zadání

Evaluation level: zadání splněno

Všechny body zadání byly splněny. 

Rozsah technické zprávy

Evaluation level: je v obvyklém rozmezí

Práce je na horní hranici obvyklého rozmezí.

Prezentační úroveň technické zprávy

Technická zpráva má logickou strukturu odpovídající charakteru řešené problematiky. Kapitoly na sebe přirozeně navazují a čtenář má možnost sledovat celý proces od formulace problému až po vyhodnocení výsledků.

Pozitivně hodnotím zejména rozsah experimentální části a diskusi omezení navrženého přístupu. Součástí práce je rovněž uživatelská dokumentace a popis implementace. 

90
Formální úprava technické zprávy

Práce je po formální stránce zpracována na velmi dobré úrovni. Text je stylisticky konzistentní, odborně formulovaný a používá korektní terminologii. Obrázky, tabulky i přílohy jsou systematicky zařazeny a vhodně doplňují text.

 

V práci se místy vyskytují drobné jazykové či typografické nepřesnosti, které však nijak nesnižují její celkovou kvalitu ani srozumitelnost. Formální úprava odpovídá požadavkům kladeným na diplomovou práci.

90
Práce s literaturou

Studentka pracuje s relevantními zdroji pokrývajícími oblast digitální forenzní analýzy, obnovy hesel i moderních metod generování hesel založených na strojovém učení. Oceňuji zejména zařazení aktuálních odborných článků publikovaných v posledních letech a použití původních vědeckých prací popisujících nástroje jako PassGAN, PassBERT, TarGuess či moderní rozšíření PCFG přístupů.

Neshledal jsem známky porušení citační etiky ani nedostatečného odlišení převzatých poznatků od vlastních výsledků.

95
Realizační výstup

Realizačním výstupem práce je implementace v jazyce Python, včetně grafického uživatelského rozhraní, určená pro generování hesel na základě definovaného uživatelského profilu. Odevzdané soubory dále obsahují experimentální data a výsledky provedených vyhodnocení. Výsledné řešení je funkční a představuje vhodný základ pro další rozvoj i pro využití k demonstračním účelům.

 

Zdrojové kódy jsou přiměřeně dokumentovány a součástí odevzdaného řešení je také soubor Readme.md, který obsahuje základní informace potřebné pro instalaci, konfiguraci a spuštění implementovaného nástroje.

95
Využitelnost výsledků

Výsledkem je funkční software, který lze využít jako podpůrný nástroj při digitálně-forenzních šetřeních. Práce tak představuje aplikovaný výzkum s potenciálem dalšího rozvoje a praktického nasazení.

Náročnost zadání

Evaluation level: obtížnější zadání

Zadání diplomové práce hodnotím jako nadprůměrně náročné. Studentka musela nastudovat problematiku digitální forenzní analýzy a moderních metod obnovy hesel, analyzovat existující přístupy, navrhnout vlastní metodu generování hesel založenou na osobních údajích podezřelého, implementovat funkční nástroj a experimentálně jej ověřit na vytvořené datové sadě. Významnou komplikací byla absence veřejně dostupných dat obsahujících osobní profily a odpovídající hesla, což vedlo k nutnosti vytvoření vlastní syntetické datové sady. 

Topics for thesis defence:
  1. Jaké dopady může mít použití syntetických dat na validitu experimentálních výsledků a jakým způsobem by bylo možné ověřit přenositelnost dosažených výsledků na reálné forenzní případy?
Points proposed by reviewer: 95

Grade proposed by reviewer: A

Responsibility: Mgr. et Mgr. Hana Odstrčilová