Master's Thesis

Software Manager for Preprocessing Large Image Datasets

Final Thesis 5.78 MB Appendix 869.3 kB

Author of thesis: Bc. Jaroslav Szkandera

Acad. year: 2025/2026

Supervisor: Ing. Petr Šoustek, Ph.D.

Reviewer: Ing. Milan Šabata

Abstract:

This work presents Luminous, a graphical application for preprocessing image datasets for machine learning pipelines. The first part provides a brief overview of available software and describes the challenges of creating image datasets, covering cleaning, annotation, augmentation, and formatting. In the next chapter, the application is described. The created application provides extensibility through two plugin backends: shared libraries and inter-process communication. Example plugins are provided, including support for additional formats and use of state-of-the-art models, specifically CLIP and SAM 3. Finally, benchmarking experiments are presented, namely image loading throughput and GPU-accelerated augmentation pipeline performance.

Keywords:

image viewer, plugin interface, GPU pipeline, image dataset processing

Date of defence

09.06.2026

Result of the defence

Defended (thesis was successfully defended)

znamkaBznamka

Grading

B

Process of defence

Student obeznámil komisi s výsledky své DP. Po přečtení posudků následovaly dotazy oponenta (viz posudek oponenta) a komise: Časové porovnání GPU a pipeline. Zesvětlení. Vytížení procesoru (testování). Srovnání získaného řešení s existujícími (přínosy). Výběr Rustu. Zazněla pochvala na zpracování obrázků. Jak velké byly datasety. Komise byla s odpověďmi studenta spokojena.

Language of thesis

English

Faculty

Department

Study programme

Applied Computer Science and Control (N-AIŘ-P)

Composition of Committee

doc. Ing. Oldřich Trenz, Ph.D. (předseda)
doc. Ing. Jakub Kůdela, Ph.D. (místopředseda)
prof. Ing. Zdeněk Hadaš, Ph.D. (člen)
doc. Ing. Pavel Škrabánek, Ph.D. (člen)
doc. Ing. David Fojtík, Ph.D. (člen)
prof. Ing. Jiří Jaroš, Ph.D. (člen)
doc. Ing. Miloš Hammer, CSc. (člen)

Supervisor’s report
Ing. Petr Šoustek, Ph.D.

Cílem diplomové práce Jaroslava Szkandery bylo vytvořit software pro přípravu rozsáhlých obrazových datasetů. Jedná se o aktuální tematiku v problematice trénování modelů umělé inteligence. Student se zadaného úkolu zhostil velmi dobře a vytvořil kvalitní SW řešení, které ilustruje výbornou technickou dovednost autora. Zvláště oceňuji zaměření na jeden z cílů práce, a to na rychlost samotného SW. Díky tomu lze pohodlně zpracovat i velké množství obrazových dat. Další silnou stránkou je navržené rozhraní pro doplňky aplikace, které je jazykově i platformě nezávislé. Lze tak rozšiřovat aplikaci o další funkcionalitu, jak je patrné z vytvořených doplňků, které do SW napojují pokročilé modely CLIP a SAM 3.

Diplomant měl vynikající pracovní morálku a při zpracování náročné problematiky prokázal značnou míru samostatnosti. Stanovené cíle diplomové práce se podařilo splnit, a proto ji doporučuji k obhajobě s hodnocením A/výborně.
Evaluation criteria Grade
Splnění požadavků a cílů zadání A
Postup a rozsah řešení, adekvátnost použitých metod B
Vlastní přínos a originalita A
Schopnost interpretovat dosažené výsledky a vyvozovat z nich závěry B
Využitelnost výsledků v praxi nebo teorii A
Logické uspořádání práce a formální náležitosti A
Grafická, stylistická úprava a pravopis A
Práce s literaturou včetně citací A
Samostatnost studenta při zpracování tématu A

Grade proposed by supervisor: A

Reviewer’s report
Ing. Milan Šabata

Cílem diplomové práce bylo navrhnout a vyvinout softwarovou platformu pro efektivní správu a předzpracování rozsáhlých obrazových datasetů. Zadání bylo splněno v plném rozsahu. Jedná se o aktuální problematiku, se kterou se diplomant po inženýrské stránce výborně vyrovnal.

V teoretické části autor nejprve analyzuje dostupné nástroje pro správu obrazových dat a následně detailně popisuje techniky čištění, augmentace a anotace. Text tvoří vhodný základ pro následnou implementaci. Těžištěm celé práce jsou kapitoly 3 a 4, které se věnují návrhu architektury aplikace Luminous a vyhodnocení jejích výkonnostních parametrů. Autor zde prokázal výborné programátorské dovednosti. Zvolená kombinace jazyka Rust, deklarativního frameworku Slint a využití wgpu pro grafickou akceleraci představuje moderní a robustní řešení. Kladně hodnotím také návrh flexibilního systému pluginů a úspěšnou integraci modelů strojového učení (CLIP, SAM 3).

Práce je psána v anglickém jazyce na dobré úrovni s minimem překlepů. Rozsah a kvalita zdrojových kódů svědčí o nadstandardních schopnostech autora. Výhrady mám však ke způsobu interpretace dosažených výsledků v experimentální části. Autor při analýze stagnace propustnosti (např. u načítání v plném rozlišení) vyvozuje závěry o limitacích paměťové propustnosti DRAM, nicméně tato tvrzení nejsou v textu podložena reálnými daty z profilovacích nástrojů a zůstávají tak v rovině hypotéz. Dále postrádám explicitní zdůvodnění, proč nebylo provedeno (nebo proč není relevantní) srovnání rychlosti a efektivity s některým z existujících řešení popsaných v rešerši.

I přes výše zmíněné nedostatky v exaktnosti vyhodnocování experimentů se jedná o výborně odvedenou technickou práci, která je plně využitelná v praxi. Práci jednoznačně doporučuji k obhajobě a navrhuji hodnocení B/velmi dobře.
Evaluation criteria Grade
Splnění požadavků a cílů zadání A
Postup a rozsah řešení, adekvátnost použitých metod A
Vlastní přínos a originalita A
Schopnost interpretovat dosaž. výsledky a vyvozovat z nich závěry B
Využitelnost výsledků v praxi nebo teorii A
Logické uspořádání práce a formální náležitosti B
Grafická, stylistická úprava a pravopis A
Práce s literaturou včetně citací B
Topics for thesis defence:
  1. Jaká je skutečná paměťová náročnost (peak memory footprint) aplikace při načítání dávky 100 obrázků ve vysokém rozlišení? Lze vaši hypotézu o úzkém hrdle v propustnosti DRAM (ze strany 48) potvrdit profilovacím nástrojem?
  2. Proč jste se rozhodl neprovést srovnání výkonnosti Luminous s existujícími řešeními zmíněnými v teoretické části, případně jaká by byla metodologická úskalí takového srovnání?

Grade proposed by reviewer: B

Responsibility: Mgr. et Mgr. Hana Odstrčilová