Přístupnostní navigace
E-application
Search Search Close
Master's Thesis
Author of thesis: Bc. Michal Bartošák
Acad. year: 2025/2026
Supervisor: prof. Dr. Ing. Pavel Zemčík, dr. h. c.
Reviewer: doc. Ing. Vítězslav Beran, Ph.D.
This thesis investigates how extended spectral information affects the detection of visually degraded objects. The aim was to develop a comprehensive processing pipeline and evaluate to what extent a detailed spectral resolution contributes to the identification of camouflaged targets. The core of the solution lies in utilizing the YOLO26 convolutional neural network. To ensure an objective comparison, simulated RGB and multispectral datasets were derived from the source hyperspectral data. The high dimensionality of the hyperspectral images was reduced using the PCA method. The results of experiments on a small unmanned ground vehicle confirmed that more diverse data modality outperforms standard RGB images. While models trained on RGB data achieved an average accuracy of only 90.45%, utilizing the full hyperspectral range increased this value to 96.5%. These findings demonstrate that the integration of spectral information fundamentally improves the overall accuracy and stability of algorithms in detecting camouflaged targets.
object detection, multispectral image, hyperspectral data, camouflage, data modality, dimensionality reduction, deep learning, convolutional neural network
Date of defence
22.06.2026
Date of publish
21.06.2029
Result of the defence
Defended (thesis was successfully defended)
Grading
A
Process of defence
Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm A.
Topics for thesis defence
Language of thesis
Czech
Faculty
Fakulta informačních technologií
Department
Department of Computer Graphics and Multimedia
Study programme
Information Technology and Artificial Intelligence (MITAI)
Specialization
Machine Learning (NMAL)
Composition of Committee
prof. Dr. Ing. Jan Černocký (předseda) prof. Ing. Martin Čadík, Ph.D. (místopředseda) doc. Ing. Vladimír Janoušek, Ph.D. (člen) doc. Ing. Michal Bidlo, Ph.D. (člen) doc. Ing. František Zbořil, Ph.D. (člen) Ing. Petr Veigend, Ph.D. (člen)
Supervisor’s reportprof. Dr. Ing. Pavel Zemčík, dr. h. c.
Jedná se, podle mého názoru, o zdařilou práci. Vyžadovala velké úsilí studenta zejména s ohledem na sběr dat, ale i jejich zpracování bylo náročné. Student věnoval práci mimořádně velké úsilí a myslím, že dosáhl i dobrých experimentálních výsledků s velkým potenciálem pro využití v praxi. Vzhledem k tomu hodnotím mimořádné úsilí studenta i celou práci stupněm výborně (A).
Zadání práce považuji za náročné a bylo vytvořeno i na základě iniciaitivy studenta. Práce je zaměřena na zpracování multispektrálního obrazu s orientací na detekci maskovaných objektů s využitím vojenských maskovacích prostředků. Její náročnost spočívala v tom, že bylo třeba vytvoři nejen software pro zpracování obrazu, ale také (možná zejména) pořídit datovou sadu obrazů ve vhodném prostředí. Student se práce, podle mého názoru, zhostil úspěšně a výstup jeho práce je použitelný v praxi.
Práce byla dokončena včas, obsah byl konzultován a jak postupy zpracování obrazu, tak i text práce byly průběžně korigovány.
-
S literaturou student pracoval nejen na základě doporučení, ale iniciativně vyhledával literární zdroje a další studijní prameny.
Během řešení práce byl student aktivní, práci se věnoval průběžně po celou dobu akademického roku, chodil na konzultace a býval ny ně připraven, občasně jsme měli konzultace i "v terénu", kde student sbíral ve spolupráci s lidmi z UNOB obrazová data.
Grade proposed by supervisor: A
Reviewer’s reportdoc. Ing. Vítězslav Beran, Ph.D.
Pan Michal Bartošák zpracoval náročnější zadání velmi kvalitně. V rámci řešení pečlivě nastudoval relevantní znalosti, navrhl metodický postup řešení, vytvořil vlastní relevantní a hodnotnou anotovanou sadu multispektrálních dat a navrhl postupy pro generování simulovaných datových sad pro efektivní trénování hlubokých konvolučních neuronových sítí. Provedené experimenty následně úspěšně prokázaly jednoznačný přínos pro zlepšení detekce vizuálně narušených objektů. Jedná se o metodicky, teoreticky i prakticky velmi kvalitní práci.
Evaluation level: zadání splněno
Autor se dobře obeznámil s potřebnými tématy, včetně existujících publikovaných prací a dostupných relevantních datových sad. V návaznosti na to specifikoval cílové typy objektů k detekci a připravil vlastní datovou sadu, přičemž vhodně využil dostupná hyperspektrální data k simulaci dat multispektrálních i standardních RGB. Tento přístup mu umožnil provést trénování hlubokých konvolučních neuronových sítí na vlastní anotované sadě a následně experimentálně testovat chování modelů jak na reálných multispektrálních, tak na RGB datech.
Evaluation level: je v obvyklém rozmezí
Rozsah předložené práce se pohybuje v obvyklém rozmezí, přičemž text je informačně bohatý a obsahuje všechny relevantní i podstatné informace nezbytné pro pochopení řešené problematiky. Místy se však autor v textu trochu opakuje a mírné zestručnění některých pasáží by přispělo k větší dynamice a lepší čitelnosti celého dokumentu.
Předložená práce obsahuje velmi pečlivý, odborný, věcný a logický text, v němž autor postupně představí podstatná a relevantní témata a následně vhodně reflektuje jejich klíčové vlastnosti s ohledem na zadaný cíl práce. Veškeré své postupy v textu dobře vysvětluje a také autorské vývody a návrhy jsou logické a dobře obhájené, přičemž výsledky experimentů jsou jasně prezentovány. Určitý prostor pro zlepšení se však nachází v interpretaci výsledků, kde autor spíše popisuje výsledky, než že by se snažil tyto výsledky lépe interpretovat. Číselné tabulkové hodnoty by měly mít všechny stejnou přesnost (viz tab. 6.1).
Formální úroveň předložené práce je velmi kvalitní, přičemž text plně využívá zavedený odborný standard a je po jazykové stránce zpracován prakticky bez chyb. Autor prokazuje dobrou úroveň vyjadřování a schopnost přesné formulace technických i teoretických poznatků v souladu s požadavky kladenými na akademický text, což se pozitivně odráží na celkové čitelnosti a profesionálním dojmu z celého dokumentu.
Výběr studijních pramenů je velmi rozsáhlý, kvalitní a vysoce relevantní, přičemž autor v rámci práce provedl velmi pečlivou rešerši všech podstatných témat. Text čerpá z velkého množství zdrojů a vhodně využívá stávající poznatky v dané vědecké oblasti. Autor dobře a jasně odděluje svůj vlastní autorský postup a dosažené výsledky od převzatých znalostí.
Technické a programové řešení plně odpovídá charakteru zadání v oblasti strojového učení, správy rozsáhlejších datových dat, trénování statistických modelů i následného testování a vyhodnocení experimentů. V rámci práce autor realizoval kvalitní a odborný postup, který zahrnuje návrh a vytvoření vlastní relevantní anotované datové sady s vizuálně narušenými objekty, konkrétně maskovanými vozidly, v hyperspektrální, multispektrální a RGB doméně v různých prostředích. Součástí řešení je i realizace redukce dimenze u hyperspektrálních dat a návrh simulace multispektrálních a RGB dat z dat hyperspektrálních. Experimentální část byla precizně navržena s ohledem na různé proměnné, od třídní granularity objektů přes odlišná prostředí až po jednotlivé modality. Příprava modelů, jejich trénování a vyhodnocení pro rozličné kombinace těchto proměnných vyústily v pečlivé vyhodnocení a odbornou prezentaci výsledků. Výsledná diskuze přináší odborné závěry, které jednak ověřují přínos využití hyperspektrálních dat při detekci vizuálně narušených objektů, a také relevantně vysvětlují důvody, proč modely natrénované na simulovaných multispektrálních datech selhávají na reálných záznamech.
Samotné programové řešení představuje odborně náročnou a komplexní inženýrskou práci s velkými daty, které vyžaduje efektivní správu výpočtů na vzdálené HPC infrastruktuře (MetaCentrum). Autor za tímto účelem vytvořil sadu skriptů určených pro manipulaci s daty podle spektrálních modalit, jejich potřebné dělení či míchání, generování simulovaných vzorků, redukce dimenze, přesuny dat, řízení samotného trénování, testování a následnou vizualizaci. Všechny tyto vytvořené zdrojové soubory a konfigurační nastavení jsou odborně zpracované, velmi dobře zdokumentované a logicky strukturované.
Ačkoliv má práce do jisté míry kompilační charakter v oblasti rešerše spektrálního snímání, přináší hodnotné praktické ověření popsaných postupů na konkrétním případu použití. Autor tvořivě doplňuje jak metodiku generování simulovaných multispektrálních dat z dat hyperspektrálních, tak i vlastní postup při úpravě fitness funkce v rámci dotrénování a optimalizace detekčního modelu YOLO pro specifické podmínky vizuálně narušených objektů. Dosažené výsledky jsou využitelné v praxi při návrhu optických detekčních systémů a současně slouží jako velmi vhodný a ucelený základ pro další experimenty a navazující výzkum v této vědecké oblasti.
Evaluation level: obtížnější zadání
Zadání diplomové práce je náročnější, neboť vyžaduje pokročilé znalosti z oblasti pořízení a zpracování multispektrálních obrazových dat a současně metod strojového učení vhodných pro detekci objektů.
Grade proposed by reviewer: A
Reasons for publication postponement
Publication of the final thesis has been postponed in compliance with the provisions of Section 47b (4) of Act No. 111/1998 Coll., on the Higher Education Institutions and on amendments and supplements to other acts, as amended.
Responsibility: Mgr. et Mgr. Hana Odstrčilová