Master's Thesis

Optimization of Multi-Agent Unmanned Aerial Systems Behavior

Final Thesis 2.77 MB

Author of thesis: Ing. Filip Jahn

Acad. year: 2025/2026

Supervisor: Ing. Jiří Novák, Ph.D.

Reviewer: Ing. Tomáš Kašpárek, Ph.D.

Abstract:

This thesis optimizes the collective behavior of heterogeneous multi-agent unmanned systems, using autonomous wildfire suppression as a challenging real-world use case. A stochastic simulation environment is developed from the ground up, integrating cellular automata for fire spread, fire-atmosphere coupling, and real-world terrain geometry from OpenStreetMap data. The work develops and validates two UAV models: a kinematic model for fixed-wing aircraft and a dynamic model for quadcopters. The proposed heterogeneous architecture employs quadcopters as scouts to locate fires and transmit structured data to fixed-wing tankers for suppressant delivery. The system is trained using the MAPPO algorithm under the Centralized Training, Decentralized Execution (CTDE) paradigm. Experimental evaluation demonstrates that spatial coverage emerges without an explicit assignment mechanism, confirming that the architecture produces robust and scalable cooperative behavior across diverse deployment configurations.

Keywords:

{multi-agent reinforcement learning, unmanned aerial systems, wildfire suppression, heterogeneous swarm, MAPPO, centralized training decentralized execution, cellular automata, cross-attention, curriculum learning, quadcopter, fixed-wing UAV

Date of defence

25.06.2026

Result of the defence

Defended (thesis was successfully defended)

znamkaAznamka

Grading

A

Process of defence

Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm A.

Topics for thesis defence

  1. Jaké změny budou potřeba pro využití jiného typu dronu například pro průzkumníky?
  2. Bude váš systém fungovat pro nasazení na rozlehlém území desítek či stovek kilometrů (lesní požáry USA či Kanady)?

Language of thesis

English

Faculty

Department

Study programme

Information Technology and Artificial Intelligence (MITAI)

Specialization

Embedded Systems (NEMB)

Composition of Committee

doc. Ing. Zdeněk Vašíček, Ph.D. (předseda)
doc. Ing. Michal Bidlo, Ph.D. (místopředseda)
doc. Mgr. Adam Rogalewicz, Ph.D. (člen)
Ing. Marcela Zachariášová, Ph.D. (člen)
doc. Dr. Ing. Otto Fučík (člen)
Ing. Josef Strnadel, Ph.D. (člen)

Supervisor’s report
Ing. Jiří Novák, Ph.D.

In summary, the submitted thesis exceeded expectations set by the assignment and the overall quality of both formal and technical aspects are very high. The chosen methodology and the achieved results significantly exceed the standards typically expected for works of this type. The outcomes of the thesis have direct practical application potential / provide a new perspective on the investigated problem. Therefore, I unequivocally recommend the thesis for the Dean’s Award.

Evaluation criteria Verbal classification
Informace k zadání

The topic of this master's thesis is highly demanding, with a theoretical framework that exceeds the knowledge typically acquired during the course of study. All objectives were fulfilled and, in most aspects, exceeded expectations. The student successfully applied Multi-Agent Reinforcement Learning (MARL) to optimize and automate decision-making in aerial firefighting. From training a single agent for wildfire monitoring to developing complex multi-agent scenarios involving both monitoring and suppression tasks, the student had to design a custom training curriculum and appropriately shape the reward functions to achieve stable and efficient learning.

The application of MARL at this scale for the task of aerial firefighting is not present in the current literature, and many of the technical aspects had to be independently researched and implemented by the student. The work therefore demonstrates not only strong theoretical understanding but also a high level of creativity, independence, and engineering skill. The developed framework and obtained results have significant research potential and may contribute to future developments in autonomous coordination systems for emergency response applications. I also appreciate that the thesis was written in English.

Aktivita při dokončování

The thesis was completed ahead of time and both technical and formal details were consulted before the final submission.

Publikační činnost, ocenění

The student took part of the Excel@FIT 2026 conference and prepared a poster presenting his work. The student is recommended to publish the final results of the thesis in a relevant journal.

Práce s literaturou

The student appropriately researched the necessary literature and cited it correctly in the text. The thesis also contains a related work chapter which is important to place the work in scope of the current research.

Aktivita během řešení, konzultace, komunikace

Consultations took place regularly. The student was active and came prepared with questions for discussion. Both the form of technical report and results were communicated regularly and helped to ensure high quality of the resulting thesis.

Points proposed by supervisor: 99

Grade proposed by supervisor: A

Reviewer’s report
Ing. Tomáš Kašpárek, Ph.D.

Tato práce rozhodně patří k jedné z nejlepších, které se mi za poslední dobu dostaly do ruky. Student prokázal znalosti a schopnosti přesahující požadavky na diplomovou práci.


Doporučuji k ceně děkana za vynikající diplomovou práci.

Evaluation criteria Verbal classification Points
Rozsah splnění požadavků zadání

Evaluation level: zadání splněno a práce obsahuje podstatná rozšíření

Práce se drží osnovy zadání, ale rozpracovává jednotlivé body do míry překračující obvyklé požadavky na diplomovou práci a to včetně podrobné formální části.

Rozsah technické zprávy

Evaluation level: přesahuje obvyklé rozmezí

Rozsah práce překračuje obvyklé rozmezí, nicméně všechny uvedené kapitoly jsou pro práci přínosné a užitečné.

Prezentační úroveň technické zprávy

Student si zaslouží pochvalu za velmi dobře promyšlenou koncepci rozvržení práce. Obzvláště oceňuji zasazení do kontextu v kapitole 2.

99
Formální úprava technické zprávy

Jedinou výtku mám k čitelnosti některých obrázků, což předpokládám vzniklo jako snaha snížit značný rozsah stánek práce.

95
Práce s literaturou

Práce představuje důkladnou rešerši daného tématu a používá relevantní vědecké články.

99
Realizační výstup

Vzhledem k realizaci velkého množství částí oceňuji jejich čitelné členění na jednotlivé moduly, což umožňuje jejich využití nejen jako celku ale i samostatně pro navazující projekty.

99
Využitelnost výsledků

Práce rozšiřuje publikované výsledky o práci s agenty více druhů. Kromě zvoleného tématu hašení požárů je tak velmi dobře připravena na nasazení v navazujících projektech s jiným tématickým zaměřením.

Náročnost zadání

Evaluation level: obtížnější zadání

Zadání práce vyžaduje nastudovat a zpracovat rozsáhlé penzum témat především z oblastí modelování a simulace.

Topics for thesis defence:
  1. Jaké změny budou potřeba pro využití jiného typu dronu například pro průzkumníky?
  2. Bude váš systém fungovat pro nasazení na rozlehlém území desítek či stovek kilometrů (lesní požáry USA či Kanady)?
Points proposed by reviewer: 99

Grade proposed by reviewer: A

Responsibility: Mgr. et Mgr. Hana Odstrčilová