Přístupnostní navigace
E-application
Search Search Close
Master's Thesis
Author of thesis: Ing. Veronika Nevařilová
Acad. year: 2025/2026
Supervisor: Ing. Igor Szőke, Ph.D.
Reviewer: prof. Dr. Ing. Jan Černocký
This thesis focuses on the automatic extraction of information from Czech and English air traffic communication recordings for the purpose of filling electronic version of flight strips used for flight record keeping at small airfields. The proposed system processes audio recordings through several independent components including audio segmentation, speech-to-text transcription, structured information extraction using a large language model, and speaker identification. The system was evaluated on real data from Kunovice airport and in autonomous mode it achieved 65.7 % error-free outputs. After initializing the system with known voice samples of tower personnel and correcting only the most critical speaker identification errors, the system achieved more than 81 % error-free outputs.
automatic speech recognition, speech-to-text transcription, information extraction, speaker identification, large language models, air traffic communication, electronic flight strips, flight records
Date of defence
22.06.2026
Result of the defence
Defended (thesis was successfully defended)
Grading
A
Process of defence
Studentka nejprve prezentovala výsledky, kterých dosáhla v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Studentka následně odpověděla na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studentky na položené otázky rozhodla práci hodnotit stupněm A.
Topics for thesis defence
Language of thesis
Czech
Faculty
Fakulta informačních technologií
Department
Department of Computer Graphics and Multimedia
Study programme
Information Technology and Artificial Intelligence (MITAI)
Specialization
Machine Learning (NMAL)
Composition of Committee
prof. Dr. Ing. Jan Černocký (předseda) prof. Ing. Martin Čadík, Ph.D. (místopředseda) doc. Ing. Vladimír Janoušek, Ph.D. (člen) doc. Ing. Michal Bidlo, Ph.D. (člen) doc. Ing. František Zbořil, Ph.D. (člen) Ing. Petr Veigend, Ph.D. (člen)
Supervisor’s reportIng. Igor Szőke, Ph.D.
Studentka pracovala příkladně po celý akademický rok. Náročnější téma řešila aktivně a se zájmem.
Jedná se o obtížnější zadání s dostatkem prostoru pro možné rozšíření. Zadání bylo splněno. Obtížnost shledávám v tématu, které je spíše široké. Cílem je vytvořit funkční řetězec pro automatizované zpracování záznamů letecké komunikace a propojit ho s existujícím frontendem. Některé moduly bylo třeba adaptovat na cílovou doménu. S výsledky práce jsem velmi spokojen. Studentce se podařilo vytvořit funkční řešení.
Aktivita při dokončování nebyla pod stresem. Text byl dodán ke kontrole včas. Vedoucím byly doporučeny dílčí úpravy struktury a jazyková kontrola.
Práce byla oceněna na EXCEL@FIT.
Studentka literaturu získávala samostatně a aktivně.
Studentka konzultovala práci po celou dobu akademického roku pravidelně cca 1x za 2 týdny. V případě potřeby i častěji. Byla vždy připravena a ukázala slušný pokrok. Práci řešila aktivně a samostatně.
Grade proposed by supervisor: A
Reviewer’s reportprof. Dr. Ing. Jan Černocký
Jedná se o velmi kvalitně provedenou práci spojující adaptaci řečových technologií s důkladnou znalostí letecké domény, pečlivou experimentální prací a SW integraci. Text práce je čtivý, dobře strukturovaný a velmi kvalitní, Práce má potenciál pokračování v několika směrech (aplikace na skutečném letišti, follow-up projekty, patent a/nebo publikace). Práci doporučuji na Cenu děkana, případně jiná ocenění.
Evaluation level: zadání splněno a práce obsahuje podstatná rozšíření
Zadání bylo splněno, studentka vyvinula velice povedený systém pro elektronické před-vyplňování „pásek“ pro malé letiště. Při práci porozuměla a adaptovala několik pokročilých bloků zpracování řeči, velice kladně hodnotím pečlivou evaluaci jak jednotlivých bloků, tak celého řešení na vlastnoručně sesbíraných a onatovoaných datech. U některých bloků bylo potřeba adaptovat evaluaci pro danou úlohu, autorka zde projevila hlubokou znalost problematiky, kreativitu, pečlivost a schopnosti důkladné analýzy.
Evaluation level: přesahuje obvyklé rozmezí
Práce je obsáhlá, ale všechny části jsou relevantní, žádnou z kapitol či sekcí nelze považovat za zbytečnou. Popis jednotlivých technologií zpracování řeči je kompaktní, což pro porozumění naprosto postačuje, velký rozsah je (právem) věnován popisu dat, experimentů, vyhodnocení a jejich diskusi. K práci je přiložen obsáhlý annex se dvěma verzemi LLM promptu pro extrakci informací z rozpoznaných dat, jedná se o velmi zdařilou práci, která je sama o sobě velmi zajímavá.
Prezentační úroveň je výborná – práce je logicky členěná, sekce na sebe plynule navazují a jak již bylo řečeno, neobsahuje zbytečný „balast“.
Formálně je práce rovněž perfektně zpracovaná, kladně hodnotím řadu pěkně provedených grafů a tabulek s výsledky experimentů (byť by na některých místech bylo dobré zapracovat na srovnatelnosti mezi jednotlivými setupy). Práce je psána perfektní češtinou prakticky bez chyb, drobné poznámky jsou spíše podněty k diskusi - studentce předám okomentovaný výtisk práce.
Rozsah seznamu literatury odpovídá diplomové práci, zdroje jsou vyvážené a je patrné, že z nich autorka čerpala, doporučoval bych pouze citace verzí článků publikovaných na konferencích či v časopisech spíše než jen arXiv reference.
Výstupem je kompletní SW řešení pro práci s „leteckým“ audiem vhodné pro integraci se SW systémem pro vyplňování letových pásek. SW řešení dokumentuje zběhlost autorky nejen v technologiích zpracování řeči a v „letečtině“, ale i v technikách, toolkitech a API pro SW integraci.
Práce je přímo využitelná pro vyplňování leteckých pásek na malém letišti a po integraci s příslušným UI má potenciál být užitečná pro zjednodušení práce dispečerů. Využitelné jsou ale i prostudované a otestované techniky adaptace technologií pro daný scénář, LLM prompty pro extrakci letových dat z textu a metoda evaluace. Celá „pipeline“ má potenciál k patentování a publikaci na slušné letecké či řečové konferenci.
Evaluation level: obtížnější zadání
Zadání vyžadovalo velmi studium přístupů k několika doménám zpracování řeči (diarisace, segmentace, rozpoznávání řeči, rozpoznávání řečníka, zpracování pomocí LLM) a letecké komunikace včetně potřeb evidence letů na malém letišti. Práce navazuje na autorčinu bakalářskou práci, ale svým obsahem ji podstatně překračuje a rozvíjí.
Grade proposed by reviewer: A
Responsibility: Mgr. et Mgr. Hana Odstrčilová