Master's Thesis

Automatic filling of electronic flight strips

Final Thesis 7.49 MB

Author of thesis: Ing. Veronika Nevařilová

Acad. year: 2025/2026

Supervisor: Ing. Igor Szőke, Ph.D.

Reviewer: prof. Dr. Ing. Jan Černocký

Abstract:

This thesis focuses on the automatic extraction of information from Czech and English air traffic communication recordings for the purpose of filling electronic version of flight strips used for flight record keeping at small airfields. The proposed system processes audio recordings through several independent components including audio segmentation, speech-to-text transcription, structured information extraction using a large language model, and speaker identification. The system was evaluated on real data from Kunovice airport
and in autonomous mode it achieved 65.7 % error-free outputs. After initializing the system with known voice samples of tower personnel and correcting only the most critical speaker identification errors, the system achieved more than 81 % error-free outputs.

Keywords:

automatic speech recognition, speech-to-text transcription, information extraction, speaker identification, large language models, air traffic communication, electronic flight strips, flight records

Date of defence

22.06.2026

Result of the defence

Defended (thesis was successfully defended)

znamkaAznamka

Grading

A

Process of defence

Studentka nejprve prezentovala výsledky, kterých dosáhla v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Studentka následně odpověděla na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studentky na položené otázky rozhodla práci hodnotit stupněm A.

Topics for thesis defence

  1. V promptu (str 84) uvádíte, že vytrvalost má být zkonvertována na hodiny, přitom už by měla být v hodinách uváděna. Nedochází zde ke zbytečným chybám extrakce pomocí LLM ?
  2. Uveďte, jak je řešena možná situace, kdy z jednoho letadla mluví dva piloti.
  3. Odhadněte přesnost práce s mluvčími systému při provozu na velkém letišti (stovky mluvčích denně) a případné nutné adaptace.
  4. Předpokládá se reálné nasazení?

Language of thesis

Czech

Faculty

Department

Study programme

Information Technology and Artificial Intelligence (MITAI)

Specialization

Machine Learning (NMAL)

Composition of Committee

prof. Dr. Ing. Jan Černocký (předseda)
prof. Ing. Martin Čadík, Ph.D. (místopředseda)
doc. Ing. Vladimír Janoušek, Ph.D. (člen)
doc. Ing. Michal Bidlo, Ph.D. (člen)
doc. Ing. František Zbořil, Ph.D. (člen)
Ing. Petr Veigend, Ph.D. (člen)

Supervisor’s report
Ing. Igor Szőke, Ph.D.

Studentka pracovala příkladně po celý akademický rok. Náročnější téma řešila aktivně a se zájmem.

Evaluation criteria Verbal classification
Informace k zadání

Jedná se o obtížnější zadání s dostatkem prostoru pro možné rozšíření. Zadání bylo splněno. Obtížnost shledávám v tématu, které je spíše široké. Cílem je vytvořit funkční řetězec pro automatizované zpracování záznamů letecké komunikace a propojit ho s existujícím frontendem. Některé moduly bylo třeba adaptovat na cílovou doménu. S výsledky práce jsem velmi spokojen. Studentce se podařilo vytvořit funkční řešení.

Aktivita při dokončování

Aktivita při dokončování nebyla pod stresem. Text byl dodán ke kontrole včas. Vedoucím byly doporučeny dílčí úpravy struktury a jazyková kontrola.

Publikační činnost, ocenění

Práce byla oceněna na EXCEL@FIT.

Práce s literaturou

Studentka literaturu získávala samostatně a aktivně.

Aktivita během řešení, konzultace, komunikace

Studentka konzultovala práci po celou dobu akademického roku pravidelně cca 1x za 2 týdny. V případě potřeby i častěji. Byla vždy připravena a ukázala slušný pokrok. Práci řešila aktivně a samostatně. 

Points proposed by supervisor: 97

Grade proposed by supervisor: A

Reviewer’s report
prof. Dr. Ing. Jan Černocký

Jedná se o velmi kvalitně provedenou práci spojující adaptaci řečových technologií s důkladnou znalostí letecké domény, pečlivou experimentální prací a SW integraci. Text práce je čtivý, dobře strukturovaný a velmi kvalitní, Práce má potenciál pokračování v několika směrech (aplikace na skutečném letišti, follow-up projekty, patent a/nebo publikace). Práci doporučuji na Cenu děkana, případně jiná ocenění.

Evaluation criteria Verbal classification Points
Rozsah splnění požadavků zadání

Evaluation level: zadání splněno a práce obsahuje podstatná rozšíření

Zadání bylo splněno, studentka vyvinula velice povedený systém pro elektronické před-vyplňování „pásek“ pro malé letiště. Při práci porozuměla a adaptovala několik pokročilých bloků zpracování řeči, velice kladně hodnotím pečlivou evaluaci jak jednotlivých bloků, tak celého řešení na vlastnoručně sesbíraných a onatovoaných datech. U některých bloků bylo potřeba adaptovat evaluaci pro danou úlohu, autorka zde projevila hlubokou znalost problematiky, kreativitu, pečlivost a schopnosti důkladné analýzy.

Rozsah technické zprávy

Evaluation level: přesahuje obvyklé rozmezí

Práce je obsáhlá, ale všechny části jsou relevantní, žádnou z kapitol či sekcí nelze považovat za zbytečnou. Popis jednotlivých technologií zpracování řeči je kompaktní, což pro porozumění naprosto postačuje, velký rozsah je (právem) věnován popisu dat, experimentů, vyhodnocení a jejich diskusi. K práci je přiložen obsáhlý annex se dvěma verzemi LLM promptu pro extrakci informací z rozpoznaných dat, jedná se o velmi zdařilou práci, která je sama o sobě velmi zajímavá.

Prezentační úroveň technické zprávy

Prezentační úroveň je výborná – práce je logicky členěná, sekce na sebe plynule navazují a jak již bylo řečeno, neobsahuje zbytečný „balast“.

95
Formální úprava technické zprávy

Formálně je práce rovněž perfektně zpracovaná, kladně hodnotím řadu pěkně provedených grafů a tabulek s výsledky experimentů (byť by na některých místech bylo dobré zapracovat na srovnatelnosti mezi jednotlivými setupy). Práce je psána perfektní češtinou prakticky bez chyb, drobné poznámky jsou spíše podněty k diskusi - studentce předám okomentovaný výtisk práce.

99
Práce s literaturou

Rozsah seznamu literatury odpovídá diplomové práci, zdroje jsou vyvážené a je patrné, že z nich autorka čerpala, doporučoval bych pouze citace verzí článků publikovaných na konferencích či v časopisech spíše než jen arXiv reference.

90
Realizační výstup

Výstupem je kompletní SW řešení pro práci s „leteckým“ audiem vhodné pro integraci se SW systémem pro vyplňování letových pásek. SW řešení dokumentuje zběhlost autorky nejen v technologiích zpracování řeči a v „letečtině“, ale i v technikách, toolkitech a API pro SW integraci.

98
Využitelnost výsledků

Práce je přímo využitelná pro vyplňování leteckých pásek na malém letišti a po integraci s příslušným UI má potenciál být užitečná pro zjednodušení práce dispečerů. Využitelné jsou ale i prostudované a otestované techniky adaptace technologií pro daný scénář, LLM prompty pro extrakci letových dat z textu a metoda evaluace. Celá „pipeline“ má potenciál k patentování a publikaci na slušné letecké či řečové konferenci.

Náročnost zadání

Evaluation level: obtížnější zadání

Zadání vyžadovalo velmi studium přístupů k několika doménám zpracování řeči (diarisace, segmentace, rozpoznávání řeči, rozpoznávání řečníka, zpracování pomocí LLM) a letecké komunikace včetně potřeb evidence letů na malém letišti. Práce navazuje na autorčinu bakalářskou práci, ale svým obsahem ji podstatně překračuje a rozvíjí.

Topics for thesis defence:
  1. Odhadněte přesnost práce s mluvčími systému při provozu na velkém letišti (stovky mluvčích denně) a případné nutné adaptace.
  2. V promptu (str 84) uvádíte, že vytrvalost má být zkonvertována na hodiny, přitom už by měla být v hodinách uváděna. Nedochází zde ke zbytečným chybám extrakce pomocí LLM ?
  3. Uveďte, jak je řešena možná situace, kdy z jednoho letadla mluví dva piloti.
Points proposed by reviewer: 97

Grade proposed by reviewer: A

Responsibility: Mgr. et Mgr. Hana Odstrčilová