Přístupnostní navigace
E-application
Search Search Close
Bachelor's Thesis
Author of thesis: Boris Hatala
Acad. year: 2025/2026
Supervisor: Ing. Igor Szőke, Ph.D.
Reviewer: prof. Ing. Adam Herout, Ph.D.
This thesis presents the design and implementation of a real-time automatic speech transcription editor. The solution is a client-side web application that uses an external service for automatic speech recognition. It supports microphone recording or audio file upload, with real-time automatic transcription and simultaneous editing. The application also provides speaker and bookmark management, and bidirectionally synchronizes the transcript with the audio recording at the word level. The application was validated through usability testing, resulting in a web application that requires no server infrastructure and enables editing the transcript directly as it is being inserted.
speech transcription, automatic speech recognition, web application, editor, UI, UX, usability testing
Date of defence
17.06.2026
Result of the defence
Defended (thesis was successfully defended)
Grading
B
Process of defence
Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm B.
Topics for thesis defence
Language of thesis
Slovak
Faculty
Fakulta informačních technologií
Department
Department of Computer Graphics and Multimedia
Study programme
Information Technology (BIT)
Composition of Committee
doc. Ing. František Zbořil, CSc. (předseda) doc. Ing. Michal Španěl, Ph.D. (místopředseda) Ing. Jan Pluskal, Ph.D. (člen) Ing. Aleš Smrčka, Ph.D. (člen) Ing. Josef Strnadel, Ph.D. (člen)
Supervisor’s reportIng. Igor Szőke, Ph.D.
Celkově hodnotím aktivitu studenta velmi dobře. Student k řešení přistupoval zodpovědně, samostatně a pracoval průběžně.
Jedná se o průměrně obtížné zadání s dostatkem prostoru pro možné rozšíření. Téma volně navazuje na výzkumné projekty skupiny Speech@FIT. Student se návrhu a implementace podle mého názoru zhostil dobře. Vytvořený editor by mohl být použitelný pro projekty a demonstrátory v rámci výzkumné skupiny.
Student literaturu získával samostatně a aktivně.
Student konzultoval práci po celou dobu akademického roku pravidelně. V zimním semestru cca 1x za 3 týdny, v letním pak každých 14 dní. Byl vždy připraven a ukázal pokrok. Práci řešil aktivně a samostatně. Reflektoval zpětnou vazbu od vedoucího.
Aktivita při dokončování nebyla pod stresem. Text byl dodán ke kontrole včas. Vedoucím byly doporučeny dílčí úpravy struktury a jazyková kontrola.
Nejsou.
Grade proposed by supervisor: B
Reviewer’s reportprof. Ing. Adam Herout, Ph.D.
Vytvořená aplikace působí velice podařeným a použitelným dojmem. Technická zpráva je velice účelně a přehledně sepsaná, jde k věci a neobsahuje zbytečnosti.
Evaluation level: průměrně obtížné zadání
Zadání je průměrně obtížné. Řešitel se seznámil s množstvím moderních technologií a knihoven a s jejich využitím navrhl a implementoval jednoduché a velice dobře použitelné řešení. Posuzovatel oceňuje jednoduchost a intuitivnost vytvořeného nástroje, který je zároveň velice mocný a prakticky velice dobře použitelný.
Text technické zprávy je velice užitečný a věnuje se skutečně podstatným informacím. Posuzovatel oceňuje podrobnou a informačně bohatou část o uživatelském testování a vylepšování rozhraní. Velice kvalitní a přínosný je i přehled existujících řešení a využitelných/využitých technologií. Kapitola s implementací možná mohla využít schéma nebo jiný obrázek pro lepší komunikaci architektury navrženého řešení.
Technická zpráva má velice dobrou formální úroveň. Mírně protivné jsou velice časté krátké odstavce (dva řádky) – strukturování sdělení do větších celků (odstavců) by čitelnosti textu prospělo. Drobným neduhem je také poměrně častý výskyt stránek s bílým vertikálním místem na svém konci.
Vytvořené uživatelské rozhraní je mimořádně kvalitní a je patrné, že prošlo důkladným testováním a iterativním vylepšováním. Dodaný výsledek působí profesionálním a rutinně použitelným dojmem.
Výsledkem je uživatelské rozhraní, které je mimořádně kvalitní a použitelné a pravděpodobně může najít praktické uplatnění.
Evaluation level: zadání splněno
Evaluation level: je v obvyklém rozmezí
Seznam citované literatury obsahuje téměř výhradně zdroje o návrhu UI/UX. Technická zpráva mohla podat i přehled základních informací o podstatě metod rozpoznávání řeči a identifikace řečníka. Na druhou stranu tuto funkčnost řešitel využíval jako hotové knihovny (které transparentně odkazuje prostřednictvím poznámek pod čarou) a posuzovatel oceňuje, že text není zaplevelený samoúčelným (a strojově generovaným) textem, který se samotným řešením nemá co společného.
Grade proposed by reviewer: B
Responsibility: Mgr. et Mgr. Hana Odstrčilová