Bachelor's Thesis

Editor for real time speech transcription

Final Thesis 6.34 MB

Author of thesis: Boris Hatala

Acad. year: 2025/2026

Supervisor: Ing. Igor Szőke, Ph.D.

Reviewer: prof. Ing. Adam Herout, Ph.D.

Abstract:

This thesis presents the design and implementation of a real-time automatic speech transcription editor.
The solution is a client-side web application that uses an external service for automatic speech recognition. It supports microphone recording or audio file upload, with real-time automatic transcription and simultaneous editing. The application also provides speaker and bookmark management, and bidirectionally synchronizes the transcript with the audio recording at the word level.
The application was validated through usability testing, resulting in a web application that requires  no server infrastructure and enables editing the transcript directly as it is being inserted.

Keywords:

speech transcription, automatic speech recognition, web application, editor, UI, UX, usability testing

Date of defence

17.06.2026

Result of the defence

Defended (thesis was successfully defended)

znamkaBznamka

Grading

B

Process of defence

Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm B.

Topics for thesis defence

  1. Jakým způsobem řešíte perzistentní uložení dat?
  2. Jakým způsobem pracujete s anotacemi? Musí se zadávat ručně?

Language of thesis

Slovak

Faculty

Department

Study programme

Information Technology (BIT)

Composition of Committee

doc. Ing. František Zbořil, CSc. (předseda)
doc. Ing. Michal Španěl, Ph.D. (místopředseda)
Ing. Jan Pluskal, Ph.D. (člen)
Ing. Aleš Smrčka, Ph.D. (člen)
Ing. Josef Strnadel, Ph.D. (člen)

Supervisor’s report
Ing. Igor Szőke, Ph.D.

Celkově hodnotím aktivitu studenta velmi dobře. Student k řešení přistupoval zodpovědně, samostatně a pracoval průběžně.

Evaluation criteria Verbal classification
Informace k zadání

Jedná se o průměrně obtížné zadání s dostatkem prostoru pro možné rozšíření. Téma volně navazuje na výzkumné projekty skupiny Speech@FIT. Student se návrhu a implementace podle mého názoru zhostil dobře. Vytvořený editor by mohl být použitelný pro projekty a demonstrátory v rámci výzkumné skupiny.

Práce s literaturou

Student literaturu získával samostatně a aktivně.

Aktivita během řešení, konzultace, komunikace

Student konzultoval práci po celou dobu akademického roku pravidelně. V zimním semestru cca 1x za 3 týdny, v letním pak každých 14 dní. Byl vždy připraven a ukázal pokrok. Práci řešil aktivně a samostatně. Reflektoval zpětnou vazbu od vedoucího.

Aktivita při dokončování

Aktivita při dokončování nebyla pod stresem. Text byl dodán ke kontrole včas. Vedoucím byly doporučeny dílčí úpravy struktury a jazyková kontrola.

Publikační činnost, ocenění

Nejsou.

Points proposed by supervisor: 83

Grade proposed by supervisor: B

Reviewer’s report
prof. Ing. Adam Herout, Ph.D.

Vytvořená aplikace působí velice podařeným a použitelným dojmem. Technická zpráva je velice účelně a přehledně sepsaná, jde k věci a neobsahuje zbytečnosti.

Evaluation criteria Verbal classification Points
Náročnost zadání

Evaluation level: průměrně obtížné zadání

Zadání je průměrně obtížné. Řešitel se seznámil s množstvím moderních technologií a knihoven a s jejich využitím navrhl a implementoval jednoduché a velice dobře použitelné řešení. Posuzovatel oceňuje jednoduchost a intuitivnost vytvořeného nástroje, který je zároveň velice mocný a prakticky velice dobře použitelný.

Prezentační úroveň technické zprávy

Text technické zprávy je velice užitečný a věnuje se skutečně podstatným informacím. Posuzovatel oceňuje podrobnou a informačně bohatou část o uživatelském testování a vylepšování rozhraní. Velice kvalitní a přínosný je i přehled existujících řešení a využitelných/využitých technologií. Kapitola s implementací možná mohla využít schéma nebo jiný obrázek pro lepší komunikaci architektury navrženého řešení.

90
Formální úprava technické zprávy

Technická zpráva má velice dobrou formální úroveň. Mírně protivné jsou velice časté krátké odstavce (dva řádky) – strukturování sdělení do větších celků (odstavců) by čitelnosti textu prospělo. Drobným neduhem je také poměrně častý výskyt stránek s bílým vertikálním místem na svém konci.

85
Realizační výstup

Vytvořené uživatelské rozhraní je mimořádně kvalitní a je patrné, že prošlo důkladným testováním a iterativním vylepšováním. Dodaný výsledek působí profesionálním a rutinně použitelným dojmem.

90
Využitelnost výsledků

Výsledkem je uživatelské rozhraní, které je mimořádně kvalitní a použitelné a pravděpodobně může najít praktické uplatnění.

Rozsah splnění požadavků zadání

Evaluation level: zadání splněno

Rozsah technické zprávy

Evaluation level: je v obvyklém rozmezí

Práce s literaturou

Seznam citované literatury obsahuje téměř výhradně zdroje o návrhu UI/UX. Technická zpráva mohla podat i přehled základních informací o podstatě metod rozpoznávání řeči a identifikace řečníka. Na druhou stranu tuto funkčnost řešitel využíval jako hotové knihovny (které transparentně odkazuje prostřednictvím poznámek pod čarou) a posuzovatel oceňuje, že text není zaplevelený samoúčelným (a strojově generovaným) textem, který se samotným řešením nemá co společného.

85
Points proposed by reviewer: 89

Grade proposed by reviewer: B

Responsibility: Mgr. et Mgr. Hana Odstrčilová