Přístupnostní navigace
E-přihláška
Vyhledávání Vyhledat Zavřít
diplomová práce
Autor práce: Bc. Roman Křivánek
Ak. rok: 2025/2026
Vedoucí: doc. Ing. Tomáš Frýza, Ph.D.
Oponent: doc. Ing. Roman Jarina, PhD.
Tato diplomová práce představuje návrh, implementaci a vyhodnocení softwarové aplikace pro separaci zdrojů zvuku a přepis řeči. Aplikace integruje pokročilé metody separace, včetně nástrojů Spleeter, Demucs a Open-Unmix, s nástroji pro přepis řeči, jako jsou Whisper, Wav2Vec2 a Vosk. Modulární architektura backendu s grafickým uživatelským rozhraním umožňuje lokální spouštění, uživatelskou konfiguraci a podporu předtrénovaných modelů. Vyhodnocení pomocí datové sady MUSDB18-hq ukazuje, že Demucs dosahuje nejvyšší kvality separace, zatímco Spleeter nabízí vysokou výpočetní efektivitu. Práce poskytuje funkční a rozšiřitelnou platformu pro další vývoj, včetně specializovaného přepisu řeči a multiplatformního nasazení.
separace zdrojů zvuku, přepis řeči, hluboké učení, Python, MUSDB18-hq, Spleeter, Demucs, Open-Unmix, Whisper, Wav2Vec2, Vosk
Termín obhajoby
09.06.2026
Výsledek obhajoby
obhájeno (práce byla úspěšně obhájena)
Klasifikace
A
Průběh obhajoby
Student prezentuje výsledky a postupy řešení závěrečné práce. Následně odpovídá na dotazy vedoucího a oponenta práce a na dotazy členů zkušební komise.
Jazyk práce
angličtina
Fakulta
Fakulta elektrotechniky a komunikačních technologií
Ústav
Ústav radioelektroniky
Studijní program
Elektronika a komunikační technologie (MPC-EKT)
Složení komise
doc. Ing. Tomáš Frýza, Ph.D. (předseda) doc. Ing. Ladislav Polák, Ph.D. (místopředseda) Ing. Tomáš Urbanec, Ph.D. (člen) doc. Ing. Jan Mikulka, Ph.D. (člen) doc. Ing. Patrik Kamencay, Ph.D. (člen)
Posudek vedoucíhodoc. Ing. Tomáš Frýza, Ph.D.
Známka navržená vedoucím: A
Posudek oponentadoc. Ing. Roman Jarina, PhD.
Známka navržená oponentem: A
Odpovědnost: Mgr. et Mgr. Hana Odstrčilová