diplomová práce

Doplňování chybějících úseků audio signálu pomocí autoregresního modelování

Text práce 4.56 MB Příloha 12.88 MB

Autor práce: Bc. Matěj Hrdlička

Ak. rok: 2025/2026

Vedoucí: prof. Mgr. Pavel Rajmic, Ph.D.

Oponent: Ing. Ondřej Mokrý, Ph.D.

Abstrakt:

Diplomová práce se zabývá doplňováním chybějících úseků audio signálu. Primární zaměření práce je na implementaci metody navržené Walterem Etterem. Dále je v práci navržena úprava Etterovy metody pro jednostranné doplňování mezer ve zvukových signálech. V teoretické části práce jsou odvozeny v problematice audio inpaintingu a AR modelování běžně používané metody a algoritmy, kterými jsou například LPC, nebo Burgův algoritmus. Je zde také podrobně popsáno odvození Etterovy metody a její jednostranná úprava. V praktické části práce je pak Etterova metoda v obou popisovaných podobách implementována v prostředí Matlab a jsou zde zobrazeny ukázky doplňování. Pro porovnání kvality vyplňování mezer v signálech Etterovou metodou s konkurenčními metodami byl proveden experiment na testovací databázi zvukových nahrávek. Výsledky experimentu jsou hodnoceny objektivními metrikami a subjektivním poslechovým testem. V závěru práce jsou krátce navrhovány možnosti praktického využití obou variant Etterovy metody s ohledem na jejich přednosti a nedostatky.

Klíčová slova:

Audio, autoregresní modelování, Burgova metoda, Etterova metoda, inpainting, LPC

Termín obhajoby

11.06.2026

Výsledek obhajoby

obhájeno (práce byla úspěšně obhájena)

znamkaBznamka

Klasifikace

B

Průběh obhajoby

Student prezentoval výsledky své práce a komise byla seznámena s posudky. Otázky: Kde vidíte největší rozdíl ve výpočetní náročnosti dvou navržených módů metody? Můžete např. pomocí profileru Matlabu prezentovat hlavní důvody zdržení v nekauzálním módu a jak by toto šlo řešit? Navrhněte způsob, jak zvýšit kvalitu rekonstrukce Etterovy metody. Student obhájil diplomovou práci a odpověděl na otázky členů komise a oponenta.

Jazyk práce

čeština

Fakulta

Ústav

Studijní program

Audio inženýrství (MPC-AUD)

Specializace

Zvuková produkce a nahrávání (AUDM-ZVUK)

Složení komise

prof. Mgr. Pavel Rajmic, Ph.D. (předseda)
doc. Ing. Petr Sysel, Ph.D. (místopředseda)
Ing. MgA. Jana Jelínková (člen)
Ing. Petr Honzík, Ph.D. (člen)
Ing. David Leitgeb (člen)

Bc. Matěj Hrdlička pracoval na svém tématu svědomitě, samostatně, se zájmem o věc, a pravidelně konzultoval svůj postup. Několikrát našel své řešení když narazil na komplikace. Sám navrhnul smysluplnou podobu prezentace výstupů. Všechny body zadání byly splněny; jedinou slabinu vidím v tom, že data subjektivního testu nebyla zpracována kompletně podle doporučení MUSHRA. Práce je vypracována na vysoké úrovni jak po jazykové, tak po prezentační a grafické stránce. Výsledný počet bodů navržený vedoucím: 95

Známka navržená vedoucím: A

Práce implementuje rekonstrukční metodu staršího data založenou na autoregresním modelu, jejíž implementace a systematické otestování v současné literatuře chybí. Práce je spíše kratšího rozsahu, ale celkově na dobré úrovni. Její struktura je logická, hloubka teoretické části i provedení experimentů svědčí o pečlivosti autora.

Drobné výhrady mám k úplnosti splnění zadání: Není řešena výpočetní optimalizace samotné Etterovy metody. Na druhou stranu student nad rámec zadání odvodil a implementoval kauzální podobu metody, u níž správně demonstruje nižší výpočetní náročnost. Nedořešen je návrh obměny metody vedoucí k vyšší kvalitě – autor identifikuje, že horší výsledky jsou způsobeny nespojitostmi v doplněném signálu a širokospektrálním šumem, již však nenavrhuje, jak tyto problémy řešit.

Po obsahové stránce je práce kvalitní, vidím pouze mírné nedostatky:
– Oceňuji odvození odhadů AR koeficientů (část 1.2) a Etterovy metody (část 2.2), pro úplné pochopení ale postrádám vysvětlení některých kroků (např. zdůvodnění definice chyby (1.27), manipulace s komplexními čísly v (1.32)). Vyskytují se nepřesnosti či drobné chyby (nesprávné užívání pojmu „diferenciální rovnice“, chybějící nulový první řádek a nulový první sloupec v definici matice v (2.6)).
– Popis kódu (část 3.1) je spíše nadbytečný, zejména pak množství výpisů kódu.
– Zdůvodnění výpočetní efektivity funkce fillgaps není přesné; metoda je výpočetně snadná svým principem, nikoliv využitím funkce filter.
– U přiložených kódů postrádám komentář o závislostech a nastavení cest Matlabu potřebných pro spuštění.

Po stránce jazykové a grafické je práce na dobré úrovni, pouze zřídka se objevují překlepy, špatné formy odkazu či chybná forma přivlastňovacích přídavných jmen. Místy nejsou optimálně zvoleny způsoby vizualizace:
– Výpočetní časy (obr. 4.6 nebo 4.8) by možná byly lépe graficky porovnatelné v logaritmickém měřítku.
– Grafy v obr. 4.7 bych volil se stejným měřítkem obou os (tj. čtvercové), jelikož se jedná o stejnou metriku.
– Porovnání spekter na obr. 4.10–4.16 není vizuálně snadné, vhodnější by nejspíš bylo prezentovat rozdíly oproti vhodné referenci.

Ačkoliv se celkově jedná o dobrou práci, vzhledem k uvedeným nedostatkům stran splnění zadání navrhuji hodnocení 75 bodů. Otázky k obhajobě:
  1. Kde vidíte největší rozdíl ve výpočetní náročnosti dvou navržených módů metody? Můžete např. pomocí profileru Matlabu prezentovat hlavní důvody zdržení v nekauzálním módu a jak by toto šlo řešit?
  2. Navrhněte způsob, jak zvýšit kvalitu rekonstrukce Etterovy metody.
Výsledný počet bodů navržený oponentem: 75

Známka navržená oponentem: C

Odpovědnost: Mgr. et Mgr. Hana Odstrčilová