Master's Thesis

Audio inpainting using autoregressive modelling

Final Thesis 4.56 MB Appendix 12.88 MB

Author of thesis: Bc. Matěj Hrdlička

Acad. year: 2025/2026

Supervisor: prof. Mgr. Pavel Rajmic, Ph.D.

Reviewer: Ing. Ondřej Mokrý, Ph.D.

Abstract:

This master’s thesis deals with the reconstruction of missing sections of an audio signal. The primary focus of the thesis is on the implementation of the method proposed by Walter Etter. Furthermore, the thesis proposes a modification of the Etter’s method for one-sided gap filling in audio signals. The theoretical section of the thesis derives commonly used methods and algorithms in the field of audio inpainting and AR modeling, such as LPC or the Burg algorithm. It also provides a detailed description of the derivation of the Etter’s method and its one-sided modification. In the practical part of the thesis, Etter’s method is implemented in both described forms in the Matlab environment, and examples of inpainting are presented. To compare the quality of signal gap filling using Etter’s method with competing methods, an experiment was conducted on a test database of audio recordings. The results of the experiment are evaluated using objective metrics and a subjective listening test. In the conclusion, possible practical applications of both variants of the Etter’s method are briefly proposed, taking into account their advantages and shortcomings.

Keywords:

Audio, autoregressive modeling, Burg method, Etter’s method, inpainting, LPC

Date of defence

11.06.2026

Result of the defence

Defended (thesis was successfully defended)

znamkaBznamka

Grading

B

Process of defence

Student prezentoval výsledky své práce a komise byla seznámena s posudky. Otázky: Kde vidíte největší rozdíl ve výpočetní náročnosti dvou navržených módů metody? Můžete např. pomocí profileru Matlabu prezentovat hlavní důvody zdržení v nekauzálním módu a jak by toto šlo řešit? Navrhněte způsob, jak zvýšit kvalitu rekonstrukce Etterovy metody. Student obhájil diplomovou práci a odpověděl na otázky členů komise a oponenta.

Language of thesis

Czech

Faculty

Department

Study programme

Audio Engineering (MPC-AUD)

Specialization

Audio Production and Recording (AUDM-ZVUK)

Composition of Committee

prof. Mgr. Pavel Rajmic, Ph.D. (předseda)
doc. Ing. Petr Sysel, Ph.D. (místopředseda)
Ing. MgA. Jana Jelínková (člen)
Ing. Petr Honzík, Ph.D. (člen)
Ing. David Leitgeb (člen)

Supervisor’s report
prof. Mgr. Pavel Rajmic, Ph.D.

Bc. Matěj Hrdlička pracoval na svém tématu svědomitě, samostatně, se zájmem o věc, a pravidelně konzultoval svůj postup. Několikrát našel své řešení když narazil na komplikace. Sám navrhnul smysluplnou podobu prezentace výstupů. Všechny body zadání byly splněny; jedinou slabinu vidím v tom, že data subjektivního testu nebyla zpracována kompletně podle doporučení MUSHRA. Práce je vypracována na vysoké úrovni jak po jazykové, tak po prezentační a grafické stránce. Points proposed by supervisor: 95

Grade proposed by supervisor: A

Reviewer’s report
Ing. Ondřej Mokrý, Ph.D.

Práce implementuje rekonstrukční metodu staršího data založenou na autoregresním modelu, jejíž implementace a systematické otestování v současné literatuře chybí. Práce je spíše kratšího rozsahu, ale celkově na dobré úrovni. Její struktura je logická, hloubka teoretické části i provedení experimentů svědčí o pečlivosti autora.

Drobné výhrady mám k úplnosti splnění zadání: Není řešena výpočetní optimalizace samotné Etterovy metody. Na druhou stranu student nad rámec zadání odvodil a implementoval kauzální podobu metody, u níž správně demonstruje nižší výpočetní náročnost. Nedořešen je návrh obměny metody vedoucí k vyšší kvalitě – autor identifikuje, že horší výsledky jsou způsobeny nespojitostmi v doplněném signálu a širokospektrálním šumem, již však nenavrhuje, jak tyto problémy řešit.

Po obsahové stránce je práce kvalitní, vidím pouze mírné nedostatky:
– Oceňuji odvození odhadů AR koeficientů (část 1.2) a Etterovy metody (část 2.2), pro úplné pochopení ale postrádám vysvětlení některých kroků (např. zdůvodnění definice chyby (1.27), manipulace s komplexními čísly v (1.32)). Vyskytují se nepřesnosti či drobné chyby (nesprávné užívání pojmu „diferenciální rovnice“, chybějící nulový první řádek a nulový první sloupec v definici matice v (2.6)).
– Popis kódu (část 3.1) je spíše nadbytečný, zejména pak množství výpisů kódu.
– Zdůvodnění výpočetní efektivity funkce fillgaps není přesné; metoda je výpočetně snadná svým principem, nikoliv využitím funkce filter.
– U přiložených kódů postrádám komentář o závislostech a nastavení cest Matlabu potřebných pro spuštění.

Po stránce jazykové a grafické je práce na dobré úrovni, pouze zřídka se objevují překlepy, špatné formy odkazu či chybná forma přivlastňovacích přídavných jmen. Místy nejsou optimálně zvoleny způsoby vizualizace:
– Výpočetní časy (obr. 4.6 nebo 4.8) by možná byly lépe graficky porovnatelné v logaritmickém měřítku.
– Grafy v obr. 4.7 bych volil se stejným měřítkem obou os (tj. čtvercové), jelikož se jedná o stejnou metriku.
– Porovnání spekter na obr. 4.10–4.16 není vizuálně snadné, vhodnější by nejspíš bylo prezentovat rozdíly oproti vhodné referenci.

Ačkoliv se celkově jedná o dobrou práci, vzhledem k uvedeným nedostatkům stran splnění zadání navrhuji hodnocení 75 bodů. Topics for thesis defence:
  1. Kde vidíte největší rozdíl ve výpočetní náročnosti dvou navržených módů metody? Můžete např. pomocí profileru Matlabu prezentovat hlavní důvody zdržení v nekauzálním módu a jak by toto šlo řešit?
  2. Navrhněte způsob, jak zvýšit kvalitu rekonstrukce Etterovy metody.
Points proposed by reviewer: 75

Grade proposed by reviewer: C

Responsibility: Mgr. et Mgr. Hana Odstrčilová