Bachelor's Thesis

Audio Dequantization via Filter Banks

Final Thesis 3.49 MB Appendix 13.4 MB

Author of thesis: Adrian Szabó

Acad. year: 2025/2026

Supervisor: Ing. Vojtěch Kovanda

Reviewer: prof. Mgr. Pavel Rajmic, Ph.D.

Abstract:

This thesis deals with audio dequantization from two differently quantized subband observations obtained using a wavelet filter bank. The input signal is decomposed by a single-level discrete wavelet transform into approximation and detail branches, which are decimated and then quantized using different bit depths. The aim of the thesis is to design and verify a reconstruction method that uses information from
both branches and reduces the distortion caused by quantization. The proposed approach is formulated as a convex optimization problem combining consistency conditions with the quantization intervals of both branches and a regularization term promoting sparsity of the signal in the time-frequency representation. This problem is solved using the Condat--Vũ algorithm, which allows efficient processing of several nonsmooth terms and projections onto feasible sets.

The method was implemented in MATLAB and tested on a database of monophonic recordings of musical instruments. The experiments were performed for different combinations of bit depths in the approximation and detail branches, for several types of Daubechies wavelet filters, and additionally for different depths of the wavelet decomposition. The reconstruction quality was evaluated using the objective metrics Signal-to-Distortion Ratio and Objective Difference Grade. The proposed method was compared with direct reconstruction using the inverse discrete wavelet transform and with a single-channel dequantization method based on the Chambolle--Pock algorithm. The results showed that the proposed method improves the reconstruction compared with direct reconstruction for most tested bit-depth combinations, especially according to the Signal-to-Distortion Ratio metric. With a suitable choice of bit depths in the approximation and detail branches, the method achieves better results than the single-channel reference dequantization at a comparable effective bit depth. Additional experiments showed that the db4 filter represents a compromise between reconstruction quality, simplicity, and processing stability. The results confirmed that subband signal processing combined with convex optimization is a usable approach for audio dequantization.

Keywords:

Audio signal, filter bank, bit depth, Condat–Vũ algorithm, dequantization, discrete wavelet transform, quantization, Objective Difference Grade, Signal-to-Distortion Ratio

Date of defence

18.06.2026

Result of the defence

Defended (thesis was successfully defended)

znamkaCznamka

Grading

C

Process of defence

Student prezentoval výsledky své práce a komise byla seznámena s posudky. Student obhájil bakalářskou práci s výhradami a odpověděl na otázky členů komise a oponenta. Otázky: Na straně 25 konstatujete, že délka okna u STFT ovlivňuje rozlišení na frekvenční a časové ose. Mohl byste vysvětlit, co přesně jste pojmem rozlišení myslel? Dovedete si představit navržený systém v praxi jako součást netradičního A/D převodníku? Z čeho by se takové zařízení skládalo? Jak byla vytvořena samotná databáze zvuků? Kde v práci byla popsána využitá databáze?

Language of thesis

Slovak

Faculty

Department

Study programme

Audio Engineering (BPC-AUD)

Specialization

Audio Production and Recording (AUDB-ZVUK)

Composition of Committee

Ing.MgA. Edgar Mojdl, Ph.D. (místopředseda)
doc. Ing. David Kubánek, Ph.D. (člen)
Ing. Vojtěch Kovanda (člen)
Ing. Jiří Přinosil, Ph.D. (člen)
prof. Ing. Zdeněk Smékal, CSc. (předseda)

Supervisor’s report
Ing. Vojtěch Kovanda

Práce se zabývá problematikou kvantizace a dekvantizace audio signálů s využitím vlnkové banky filtrů. Autor zpracoval základní teoretický přehled, implementoval navržené řešení v prostředí Matlab a provedl jeho experimentální ověření na vytvořené databázi audio signálů.
Zadání bylo z větší části splněno. Přestože byla navržená metoda implementována a vyhodnocena pomocí objektivních metrik, některé části textu působí poměrně povrchně a postrádají hlubší rozbor dosažených výsledků (například souvislost vstupních signálů s kvantizací v různých větvích vlnkové transformace). Za nejvýznamnější nedostatek považuji absenci experimentů s vyšší hloubkou vlnkové dekompozice, kde autor srovnává pouze kvantizované porovnání bez možnosti dekvantizace. Rozsah práce odpovídá náročnosti problematiky.
Student svoji práci pravidelně konzultoval, jeho postup byl ale relativně pomalý, což se podepsalo na absenci dílčích cílů práce.
Přes uvedené výhrady práce představuje algoritmus dekvantizace s výsledky, které potvrzující funkčnost navrženého přístupu. I vzhledem k náročnosti problematiky navrhuji práci k obhajobě, 72/C. Points proposed by supervisor: 72

Grade proposed by supervisor: C

Reviewer’s report
prof. Mgr. Pavel Rajmic, Ph.D.

Bakalářská práce pana Adriana Szabó je zaměřena na originální myšlenku vícevětvového kvantizeru, respektive na proces rekonstrukce signálu z takových kvantovaných pozorování.

Struktura práce je nečekaná, autor zvolil dělení na pouze tři kapitoly. Přehlednosti by podle mého názoru prospělo podrobnější členění. Z metodického hlediska působí matoucím dojmem, když se v kapitole návrhu mluví o konkrétních matlabovských funkcích. Základům konvexní optimalizace, operátorům, framům, bázím, ortogonalitě či krátkodobé Fourierově tranformaci se autor nevěnuje, přestože je v pozdějších částech díla používá jako standardní stavební prvky svého algoritmu.

Pasáže textového charakteru vyznívají obstojně a oceňuji, že autor ve většině případů staví na korektních argumentech. Jakmile však práce přejde k matematice a zpracování signálů, je patrné, že autorovo pochopení problematiky zůstalo spíše na povrchu (byť je nutné respektovat, že zvolené téma není jednoduché). U některých klíčových rozhodnutí mi chybí hlubší diskuze; volba parametrů či postupů tak občas působí ad hoc.

Grafickou stránku práce považuji za průměrnou. Grafy jsou vhodně zpracovány, nicméně výkladu by prospělo další ilustrace přidat (např. u vlnkové transformace s hloubkou vyšší než J=1). V práci se vyskytují velká prázdná místa. Typografie je vyloženě na nízké úrovni.

Konkrétnější připomínky:
* Rekonstrukční úloha je sice formulována pro libovolnou hloubku dekompozice, avšak algoritmické ověření proběhlo pouze pro hloubku J=1.
* Zcela chybí matematická definice množin Gama, přičemž ty jsou pro celou práci klíčové.
* Použitý toolbox LTFAT není citovaný.
* Moreau identita se objevuje pozdě, až na str. 37.

Celkově lze konstatovat, že student splnil zadání (až na zahrnutí vyšších hloubek dekompozice). Vhled autora do problematiky je spíše povrchní, nicméně výsledky jsou prezentovány a diskutovány logicky a pro nově navrženou metodu vycházejí pozitivně. Topics for thesis defence:
  1. Na straně 25 konstatujete, že délka okna u STFT ovlivňuje rozlišení na frekvenční a časové ose. Mohl byste vysvětlit, co přesně jste pojmem rozlišení myslel?
  2. Dovedete si představit navržený systém v praxi jako součást netradičního A/D převodníku? Z čeho by se takové zařízení skládalo?
Points proposed by reviewer: 70

Grade proposed by reviewer: C

Responsibility: Mgr. et Mgr. Hana Odstrčilová