Přístupnostní navigace
E-přihláška
Vyhledávání Vyhledat Zavřít
diplomová práce
Autor práce: Bc. Kristína Niková
Ak. rok: 2025/2026
Vedoucí: Ing. Michal Švento
Oponent: Ing. David Leitgeb
Diplomová práca sa zaoberá problematikou intuitívneho ovládania wavetable syntézy prostredníctvom sémantických atribútov, ktoré nahrádzajú tradičné technické parametre zrozumiteľnejšími psychoakustickými pojmami. Hlavným cieľom práce je rozšírenie existujúceho modelu založeného na podmienenom variačnom autoenkodéri o nové sémantické značky, čím sa rozširuje možnosť ovládania syntetizátora. Teoretická časť práce analyzuje princípy wavetable syntézy, architektúry hlbokého učenia a ich schopnosť učiť sa latentné reprezentácie zvukových signálov. V praktickej časti bol navrhnutý a realizovaný proces tvorby novej dátovej sady, ktorá integruje špecifické psychoakustické príznaky priradené k jednotlivým vlnovým priebehom. Model bol následne natrénovaný na týchto dátach tak, aby dokázal generovať vlnové tabuľky zodpovedajúce zadaným atribútom. Funkčnosť a efektivita navrhnutého systému boli overené subjektívnym posluchovým testom, ktorého výsledky potvrdzujú koreláciu medzi zvolenými sémantickými atribútmi a subjektívnym vnímaním generovaného zvuku. Práca prináša príspevok v oblasti inteligentných rozhraní pre hudobnú produkciu a zvukový dizajn, pričom demonštruje potenciál neurónových sietí pri premosťovaní technickej a umeleckej stránky tvorby zvuku.
wavetable syntéza, podmienený variačný autoenkodér, sémantické značky, psychoakustické príznaky, hlboké učenie, spracovanie zvukových signálov, zvukový dizajn
Termín obhajoby
11.06.2026
Výsledek obhajoby
obhájeno (práce byla úspěšně obhájena)
Klasifikace
A
Průběh obhajoby
Studentka prezentovala výsledky své práce a komise byla seznámena s posudky. Otázky oponenta a komise: Syntezátor z původního zdroje je dostupný také jako zásuvný modul pracující v reálném čase. Jak náročné by bylo převést současnou verzi navrženého modelu do této podoby a jaká omezení by případně bylo nutné řešit? V teoretickém úvodu práce je zmíněno, že délka vlnových tabulek je často volena jako mocnina dvou z důvodu efektivity operace modulo. Použitý dataset však obsahuje vlnové tabulky o délce 600 vzorků. Může mít tato volba znatelný dopad na výpočetní náročnost nebo výslednou kvalitu generovaného signálu? Studentka obhájila diplomovou práci a odpověděla na otázky členů komise a oponenta.
Jazyk práce
slovenština
Fakulta
Fakulta elektrotechniky a komunikačních technologií
Ústav
Ústav telekomunikací
Studijní program
Audio inženýrství (MPC-AUD)
Specializace
Zvuková produkce a nahrávání (AUDM-ZVUK)
Složení komise
PhDr. Aleš Dvořák (člen) prof. Ing. Jiří Mekyska, Ph.D. (předseda) doc. Ing. MgA. Mgr. Dan Dlouhý, Ph.D. (místopředseda) Ing. Miroslav Balík, Ph.D. (člen) Ing. Michal Švento (člen)
Posudek vedoucíhoIng. Michal Švento
Známka navržená vedoucím: A
Posudek oponentaIng. David Leitgeb
Známka navržená oponentem: A
Odpovědnost: Mgr. et Mgr. Hana Odstrčilová