diplomová práce

Zpracování signálů pomocí skrytých Markovových modelů

Text práce 981.2 kB

Autor práce: Ing. Jindřich Hampl

Ak. rok: 2009/2010

Vedoucí: prof. Ing. Milan Sigmund, CSc.

Oponent: Ing. Václav Pfeifer, Ph.D.

Abstrakt:

Jedna z nejpoužívanějších metod pro rozpoznávání řeči je založena na skrytých Markovových modelech. Jedna z nejpoužívanějších metod pro rozpoznávání řeči je založena na Markovových modelech. Řečový signál můžeme považovat za sled po sobě jdoucích částí signálu s specifickými statistickými parametry. Skrytý Markovův model odpovídá statistickému modelu s konečným počtem stavů, který může být užitečný pro signály, jako je například řeč. Modul HTK je soubor programů, který je nejvíce používán pro práci se skrytými Markovovými modely.

Klíčová slova:

Skryté Markovovy modely, zpracování signálu, rozpoznávání spojité řeči, HTK.

Termín obhajoby

09.06.2010

Výsledek obhajoby

obhájeno (práce byla úspěšně obhájena)

znamkaDznamka

Klasifikace

D

Průběh obhajoby

Student prezentuje výsledky a postupy řešení své diplomové práce. Následně odpovídá na dotazy vedoucího a oponenta práce a na dotazy členů zkušební komise.

Jazyk práce

čeština

Fakulta

Ústav

Studijní program

Elektrotechnika, elektronika, komunikační a řídicí technika (EEKR-M)

Studijní obor

Elektronika a sdělovací technika (M-EST)

Složení komise

prof. Dr. Ing. Zbyněk Raida (předseda)
doc. Ing. Jiří Šebesta, Ph.D. (místopředseda)
Ing. Josef Halámek, CSc. (člen)
doc. Ing. Jana Kolářová, Ph.D. (člen)
prof. Ing. Roman Maršálek, Ph.D. (člen)
doc. Ing. Jiří Petržela, Ph.D. (člen)

Zadání práce bylo převážně splněno. Úvodní přehledová studie o softwarových nástrojích mohla být obsáhlejší. Větší pozornost mohla být věnována také vytváření databáze vhodných akustických signálů. Student docházel po celou dobu na pravidelné konzultace. Velmi zdařile je zpracována část pojednávající o způsobu stažení modulu HTK. Škoda, že podobným názorným stylem nejsou prezentovány vytvořené ukázkové příklady. Některé části práce jsou zbytečně přebírány z cizích zdrojů, ovšem všude jsou uváděny odkazy na původní prameny. Tématika Markovových modelů a práce s modulem HTK byla pro studenta nová a musel se s ní postupně seznámit. Po formální stránce vykazuje práce řadu drobných překlepů a některé stylistické chyby.
Kritérium hodnocení Známka Body Max. body
Splnění zadání B 41 50
Aktivita během řešení a zpracování práce (práce s literaturou, využívání konzultací, atd.) C 15 20
Formální zpracování práce D 12 20
Využití literatury C 7 10
Výsledný počet bodů navržený vedoucím: 75

Známka navržená vedoucím: C

Student se ve své diplomové práci zabýval aplikačními možnostmi HTK knihovny a jejím následným využitím při rozpoznávání řečových signálů. Student splnil většinu požadavků zadání a jedinou výhradou je pouze vytvoření databáze vzorků, kterou student převzal. Odbornou úroveň práce snižují časté neodborné a nespisovné výrazy ("syrový řečový průběh", "rozumný ton" apod.), spolu s nevhodnou volbou anglicko-českého překladu některých výrazů (např. výraz re-estimace je přeložen jako přetrénování - namísto zde většinou užívaného překladu "znovu odhadu"). Další připomínkou je někdy až nedostatečné vysvětlení klíčových pojmů (např. význam gramatiky nemusí být z výkladu pro čtenáře zřejmý). Vzhledem ke komplexnosti problému rozpoznávání řeči, je obtížné interpretovat výsledky založené na velmi omezeném vstupním řečovém korpusu. I přes to se studentovi podařilo dobře interpretovat své výsledky spolu s návrhem na další modifikace pro zvýšení přesnosti celého systému. Formální úroveň práce snižují časté překlepy a nekvalitní obrázky, ale jinak je práce po formální stránce na dobré úrovni. Práci doporučuji k obhajobě s hodnocením D/65B.
Kritérium hodnocení Známka Body Max. body
Splnění požadavků zadání B 17 20
Odborná úroveň práce E 25 50
Interpretace výsledků a jejich diskuse C 15 20
Formální zpracování práce B 8 10
Otázky k obhajobě:
  1. 1. Upřesněte význam gramatiky v HTK modulu.
  2. 2. Vysvětlete význam Bayesovy věty při rozpoznávání řečových signálů.
Výsledný počet bodů navržený oponentem: 65

Známka navržená oponentem: D

Odpovědnost: Mgr. et Mgr. Hana Odstrčilová