Master's Thesis

Signal processing by hidden Markov models

Final Thesis 981.2 kB

Author of thesis: Ing. Jindřich Hampl

Acad. year: 2009/2010

Supervisor: prof. Ing. Milan Sigmund, CSc.

Reviewer: Ing. Václav Pfeifer, Ph.D.

Abstract:

One of the most common methods for isolated words recognition is based on Hidden Markov
models. Speech signal can be considered as a sequence of successive parts of the signal with specific statistical parameters. Hidden Markov model corresponds to the statistical model with the final number of states, which may be useful for signals such as speech. HTK module is a software tools, which is mostly used to work with hidden Markov models.

Keywords:

Hidden Markov Models, processing signals, speech recognition, HTK.

Date of defence

09.06.2010

Result of the defence

Defended (thesis was successfully defended)

znamkaDznamka

Grading

D

Process of defence

Student prezentuje výsledky a postupy řešení své diplomové práce. Následně odpovídá na dotazy vedoucího a oponenta práce a na dotazy členů zkušební komise.

Language of thesis

Czech

Faculty

Department

Study programme

Electrical, Electronic, Communication and Control Technology (EEKR-M)

Field of study

Electronics and Communication (M-EST)

Composition of Committee

prof. Dr. Ing. Zbyněk Raida (předseda)
doc. Ing. Jiří Šebesta, Ph.D. (místopředseda)
Ing. Josef Halámek, CSc. (člen)
doc. Ing. Jana Kolářová, Ph.D. (člen)
prof. Ing. Roman Maršálek, Ph.D. (člen)
doc. Ing. Jiří Petržela, Ph.D. (člen)

Supervisor’s report
prof. Ing. Milan Sigmund, CSc.

Zadání práce bylo převážně splněno. Úvodní přehledová studie o softwarových nástrojích mohla být obsáhlejší. Větší pozornost mohla být věnována také vytváření databáze vhodných akustických signálů. Student docházel po celou dobu na pravidelné konzultace. Velmi zdařile je zpracována část pojednávající o způsobu stažení modulu HTK. Škoda, že podobným názorným stylem nejsou prezentovány vytvořené ukázkové příklady. Některé části práce jsou zbytečně přebírány z cizích zdrojů, ovšem všude jsou uváděny odkazy na původní prameny. Tématika Markovových modelů a práce s modulem HTK byla pro studenta nová a musel se s ní postupně seznámit. Po formální stránce vykazuje práce řadu drobných překlepů a některé stylistické chyby.
Evaluation criteria Grade Points Max. points
Splnění zadání B 41 50
Aktivita během řešení a zpracování práce (práce s literaturou, využívání konzultací, atd.) C 15 20
Formální zpracování práce D 12 20
Využití literatury C 7 10
Points proposed by supervisor: 75

Grade proposed by supervisor: C

Reviewer’s report
Ing. Václav Pfeifer, Ph.D.

Student se ve své diplomové práci zabýval aplikačními možnostmi HTK knihovny a jejím následným využitím při rozpoznávání řečových signálů. Student splnil většinu požadavků zadání a jedinou výhradou je pouze vytvoření databáze vzorků, kterou student převzal. Odbornou úroveň práce snižují časté neodborné a nespisovné výrazy ("syrový řečový průběh", "rozumný ton" apod.), spolu s nevhodnou volbou anglicko-českého překladu některých výrazů (např. výraz re-estimace je přeložen jako přetrénování - namísto zde většinou užívaného překladu "znovu odhadu"). Další připomínkou je někdy až nedostatečné vysvětlení klíčových pojmů (např. význam gramatiky nemusí být z výkladu pro čtenáře zřejmý). Vzhledem ke komplexnosti problému rozpoznávání řeči, je obtížné interpretovat výsledky založené na velmi omezeném vstupním řečovém korpusu. I přes to se studentovi podařilo dobře interpretovat své výsledky spolu s návrhem na další modifikace pro zvýšení přesnosti celého systému. Formální úroveň práce snižují časté překlepy a nekvalitní obrázky, ale jinak je práce po formální stránce na dobré úrovni. Práci doporučuji k obhajobě s hodnocením D/65B.
Evaluation criteria Grade Points Max. points
Splnění požadavků zadání B 17 20
Odborná úroveň práce E 25 50
Interpretace výsledků a jejich diskuse C 15 20
Formální zpracování práce B 8 10
Topics for thesis defence:
  1. 1. Upřesněte význam gramatiky v HTK modulu.
  2. 2. Vysvětlete význam Bayesovy věty při rozpoznávání řečových signálů.
Points proposed by reviewer: 65

Grade proposed by reviewer: D

Responsibility: Mgr. et Mgr. Hana Odstrčilová