Detail předmětu

Moderní metody zpracování řeči

FIT-MZDAk. rok: 2010/2011

Jazyk výuky

čeština

Počet kreditů

0

Základní literatura

  • Psutka, J.: Komunikace s s počítačem mluvenou řečí. Academia, Praha, 1995
  • Gold, B., Morgan, N.: Speech and audio signal processing, John Wiley & Sons, 2000
  • Texty z http://www.fit.vutbr.cz/~cernocky/speech/

Doporučená literatura

  • Moore, B.C.J., : An introduction to the psychology of hearing, Academic Press, 1989
  • Jelinek, F.: Statistical Methods for Speech Recognition, MIT Press, 1998
  • Fukunaga, K.: Introduction to Statistical Pattern Recognition, Academic Press, 1990
  • Vapnik, V. N.: Statistical Learning Theory, Wiley-Interscience, 1998
  • Dutoit, T.: An Introduction to Text-To-Speech Synthesis, Kluwer Academic Publishers, 1997

Zařazení předmětu ve studijních plánech

  • Program VTI-DR-4 doktorský

    obor DVI4 , libovolný ročník, zimní semestr, volitelný

  • Program VTI-DR-4 doktorský

    obor DVI4 , libovolný ročník, zimní semestr, volitelný

Typ (způsob) výuky

 

Přednáška

39 hod., nepovinná

Vyučující / Lektor

Osnova

  1. Základní pojmy: signálové vektory a matice parametrů, statistiky.
  2. Statistické modelování parametrů, modelování času stavovými sekvencemi.
  3. Skryté Markovovy modely (HMM), struktura, trénování.
  4. Rozpoznávání řeči pomocí HMM: Viterbiho algoritmus, předávání žetonů (token passing).
  5. ýslovnostní slovníky a jazykové modely.
  6. Tvorba řeči a odvozené parametry: LPC, log area ratios (LAR), line spectral pairs (LSP).
  7. Slyšení řeči a odvozené parametry - Mel-frekvenční cepstrální koeficienty, Perceptual linear prediction (PLP).
  8. Časové vlastnosti sluchu - RASTA filtrování.
  9. Trénování výpočtu příznaků na datech: lineární diskriminační analýza.
  10. Řečové databáze: standardy, obsah, mluvčí, anotace.
  11. Vokodéry a modelování jejich buzení, multipulsní a statistické modelování (GSM kódování).
  12. CELP kódování: dlouhodobý prediktor, kódové knihy. Kódování s velmi malým bitovým tokem.
  13. Současné metody identifikace a ověřování mluvčího.