Detail předmětu

Klasifikace a rozpoznávání

FIT-KRDAk. rok: 2010/2011

Odhady parametrů pomocí metody maximální věrohodnosti a algoritmu Expectiation-Maximization, formulace objektivní funkce diskriminativního trénování, kritérium Maximum Mutual information (MMI), adaptace GMM modelů, transformace parametrů pro rozpoznávání, modelování prostoru parametrů pomocí diskriminativních podprostorů, faktorová analýza, kernelové techniky, kalibrace a fúze klasifikátorů, aplikace v rozponávání řeči, videa a textu.

Jazyk výuky

čeština

Počet kreditů

0

Výsledky učení předmětu

Studenti se v rámci předmětu seznámí s pokročilými technikami klasifikace a rozpoznávání a naučí se aplikovat  metody v této oblasti na vybrané problémy rozpoznávání mluvené řeči, počítačové grafiky a zpracování přirozeného jazyka.

Studenti si vyzkouší obecné přístupy k řešení problémů klasifikace a rozpoznávání.

Prerekvizity

Základní znalost statistiky, teorie pravděpodobnosti, matematické analýzy a algebry.

Způsob a kritéria hodnocení

Hodnocení studia je založeno na bodovacím systému. Pro úspěšné absolvování předmětu je nutno dosáhnout 50 bodů.

Osnovy výuky

  1. Odhad parametrů Gaussova rozdělení pravděpodobnosti pomocí Maximum Likelihood (ML)
  2. Odhad parametrů směsi Gaussových rozdělení pravděpodobnosti (Gaussian Mixture Model - GMM) pomocí Expectiation-Maximization (EM)
  3. Diskriminativní trénování, úvod, formulace objektivní funkce
  4. Diskriminativní trénování s kritériem Maximum Mutual information (MMI)
  5. Adaptace GMM modelů - Maximum A-Posteriori (MAP), Maximum Likelihood Linear Regression (MLLR)
  6. Transformace parametrů pro rozpoznávání - základy, Principal component analysis (PCA)
  7. Diskriminativní transformace parametrů - Linear Discriminant Analysis (LDA) a Heteroscedastic Linear Discriminant Analysis  (HLDA)
  8. Modelování prostoru parametrů pomocí diskriminativních podprostorů - faktorová analýza
  9. Kernelové techniky, SVM
  10. Kalibrace a fúze klasifikátorů
  11. Aplikace v rozponávání řeči, videa a textu
  12. Presentace frekventantů kursu I
  13. Presentace frekventantů kursu II

Učební cíle

Porozumět pokročilým technikám a postupům v oblasti klasifikace a rozpoznávání a naučit se aplikovat algoritmy a metody v této oblasti na problémy  rozpoznávání mluvené řeči, počítačové grafiky a zpracování přirozeného jazyka. Seznámit se způsoby vyhodnocování úspěšnosti metod. Pochopit specifika diskriminativního trénování a vytváření hybridních systémů.

Vymezení kontrolované výuky a způsob jejího provádění a formy nahrazování zameškané výuky

Kontrolovaná výuka zahrnuje individuální projekt.

Základní literatura

  • Bishop, C. M.: Pattern Recognition, Springer Science + Business Media, LLC, 2006, ISBN 0-387-31073-8.
  • Fukunaga, K. Statistical pattern recognition, Morgan Kaufmann, 1990, ISBN 0-122-69851-7.

Doporučená literatura

  • Mařík,V., Štěpánková,O., Lažanský, J. a kol.: Umělá inteligence (1-4), ACADEMIA Praha, 1998-2003, ISBN 80-200-1044-0.

Zařazení předmětu ve studijních plánech

  • Program VTI-DR-4 doktorský

    obor DVI4 , libovolný ročník, letní semestr, volitelný

  • Program VTI-DR-4 doktorský

    obor DVI4 , libovolný ročník, letní semestr, volitelný

Typ (způsob) výuky

 

Přednáška

39 hod., nepovinná

Vyučující / Lektor

Osnova

  1. Odhad parametrů Gaussova rozdělení pravděpodobnosti pomocí Maximum Likelihood (ML)
  2. Odhad parametrů směsi Gaussových rozdělení pravděpodobnosti (Gaussian Mixture Model - GMM) pomocí Expectiation-Maximization (EM)
  3. Diskriminativní trénování, úvod, formulace objektivní funkce
  4. Diskriminativní trénování s kritériem Maximum Mutual information (MMI)
  5. Adaptace GMM modelů - Maximum A-Posteriori (MAP), Maximum Likelihood Linear Regression (MLLR)
  6. Transformace parametrů pro rozpoznávání - základy, Principal component analysis (PCA)
  7. Diskriminativní transformace parametrů - Linear Discriminant Analysis (LDA) a Heteroscedastic Linear Discriminant Analysis  (HLDA)
  8. Modelování prostoru parametrů pomocí diskriminativních podprostorů - faktorová analýza
  9. Kernelové techniky, SVM
  10. Kalibrace a fúze klasifikátorů
  11. Aplikace v rozponávání řeči, videa a textu
  12. Presentace frekventantů kursu I
  13. Presentace frekventantů kursu II