Detail projektu

Rozpoznávání klíčových slov a akcí v audiovizuálních datech

Období řešení: 26.10.2004 — 26.10.2006

O projektu

Cílem projektu je automatické zpracování pořizovaných meetingových dat, umožnující uživateli přímé vyhledávání požadovaných událostí v audio/video záznamech podle zvolených kritérií. Aplikačně budou  algoritmy také zaměřeny na automatické rozpoznávání řeči s velkým slovníkem. Tvorba navrhovaného robustního a uživatelem použitelného systému závisí na trénování a testování jednotlivých dílčích algoritmů, které jsou však v případě meetingových dat a velkých řečových databází vysoce náročné na  výpočetní kapacitu. Projektem navrhovaný cluster je schopen podstatně rozšířit výpočetní kapacitu na naši fakultě a tedy umožnit využití nových metod a postupů v oblasti výzkumu zpracování řečových signálů. Předpokládá se využití clusteru i v jiných oblastech výzkumu v rámci Fakulty informačních technologií.

Popis anglicky
The goal of the project is automatic processing of recorded meeting data, which would allow to user the direct browsing of required events in acoustic/visual databases according to selected criteria. Further, proposed algorithms will be also modified to be used in large vocabulary continuous speech recognition tasks. Derivation of robust, efficient and by any user utilized system depends on training and testing of particular algorithms. These algorithms are generally very computationally expensive, mainly in case of processing real meeting data and large vocabulary databases. A cluster proposed in this project is able to significantly increase a computational capacity at our faculty, thus, new modern algorithms and trends in area of automatic speech recognition can be applied. We also suppose the utilization of new cluster in other spheres of research activity at Faculty of Information Technology.

Klíčová slova
rozpoznávání řeči, parametrizace, audiovizuální data, audio-video zpracování, vyhledávání klíčových slov

Klíčová slova anglicky
speech recognition, feature extraction, meeting data, audio-video processing, keyword spotting

Označení

119/2004

Originální jazyk

čeština

Řešitelé

Útvary

Ústav počítačové grafiky a multimédií
- spolupříjemce (26.10.2004 - 26.10.2006)