Project detail

Rozpoznávání klíčových slov a akcí v audiovizuálních datech

Duration: 26.10.2004 — 26.10.2006

On the project

Cílem projektu je automatické zpracování pořizovaných meetingových dat, umožnující uživateli přímé vyhledávání požadovaných událostí v audio/video záznamech podle zvolených kritérií. Aplikačně budou  algoritmy také zaměřeny na automatické rozpoznávání řeči s velkým slovníkem. Tvorba navrhovaného robustního a uživatelem použitelného systému závisí na trénování a testování jednotlivých dílčích algoritmů, které jsou však v případě meetingových dat a velkých řečových databází vysoce náročné na  výpočetní kapacitu. Projektem navrhovaný cluster je schopen podstatně rozšířit výpočetní kapacitu na naši fakultě a tedy umožnit využití nových metod a postupů v oblasti výzkumu zpracování řečových signálů. Předpokládá se využití clusteru i v jiných oblastech výzkumu v rámci Fakulty informačních technologií.

Description in English
The goal of the project is automatic processing of recorded meeting data, which would allow to user the direct browsing of required events in acoustic/visual databases according to selected criteria. Further, proposed algorithms will be also modified to be used in large vocabulary continuous speech recognition tasks. Derivation of robust, efficient and by any user utilized system depends on training and testing of particular algorithms. These algorithms are generally very computationally expensive, mainly in case of processing real meeting data and large vocabulary databases. A cluster proposed in this project is able to significantly increase a computational capacity at our faculty, thus, new modern algorithms and trends in area of automatic speech recognition can be applied. We also suppose the utilization of new cluster in other spheres of research activity at Faculty of Information Technology.

Keywords
rozpoznávání řeči, parametrizace, audiovizuální data, audio-video zpracování, vyhledávání klíčových slov

Key words in English
speech recognition, feature extraction, meeting data, audio-video processing, keyword spotting

Mark

119/2004

Default language

Czech

People responsible

Karafiát Martin, Ing., Ph.D. - fellow researcher
Kašpárek Tomáš, Ing. - fellow researcher
Sumec Stanislav, Ing., Ph.D. - fellow researcher
Motlíček Petr, doc. Ing., Ph.D. - principal person responsible

Units