Project detail
Advancing the automatic language recognition using streamed audio media
Duration: 19.1.2006 — 19.7.2007
Funding resources
On the project
Projekt je zaměřen na masivní využití streamovaného audia pro kvalitativní posun v úspěšnosti systémů pro automatickou identifikaci jazyka (language identification - LID). Skupina zpracování řeči na Fakultě informačních technologií VUT v Brně (Speech@FIT), jejíž členové projekt podávají, disponuje state-of-the-art systémem pro LID jazyka založeným na akustickém a fonotaktickém modelování. Pro jeho další zlepšení je nutné získat velká množství jazykově závislých dat. V rámci projektu budou tato data získávána z dostupných streamovaných zdrojů (internetová rádia), on-line ukládána, parametrizována a zpracovávána. Bude vyvíjen software pro paralelní trénování modelů pro LID. Získané modely a algoritmy budou evaluovány v rámci mezinárodních kampaní NIST a ve spolupráci s českými bezpečnostními složkami.
Description in English
The projects aims at massive usage of streamed audio for a qualitative
improvement of LID (automatic language identification) system accuracy. The
speech processing research group at Faculty of Information Technology, Brno
University of Technology (Speech@FIT) disposes of a state-of-the-art LID system
based on acoustic and phonotactic modeling. For further improvement of its
accuracy, it is crucial to gather huge amounts of language-specific data. In the
framework of this project, such data will be collected from available streamed
sources (Internet radios), on-line stored, parameterized and processed. We will
develop software for training of LID models. Resulting models and algorithms will
be evaluated in international evaluation campaigns organized by NIST and in
cooperation with Czech law enforcement forces.
Keywords
zpracování řeči, identifikace jazyka, paralelní výpočty, získávání řečových dat,
streaming
Key words in English
speech processing, language identification, parallel computing, unsupervised
acquisition of speech data, streaming
Mark
162/2005
Default language
Czech
People responsible
Černocký Jan, prof. Dr. Ing. - principal person responsible
Units
Department of Computer Graphics and Multimedia
- responsible department (1.1.1989 - not assigned)
Speech Data Mining Research Group BUT Speech@FIT
- internal (17.2.2006 - 19.7.2007)
Department of Computer Graphics and Multimedia
- co-beneficiary (17.2.2006 - 19.7.2007)
Responsibility: Černocký Jan, prof. Dr. Ing.