Přístupnostní navigace
E-přihláška
Vyhledávání Vyhledat Zavřít
Detail projektu
Období řešení: 23.2.2015 — 31.3.2017
Zdroje financování
Neveřejný sektor - Přímé kontrakty - smluvní výzkum, neveřejné zdroje
O projektu
Existing speech signal processing technologies are inadequate for most noisy or degraded speech signals that are important to military intelligence. The Robust Automatic Transcription of Speech (RATS) program is creating algorithms and software for performing the following tasks on potentially speech-containing signals received over communication channels that are extremely noisy and/or highly distorted: Speech Activity Detection, Language Identification, Speaker Identification and Key Word Spotting.
Popis českyExistující technologie zpracování řečového signálu jsou nedostačující pro většinu hlučných nebo degradovaných řečových signálů, které jsou důležité pro vojenskou špionáž. Program robustní automatické transkripce řeči vytváří algoritmy a software, které provedou následující úkony na signálech potenciálně obsahujících řeč, které byly získány prostřednictvím komunikačních kanálů, jež jsou extrémně hlučné a/nebo vysoce deformované: detekce řečové aktivity, rozpoznávání jazyka, rozpoznávání mluvčího a detekce klíčových slov.
Klíčová slova speech recognition, speaker recognition, language recognition, keyword spotting, robustness, noise, transmission channels
Klíčová slova českyrozpoznávání řeči, rozpoznávání mluvčího, rozpoznávání jazyka, detekce klíčových slov, robustnost, šum, přenosové kanály
Originální jazyk
angličtina
Řešitelé
Matějka Pavel, Ing., Ph.D. - hlavní řešitelFér Radek, Ing. - spoluřešitelGlembek Ondřej, Ing., Ph.D. - spoluřešitelHeřmanský Hynek, prof. Ing., Dr. Eng. - spoluřešitelKarafiát Martin, Ing., Ph.D. - spoluřešitelKobes Michal - spoluřešitelNovotný Ondřej, Ing., Ph.D. - spoluřešitelOgawa Tetsuji - spoluřešitelOndel Lucas Antoine Francois, Mgr., Ph.D. - spoluřešitelPlchot Oldřich, Ing., Ph.D. - spoluřešitelPopková Anna, Ing. - spoluřešitelSilnova Anna, M.Sc., Ph.D. - spoluřešitelSkácel Miroslav, Ing. - spoluřešitelVeselý Karel, Ing., Ph.D. - spoluřešitel
Útvary
Ústav počítačové grafiky a multimédií- odpovědné pracoviště (10.11.2014 - nezadáno)Výzkumná skupina dolování dat z řeči BUT Speech@FIT- interní (10.11.2014 - 31.3.2017)Raytheon BBN Technologies Corp- objednatel (10.11.2014 - 31.3.2017)Ústav počítačové grafiky a multimédií- příjemce (10.11.2014 - 31.3.2017)
Výsledky
NOVOTNÝ, O.; MATĚJKA, P.; PLCHOT, O.; GLEMBEK, O.; BURGET, L.; ČERNOCKÝ, J. Analysis of Speaker Recognition Systems in Realistic Scenarios of the SITW 2016 Challenge. In Proceedings of Interspeech 2016. San Francisco: International Speech Communication Association, 2016. p. 828-832. ISBN: 978-1-5108-3313-5.Detail
MATĚJKA, P.; GLEMBEK, O.; NOVOTNÝ, O.; PLCHOT, O.; GRÉZL, F.; BURGET, L.; ČERNOCKÝ, J. Analysis Of DNN Approaches To Speaker Identification. In Proceedings of the 41th IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP 2016), 2016. Shanghai: IEEE Signal Processing Society, 2016. p. 5100-5104. ISBN: 978-1-4799-9988-0.Detail
PEŠÁN, J.; BURGET, L.; ČERNOCKÝ, J. Sequence Summarizing Neural Networks for Spoken Language Recognition. In Proceedings of Interspeech 2016. San Francisco: International Speech Communication Association, 2016. p. 3285-3289. ISBN: 978-1-5108-3313-5.Detail
MATĚJKA, P.; PLCHOT, O.; NOVOTNÝ, O.; FÉR, R. Summary report for project "Robust Automatic Speech Transcription" in Year 2015. Brno: Raytheon BBN Technologies, 2015. 1 p.Detail
MATĚJKA, P. Summary report for project "Robust Automatic Speech Transcription" in Year 2016. Brno: Raytheon BBN Technologies, 2016. p. 1 (1 s.). Detail
FÉR, R.; MATĚJKA, P.; GRÉZL, F.; PLCHOT, O.; ČERNOCKÝ, J. Multilingual Bottleneck Features for Language Recognition. In Proceedings of Interspeech 2015. Proceedings of Interspeech. Dresden: International Speech Communication Association, 2015. no. 09, p. 389-393. ISBN: 978-1-5108-1790-6. ISSN: 1990-9772.Detail
PEŠÁN, J.; BURGET, L.; HEŘMANSKÝ, H.; VESELÝ, K. DNN derived filters for processing of modulation spectrum of speech. In Proceedings of Interspeech 2015. Proceedings of Interspeech. Dresden: International Speech Communication Association, 2015. no. 09, p. 1908-1911. ISBN: 978-1-5108-1790-6. ISSN: 1990-9772.Detail
PLCHOT, O.; BURGET, L.; ARONOWITZ, H.; MATĚJKA, P. Audio Enhancing With DNN Autoencoder For Speaker Recognition. In Proceedings of the 41th IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP 2016), 2016. Shanghai: IEEE Signal Processing Society, 2016. p. 5090-5094. ISBN: 978-1-4799-9988-0.Detail
LI, R.; MALLIDI, S.; PLCHOT, O.; BURGET, L.; DEHAK, N. Exploiting Hidden-Layer Responses of Deep Neural Networks for Language Recognition. In Proceedings of Interspeech 2016. San Francisco: International Speech Communication Association, 2016. p. 3265-3269. ISBN: 978-1-5108-3313-5.Detail
NOVOTNÝ, O.; MATĚJKA, P.; GLEMBEK, O.; PLCHOT, O.; GRÉZL, F.; BURGET, L.; ČERNOCKÝ, J. Analysis of the DNN-Based SRE Systems in Multi-language Conditions. In Proceedings of SLT 2016. San Diego: IEEE Signal Processing Society, 2016. p. 199-204. ISBN: 978-1-5090-4903-5.Detail
CUMANI, S.; PLCHOT, O.; FÉR, R. Exploiting i-vector posterior covariances for short-duration language recognition. In Proceedings of Interspeech 2015. Proceedings of Interspeech. Dresden: International Speech Communication Association, 2015. no. 09, p. 1002-1006. ISBN: 978-1-5108-1790-6. ISSN: 1990-9772.Detail
BRUMMER, J.; SWART, A.; PRIETO, J.; GARCIA PERERA, L.; MATĚJKA, P.; PLCHOT, O.; DIEZ SÁNCHEZ, M.; SILNOVA, A.; JIANG, X.; NOVOTNÝ, O.; ROHDIN, J.; GLEMBEK, O.; GRÉZL, F.; BURGET, L.; ONDEL YANG, L.; PEŠÁN, J.; ČERNOCKÝ, J.; KENNY, P.; ALAM, J.; BHATTACHARYA, G.; ZEINALI, H. ABC NIST SRE 2016 SYSTEM DESCRIPTION. San Diego: National Institute of Standards and Technology, 2016. p. 1-8. Detail
MATĚJKA, P. Summary report for project "Robust Automatic Speech Transcription" in Year 2017. Brno: Raytheon BBN Technologies, 2017. p. 1-5. Detail
PLCHOT, O.; MATĚJKA, P.; FÉR, R.; GLEMBEK, O.; NOVOTNÝ, O.; PEŠÁN, J.; VESELÝ, K.; ONDEL YANG, L.; KARAFIÁT, M.; GRÉZL, F.; KESIRAJU, S.; BURGET, L.; BRUMMER, J.; SWART, A.; CUMANI, S.; MALLIDI, S.; LI, R. BAT System Description for NIST LRE 2015. In Proceedings of Odyssey 2016, The Speaker and Language Recognition Workshop. Proceedings of Odyssey: The Speaker and Language Recognition Workshop Odyssey 2014, Joensuu, Finland. Bilbao: International Speech Communication Association, 2016. no. 06, p. 166-173. ISSN: 2312-2846.Detail
Jan Muller, Rudolf Muller; Ing. Jan Muller: Vícekomorová dvouplášťová kubická nádrž. 296976, Patent. (2005)Detail
Odpovědnost: Matějka Pavel, Ing., Ph.D.