Detail projektu

Speech enhancement front-end for robust automatic speech recognition with large amount of training data

Období řešení: 1.1.2020 — 31.12.2020

Zdroje financování

Neveřejný sektor - Přímé kontrakty - smluvní výzkum, neveřejné zdroje

O projektu

Cílem společného výzkumu je vyvinout technologie parametrizace s obohacováním řeči pro robustní automatické rozpoznávání řeči s velkým objemem trénovacích dat v rámci spolupráce mezi VUT a NTT. Práce je založena na nízkodimenzionálních reprezentacích dat (embeddings) produkovaných neuronovými sítěmi v různých místech řetězce zpracování.

Popis česky
The purpose of the Joint Research is to develop Speech enhancement front-end for robust automatic speech recognition with large amount of training data through the cooperation of NTT and BUT. The work is relying on embeddings produced by neural networks in various places of the processing chain.

Klíčová slova
speech recognition, robustness, large data, DNN embeddings

Klíčová slova česky
rozpoznávání řeči, odolnost, velký objem dat,

Originální jazyk

angličtina

Řešitelé

Žmolíková Kateřina, Ing., Ph.D. - hlavní řešitel

Útvary

Ústav počítačové grafiky a multimédií
- odpovědné pracoviště (10.12.2019 - nezadáno)
Výzkumná skupina dolování dat z řeči BUT Speech@FIT
- interní (1.1.2020 - 31.12.2020)
NTT, Inc.
- objednatel (1.1.2020 - 31.12.2020)
Ústav počítačové grafiky a multimédií
- příjemce (1.1.2020 - 31.12.2020)

Odpovědnost: Žmolíková Kateřina, Ing., Ph.D.

VUT

Fakulty a vysokoškolské ústavy

Součásti

Speech enhancement front-end for robust automatic speech recognition with large amount of training data