Tacotron — это нейросеть, разработанная компанией Google для синтеза речи. Эта модель использует архитектуру р...
**Wav2Vec** — это мощная нейросеть, разработанная компанией Facebook AI, которая предназначена для преобразова...
Kaldi — это мощный инструмент для создания систем распознавания речи, который используется во многих коммерчес...
Mozilla Common Voice — это инициатива по созданию открытой базы данных голосовых записей, которая может быть и...
DeepSpeech — это мощная нейросетевая модель для распознавания речи, разработанная компанией Mozilla. Модель ос...
ESPnet — это современная платформа для разработки и исследования систем автоматического распознавания речи (AS...