Специалисты Новосибирского государственного университета представили обновлённую модель распознавания русской речи. ИИ создан на основе нейросети Whisper от OpenAI и дополнительно обучен на расширенных данных.
Система прошла обучение на массиве, включающем более 500 часов разговорной русской речи. Чтобы увеличить объём данных, команда использовала синтетические записи, созданные другими нейросетями.
Разработка предназначена для точного преобразования устной русской речи в текст, а также для её перевода на английский язык.
Сейчас обработка запроса занимает примерно 40 секунд, однако исследователи намерены уменьшить это время до примерно 5 секунд в ближайшие месяцы.
Источник: ТАСС











