Whisper by OpenAI
Надёжное распознавание речи с помощью большого масштаба слабой супервизии
О Whisper by OpenAI
Whisper - это система автоматического распознавания речи (ASR), обученная на 680 000 часах многоязычных и многозадачных супервизируемых данных, собранных с веб-страниц. Мы показываем, что использование такого большого и разнообразного набора данных приводит к улучшению устойчивости к акцентам, шуму и техническому языку. Кроме того, он позволяет транскрибировать текст на нескольких языках и переводить их на английский язык. Мы сделали модели и код инференции доступными для свободного использования, чтобы служить основой для создания полезных приложений и для дальнейшего исследования по устойчивой обработке речи.
Источник: https://openai.com/blog/whisper/
Цены на Whisper by OpenAI
API Whisper ценится в $0.006 за минуту.
Скриншоты Whisper by OpenAI
Читать на английском