«ВКонтакте» открыла доступ к собственной технологии распознавания речи

Автор Антон Курилов 11:55 22.09.2022
- 0 +  1 345 0
«ВКонтакте» открыла доступ к собственной технологии распознавания речи

«ВКонтакте» открыла доступ для сторонних разработчиков к собственной версии технологии ASR (Automatic Speech Recognition), которая распознаёт речь на аудио при помощи нейросетей.

ASR получает аудиофайл, при помощи одной нейросети распознаёт устную речь, другой моделью подбирает подходящие слова, а третья нейросеть помогает в расстановке знаков препинания. На выходе — готовый к использованию текст. 

Пользователям предлагают две модели распознавания: спонтанная (речь со сленгом и ненормативной лексикой) и нейтральная (разборчивая речь, например, из интервью или телешоу). Как отмечают разработчики, нейросети не заточены под расшифровку песен и записей из колл-центров. Внутри «ВКонтакте» технология используется для расшифровки голосовых сообщений и генерации субтитров в видео.

«ВКонтакте» позволяет расшифровывать до 100 минут файлов в сутки бесплатно даже в коммерческих целях. Стоимость пользования технологией с повышенными лимитами не разглашается. Применять ASR можно как через веб-интерфейс, так и через API.

Подписывайтесь на Rozetked в Telegram, во «ВКонтакте» и обязательно в YouTube.

14.05.2024
Google I/O 2024
21.05.2024
Microsoft Build 2024
Нет событий
04.04.2025
«Форсаж 11»
Все события





Реклама на сайте



Комментарии

14.05.2024
Google I/O 2024
21.05.2024
Microsoft Build 2024
Нет событий
04.04.2025
«Форсаж 11»
Все события





Реклама на сайте