Nvidia представила технологию, способную синтезировать реалистичную речь

Автор Владислав Войтенко 19:58 31.08.2021
- 0 +  1 572 0
Nvidia представила технологию, способную синтезировать реалистичную речь

На конференции Interspeech 2021 исследовательская группа компании Nvidia представила новую технологию, которая позволяет синтезировать реалистичную речь.

Цель её создания заключается в желании добиться того, чтобы голос искусственного интеллекта не отличался от человеческого. 

Для этого было разработано несколько моделей преобразования текста в речь. Одна из них получила название RAD-TTS.

Технология даёт возможность человеку обучать модель синтеза речи с помощью собственного голоса, предоставляя ей данные о тональности, тембре и других индивидуальных характеристиках.

Слова одного человека при помощи технологии способны преобразоваться в речь, которая в результате произносится голосом другого. В Nvidia уверены, что это позволит сделать более выразительными и реалистичными искусственные голоса.

Данная система также будет полезна, например, для воссоздания голоса известных исполнителей. Кроме того, такая технология может стать потенциальным помощником для людей с функциональными нарушениями голоса.

Один из роликов, озвученных ИИ:

Испытать некоторые обученные модели синтеза речи можно через соответствующий инструментарий для разговорного ИИ. 

Подписывайтесь на Rozetked в Telegram, во «ВКонтакте» и обязательно в YouTube.
Хабы: nvidia

14.05.2024
Google I/O 2024
21.05.2024
Microsoft Build 2024
Нет событий
04.04.2025
«Форсаж 11»
Все события





Реклама на сайте



Комментарии

14.05.2024
Google I/O 2024
21.05.2024
Microsoft Build 2024
Нет событий
04.04.2025
«Форсаж 11»
Все события





Реклама на сайте