Денис Гурьянов 0

Nvidia представила платформу для создания продвинутых ИИ-помощников Omniverse Avatar

Виртуальных помощников можно будет использовать практически в любой отрасли.

Компания Nvidia в рамках конференции GTC представила технологию Omniverse Avatar, которая позволяет создавать интерактивных аватаров с искусственным интеллектом.

Виртуальных помощников Omniverse Avatar можно использовать практически в любой отрасли. Например, в одной из демонстраций милый анимированный персонаж рассказывает клиентам о меню в ресторане быстрого питания, отвечая на разные вопросы с их стороны. Персонаж использует технологию отслеживания лиц, чтобы поддерживать зрительный контакт с покупателями и реагировать на выражения их лиц.

В другой демонстрации, анимированная виртуальная версия главы Nvidia Дженсена Хуанга отвечала на вопросы по разным темам, включая изменение климата. Ещё одна демонстрация показала реалистичный анимированный аватар для конференц-связи. Звонившая девушка была одета в повседневную одежду и находилась в оживлённом кафе, однако её виртуальный аватар выглядел более элегантно, а речь передавалась без постороннего шума. Более того, когда она говорила, её слова транскрибировались и переводились в реальном времени на немецкий, французский и испанский языки с тем же голосом и интонацией.

Этот пример основан на работе технологии Nvidia Project Maxine, которая направлена на устранение распространённых проблем с видеоконференцсвязью, таких как видео низкого качества и поддержание зрительного контакта.

Анимация аватаров основана на технологиях Nvidia Video2Face и Audio2Face, 2D и 3D лицевой анимации и рендеринге на основе искусственного интеллекта. Для распознавания речи используется Nvidia Riva — комплект разработки программного обеспечения, который способен распознавать речь на нескольких языках. Понимание аватаром естественного языка основано на модели Nvidia Megatron 530B, которая может распознавать, понимать и генерировать человеческий язык.

nvidia