ChatGPT теперь умеет распознавать изображения и вести диалог голосом

Сначала эти возможности появятся для подписчиков тарифов Plus и Enterprise.

ChatGPT теперь умеет распознавать изображения и вести диалог голосом

OpenAI запускает голосовые и графические возможности чат-бота ChatGPT, что работает на базе большой языковой модели GPT. Об этом стартап сообщил в своём блоге.

Голосовой чат. ChatGPT и прежде можно было задавать вопросы голосом через мобильное приложение. Но теперь чат-бот обрёл свой голос — точнее, сразу пять голосов на выбор.

Для создания голосов OpenAI работала с профессиональными актёрами дубляжа, а в преобразовании речи в текст используется собственная технология Whisper.

Распознавание изображений. Текст и голос — не единственные формы общения с ChatGPT. Теперь чат-боту можно показать одно или несколько изображений. Например, чтобы просканировать содержимое холодильника и составить список рецептов из имеющихся продуктов. Или проанализировать сложный график и сделать выводы.

Для выделения определённого фрагмента изображения в мобильном приложении есть инструмент для рисования.

Новые возможности постепенно станут доступны для подписчиков тарифов Plus (19,99 доллара в месяц) и Enterprise. Формат голосового чата работает только в приложениях ChatGPT для iOS и Android.