ChatGPT теперь умеет распознавать изображения и вести диалог голосом
Сначала эти возможности появятся для подписчиков тарифов Plus и Enterprise.

OpenAI запускает голосовые и графические возможности чат-бота ChatGPT, что работает на базе большой языковой модели GPT. Об этом стартап сообщил в своём блоге.
Голосовой чат. ChatGPT и прежде можно было задавать вопросы голосом через мобильное приложение. Но теперь чат-бот обрёл свой голос — точнее, сразу пять голосов на выбор.
Для создания голосов OpenAI работала с профессиональными актёрами дубляжа, а в преобразовании речи в текст используется собственная технология Whisper.
Распознавание изображений. Текст и голос — не единственные формы общения с ChatGPT. Теперь чат-боту можно показать одно или несколько изображений. Например, чтобы просканировать содержимое холодильника и составить список рецептов из имеющихся продуктов. Или проанализировать сложный график и сделать выводы.

Для выделения определённого фрагмента изображения в мобильном приложении есть инструмент для рисования.
Новые возможности постепенно станут доступны для подписчиков тарифов Plus (19,99 доллара в месяц) и Enterprise. Формат голосового чата работает только в приложениях ChatGPT для iOS и Android.