Кай Ленг 4 495 0

Google представила новую видеомодель Gemini Omni

Она позволяет создавать реалистичные видео и редактировать их с помощью естественного диалога.

Google официально представила ранее засветившуюся мультимодальную модель для создания видео Gemini Omni. Точнее, семейство моделей — пока что доступна только облегчённая версия Omni Flash.

Она использует возможности других продуктов Google, включая Gemini Nano, Veo и Genie, чтобы генерировать видео, в том числе и сложные, из слов, рисунков, картинок и текста. Omni отличается пониманием законов физики и может создавать реалистичные видео с учётом кинетической энергии объектов и гравитации.

Главной особенностью Omni стала возможность редактирования уже готового видео путём текстового запроса, при этом модель понимает контекст ситуации, поэтому внесёт только запрошенные изменения — все персонажи и объекты останутся на своих местах, если пользователь не просил иного.

Gemini Omni Flash уже доступна в приложении Gemini и для создателей YouTube Shorts.