Google официально представила ранее засветившуюся мультимодальную модель для создания видео Gemini Omni. Точнее, семейство моделей — пока что доступна только облегчённая версия Omni Flash.
Она использует возможности других продуктов Google, включая Gemini Nano, Veo и Genie, чтобы генерировать видео, в том числе и сложные, из слов, рисунков, картинок и текста. Omni отличается пониманием законов физики и может создавать реалистичные видео с учётом кинетической энергии объектов и гравитации.
Главной особенностью Omni стала возможность редактирования уже готового видео путём текстового запроса, при этом модель понимает контекст ситуации, поэтому внесёт только запрошенные изменения — все персонажи и объекты останутся на своих местах, если пользователь не просил иного.
Gemini Omni Flash уже доступна в приложении Gemini и для создателей YouTube Shorts.