13 главных анонсов Google I/O 2024

Очень много искусственного интеллекта. И совсем ничего о Pixel.

13 главных анонсов Google I/O 2024

По традиции Google провела ежегодную весеннюю презентацию I\O, но вопреки ожиданиям нам не показали свежий Android 15 и новые смартфоны Pixel. Видимо, виной тому работа редакции Rozetked, когда произошла утечка топовых смартфонов. Долгая двухчасовая презентация была целиком посвящена искусственному интеллекту, поэтому пробежимся по основным моментам. 

Придумываю музыку за вас

Перед запуском трансляции Google напомнила о сервисе MusicFX, где мелодии создаются по текстовому запросу. Оценить способности ИИ-композитора могут все желающие по ссылке, где требуется залогиниться в свой Google-аккаунт.

Gemini и его бесконечные возможности

Мы узнали, что более 1,5 млн разработчиков используют Gemini. Теперь Gemini 1.5 Pro доступен как разработчикам, так и пользователям на 35 языках. Новая версия обработает больше данных, это касается текстов, аудио и видео. Контекстное окно увеличили с 1 до 2 млн токенов. 

Ещё появилась «облегчённая» версия Gemini 1.5 Flash, оптимизированная для более простых задач, Упор на более быстрый отклик и низкую стоимость. Как пример — чат-приложения или поиск данных в документах. 

В приложении Google Photo точнее распознаются запросы, а значит, легче и быстрее найти нужное изображение. Как пример, можно попросить показать фотографии с определёнными госномерами на машинах, а поиск выдаст нужный результат. Или попросить показать своего ребёнка в воде, а в ответ появятся все подходящие по смыслу фото и видео. 

К тому же, в этом году для жителей США в поиске Google станет доступна функция AI Overview — это краткий ответ по запросу. Нейросеть анализирует источники и выдаёт суть, без необходимости посещать сайт и искать нужное самому. Функция тестирует с 2023 года, но только сейчас начнёт «раскатываться». К слову, похожие возможности стали доступны в апреле в «Яндексе».

Imagen 3 — лучший  инструмент Google для создания фото по текстовому описанию на сегодняшний день. Чёткость, высокая детализация, реалистичное освещение — всё, что душе угодно в самых разных стилях. 

Veo — нейросеть для создания и редактирования видео в 1080p длительностью более минуты в различной обработке: нуар, фотореализм, киберпанк или сюрреализм. Она создаёт ролики по текстовому запросу, но можно использовать другое видео или фото. 

Поисковые запросы в Google будут анализироваться системой, разделяться на части. Поисковик сам поймёт приоритеты и выдаст ответ за секунды, сэкономив несколько минут или даже часов. Если лень писать текстовый запрос, то можно сразу отправить видео — функция пока недоступна, но в скором времени появится. 

Сообразительный помощник обработает данные в документах. К примеру, можно проанализировать свои расходы в таблице, отправив простой текстовый запрос: «Куда ушли деньги?» Gemini 1.5 Pro появится в боковой панели офисных приложений Google, в течение следующего месяца пользователи с платной подпиской смогут с его помощью выполнять рутинные задачи. Подготовить ответы на электронную почту, используя ранее просмотренные документы. Или просто напомнить в нужное время, что пора бы отправить письмо. 

Gemini Live — это ответ на ChatGPT 4o. Вы можете пообщаться с Gemini, он выступит в роли собеседника. Он не только даст ответы на вопросы, но и расскажет, что видит вокруг, определяя объекты через камеру в режиме реального времени. Причём речь не только про камеру смартфонов, но и очки. Диалоги с ИИ выйдут на новый уровень в ближайшем будущем, функция пока что в разработке.

Не только творит, но и защищает

Всё это многообразие контента, созданного нейросетями, нужно как-то помечать. Для этого пригодятся водяные знаки SynthID. Ими можно маркировать не только фото или видео, но и музыку. Борьба с дипфейками, защита авторских прав — человечество справедливо опасается возможных проблем от ИИ в будущем. 

Борьба с надоедливым спамом и мошенничеством по телефону тоже ляжет на Gemini. Ассистент определит подозрительные запросы собеседника во время звонков и выдаст уведомление, если заметит неладное во время сомнительного диалога с представителем банка. Добровольная прослушка телефона со стороны Google? Звучит как-то не очень секьюрно. 

Кое-что по мелочи

Google Gems — это персонифицированный чат-бот со своим характером, который будет доступен для пользователей платной версии Gemini Advanced. 

В Chrome на компьютерах появится помощник Gemini Nano. Облегчённая версия нейросети сгенерирует текст для соцсетей или напишет заметку прямо в окошке браузера.

Функция «Обвести и найти» (Circle to Search), доступная владельцам Pixel и Samsung Galaxy S24, теперь работает и с математическими формулами. Нужно выделить объект, изобразив круг на экране, после чего система выдаст подсказку. 

Итого

Презентация была исключительно софтовой, но можно порадоваться за будущих пользователей новых Pixel — они смогут оценить все многочисленные возможности Gemini на устройствах. Эра ИИ в разгаре, будет интересно посмотреть, чем на это ответит летом Apple во время ежегодной WWDC. Учитывая, что на днях ​​Apple договорилась с OpenAI об использовании технологий в айфонах, есть надежда, что наконец-то она будет на равных тягаться с Google в этой части. 

И да, небольшая новость про Android была. Уже завтра пользователи Pixel и других смартфонов от партнёров смогут скачать вторую бету Android 15. И для тех, кто любит считать — 121 раз прозвучало слово AI (ИИ) во время презентации, такая история.