Андрей Чуяшов 60 413 189

Gemini 3 против GPT-5.2: сравниваем самые мощные нейросети 2025 года

Рассказываем, как внезапный релиз GPT-5.2 изменил расклад сил и почему «старая» 5.1 всё ещё нужна для сложных задач.

В конце 2025 года битва OpenAI и Google перешла на новый уровень. Поисковик наконец догнал конкурента по мощности нейросетевых моделей: в бенчмарках Gemini 3 Pro показывает потрясающие результаты. Но ответ империи Сэма Альтмана не заставил себя ждать — свежая GPT-5.2 Thinking задаёт новую планку качества. По крайней мере, если верить сухим цифрам.

Мы протестировали обе нейронки на задачах разной сложности — от кодинга до русской сатиры.

В новой версии OpenAI сделали упор на способности в решении ежедневных задач, чтобы раскрыть экономическую выгоду от технологии. GPT-5.2 Thinking выполнила задачи бенчмарка GDPval, который включает задачи интеллектуального труда 44 популярных профессий, более чем в 11 раз быстрее, чем живые специалисты.

Как и GPT-5.1, семейство GPT-5.2 включает три режима:

Instant — мгновенные ответы на повседневные вопросы, не требующие логики.
Thinking — «думающая» версия с наилучшими результатами в логике, математике и программировании.
Pro — ещё одна модель с «размышлениями» для ещё более глубокого анализа.

Модель способна автоматически переключаться между Instant и Thinking в зависимости от сути запроса. Версия Pro доступна только подписчикам ChatGPT Pro или по API-интерфейсу.

Основные характеристики GPT-5.2:

Контекстное окно: 400 000 токенов
Знания: актуальны по 31 августа 2025 года
Стоимость: бесплатно (с лимитами), 20 долларов (~1593 рубля) в месяц за Plus-подписку или 200 долларов (~15 934 рубля) в месяц за Pro-подписку

В России сервисы OpenAI не работают. Для регистрации понадобятся зарубежный номер телефона и IP-адрес. Ранее мы рассказывали, как дёшево приобрести подписку ChatGPT Plus или Pro без иностранной банковской карты.

Нейронка от Google тоже представлена в двух форматах: скоростная Gemini 2.5 Flash (предыдущее поколение) и «думающая» Gemini 3 Pro. Разработчики позиционируют Gemini 3 как «лучшую в мире модель для мультимодального понимания»: она хорошо понимает не только текст, но и другие формы контента: изображения, видео и файлы.

Основные характеристики Gemini 3 Pro:

Контекстное окно: 1 000 000 токенов
Знания: актуальны до января 2025 года
Стоимость: бесплатно до 5 запросов, после включается Gemini 2.5 Flash. Есть подписка AI Pro за 19,99 долларов (~1592 рубля) в месяц с расширенными лимитами

C доступом к Gemini из России несколько сложнее. Зачастую простой смены IP-адреса недостаточно: Google активно пытается вычислить ваше местоположение по косвенным данным. Иногда не обойтись без перебора сервисов для смены IP-адреса или даже регистрации новой учётной записи Google — естественно, с иностранными «пропиской» и номером телефона.

Бенчмарк	Что проверяет	Gemini 3 Pro	GPT-5.2 Thinking	Кто победил?
GPQA Diamond	Научные знания уровня PhD (физика, химия)	91,9%	92,4%	GPT-5.2
SWE-bench Verified	Реальные задачи по программированию	76,2%	80,0%	GPT-5.2
ARC-AGI-2	Визуальная логика и абстрактное мышление	31,1%	52,9%	GPT-5.2
AIME 2025	Математика олимпиадного уровня	95,0%	100%	GPT-5.2
GDPval	Прикладные задачи (тест разработан OpenAI)	53,5%	70,9%	GPT-5.2

Стоит учитывать, что цифры выше предоставлены OpenAI. По её данным, GPT-5.2 Thinking проигрывает Gemini 3 Pro только в бенчмарке FrontierMath (Tier-4), который проверяет способности в решении чрезвычайно сложных математических задач.

По какой-то причине OpenAI не стала раскрывать результаты тестирования GPT-5.2 в популярном бенчмарке Humanity's Last Exam c вопросами по математике, гуманитарным и естественным наукам. Вероятно, потому что результат не выделяется на фоне показателей Gemini 3.

В независимых отчётах ситуация интереснее. В индексе интеллекта Artificial Analysis Gemini 3 Pro и GPT-5.2 делят первое место с одинаковым баллом 73, оторвавшись от преследователей в лице Claude Opus 4.5 и GPT-5.1 (у них по 70 баллов).

За названием gpt-5.2-high скрывается GPT‑5.2 Thinking

В рейтинге текстовой генерации на площадке LMArena GPT-5.2 пока нет. Зато новинка присутствует в топе по веб-разработке, слегка опережая Gemini 3 Pro. Любопытно, что обе модели «сливают» Claude Opus 4.5 — нейросети Anthropic традиционно лидируют по части программирования.

Мы изучили свежие ветки обсуждений, чтобы сравнить красивые цифры из отчётов с опытом тех, кто использует эти нейросети в работе 24/7.

Мнения о GPT-5.2 разделились. С одной стороны, пользователи в восторге от размера контекста: «GPT-5.2 пока что фантастическая, особенно на длинных дистанциях контекстного окна. Она не теряет нить там, где другие начинают путаться».

С другой стороны, многие считают, что за высокими цифрами тестов скрывается удешевление технологий:

«Бенчмарки выглядят сомнительно. Ощущение, что в реальности 5.2 — это просто очередная оптимизация расходов компании (чтобы модель была дешевле), а не реальный прирост интеллекта»

Если к OpenAI есть вопросы, то Gemini 3 Pro хвалят за её конкретные сильные стороны:

«Её способность понимать элементы на изображении — это чертовски потрясающе. Это первая модель, которая реально разобрала мой почерк, GPT-5.1 даже близко не стояла»

В итоге GPT-5.2 по-прежнему используют для стабильной работы с текстом и длинных диалогов, а Gemini 3 Pro — когда нужно решить сложную задачу или распознать рукописный текст. Самая популярная стратегия сейчас — не выбирать одну модель, а комбинировать.

В эксперименте участвуют две «думающие» модели: Gemini 3 Pro и GPT-5.2 Thinking. Цель — показать на простых и наглядных примерах, как современные модели ведут себя в руках обычного пользователя.

Они должны справиться со школьной логической головоломкой, написать красивый визуальный код, распознать и прокомментировать иконки с духовки и пройти проверку на чувство юмора (чтобы по конкретному запросу и без кринжа).

Вместо стандартных тестов мы взяли классическую школьную задачу про торт. Нюанс в том, что у задачи нет одного правильного ответа — это тест на вариативность. Нейросеть должна понять, что разрезы могут пересекаться по-разному.

Задача: У хозяйки был круглый торт с розочками из крема. Она разрезала его на части так, чтобы в каждой части была одна розочка. Всего она сделала три разреза. Сколько розочек могло быть на торте?

GPT-5.2 Thinking потратила 18 секунд на размышление и выдала академически точный ответ. Модель педантично расписала все сценарии: от параллельных линий (4 куска) до «максимума» (7 кусков), структурировав ответ, как обычно это делает.

Gemini 3 Pro тоже дала верный ответ (4, 5, 6 или 7), но подход принципиально другой. Она не просто посчитала, а предложила сгенерировать изображение силами Nano Banana Pro, наглядно показав схему разрезов для самого сложного случая (7 частей).

Усложним задачу и перейдём к вайб-кодингу. Просим написать готовый веб-виджет. Здесь мы смотрим не только на отсутствие багов, но и на эстетику. Сможет ли ИИ сделать «современно» с первого раза, используя стиль Glassmorphism?

Промпт: Напиши один HTML-файл (с CSS и JS внутри), который создаёт виджет «Кредитная карта» в стиле Glassmorphism (эффект матового стекла). Требования:

При вводе цифр они должны красиво появляться на карте.
Логотип банка (Visa/Mastercard) должен меняться автоматически в зависимости от первой цифры (4 — Visa, 5 — MC).
Фон страницы — красивый градиент.

Gemini 3 Pro сработала быстрее и лаконичнее — всего 371 строка кода. Визуал получился более строгим (тёмная тема), но Gemini «споткнулась» на мелочи, попытавшись подтянуть логотип Visa по несуществующей ссылке, из-за чего на карте отобразилась «битая» картинка.

Зато Google верна себе: после кода модель выдала подробный туториал, объяснив, как именно она настроила CSS-фильтры для эффекта стекла.

GPT-5.2 Thinking думала в 2 раза дольше конкурента и выдала массивный код на 683 строки. Зато результат выглядит эффектнее: нейросеть реализовала настоящий 3D-эффект — карта поворачивается и бликует при наведении мыши.

Но без «косяка» не обошлось: поле ввода срока действия (MM/YY) вылезло за границы формы, сломав вёрстку.

Оба варианта пришлось бы дорабатывать, однако если реализация Gemini 3 Pro выглядит привычнее, то GPT-5.2 Thinking точнее соответствует промпту. Кстати, недавно мы уже рассказывали, как Gemini 3 Pro создала рабочий «клон» macOS прямо в приложении для iOS.

Проверяем, спасут ли нейросети, когда инструкция к технике давно потеряна. Распознать чёткий текст с картинки сегодня может любой смартфон, а вот правильно интерпретировать абстрактные схематичные иконки без подписей — задача со звёздочкой.

Задача: Подпиши и объясни, что означает каждый значок на духовке.

У GPT-5.2 Thinking это было долго и мучительно. С первой попытки нейросеть просто «упала» с ошибкой сети. Со второго раза она думала 6 минут. Но результат оправдал ожидание: модель не просто перечислила функции, а создала подробный мануал к запросу.

Она нарезала исходное фото на кусочки, сопоставив каждую иконку с описанием, и даже корректно перевела специфические турецкие режимы (запрос к GPT выполнялся по IP из Турции) вроде Hamur Şefi (выпечка хлеба) и Yoğurt (Йогурт).

Gemini 3 Pro сработала мгновенно, но схитрила. Модель прочитала название загруженного файла и радостно сообщила: «Судя по названию файла, это Vestel».

Опираясь на это знание, она подтянула информацию из своей базы и выдала корректный список режимов.

В финале мы предложили двум моделям написать стих, попав в специфический ломаный ритм «Вредных советов» Григория Остера, про джуна, который положил прод в пятницу вечером.

Промпт: Напиши стихотворение в точном стиле «Вредных советов» Григория Остера. Ситуация: ты джуниор-программист, который случайно удалил базу данных в пятницу вечером за 5 минут до конца рабочего дня. Соблюдай характерный ритм Остера, не пиши обычный стих с простыми рифмами, нужен именно стиль «Вредных советов».

GPT-5.2 Thinking сразу отказалась от стиля Остера, заявив, что «не может копировать точный стиль конкретного живого автора». Вместо этого она выдала длинное, пресное стихотворение с простыми рифмами, которое больше напоминает инструкцию по технике безопасности, чем сатиру.

Gemini 3 Pro обошлась без комментариев про стихотворные размеры, но саму задачу выполнила лучше. Она попыталась попасть в тот самый ритм автора. Получилось не идеально и местами кринжово, но это хотя бы похоже на пародию.

Если вы готовы сыграть в «лотерею» с доступом или зарегистрировать новый аккаунт Google — Gemini 3 Pro однозначно стоит этих усилий. Модель ощущается живым соавтором: там, где конкурент пишет сухой текст, ИИ от Google предложит нарисовать схемы и считает культурный контекст или мем.

Если же вам нужен результат здесь и сейчас без танцев с бубном — GPT-5.2 закроет 90% ваших потребностей. Это надёжный, но скучный «зубрила», который просто выполняет инструкции. Хороший промпт — хороший результат. Но как часто вы пишете точные запросы к ИИ?

Gemini 3 против GPT-5.2: сравниваем самые мощные нейросети 2025 года

GPT-5.2

Gemini 3

Бенчмарки

Глас народа: что говорят на Reddit

Сравнение в реальных задачах

Логика и «рассуждение»

Программирование

Та самая мультимодальность

Креатив

Выводы