В конце 2025 года битва OpenAI и Google перешла на новый уровень. Поисковик наконец догнал конкурента по мощности нейросетевых моделей: в бенчмарках Gemini 3 Pro показывает потрясающие результаты. Но ответ империи Сэма Альтмана не заставил себя ждать — свежая GPT-5.2 Thinking задаёт новую планку качества. По крайней мере, если верить сухим цифрам.
Мы протестировали обе нейронки на задачах разной сложности — от кодинга до русской сатиры.
GPT-5.2
В новой версии OpenAI сделали упор на способности в решении ежедневных задач, чтобы раскрыть экономическую выгоду от технологии. GPT-5.2 Thinking выполнила задачи бенчмарка GDPval, который включает задачи интеллектуального труда 44 популярных профессий, более чем в 11 раз быстрее, чем живые специалисты.
Как и GPT-5.1, семейство GPT-5.2 включает три режима:
- Instant — мгновенные ответы на повседневные вопросы, не требующие логики.
- Thinking — «думающая» версия с наилучшими результатами в логике, математике и программировании.
- Pro — ещё одна модель с «размышлениями» для ещё более глубокого анализа.
Модель способна автоматически переключаться между Instant и Thinking в зависимости от сути запроса. Версия Pro доступна только подписчикам ChatGPT Pro или по API-интерфейсу.
Основные характеристики GPT-5.2:
- Контекстное окно: 400 000 токенов
- Знания: актуальны по 31 августа 2025 года
- Стоимость: бесплатно (с лимитами), 20 долларов (~1593 рубля) в месяц за Plus-подписку или 200 долларов (~15 934 рубля) в месяц за Pro-подписку
В России сервисы OpenAI не работают. Для регистрации понадобятся зарубежный номер телефона и IP-адрес. Ранее мы рассказывали, как дёшево приобрести подписку ChatGPT Plus или Pro без иностранной банковской карты.
Gemini 3
Нейронка от Google тоже представлена в двух форматах: скоростная Gemini 2.5 Flash (предыдущее поколение) и «думающая» Gemini 3 Pro. Разработчики позиционируют Gemini 3 как «лучшую в мире модель для мультимодального понимания»: она хорошо понимает не только текст, но и другие формы контента: изображения, видео и файлы.
Основные характеристики Gemini 3 Pro:
- Контекстное окно: 1 000 000 токенов
- Знания: актуальны до января 2025 года
- Стоимость: бесплатно до 5 запросов, после включается Gemini 2.5 Flash. Есть подписка AI Pro за 19,99 долларов (~1592 рубля) в месяц с расширенными лимитами
C доступом к Gemini из России несколько сложнее. Зачастую простой смены IP-адреса недостаточно: Google активно пытается вычислить ваше местоположение по косвенным данным. Иногда не обойтись без перебора сервисов для смены IP-адреса или даже регистрации новой учётной записи Google — естественно, с иностранными «пропиской» и номером телефона.
Бенчмарки
| Бенчмарк | Что проверяет | Gemini 3 Pro | GPT-5.2 Thinking | Кто победил? |
|---|---|---|---|---|
| GPQA Diamond | Научные знания уровня PhD (физика, химия) | 91,9% | 92,4% | GPT-5.2 |
| SWE-bench Verified | Реальные задачи по программированию | 76,2% | 80,0% | GPT-5.2 |
| ARC-AGI-2 | Визуальная логика и абстрактное мышление | 31,1% | 52,9% | GPT-5.2 |
| AIME 2025 | Математика олимпиадного уровня | 95,0% | 100% | GPT-5.2 |
| GDPval | Прикладные задачи (тест разработан OpenAI) | 53,5% | 70,9% | GPT-5.2 |
Стоит учитывать, что цифры выше предоставлены OpenAI. По её данным, GPT-5.2 Thinking проигрывает Gemini 3 Pro только в бенчмарке FrontierMath (Tier-4), который проверяет способности в решении чрезвычайно сложных математических задач.
По какой-то причине OpenAI не стала раскрывать результаты тестирования GPT-5.2 в популярном бенчмарке Humanity's Last Exam c вопросами по математике, гуманитарным и естественным наукам. Вероятно, потому что результат не выделяется на фоне показателей Gemini 3.
В независимых отчётах ситуация интереснее. В индексе интеллекта Artificial Analysis Gemini 3 Pro и GPT-5.2 делят первое место с одинаковым баллом 73, оторвавшись от преследователей в лице Claude Opus 4.5 и GPT-5.1 (у них по 70 баллов).
В рейтинге текстовой генерации на площадке LMArena GPT-5.2 пока нет. Зато новинка присутствует в топе по веб-разработке, слегка опережая Gemini 3 Pro. Любопытно, что обе модели «сливают» Claude Opus 4.5 — нейросети Anthropic традиционно лидируют по части программирования.
Глас народа: что говорят на Reddit
Мы изучили свежие ветки обсуждений, чтобы сравнить красивые цифры из отчётов с опытом тех, кто использует эти нейросети в работе 24/7.
Мнения о GPT-5.2 разделились. С одной стороны, пользователи в восторге от размера контекста: «GPT-5.2 пока что фантастическая, особенно на длинных дистанциях контекстного окна. Она не теряет нить там, где другие начинают путаться».
С другой стороны, многие считают, что за высокими цифрами тестов скрывается удешевление технологий:
«Бенчмарки выглядят сомнительно. Ощущение, что в реальности 5.2 — это просто очередная оптимизация расходов компании (чтобы модель была дешевле), а не реальный прирост интеллекта»
Если к OpenAI есть вопросы, то Gemini 3 Pro хвалят за её конкретные сильные стороны:
«Её способность понимать элементы на изображении — это чертовски потрясающе. Это первая модель, которая реально разобрала мой почерк, GPT-5.1 даже близко не стояла»
В итоге GPT-5.2 по-прежнему используют для стабильной работы с текстом и длинных диалогов, а Gemini 3 Pro — когда нужно решить сложную задачу или распознать рукописный текст. Самая популярная стратегия сейчас — не выбирать одну модель, а комбинировать.
Сравнение в реальных задачах
В эксперименте участвуют две «думающие» модели: Gemini 3 Pro и GPT-5.2 Thinking. Цель — показать на простых и наглядных примерах, как современные модели ведут себя в руках обычного пользователя.
Они должны справиться со школьной логической головоломкой, написать красивый визуальный код, распознать и прокомментировать иконки с духовки и пройти проверку на чувство юмора (чтобы по конкретному запросу и без кринжа).
Логика и «рассуждение»
Вместо стандартных тестов мы взяли классическую школьную задачу про торт. Нюанс в том, что у задачи нет одного правильного ответа — это тест на вариативность. Нейросеть должна понять, что разрезы могут пересекаться по-разному.
Задача: У хозяйки был круглый торт с розочками из крема. Она разрезала его на части так, чтобы в каждой части была одна розочка. Всего она сделала три разреза. Сколько розочек могло быть на торте?
GPT-5.2 Thinking потратила 18 секунд на размышление и выдала академически точный ответ. Модель педантично расписала все сценарии: от параллельных линий (4 куска) до «максимума» (7 кусков), структурировав ответ, как обычно это делает.
Gemini 3 Pro тоже дала верный ответ (4, 5, 6 или 7), но подход принципиально другой. Она не просто посчитала, а предложила сгенерировать изображение силами Nano Banana Pro, наглядно показав схему разрезов для самого сложного случая (7 частей).
Программирование
Усложним задачу и перейдём к вайб-кодингу. Просим написать готовый веб-виджет. Здесь мы смотрим не только на отсутствие багов, но и на эстетику. Сможет ли ИИ сделать «современно» с первого раза, используя стиль Glassmorphism?
Промпт: Напиши один HTML-файл (с CSS и JS внутри), который создаёт виджет «Кредитная карта» в стиле Glassmorphism (эффект матового стекла). Требования:
- При вводе цифр они должны красиво появляться на карте.
- Логотип банка (Visa/Mastercard) должен меняться автоматически в зависимости от первой цифры (4 — Visa, 5 — MC).
- Фон страницы — красивый градиент.
Gemini 3 Pro сработала быстрее и лаконичнее — всего 371 строка кода. Визуал получился более строгим (тёмная тема), но Gemini «споткнулась» на мелочи, попытавшись подтянуть логотип Visa по несуществующей ссылке, из-за чего на карте отобразилась «битая» картинка.
Зато Google верна себе: после кода модель выдала подробный туториал, объяснив, как именно она настроила CSS-фильтры для эффекта стекла.
GPT-5.2 Thinking думала в 2 раза дольше конкурента и выдала массивный код на 683 строки. Зато результат выглядит эффектнее: нейросеть реализовала настоящий 3D-эффект — карта поворачивается и бликует при наведении мыши.
Но без «косяка» не обошлось: поле ввода срока действия (MM/YY) вылезло за границы формы, сломав вёрстку.
Оба варианта пришлось бы дорабатывать, однако если реализация Gemini 3 Pro выглядит привычнее, то GPT-5.2 Thinking точнее соответствует промпту. Кстати, недавно мы уже рассказывали, как Gemini 3 Pro создала рабочий «клон» macOS прямо в приложении для iOS.
Та самая мультимодальность
Проверяем, спасут ли нейросети, когда инструкция к технике давно потеряна. Распознать чёткий текст с картинки сегодня может любой смартфон, а вот правильно интерпретировать абстрактные схематичные иконки без подписей — задача со звёздочкой.
Задача: Подпиши и объясни, что означает каждый значок на духовке.
У GPT-5.2 Thinking это было долго и мучительно. С первой попытки нейросеть просто «упала» с ошибкой сети. Со второго раза она думала 6 минут. Но результат оправдал ожидание: модель не просто перечислила функции, а создала подробный мануал к запросу.
Она нарезала исходное фото на кусочки, сопоставив каждую иконку с описанием, и даже корректно перевела специфические турецкие режимы (запрос к GPT выполнялся по IP из Турции) вроде Hamur Şefi (выпечка хлеба) и Yoğurt (Йогурт).
Gemini 3 Pro сработала мгновенно, но схитрила. Модель прочитала название загруженного файла и радостно сообщила: «Судя по названию файла, это Vestel».
Опираясь на это знание, она подтянула информацию из своей базы и выдала корректный список режимов.
Креатив
В финале мы предложили двум моделям написать стих, попав в специфический ломаный ритм «Вредных советов» Григория Остера, про джуна, который положил прод в пятницу вечером.
Промпт: Напиши стихотворение в точном стиле «Вредных советов» Григория Остера. Ситуация: ты джуниор-программист, который случайно удалил базу данных в пятницу вечером за 5 минут до конца рабочего дня. Соблюдай характерный ритм Остера, не пиши обычный стих с простыми рифмами, нужен именно стиль «Вредных советов».
GPT-5.2 Thinking сразу отказалась от стиля Остера, заявив, что «не может копировать точный стиль конкретного живого автора». Вместо этого она выдала длинное, пресное стихотворение с простыми рифмами, которое больше напоминает инструкцию по технике безопасности, чем сатиру.
Gemini 3 Pro обошлась без комментариев про стихотворные размеры, но саму задачу выполнила лучше. Она попыталась попасть в тот самый ритм автора. Получилось не идеально и местами кринжово, но это хотя бы похоже на пародию.
Выводы
Если вы готовы сыграть в «лотерею» с доступом или зарегистрировать новый аккаунт Google — Gemini 3 Pro однозначно стоит этих усилий. Модель ощущается живым соавтором: там, где конкурент пишет сухой текст, ИИ от Google предложит нарисовать схемы и считает культурный контекст или мем.
Если же вам нужен результат здесь и сейчас без танцев с бубном — GPT-5.2 закроет 90% ваших потребностей. Это надёжный, но скучный «зубрила», который просто выполняет инструкции. Хороший промпт — хороший результат. Но как часто вы пишете точные запросы к ИИ?















