GPT-5.2 и Gemini 3 Pro признаны ИИ с самым высоким IQ

Главное:

GPT-5.2 Thinking и Gemini 3 Pro набрали одинаковый IQ, став лидерами рейтинга ИИ по версии сайта Tracking AI.
Обе модели показали 141 балл в классическом тесте Mensa Norway и 127 очков в уникальном оффлайн-тесте.
GPT-5.2 Thinking превзошла GPT-5 Pro в оффлайн-тесте, что демонстрирует разницу в способностях моделей вне известных данных.

Сайт Tracking AI обновил рейтинг искусственного интеллекта по уровню IQ, отметив сразу две модели — GPT-5.2 Thinking от OpenAI и Gemini 3 Pro от Google — которые заняли первое место с одинаковыми результатами. Обе системы набрали 141 балл в классическом тесте Mensa Norway и 127 баллов в дополнительном оффлайн-тесте, разработанном для оценки интеллектуальных способностей ИИ на новых данных, не представленных в обучающих выборках.

Тест Mensa Norway представляет собой открытый онлайн-тест из 35 задач на выявление закономерностей. Его средний человек составляет примерно 100 баллов. Однако, из-за того что вопросы доступны публично, ИИ имеет возможность изучать их заранее. Чтобы избежать искажения результатов, авторы сайта создали оффлайн-версию, в которой задаются новые задачи с аналогичной сложностью, но доступ к ним закрыт, что позволяет провести более объективную оценку возможностей ИИ.

При проведении экзамена многие модели проверялись в двух режимах: Vision, где системы работают с визуальной информацией, самостоятельно анализируя изображение с условиями задачи, и текстовом, где им описываются условия в письменной форме. Такая методика позволяет оценить мультимодальные способности ИИ и его адаптивность к различным форматам подачи информации.

Интересно, что в оффлайн-тесте GPT-5.2 Thinking обогнала более дорогую и мощную версию GPT-5 Pro, хотя последняя показала лучшие результаты в классическом тесте. Данный факт говорит о том, что GPT-5 Pro, возможно, лучше оптимизирована под известные данные, тогда как GPT-5.2 Thinking демонстрирует более высокий интеллект при работе с новыми задачами. Также следует отметить, что обычная чат-версия GPT-5.2, не использующая режим рассуждений, набрала 120 очков — уровень, равный результатам модели Claude Opus 4.5.

В целом, данные тестирования подтверждают, что современные достижения в области искусственного интеллекта позволяют создавать системы с высоким уровнем аналитических и логических способностей. Сопоставимость результатов моделей OpenAI и Google демонстрирует конкуренцию двух крупных разработчиков в стремлении приблизить ИИ к человеческому интеллекту.