- GPT-5.2 Thinking и Gemini 3 Pro набрали одинаковый IQ, став лидерами рейтинга ИИ по версии сайта Tracking AI.
- Обе модели показали 141 балл в классическом тесте Mensa Norway и 127 очков в уникальном оффлайн-тесте.
- GPT-5.2 Thinking превзошла GPT-5 Pro в оффлайн-тесте, что демонстрирует разницу в способностях моделей вне известных данных.
Сайт Tracking AI обновил рейтинг искусственного интеллекта по уровню IQ, отметив сразу две модели — GPT-5.2 Thinking от OpenAI и Gemini 3 Pro от Google — которые заняли первое место с одинаковыми результатами. Обе системы набрали 141 балл в классическом тесте Mensa Norway и 127 баллов в дополнительном оффлайн-тесте, разработанном для оценки интеллектуальных способностей ИИ на новых данных, не представленных в обучающих выборках.
Тест Mensa Norway представляет собой открытый онлайн-тест из 35 задач на выявление закономерностей. Его средний человек составляет примерно 100 баллов. Однако, из-за того что вопросы доступны публично, ИИ имеет возможность изучать их заранее. Чтобы избежать искажения результатов, авторы сайта создали оффлайн-версию, в которой задаются новые задачи с аналогичной сложностью, но доступ к ним закрыт, что позволяет провести более объективную оценку возможностей ИИ.
При проведении экзамена многие модели проверялись в двух режимах: Vision, где системы работают с визуальной информацией, самостоятельно анализируя изображение с условиями задачи, и текстовом, где им описываются условия в письменной форме. Такая методика позволяет оценить мультимодальные способности ИИ и его адаптивность к различным форматам подачи информации.
Интересно, что в оффлайн-тесте GPT-5.2 Thinking обогнала более дорогую и мощную версию GPT-5 Pro, хотя последняя показала лучшие результаты в классическом тесте. Данный факт говорит о том, что GPT-5 Pro, возможно, лучше оптимизирована под известные данные, тогда как GPT-5.2 Thinking демонстрирует более высокий интеллект при работе с новыми задачами. Также следует отметить, что обычная чат-версия GPT-5.2, не использующая режим рассуждений, набрала 120 очков — уровень, равный результатам модели Claude Opus 4.5.
В целом, данные тестирования подтверждают, что современные достижения в области искусственного интеллекта позволяют создавать системы с высоким уровнем аналитических и логических способностей. Сопоставимость результатов моделей OpenAI и Google демонстрирует конкуренцию двух крупных разработчиков в стремлении приблизить ИИ к человеческому интеллекту.
