Создатель ARC-AGI назвал сроки появления искусственного интеллекта Обложка: Skyread

Создатель ARC-AGI назвал сроки появления искусственного интеллекта

Новости
Главное:

  • Франсуа Шолле, создатель бенчмарка ARC-AGI, прогнозирует появление AGI к 2030 году.
  • ARC-AGI развивается: версия ARC-3 почти готова, ARC-4 выйдет в начале 2027 года, а финальные версии — ARC-6 или ARC-7.
  • Google DeepMind недавно представила обновленную модель Gemini 3 Deep Think, показавшую 84,6% на ARC-AGI-2, тогда как лучшие модели 2025 года набирали лишь 1–4%.

Франсуа Шолле, известный разработчик Keras и автор бенчмарка ARC-AGI, опубликовал в социальной сети X подробную дорожную карту развития своих тестов для оценки абстрактного мышления у искусственного интеллекта. В своём треде он также озвучил прогноз появления искусственного общего интеллекта (AGI) — ориентировочно в 2030 году.

Шолле сообщил, что следующая версия ARC-3 уже практически готова, на подходе ARC-4, которая выйдет в начале 2027 года, а в планах также версии ARC-5 и финальные ARC-6 либо ARC-7. Главная цель исследовательского проекта — создавать бенчмарки до тех пор, пока не останется задач, с которыми успешно справляется человек, но не справляется ИИ. По мнению автора, именно этот рубеж будет свидетельствовать о появлении AGI.

Отметим, что релиз треда совпал с анонсом Google DeepMind — обновленной модели Gemini 3 Deep Think. Эта система достигла 84,6% на ARC-AGI-2, что значительно превышает показатели лучших моделей во время запуска бенчмарка в марте 2025 года, которые находились на уровне 1–4%. Для сравнения средний результат группы из 400 человек составлял около 60%. Важно, что любая из задач ARC была решена как минимум одним человеком, что подчеркивает сложность тестов.

Франсуа Шолле уточнил, что изначально ARC-AGI не задумывался как тест для определения AGI, а представляет собой инструмент для исследований гибкого интеллекта (fluid intelligence). Он подчеркнул, что базовые языковые модели без адаптации во время теста по-прежнему показывают низкие результаты, несмотря на значительный рост вычислительных ресурсов с 2020 года — именно смена парадигмы от статических моделей к системам, «думающим» в процессе решения задач, обеспечила заметный прогресс.

В отношении влияния искусственного интеллекта на рынок труда Шолле выделил колл-центры как потенциальный индикатор приближающихся масштабных перестроек. В США сейчас около 2,75 миллиона рабочих мест в этом секторе, а мировой рынок вырос на 35% с 2016 года. По его мнению, существенное снижение занятости в этой сфере (на 50%) может стать сигналом массовых изменений в экономике. При этом эксперт не ожидает возникновения массовой безработицы из-за ИИ в ближайшие пять лет.

В ближайшее время ожидается запуск ARC-AGI-3 — первой версии бенчмарка с новым интерактивным форматом. В отличие от классических статических головоломок, этот тест представит более 1000 уровней в свыше 150 уникальных виртуальных мирах, напоминающих видеоигры. Здесь ИИ будет выполнять роль агента, которому предстоит самостоятельно исследовать правила, ставить цели, запоминать и планировать действия без каких-либо подсказок или инструкций. Основной метрикой станет не столько успешность решения задачи, сколько эффективность действий — количество шагов для достижения цели.

Tagged