Исследование ИИ поставило под вопрос теории человеческого сознания

Главное:

Исследователь Инь Цзюнь Пхуа создал ИИ-агентов, моделирующих три ведущие теории сознания: GWT, HOT и IIT.
Эксперименты показали, что модули самомониторинга и глобального рабочего пространства играют ключевые роли, а их отсутствие снижает качество оценки уверенности и доступ к информации.
Оказалось, что архитектура GWT уязвима к шуму, а нейробиологические метрики сознания, применяемые к ИИ, могут давать обратный эффект.

В Токийском институте науки исследователь Инь Цзюнь Пхуа провёл серию экспериментов с искусственными интеллектами, построенными на основе трёх ключевых теорий сознания: теории глобального рабочего пространства (GWT), теории высшего порядка (HOT) и теории интегрированной информации (IIT). Целью работы было исследование функциональных ролей этих теорий через модели ИИ-агентов, которые позволяют наблюдать и модифицировать каждый элемент их архитектуры — возможность, недоступную для изучения живого мозга.

В первом эксперименте Пхуа проверил гипотезу HOT о необходимости самомониторинга для сознания. Отключение модуля «Я-модели» у агента не повлияло на успешность выполнения задач (оставалась 88%), однако полностью разрушило способность агента адекватно оценивать свою уверенность. Результат напоминает феномен слепозрения у людей, когда выборы верны, но осознанного восприятия нет.

Во втором эксперименте изучалась теория GWT — идея о том, что сознание возникает через единое рабочее пространство, в которое транслируется информация из разных модулей мозга. Агенту было поручено запомнить и воспроизвести два сигнала, поступающих исключительно через «шину» рабочего пространства. При полном объёме шины точность достигла 99,5%, при уменьшении – резко падала, а при полном отключении шины – пада до нуля. Это показало, что рабочее пространство не просто полезно, а критически важно для доступа к информации.

Третий эксперимент выявил парадоксальную уязвимость архитектуры GWT к шуму. Несмотря на интуитивное предположение, что трансляция информации многим модулям должна повышать устойчивость, оказалось наоборот: шум усиливался и распространялся по всей системе, снижая точность с 100% до 75% при 4% шуме. В то же время агент с модулем самомониторинга выдерживал до 50% шума без существенных потерь, так как данный модуль функционирует как фильтр, устраняющий помехи до их распространения.

Также исследователь применил методику измерения индекса пертурбационной сложности (PCI), используемую в нейронауке для оценки сознания пациентов в коме. В отличие от ожиданий, архитектура GWT с её узким «рабочим пространством» показала снижение сложности реакций на возмущения, что свидетельствует о том, что нейробиологические метрики нельзя напрямую переносить на искусственные системы без учёта особенностей их архитектуры.

В итоге работа демонстрирует, что три основные теории сознания не конкурируют, а дополняют друг друга, представляя разные функциональные уровни: GWT отвечает за трансляцию информации между модулями, HOT — за контроль качества этой трансляции. Отдельно ни одна из систем не обеспечивает устойчивое поведение. Для практики создания ИИ, особенно в областях с высокими требованиями к безопасности, это означает, что отсутствие метакогнитивной оценки собственной уверенности робота или автомата критично снижает надёжность и безопасность его решений.