Google рассказал о методах работы Gemini в науке: нейро-символика и параллельное мышление Обложка: Skyread

Google рассказал о методах работы Gemini в науке: нейро-символика и параллельное мышление

Новости
Главное:

  • Google Research опубликовала крупный сборник кейсов по применению модели Gemini Deep Think в решении сложных научных задач.
  • Gemini помог доказать теоремы, опровергнуть гипотезы и усовершенствовать алгоритмы в таких областях, как теория информации, криптография и физика космических струн.
  • Важные методы работы модели включают итеративное уточнение, «кросс-опыление идей» и нейро-символические циклы с автоматическим исправлением ошибок.

Исследователи из Google Research совместно с учёными ведущих университетов, таких как CMU, MIT, Гарвард, EPFL и Стэнфорд, опубликовали 151-страничный сборник кейсов, в котором подробно описано использование модели Gemini Deep Think для решения различных научных задач. В опубликованной работе рассматриваются конкретные примеры, где Gemini выступала не просто как демонстрационный инструмент, а как полноценный соавтор, способствующий прогрессу в научных областях.

Среди достигнутых результатов — доказательство гипотезы Кортада-Кумара в теории информации, улучшение оценок для классической задачи Max-Cut, выведение аналитических спектров для космических струн и даже доказательство NP-трудности задачи Ratio Difference Maximization. Работа охватывает широкий спектр дисциплин: теоретическую информатику, криптографию, теорию игр, потоковые алгоритмы и оптимизацию.

Авторы выделяют несколько ключевых техник, применяемых в своих исследованиях с Gemini. Во-первых, итеративное уточнение через диалог с моделью, где исследователь корректирует её ошибки, что позволяет последовательно улучшать решение задачи. Во-вторых, «кросс-опыление идей» — способность модели находить неожиданные связи между отдалёнными областями науки, в частности связь между деревьями Штейнера и теоремой Киршбраума из функционального анализа. Наконец, нейро-символические циклы, при которых Gemini самостоятельно генерирует код для проверки гипотез, анализирует возникающие ошибки и без вмешательства человека корректирует программу.

Особое внимание уделяется роли модели в качестве строгого рецензента. В одном из примеров Gemini обнаружила критическую ошибку в свежем препринте по криптографии, касающемся построения SNARGs на основе LWE. Ошибка заключалась в несоответствии между формальным определением и практической конструкцией, что ускользнуло от человеческих рецензентов, но была выявлена благодаря протоколу итеративной самопроверки модели.

Исследователи подчеркивают, что все описанные методы доступны и в публичных версиях Gemini, хотя основные эксперименты проводились с использованием внутренней версии Deep Think, обладающей «параллельным мышлением» — способностью одновременно исследовать несколько ветвлений доказательств и решений, что значительно повышает продуктивность работы с комплексными научными задачами.

Опубликованная статья является своего рода методическим пособием для специалистов, желающих использовать большие языковые модели не как поисковые системы, а как равноправных научных партнёров в исследовательской деятельности.

Tagged