Нейросеть Карпати впервые обучили в космосе на произведениях Шекспира Обложка: Skyread

Нейросеть Карпати впервые обучили в космосе на произведениях Шекспира

Новости
Главное:

  • Стартап Starcloud впервые провел полный цикл обучения языковой модели в космосе на орбитальном спутнике.
  • В качестве тренировочного набора использовались произведения Шекспира, после чего модель отвечает в стиле елизаветинской эпохи.
  • На борту спутника также запущена модель Gemma от Google DeepMind, подтвердившая устойчивость открытых ИИ-моделей в космических условиях.

Компания Starcloud сделала прорыв в области космических вычислений, впервые полностью обучив языковую модель искусственного интеллекта на орбите Земли. Аппарат Starcloud-1, оснащённый мощным графическим процессором Nvidia H100, который в сто раз превосходит производительность любых предыдущих космических чипов, стал платформой для тренировки nanoGPT — минималистской реализации GPT, разработанной Андреем Карпати, бывшим главой AI в Tesla и одним из основателей OpenAI. Обучение проходило на базе полного собрания произведений Уильяма Шекспира, что позволило модели общаться в духе елизаветинской эпохи.

Одновременно на спутнике запустили открытую модель Gemma от Google DeepMind. Её первое сообщение было обращено к человечеству с приветствием: «Приветствую, земляне! Или, как я предпочитаю о вас думать, — удивительное собрание синего и зелёного». Трис Варкентин, продакт-директор DeepMind, подчеркнул, что успешная работа модели в суровых условиях космоса подтверждает надежность и адаптивность открытых ИИ систем.

Следует отметить, что языковые модели ранее уже запускались в космос. Например, на Международной космической станции работал Space Llama от Booz Allen и HPE для поддержки астронавтов, а на китайской космической станции действует ассистент «Укун». Однако все эти модели обучались на Земле и в космос попадали уже в готовом виде. В отличие от них Starcloud впервые осуществил полный цикл обучения непосредственно на орбите.

Инициатива стартапа обусловлена перспективами орбитальных дата-центров, которые смогут использовать преимущества постоянного солнечного освещения, естественного охлаждения без воды и отсутствия необходимости в сложных административных согласованиях. С ростом числа научных миссий в космосе, становится актуальной обработка данных непосредственно на месте их сбора. Starcloud ставит целью построить к началу 2030-х масштабный орбитальный центр мощностью 5 гигаватт с солнечными панелями площадью 4×4 километра.

Спутник Starcloud-1 был запущен 2 ноября 2025 года ракетой SpaceX, а следующий запуск запланирован на октябрь 2026-го с новыми процессорами Nvidia Blackwell и несколькими GPU H100. Данный проект открывает новые горизонты в развитии космического искусственного интеллекта и вычислительных мощностей за пределами Земли.

Tagged