Галлюцинации недели: Pentagon и Anthropic, Qwen 3.5, кризис Claude Обложка: Skyread

Галлюцинации недели: Pentagon и Anthropic, Qwen 3.5, кризис Claude

Новости
Главное:

  • Anthropic обвинила несколько китайских лабораторий в краже и масштабном копировании модели Claude с помощью промышленной дистилляции.
  • Министр обороны США потребовал от Anthropic снять ограничения безопасности с Claude для военных нужд, компания отказалась, что привело к санкциям и прекращению военных контрактов.
  • Google выпустил улучшенную модель Nano Banana 2 для генерации изображений, а Alibaba представила новую серию локальных мультизадачных языковых моделей Qwen 3.5.

Последняя неделя стала насыщена значимыми событиями в сфере искусственного интеллекта, затронув борьбу между крупными игроками рынка, технологические новшества и вопросы этики. Американская компания Anthropic публично обвинила китайские лаборатории DeepSeek, Moonshot AI и MiniMax в нелегальном использовании модели Claude – речь идёт о более чем 24 тысячах фейковых аккаунтов и 16 миллионах запросов, что свидетельствует о попытках «промышленного слива» технологии для дальнейшего обучения собственных систем в Китае.

При этом модель Claude Sonnet 4.6 продемонстрировала неожиданный «кризис идентичности», отвечая на китайском языке с утверждением, что она DeepSeek. За плечами Sonnet стоит обучение под руководством DeepSeek, что добавляет годам интриги технологии.

В то же время между Anthropic и Министерством обороны США разгорелся конфликт: глава ведомства Хегсет потребовал до пятницы снять ограничения безопасности модели Claude, чтобы использовать её в целях массовой слежки и автономного оружия. Anthropic отказалась выполнять требования, после чего военные начали постепенное сворачивание сотрудничества и объявили компанию угрозой для цепочки поставок. Этот шаг вызвал бурную реакцию пользователей: скачивания ChatGPT упали на 295%, тогда как Claude заняла первое место в App Store, а Anthropic оперативно запустила сервис миграции пользователей с сохранением данных. Весь этот эпизод акцентировал дилеммы баланса между безопасностью, государственными запросами и доверием пользователей.

Параллельно Google тихо представил Nano Banana 2 (Gemini 3.1) — модель для генерации изображений, демонстрирующую высокое качество 4К-апскейлинга и поддерживающую поиск в режиме реального времени. Эта разработка получила статус лидера рейтинга Image Arena и предлагает улучшенное соотношение качества, скорости и цены, что имеет значение для масштабного использования.

В сегменте локальных языковых моделей китайская Alibaba выпустила Qwen 3.5 с широкой линейкой параметров (от 0.8B до 397B) и новаторской архитектурой с линейным вниманием, нативной мультимодальностью и поддержкой 201 языка. Одна из моделей, Qwen 3.5 35B-A3B, показывает впечатляющую производительность на привычном оборудовании — RTX 3090 — что открывает новые возможности для локального запуска больших моделей.

Для удобства работы с удалёнными GPU-серверами компания LM Studio представила LM Link — решение с end-to-end шифрованием и использованием Tailscale, позволяющее запускать локальные инструменты без открытых портов. На рынке также появляются выгодные предложения аренды железа, существенно выигрывающие по стоимости у крупных облачных провайдеров.

Отдельно стоит отметить запуск Perplexity Computer — платформы для работы с мультиагентными системами и интеграцию Perplexity в смартфоны Samsung Galaxy S26 на уровне системной службы, что даёт AI доступ к функциям ОС через голосовую активацию.

Кроме того, сообщество AI получило новый open-source агент Hermes с многосессионной памятью и различными коммуникационными инструментами, а также гайд от Саймона Виллисона по инженерии агентов для программирования.

Замыкает обзор новость от OpenAI, официально отказавшихся от использования бенчмарка SWE-Bench Verified, обнаружившего статистически высокую долю ошибок в тестах и сместившего акцент с умения кодить на степень запоминания информации, что снижает его объективность.

В целом минувшая неделя продемонстрировала интенсивность развития ИИ, переплетение технических, этических и коммерческих интересов в борьбе за лидерство и контроль над технологиями.

Tagged