Китайский чип LightGen формирует изображения в 100 раз быстрее Nvidia A100
Ученые из Китая разработали LightGen — оптический чип для генеративного ИИ. Он обрабатывает данные с помощью фотонов, без электричества.
ЧитатьУченые из Китая разработали LightGen — оптический чип для генеративного ИИ. Он обрабатывает данные с помощью фотонов, без электричества.
ЧитатьВидеомодель Kandinsky 5.0 Pro заняла 14-е место в рейтинге LMArena, что является лучшим показателем среди открытых моделей. Код доступен на GitHub.
Читать«Яндекс» запустил нейросетевой чат-бот на основе Alice AI, который предлагает пользователям книги по их запросам.
ЧитатьМодель Ranke-4B-1913 с предвзятостью предпочитает мужчин с одинаковой квалификацией. Она обучена только на текстах до 1913 года.
ЧитатьHuawei и ETH Zurich разработали модель WindowSeat для удаления отражений на фото, адаптированную для различных сценариев съёмки.
ЧитатьРазработчики llama.cpp внедрили режим router mode, позволяющий динамически управлять моделями без перезагрузки сервера.
ЧитатьМантан Гупта провел реверс-инжиниринг систем памяти ChatGPT и Claude, обнаружив разные подходы и отказ от RAG с векторными базами данных.
ЧитатьСтартап Starcloud впервые обучил языковую модель в космосе на спутнике Starcloud-1 с мощным GPU Nvidia H100. Модель отвечает в стиле Шекспира.
ЧитатьDeepSeek разрабатывает новую модель с использованием контрабандных чипов Nvidia Blackwell, запрещённых к экспорту в Китай.
ЧитатьMistral анонсировала две новые модели кодирования: Devstral 2 (123B параметров) и Devstral Small 2 (24B) с открытыми весами.
Читать