Amazon анонсировала Trainium3 с выгодой до 50% по сравнению с Nvidia Обложка: Skyread

Amazon анонсировала Trainium3 с выгодой до 50% по сравнению с Nvidia

Новости
Главное:

  • Amazon Web Services представила 3-нм ИИ-чип Trainium3, превосходящий по соотношению цена/производительность GPU Nvidia до 50%.
  • Trainium3 демонстрирует рост производительности в 4,4 раза и улучшенную энергоэффективность по сравнению с предыдущим поколением Trainium2.
  • Компания также анонсировала Trainium4 с поддержкой NVIDIA NVLink Fusion и значительным приростом вычислительной мощности.

Amazon Web Services (AWS) объявила о выпуске нового собственного процессора для задач искусственного интеллекта — Trainium3. Этот ИИ-чип, выполненный по 3-нанометровой технологии, предлагает значительные преимущества в области производительности и стоимости по сравнению с современными графическими процессорами Nvidia из серии H200 (используемыми в инстансах P5e и P5en). По заявлению AWS, экономическая эффективность использования Trainium3 может достигать 50% по сравнению с GPU конкурента.

Trainium3 оснащён вычислительной мощностью 2,52 петафлопса для операций с плавающей запятой формата FP8, имеет 144 ГБ памяти HBM3e с пропускной способностью 4,9 ТБ/с. Один сервер UltraServer может включать до 144 таких чипов, что обеспечивает суммарную производительность до 362 петафлопс. Платформа масштабируется — кластер EC2 UltraClusters 3.0 способен объединять до миллиона ускорителей, что в десять раз превышает возможности предыдущего поколения Trainium2.

В сравнении с Trainium2 новый процессор демонстрирует 4,4-кратный прирост производительности, почти четырёхкратное увеличение пропускной способности памяти и существенное улучшение энергоэффективности. При тестировании с открытими моделями, например, OpenAI GPT-OSS, клиенты отметили в три раза более высокую пропускную способность на чип и четырёхкратное ускорение инференса (процесса вывода модели).

Партнёры AWS, такие как Anthropic, Ricoh и Decart, уже применяют Trainium3 для обучения и инференса моделей ИИ. Anthropic намерена использовать чип в новых версиях своей модели Claude. Стартап Decart сообщает о четырёхкратном ускорении генерации видео при затратах, составляющих половину стоимости операций на GPU. Некоторые клиенты достигают экономии в 50% на задачах обучения и использования моделей.

Кроме того, AWS анонсировала Trainium4 — следующее поколение процессоров, которое обещает как минимум трёхкратный прирост производительности в FP8 и шестикратный — в FP4. Важным нововведением станет поддержка NVIDIA NVLink Fusion, обеспечивающая совместную работу Trainium4 с GPU Nvidia в одной стойке, что позволит эффективно сочетать возможности двух архитектур.

Таким образом, AWS существенно расширяет своё предложение в области специализированных чипов для ИИ, ориентируясь на повышение производительности при снижении затрат для заказчиков. Новые процессоры Trainium3 и грядущий Trainium4 могут стать весомым конкурентом Nvidia в сегменте ускорения задач машинного обучения и искусственного интеллекта.

Tagged