Tencent представила HY3D-Bench — датасет на 22 ТБ для 3D-моделей Обложка: Skyread

Tencent представила HY3D-Bench — датасет на 22 ТБ для 3D-моделей

Новости
Главное:

  • Tencent выпустила датасет HY3D-Bench объёмом около 22 ТБ для обучения моделей генерации и реконструкции 3D-объектов.
  • Набор данных состоит из трёх частей: полноценных моделей, разделённых на составляющие объектов и синтетических данных, охватывающих редкие категории предметов.
  • На базе датасета разработана облегчённая модель Hunyuan3D-2.1-Small, доступная вместе с документацией на Hugging Face и GitHub.

Китайская компания Tencent представила крупный открытый датасет HY3D-Bench, предназначенный для обучения и тестирования алгоритмов генерации и реконструкции трёхмерных моделей. Общий объём данных составляет около 22 ТБ, что подчёркивает масштаб поставленной задачи и позволяет работать с разнообразными и комплексными 3D-объектами.

HY3D-Bench включает три ключевые части. Первая — Full-level dataset, содержащая более 250 тысяч объектов (примерно 11 ТБ). Эти объекты представлены в виде замкнутых мешей, тщательно очищенных и нормализованных для минимизации артефактов, часто возникающих при 3D-сканировании. Вторая часть — Part-level dataset с более чем 240 тысячами объектов (около 5 ТБ), в которых модели разбиты на составные части с рендерами их итоговой сборки. Третья часть — Synthetic dataset, включающая свыше 125 тысяч синтетических объектов (приблизительно 6,5 ТБ), охватывающих редкие категории предметов — всего 1252 категории.

Для демонстрации и практического использования HY3D-Bench инженеры Tencent создали модель Hunyuan3D-2.1-Small. Эта облегчённая версия модели Hunyuan3D 2.1 способна генерировать 3D-объекты на основе изображений и может служить базой для более сложных решений в области трёхмерной генерации.

Датасет доступен для загрузки на платформе Hugging Face, а подробная документация и модель опубликованы на GitHub. Более глубокий технический разбор процесса сбора и подготовки данных представлен в научной статье компании на arXiv. Новое предложение Tencent представляет значительный интерес для исследователей и разработчиков в области компьютерного зрения, 3D-моделирования и искусственного интеллекта, предоставляя уникальный обширный ресурс для обучения и тестирования современных нейросетевых моделей.

Tagged