Goldman Sachs: искусственному интеллекту не хватает новых данных Обложка: Skyread

Goldman Sachs: искусственному интеллекту не хватает новых данных

Новости
Главное:

  • ИИ исчерпал доступные для обучения данные из открытого интернета, что влияет на развитие новых моделей.
  • Разработчики обращаются к синтетическим данным, однако это может привести к снижению качества и эффективности ИИ.
  • Корпоративные данные рассматриваются как ключевой ресурс для дальнейшего совершенствования ИИ-технологий.

Директор по данным Goldman Sachs Нима Рафаэль заявил, что доступные для обучения искусственного интеллекта данные в интернете уже практически исчерпаны. По его словам, этот дефицит оказывает влияние на разработку новых решений в области ИИ, в частности, компании вынуждены переходить на использование синтетических данных — искусственно генерируемого контента, включая тексты, изображения и программный код. Такой подход теоретически предоставляет неограниченные ресурсы, однако существует риск ухудшения качества обучающих материалов, что потенциально снижает эффективность создаваемых моделей.

Рафаэль привёл в пример китайскую компанию DeepSeek, предположив, что разработчики зачастую обучают новые системы на основе уже существующих моделей, а не на принципиально новых данных. Это указывает на тенденцию, при которой предыдущие версии ИИ становятся основой для последующих, изменяя принципы и возможности их функционирования.

Несмотря на сложности с открытыми данными, эксперт отметил наличие значительных корпоративных информационных запасов, которые ещё не были полностью использованы. Goldman Sachs и другие организации обладают закрытыми наборами данных, способными значительно обогатить обучение и повысить ценность ИИ-инструментов в коммерческом использовании. Однако для этого необходим не только доступ к данным, но и глубокое понимание контекста, а также умение их эффективно структурировать и интегрировать в бизнес-процессы.

Ранее в этом году соучредитель OpenAI Илья Суцкевер уже обращал внимание на исчерпание полезных данных из интернета для обучения моделей, предупреждая о замедлении быстрого роста технологий ИИ. В связи с этим возникает важный вопрос о дальнейшем развитии отрасли, особенно в свете возрастания зависимости от синтетических данных и необходимости совершенствовать методы их использования.

Таким образом, эксперты видят переходный этап в развитии искусственного интеллекта: от опоры на общедоступные данные к акценту на закрытые корпоративные ресурсы и качественные подходы к генерации новых обучающих примеров, что может определить траекторию дальнейших инноваций в этой области.

Tagged