- «Яндекс» совместно с Институтом востоковедения РАН разработали ИИ-помощника для ускоренного анализа научных данных на восточных языках.
- Помощник способен обрабатывать до 1000 источников в день, сокращая время анализа с нескольких часов до 10–15 минут.
- На данный момент база включает свыше 1,5 млн документов на четырёх вариантах китайского языка, планируется расширение на другие восточные языки.
Компания «Яндекс» вместе с Институтом востоковедения РАН представили инновационный искусственный интеллект, разработанный для помощи исследователям в обработке и анализе научной информации на восточных языках. Новый ИИ-помощник существенно ускоряет работу с первоисточниками стран Азии, Африки и Ближнего Востока, позволяя обработать до тысячи текстов в сутки вместо прежних 8–10, что в сотни раз повышает эффективность научного анализа.
Современные вызовы, связанные с ограниченным доступом к оригинальным источникам и публикациям, которые часто бывают доступны только на национальных языках и редко переводятся, существенно осложняют изучение событий и культурного контекста. Нередко академические исследования страдают от неполноты информации и перевода, поэтому новый инструмент призван устранить эту проблему, предоставляя более точные и оперативные данные для учёных.
ИИ-помощник основан на платформе Yandex AI Studio и умеет не просто обрабатывать тексты, но и выделять ключевые факты, формируя краткие аналитические сводки. Кроме того, он анализирует публикации в китайских СМИ и генерирует русскоязычные обзоры, что помогает исследователям оперативно ориентироваться в последних событиях региона. В обучении модели участвовали специалисты Yandex Cloud и студенты Школы анализа данных.
По словам старшего научного сотрудника Института востоковедения Александра Костыркина, внедрение искусственного интеллекта позволило сократить время поиска и анализа материалов на восточных языках в 6–8 раз, повысив глубину и качество исследований. Наполнение базы ИИ-помощника произошло за счёт архива института, включающего более 1,5 миллиона документов, охватывающих четыре варианта китайского языка — континентальный, тайваньский, гонконгский и сингапурский.
Директор по национальным и стратегическим проектам Yandex Cloud Анна Лемякина подчёркивает, что работа с первоисточниками является ключевой для достоверного понимания культурного и исторического контекста исследуемых регионов. Цель компании — обеспечить доступ учёных к ранее труднодоступным материалам и расширить их аналитические возможности с помощью современных технологий.
В свою очередь директор Института востоковедения РАН, доктор исторических наук Аликбер Аликберов, рассказал о масштабной цифровой трансформации института, основой которой стала интеграция ИИ-технологий для более эффективного изучения восточных материалов. В планах разработчиков — расширение языковой поддержки помощника, включающее японский, арабский, турецкий, персидский и другие восточные языки, что позволит российским исследователям получать непосредственный доступ к уникальным корпусам знаний и первоисточникам.
Таким образом, сотрудничество «Яндекса» и Института востоковедения РАН открывает новые перспективы в области научных исследований, обеспечивая учёным мощный и удобный инструмент для работы с разнообразными материалами на восточных языках, что способствует более глубокому и многогранному пониманию сложных региональных процессов.
