- Появился open-source инструмент Skill Seekers для преобразования видеоуроков в структурированные знания.
- Skill Seekers способен извлекать транскрипты, распознавать текст с экранов, обрабатывать сложные скринкасты и формировать файл SKILL.md.
- Результат можно экспортировать сразу в 16 различных форматов и платформ, включая Claude, Gemini и OpenAI.
Экспертное сообщество в сфере искусственного интеллекта отметило появление нового мощного инструмента под названием Skill Seekers — open-source решения, которое значительно упрощает процесс преобразования образовательных видео в структурированные данные для ИИ-платформ. Данный проект доступен на сайте skillseekersweb.com и в репозитории GitHub.
Недавнее обновление до версии 3.2.0 расширило функциональность инструмента, теперь он поддерживает работу с видеоматериалами с YouTube, Vimeo, а также с локальными файлами. Помимо ранее реализованной обработки документаций, PDF и GitHub-репозиториев, Skill Seekers способен автоматически извлекать транскрипты из видео, используя встроенную технологию Whisper для расширенного распознавания речи. Кроме того, инструмент анализирует видео по кадрам, использует OCR для выделения текстов с экранов, включая панели IDE, что позволяет извлекать даже сложные команды и примеры кодов с уроков.
Процесс очищения текстовых данных реализован через двухступенчатое AI-улучшение, что обеспечивает высокое качество получаемого контента. Все сведения упорядочиваются в файле SKILL.md — специальном формате, удобном для дальнейшего использования и адаптации под разные ИИ-платформы. Этот файл можно экспортировать в 16 различных форматов, что обеспечивает совместимость с такими сервисами, как Claude, Gemini, OpenAI, а также множеством RAG-пайплайнов и AI-coding ассистентов.
С точки зрения оптимизации рабочего процесса это решение позволяет существенно экономить время, избавляя специалистов от необходимости вручную переписывать код с видео, улавливать сложные команды из терминала или многократно переслушивать уроки для корректного понимания материала. Skill Seekers распространяется по MIT-лицензии и устанавливается через пакетный менеджер pip. При этом, чтобы активировать видеофункции, требуется установка дополнительных модулей skill-seekers или skill-seekers[video-full], включающих Whisper и средства визуального анализа кадров.
