- В приложении Codex и его командной строке (CLI) от OpenAI появилась функция голосовой транскрибации.
- В приложении активация происходит по кнопке микрофона или сочетанию Ctrl + M, в CLI — через настройку voice_transcription и удержание пробела.
- Функция доступна сразу всем пользователям без поэтапного запуска, в отличие от аналогичной у Anthropic.
OpenAI оперативно внедрила голосовой режим в своё приложение Codex и командную строку (CLI), предоставив пользователям возможность диктовать текст вместо ручного ввода. Эта новация появилась менее чем через сутки после анонса аналогичной функции от Anthropic, что свидетельствует о динамичном развитии инструментов для программистов с возможностями искусственного интеллекта.
В Codex App активация голосовой транскрибации реализована весьма интуитивно: достаточно нажать кнопку с иконкой микрофона или использовать сочетание клавиш Ctrl + M, после чего произнести необходимый текст, который автоматически вставится в поле ввода. Такой функционал позволяет значительно ускорить процесс написания кода или комментариев, повышая удобство и эффективность работы.
Для пользователей командной строки CLI включение голосового режима требует ручной настройки файла конфигурации — в разделе [features] файла ~/.codex/config.toml нужно добавить параметр voice_transcription = true. Затем, находясь в режиме composer, удерживать пробел, диктовать текст и отпускать клавишу — транскрибированный текст вставится в текущее место курсора.
Отмечается, что в отличие от конкурентов, в частности Claude Code от Anthropic, функция голосовой транскрибации у Codex была выпущена массово сразу для всех пользователей, без поэтапного ограниченного доступа. Такой подход демонстрирует стремление OpenAI сделать инновационные возможности доступными в максимально короткие сроки.
Данная новинка открывает дополнительные перспективы для разработчиков, желающих интегрировать современные технологии распознавания речи в повседневные рабочие процессы, снижая время на ввод кода и увеличивая продуктивность.
