- OpenAI представила обновленный голосовой режим ChatGPT, доступный во всех подписках.
- Голосовой диалог теперь происходит прямо в чате с одновременной расшифровкой и возможностью использования виджетов и поиска картинок.
- Новый режим использует более простую модель для быстрого ответа, но для сложных задач рекомендуется переключаться на текстовый режим с GPT-5.1 Thinking.
Компания OpenAI анонсировала обновленную версию голосового режима в ChatGPT, которая стала доступна пользователям всех подписных планов. Отличительной особенностью нового интерфейса является способность вести голосовой диалог непосредственно в основном окне чата. Это позволяет пользователям видеть в реальном времени текстовую расшифровку разговора, а также получать расширенный функционал — модель может не только отвечать голосом, но и осуществлять поиск изображений и запускать различные виджеты.
В продемонстрированном примере искусственный интеллект использовал интеграцию с Google-картами: он указал популярные локации с высокими отзывами в выбранной пользователем области и затем предоставил информацию о меню одного из заведений. Такой подход значительно расширяет возможности голосового ассистента, делая его более интерактивным и удобным.
Новый голосовой режим активирован по умолчанию во всех версиях ChatGPT — как веб, так и мобильных приложениях. При необходимости пользователь может вернуть классический режим голосового ассистента, выбрав в настройках опцию «separate mode».
Важно отметить, что несмотря на визуальное единство, в голосовом режиме применяется более легкая модель искусственного интеллекта (вероятно, одна из версий GPT-4o). Она оптимизирована для поддержания непринужденного диалога и оперативного поиска информации, однако при выполнении сложных и серьезных задач её возможности могут быть ограничены. В таких случаях рекомендуется переключаться обратно в текстовый режим с активированным GPT-5.1 Thinking, где реализованы улучшенные алгоритмы для глубинного анализа и генерации ответов.
Таким образом, обновление голосового режима ChatGPT демонстрирует стремление OpenAI к более удобному и многофункциональному взаимодействию с пользователями, интегрируя голосовые технологии и расширенные сервисы в единую платформу.
