- Google представила предварительную версию голосового помощника на базе Gemini 2.5 Flash с нативной поддержкой аудио.
- Модель обеспечивает более естественное взаимодействие благодаря снижению задержек, улучшенному распознаванию голоса и адаптации к эмоциям пользователя.
- Доступ к экспериментальной версии доступен на платформе Google AI Studio, сроки релиза в других сервисах пока не объявлены.
Компания Google анонсировала предварительную версию нового голосового помощника, построенного на базе модели Gemini 2.5 Flash. Основным новшеством стала нативная поддержка аудио, что позволяет системе обрабатывать голос напрямую, без промежуточного преобразования речи в текст. Это нововведение призвано значительно уменьшить задержки в диалогах, повысить качество голоса помощника, делая его звучание максимально близким к человеческому.
Разработчики уделили особое внимание естественности взаимодействия: голосовой ассистент теперь реже перебивает пользователя, но при этом быстро завершает свою реплику, если собеседник начинает говорить. Такая динамика сделала общение более плавным и комфортным. Кроме того, улучшилась точность распознавания речи в шумной среде или при наличии фоновых голосов, что существенно расширяет возможности использования помощника в реальных условиях.
В обновленном решении усовершенствована интеграция с функциями устройства: например, удобно и быстро реализовано добавление событий в календарь по голосовой команде. Новая версия также обеспечивает бесшовное переключение между языками в процессе диалога, что упрощает использование помощника для многословных пользователей.
Примечательной особенностью Gemini 2.5 Flash стало распознавание эмоций пользователя. Голосовой ассистент способен подстраивать интонацию и стиль ответов, учитывая настроение собеседника, что открывает новый уровень персонализации общения с искусственным интеллектом.
Желающие опробовать возможности модели могут сделать это на экспериментальном ресурсе Google AI Studio в разделе Stream. Информация о дате релиза Gemini 2.5 Flash в официальных приложениях, включая Gemini App и другие сервисы Google, будет объявлена дополнительно.