- Google тестирует ИИ-агента в Gemini App, аналогичного недавно запущенному ChatGPT Agent.
- Агент способен взаимодействовать с веб-сайтами и сервисами, имитируя действия человека, но пока находится на ранней стадии разработки.
- Режим Gemini 2.5 Computer Use доступен через API и ориентирован на работу в браузерах, с доработкой для интерфейсов операционных систем.
В сети появилась первая неофициальная демонстрация нового агентского режима в приложении Gemini от Google. Видео длится всего 14 секунд, поэтому делать окончательные выводы о возможностях технологии пока преждевременно. Однако, судя по описанию на экране, речь идет о функционале, весьма схожем с недавно представленным ChatGPT Agent.
Новый ИИ-агент способен выполнять задачи, взаимодействуя с веб-сайтами и онлайн-сервисами так же, как это сделал бы пользователь: изучать содержимое страниц, кликать по элементам управления и работать с аккаунтами, предоставленными ему для авторизации. При этом Google предупреждает, что на данный момент продукт является экспериментальным прототипом, и рекомендует пользователям внимательно следить за действиями агента, воздержаться от передачи ему конфиденциальных данных и взять на себя ответственность за возможные ошибки.
Ранее в этом месяце Google презентовала режим Gemini 2.5 Computer Use. Эта технология позволяет искусственному интеллекту работать непосредственно в интерфейсах веб-сайтов и приложений, при этом основной упор сделан на браузерную среду. Разработка поддержки работы агента в интерфейсах операционных систем еще продолжается. Текущий доступ к функции осуществляется через API, а демонстрируемый в Gemini App ИИ-агент, вероятно, является адаптацией данной технологии под веб и мобильные устройства.
Таким образом, Google движется в направлении создания универсального интеллектуального помощника, способного выполнять задачи в интернете самостоятельно, однако чтобы данная функция стала полноценно надежной и безопасной, предстоит пройти множество этапов доработки и тестирования.