Top.Mail.Ru
  • Новинки
  • Эксклюзив
  • Хиты продаж
  • Акции
  • Сделано Apple
  • Рекомендуем
  • Novelizer
  • Для взрослых
  • Борьба с огнём
  • PREMIUM товары
  • Поиск по тегам
  • Статьи iG-Life

Gemini 2.5 от Google управляет браузером как человек — и делает это лучше

Обновлено 13.10.2025 в 10:00
12 октября 2025
Юрий Попович

Представьте: вы просите ИИ найти лучшие ноутбуки для работы, и через несколько секунд ваш браузер сам открывает сайты, кликает по ссылкам и заполняет формы. Это не сценарий из научной фантастики — это Gemini 2.5 Computer Use от Google. Теперь искусственный интеллект не просто отвечает, он действует как реальный пользователь компьютера.

ИИ впервые берёт управление в руки

Google представил Gemini 2.5 Computer Use — инструмент, позволяющий модели взаимодействовать с интерфейсом браузера. ИИ может кликать, вводить текст, скроллить и даже выполнять действия в мобильных приложениях.

Пока система доступна в режиме предварительного тестирования через Gemini API и Vertex AI, но Google подчёркивает: модель оптимизирована именно для браузеров, а не для управления всей операционной системой. По сути, это первый шаг к созданию цифрового помощника, который «понимает экран» так же, как человек.

По данным SiliconAngle, Gemini уже способна выполнять до тринадцати базовых действий — от кликов до перетаскивания элементов.

Как это работает внутри

Чтобы понять, как это возможно, нужно заглянуть под капот. Computer Use действует пошагово: получает снимок экрана, анализирует его, выбирает следующее действие и выполняет его, снова обновляя изображение. Этот процесс повторяется до тех пор, пока цель не достигнута.

Так ИИ превращается в «оператора», который способен решать длинные цепочки задач без участия человека. Google отмечает, что новая версия показывает минимальную задержку отклика — около 225 мс и опережает конкурентов по точности.

“Использование компьютера Gemini 2.5 превосходит ведущие аналоги по многим показателям веб-контроля и мобильного управления, и все это с меньшей задержкой” — заявили в Google DeepMind.

Сравнение с человеком: кто быстрее и точнее

Но насколько хорошо система справляется в реальности? В тестах Gemini 2.5 выполняла офисные и браузерные задачи быстрее человека в сценариях, где интерфейс оставался стандартным. В простых действиях — вход на сайты, поиск, заполнение форм — ИИ был точнее и стабильнее.

Однако в обзоре Sider AI подчёркивается, что в непредвиденных ситуациях всё ещё нужен человек:

“Когда появляются всплывающие окна или нестандартные элементы, агент ‘спотыкается’ и требует ручной помощи”.

Тем не менее, в повторяющихся процессах без доступа к API модель работает почти безошибочно и может взаимодействовать с сайтами напрямую.

Где проходит граница контроля

Скорость впечатляет, но не без последствий. Чем умнее становится ИИ, тем важнее контроль и безопасность.

Google предупреждает: Computer Use — экспериментальная технология, её нельзя применять в сценариях с конфиденциальными данными без надзора. Разработчики могут задавать исключения — например, запрет на покупки или изменение паролей.

Пользователи на Reddit подтверждают: ИИ действительно запрашивает подтверждение перед «рискованными» шагами, такими как оплата или авторизация. Это делает систему чуть медленнее, но значительно безопаснее.

Конкуренция с OpenAI: гонка интерфейсов

И всё это происходит на фоне новой технологической гонки. OpenAI обучает ChatGPT выполнять действия в приложениях, а Google идёт дальше — учит ИИ «понимать экран».

“Исследователи DeepMind утверждают, что он в первую очередь оптимизирован для веб-браузеров и уже превзошел аналоги в тестах Android” — пишет SiliconAngle.

Некоторые разработчики на Hacker News скептичны:

Это отличная игрушка, но слишком медленная для практического управления браузером”.

Тем не менее, очевидно одно — Google стремится создать ИИ, который не только понимает команды, но и действительно действует на экране.

Когда ИИ станет вашим напарником

Всё указывает на то, что это только начало. Сегодня Computer Use ограничен браузером, но вскоре может интегрироваться с Chrome OS, Android и офисными инструментами. Это откроет путь к полноценной автоматизации повседневных задач.

Согласно исследованию Human-Centric Evaluation for Foundation Models (2025), Gemini 2.5 показал высокий уровень взаимодействия с пользователями, хотя по интуитивности пока уступает лучшим решениям.

Gemini 2.5 — не просто шаг вперёд, а новая форма партнёрства между человеком и машиной. Возможно, скоро вы не будете искать, писать и клиckать — ИИ сделает это вместо вас.

В тренде 🔥
Windows 10 уходит завтра: миллионы компьютеров останутся без защиты
Завтра заканчивается целая эпоха — Windows 10, операционная система, с которой многие начали свой цифровой путь.
Генетика встречает ИИ: нейросеть из России раскрывает тайны ДНК
Нейросеть, разработанная в России, способна считывать код ДНК. В теории, это поможет в лечении серьезных заболеваний.
Геомагнитная буря накрыла Землю: почему всё спокойно, но техника может сбиться
Ночь перед бурей выдалась обманчиво тихой. Никаких сияний, ни вспышек на небе — будто само Солнце решило сделать паузу.
Россия побила рекорд по продажам планшетов — а в мире спрос падает
Парадокс года: Россия в росте, мир в спаде
Android 16 пришёл на Galaxy S23: фишки, о которых мало кто знает
Android 16 наконец доступен на Galaxy 23. Рассказываем о самых интересных фишках обновления.
Бот Роскомнадзора стал админом Telegram-каналов: контроль изнутри
С 4 октября 2025 года Telegram в России перестал быть прежним
Можно ли платить новым смарт-кольцом от Сбера: разбираемся в вопросе
Смарт-кольцо от Сбера буквально взорвало СМИ. Об основных функциях устройства сказано многое, но можно ли им оплачивать покупки?
Въехал в Россию — и интернет пропал: что происходит с иностранными SIM
Пропажа связи сразу после границы — массовая неожиданность
Ai-функции Apple Intelligence в iOS 26: как включить в РФ и что ограничено?
К сожалению, Ai-функции в новом iOS 26 ограничены для россиян. Как же решить эту проблему?
РЖД открыли продажи новогодних поездов: где ещё остались билеты
Встречаем Новый год на рельсах: почему это стало традицией
Хотите видеть меньше сообщений? Зарегистрируйтесь или войдите в аккаунт