Top.Mail.Ru
  • Новинки
  • Эксклюзив
  • Хиты продаж
  • Акции
  • Сделано Apple
  • Рекомендуем
  • Novelizer
  • Для взрослых
  • PREMIUM товары
  • Поиск по тегам
  • Статьи iG-Life
В каталог Публикации

Gemini 2.5 от Google управляет браузером как человек — и делает это лучше

Представьте: вы просите ИИ найти лучшие ноутбуки для работы, и через несколько секунд ваш браузер сам открывает сайты, кликает по ссылкам и заполняет формы. Это не сценарий из научной фантастики — это Gemini 2.5 Computer Use от Google. Теперь искусственный интеллект не просто отвечает, он действует как реальный пользователь компьютера.

ИИ впервые берёт управление в руки

Google представил Gemini 2.5 Computer Use — инструмент, позволяющий модели взаимодействовать с интерфейсом браузера. ИИ может кликать, вводить текст, скроллить и даже выполнять действия в мобильных приложениях.

Пока система доступна в режиме предварительного тестирования через Gemini API и Vertex AI, но Google подчёркивает: модель оптимизирована именно для браузеров, а не для управления всей операционной системой. По сути, это первый шаг к созданию цифрового помощника, который «понимает экран» так же, как человек.

По данным SiliconAngle, Gemini уже способна выполнять до тринадцати базовых действий — от кликов до перетаскивания элементов.

Как это работает внутри

Чтобы понять, как это возможно, нужно заглянуть под капот. Computer Use действует пошагово: получает снимок экрана, анализирует его, выбирает следующее действие и выполняет его, снова обновляя изображение. Этот процесс повторяется до тех пор, пока цель не достигнута.

Так ИИ превращается в «оператора», который способен решать длинные цепочки задач без участия человека. Google отмечает, что новая версия показывает минимальную задержку отклика — около 225 мс и опережает конкурентов по точности.

“Использование компьютера Gemini 2.5 превосходит ведущие аналоги по многим показателям веб-контроля и мобильного управления, и все это с меньшей задержкой” — заявили в Google DeepMind.

Сравнение с человеком: кто быстрее и точнее

Но насколько хорошо система справляется в реальности? В тестах Gemini 2.5 выполняла офисные и браузерные задачи быстрее человека в сценариях, где интерфейс оставался стандартным. В простых действиях — вход на сайты, поиск, заполнение форм — ИИ был точнее и стабильнее.

Однако в обзоре Sider AI подчёркивается, что в непредвиденных ситуациях всё ещё нужен человек:

“Когда появляются всплывающие окна или нестандартные элементы, агент ‘спотыкается’ и требует ручной помощи”.

Тем не менее, в повторяющихся процессах без доступа к API модель работает почти безошибочно и может взаимодействовать с сайтами напрямую.

Где проходит граница контроля

Скорость впечатляет, но не без последствий. Чем умнее становится ИИ, тем важнее контроль и безопасность.

Google предупреждает: Computer Use — экспериментальная технология, её нельзя применять в сценариях с конфиденциальными данными без надзора. Разработчики могут задавать исключения — например, запрет на покупки или изменение паролей.

Пользователи на Reddit подтверждают: ИИ действительно запрашивает подтверждение перед «рискованными» шагами, такими как оплата или авторизация. Это делает систему чуть медленнее, но значительно безопаснее.

Конкуренция с OpenAI: гонка интерфейсов

И всё это происходит на фоне новой технологической гонки. OpenAI обучает ChatGPT выполнять действия в приложениях, а Google идёт дальше — учит ИИ «понимать экран».

“Исследователи DeepMind утверждают, что он в первую очередь оптимизирован для веб-браузеров и уже превзошел аналоги в тестах Android” — пишет SiliconAngle.

Некоторые разработчики на Hacker News скептичны:

Это отличная игрушка, но слишком медленная для практического управления браузером”.

Тем не менее, очевидно одно — Google стремится создать ИИ, который не только понимает команды, но и действительно действует на экране.

Когда ИИ станет вашим напарником

Всё указывает на то, что это только начало. Сегодня Computer Use ограничен браузером, но вскоре может интегрироваться с Chrome OS, Android и офисными инструментами. Это откроет путь к полноценной автоматизации повседневных задач.

Согласно исследованию Human-Centric Evaluation for Foundation Models (2025), Gemini 2.5 показал высокий уровень взаимодействия с пользователями, хотя по интуитивности пока уступает лучшим решениям.

Gemini 2.5 — не просто шаг вперёд, а новая форма партнёрства между человеком и машиной. Возможно, скоро вы не будете искать, писать и клиckать — ИИ сделает это вместо вас.

Подпишись на наш Telegram Подпишись на наш Telegram
В тренде 🔥
Складной, а воды не боится! Honor Magic V6 получил IP69, 7 000 мАч и камеру на 200 Мп
Honor Magic V6 станет первым складным смартфоном с сертификацией IP69 — защитой от горячей воды под давлением. Презентация — 1 марта на MWC в Барселоне.
OnePlus 15T: 7 500 мАч в корпусе 6,32" — рекорд для компактного флагмана
OnePlus подтвердила компактный флагман 15T с батареей больше, чем у старшего OnePlus 15, и топовым чипом Snapdragon 8 Elite Gen 5.
Nothing Phone (4a) Pro: Snap 8 Gen 3, 144 Гц и никакого флагмана в 2026 году
Nothing отказалась от выпуска флагмана Phone 4 и сделала ставку на Phone (4a) Pro с прошлогодним флагманским чипом, 144 Гц и прозрачным корпусом за ~€500.
Конец эпохи 3G: МТС отключает сеть в 2026 — кому пора менять телефон
МТС ускоряет отключение 3G — большинство базовых станций выключат уже в 2026 году. Разбираемся, кого это затронет и что делать.
Складной без складки: Oppo Find N6 с экраном 8,12" и Snap 8 Elite заменит отменённый OnePlus Open 2
Oppo показала тизер Find N6 с «невидимой складкой» и экраном 8,12". Складной выходит 17 марта и заменит отменённый OnePlus Open 2.
Битва середняков: сравниваем OnePlus 15T и Nothing (4a) Pro
OnePlus 15T и Nothing Phone (4a) Pro выходят в марте с противоположными ставками: один — компактный флагман с рекордной батареей, другой — дизайнерский среднебюджетник без флагмана в линейке.
Galaxy S26 стартует от 95 тыс. ₽: цены ниже S25, но ввоз в Россию усложнился
Цены Galaxy S26 в России оказались ниже прошлогодних S25, но приостановка 16 000 сертификатов параллельного импорта может осложнить покупку на старте.
Как Xiaomi засунула кремний-углеродную батарею в пауэрбанк толщиной всего 6 мм?
Xiaomi выпускает магнитный пауэрбанк толщиной 6 мм и весом 98 г — с той же технологией батареи, что в смартфонах с рекордной автономностью.
Galaxy S26 Ultra за 140 000 ₽ или iPhone 17 Pro Max за 123 000 ₽: что выгоднее в России
Samsung Galaxy S26 Ultra стартует от 139 990 ₽, а iPhone 17 Pro Max уже упал до 123 000 ₽ — разбираем, кто выигрывает по спекам, цене и перспективам.
Почему новый флагман HONOR Magic 8 Pro оказался на 20 000 ₽ дешевле предшественника?
Флагман с камерой из топ-10 DxOMark, батареей 7100 мА·ч и топовым чипом — на 20 тысяч рублей дешевле, чем Magic 7 Pro на старте в прошлом году
Не ставьте смартфон на беспроводную зарядку ночью
Неожиданное предупреждение инженеров
Как смотрят презентацию нового iPhone в Китае?
Было "яблоко", а стал "персик"!
Хотите видеть меньше сообщений? Зарегистрируйтесь или войдите в аккаунт