Top.Mail.Ru
  • Новинки
  • Эксклюзив
  • Хиты продаж
  • Акции
  • Сделано Apple
  • Рекомендуем
  • Novelizer
  • Для взрослых
  • Борьба с огнём
  • PREMIUM товары
  • Поиск по тегам
  • Статьи iG-Life

Как работает офлайн‑ИИ в смартфонах: простое объяснение NPU и мобильных нейросетей

Обновлено 06.10.2025 в 10:00
2 октября 2025
Константин Назаров

Объясняем «на пальцах», почему телефон сегодня справляется с ИИ‑задачами без интернета, что такое NPU и TOPS, и как понять, «потянет» ли ваш аппарат локальные ассистенты, перевод и "фото‑магию".

Зачем вообще нужен офлайн‑ИИ в смартфоне?

Офлайн‑режим даёт три ключевые вещи: приватность — данные не передаются в облако; скорость — задержка минимальна и не зависит от сети; предсказуемость — всё работает в самолёте, метро и в зонах с плохим интернетом. Это особенно важно для диктовки и перевода речи, «волшебной» ретуши фото, поиска по галерее, редактирования заметок, подсказок в клавиатуре и диалога с компактной языковой моделью прямо на устройстве. Позицию индустрии хорошо иллюстрирует формулировка Тима Кука«мы не принимаем, что между приватностью и интеллектом есть компромисс».

Что такое NPU и чем он отличается от CPU/GPU

NPU (Neural Processing Unit) — специализированный «процессор» для математики нейросетей, которым начали снабжать современные смартфоны. Универсальный CPU справляется со всем понемногу, но неэффективен на массивных матричных операциях. GPU отлично умножает матрицы, но потребляет больше энергии и не всегда удобен для смешанных точностей. NPU можно представить как аппаратный калькулятор для типовых слоёв — свёрток и матричных умножений, — c оптимизированными буферами и конвейерами. Отсюда — высокая производительность на ватт и меньше нагрев на длинных сессиях. Современные мобильные платформы поддерживают вычисления в низких разрядностях (например, INT4/INT8) и оптимизации памяти; в документах Qualcomm для линейки Snapdragon, в частности, упоминаются механизмы, снижающие «узкие места» памяти — Hexagon Direct Link и Micro Tile Inferencing.

Что такое TOPS и почему это не вся правда

Производительность NPU принято измерять в единицах TOPS — «триллионы операций в секунду». Но его считают по‑разному: в INT8, INT4 или FP16, в пиковом или устойчивом режиме. Важнейшую роль играет и пропускная способность памяти, если она мала, очередь из тензоров затормозит даже очень быстрый ускоритель. Поэтому одинаковые цифры TOPS у разных устройств вовсе не гарантируют одинаковое время выполнения задач ИИ.

Как смартфон выполняет ИИ‑задачу без облака?

Типичный путь таков. Сначала подготавливается вход: видео идёт через ISP, речь преобразуется в спектрограмму, текст — в токены. Затем фреймворк (Core ML/Metal на iOS, NNAPI/TFLite/ONNX на Android) раскладывает вычислительный граф и направляет подходящие части на NPU, а оставшееся распределяет между GPU, DSP и CPU. Далее подключаются оптимизации — квантизация в INT8/INT4, сжатие весов, разреженность и слияние операторов — после чего результат проходит постобработку: апскейл и подавление артефактов у фото и видео, детокенизация у речи, выбор температуры и стоп‑слов для текстовых моделей. Наконец, система кеширует словари, эмбеддинги и локальные адаптеры (например, LoRA), чтобы ответы лучше соответствовали вашему стилю. В Android за низкую задержку и актуальность локальной модели отвечает системная служба AICore, через которую Gemini Nano использует аппаратные ускорители и автоматически обновляется на устройстве.

Примеры из мира смартфонов: что уже работает офлайн

У Pixel на базе Gemini Nano без интернета доступны Pixel ScreenshotsCall NotesSummarize в Recorder и офлайн‑вариант Magic Compose; мультимодальность позволяет понимать изображения, звук и речь, поэтому, например, улучшенные описания в TalkBack формируются именно на устройстве. Практические данные подтверждают пользу офлайна: после появления суммаризации в Recorder (система, которая прослушивает аудиозаписи и выдает краткое резюме в текстовом виде) количество сохранённых записей выросло на 24%, а функцией пользуются в среднем 2–5 раз в день; благодаря AICore и тонкой настройке через LoRA фичу удалось доставить примерно за четыре месяца. Как метко сформулировала продакт‑менеджер Pixel Кристи Брэдфорд«держать большую языковую модель на устройстве полезно для пользователей: это даёт больше приватности, меньшую задержку и работу там, где это нужно, — без интернета».

У iPhone реализована офлайн‑логика с облачной подстраховкой через Private Cloud Compute (PCC): если мощности телефона недостаточно, запрос уходит на серверы на Apple silicon с криптографической аттестацией; при этом данные используются только для выполнения запроса, не сохраняются и недоступны никому, включая Apple. Крейг Федериги подчёркивает это ещё прямее: «Ваши данные никогда не сохраняются и не становятся доступными Apple».

Samsung и крупные китайские бренды — Xiaomi, OPPO, vivo, Honor — опираются на NPU из экосистем Snapdragon/Dimensity/Exynos и всё активнее переводят на устройство камеры, переводчики и заметки. При этом прямо декларируется гибридный курс. Президент Samsung MX Ти‑эм Ро сформулировал это так: «Мы выбрали гибрид, объединяющий ИИ на устройстве и в облаке… это позволяет пользователям оставлять часть функций полностью локальными».

Где офлайн‑ИИ полезен уже сегодня

В камере локально считаются HDR‑стеккинг, шумоподавление, портретные маски и «ластик»; голосовые функции — распознавание и перевод в реальном времени, субтитры и диктовка — тоже работают на устройстве; с текстом возможны суммаризация заметок, умные ответы и поиск по содержимому телефона; в задачах доступности Android TalkBack формирует описания изображений офлайн благодаря мультимодальному Gemini Nano; а в вопросах безопасности помогает приватная категоризация фото и выявление типичных схем мошенничества без отправки данных наружу.

Как выбрать «смартфон для ИИ»?

При выборе имеет смысл сначала смотреть на функции «из коробки» — не на маркетинговые цифры, а на то, что действительно доступно офлайн на вашем языке и в вашей стране (для Pixel, iPhone и Galaxy ориентируйтесь на официальные страницы и справку по конкретным функциям). Далее оцените память: для локальных моделей удобны 12–16 ГБ ОЗУ, а 8 ГБ подойдут для компактных сценариев; если планируете держать несколько моделей, разумно брать от 256 ГБ хранилища. Важна экосистема: на iOS это поддержка Core ML в нужных приложениях, на Android — свежие драйверы NPU и интеграция с AICore/NNAPI. Обратите внимание на теплопакет и автономность — длительные задачи быстро выявляют слабое охлаждение. Проверьте настройки приватности: хорошо, когда можно жёстко выбрать «только устройство» или гибрид и видеть, что именно идёт в облако; показательна архитектура PCC с независимой проверкой кода и криптографической аттестацией. И, наконец, ориентируйтесь на реальные метрики: для текстовых моделей это скорость генерации и доступная длина контекста, для фото и видео — время применения эффектов без падения производительности.

Мифы и заблуждения

Миф «больше TOPS — всегда быстрее» не выдерживает проверки: часто всё упирается в пропускную способность памяти и качество софта. Идея «скоро всё станет полностью офлайн» тоже неверна: гибридная модель — когда на устройстве выполняется максимум возможного, а облако берёт на себя действительно тяжёлые задачи — останется нормой, и это прямо признают производители. Наконец, квантизация вовсе не обязательно ухудшает качество: при грамотной калибровке INT8/INT4 дают существенную экономию ресурсов при незаметной для пользователя разнице, тем более что поддержка низких разрядностей давно присутствует в мобильных NPU.

Итог

NPU — не волшебная коробочка, а инструмент, который делает ИИ‑возможности смартфона быстрыми, приватными и доступными везде. Однако сегодня индустрия сходится на гибридной модели: офлайн‑ИИ берёт на себя максимум, а облако подключается лишь там, где без больших моделей не обойтись — именно так формулирует подход и Samsung.

Последние публикации
GPT-5 Instant теперь утешает в трудные моменты: OpenAI добавила эмпатию в ИИ
Теперь ChatGPT понимает эмоции пользователей. Рассказываем, зачем это сделано и есть ли риски у новой технологии
Кунг-фу от Tesla Optimus: робот Маска показал пугающе живые движения
«Боевой привет от Tesla»: как робот Маска удивил мир
Бот Роскомнадзора стал админом Telegram-каналов: контроль изнутри
С 4 октября 2025 года Telegram в России перестал быть прежним
40 млн в Max: как «национальный мессенджер» вытесняет WhatsApp из России
За свое недолгое время существования мессенджер Max уже успел завоевать любовь среди россиян. Более того, он вытесняет зарубежные аналоги!
Вышел Honor X7d: первый «бронесмартфон» с батареей на двое суток
В продаже появился первый «бронесмартфон» со сверхъемкой батареей, заряда которой хватает на 2 дня.
Новые Xiaomi 15T/15T Pro вышли в России: какие «плюшки» получат первые покупатели?
Новинки от Xiaomi уже в продаже. Рассказываем, какие бонусы получат первые покупатели в России.
Генератор видео Sora от OpenAI под огнём: расследования о дипфейках и угрозах
У генератора видео Sora обнаружили важный недостаток. Из-за качественных дипфейков, созданных в сервисе, разгорелись громкие скандалы.
2029: как изменится жизнь, если смартфон начнёт думать вместо вас
Сильно ли изменится наша жизнь, если смартфоны начнут думать за нас? На этот вопрос мы постарались ответить.
7 офлайн‑экспериментов с Pixel и iPhone: что умеет локальный ИИ без интернета
Рассказываем, на что уже способны смартфоны с ИИ, работающим без интернета. Для этого были проведены эксперименты.
Apple против Google: чей ИИ первым научит смартфон думать офлайн
Apple и Google всегда были конкурентами, но теперь эта конкуренция вышла на новый уровень. Кто же победит и первым создаст совершенный ИИ?
Хотите видеть меньше сообщений? Зарегистрируйтесь или войдите в аккаунт