Top.Mail.Ru
  • Новинки
  • Эксклюзив
  • Хиты продаж
  • Акции
  • Сделано Apple
  • Рекомендуем
  • Novelizer
  • Для взрослых
  • PREMIUM товары
  • Поиск по тегам
  • Статьи iG-Life
В каталог Публикации

Как работает офлайн‑ИИ в смартфонах: простое объяснение NPU и мобильных нейросетей

Объясняем «на пальцах», почему телефон сегодня справляется с ИИ‑задачами без интернета, что такое NPU и TOPS, и как понять, «потянет» ли ваш аппарат локальные ассистенты, перевод и "фото‑магию".

Зачем вообще нужен офлайн‑ИИ в смартфоне?

Офлайн‑режим даёт три ключевые вещи: приватность — данные не передаются в облако; скорость — задержка минимальна и не зависит от сети; предсказуемость — всё работает в самолёте, метро и в зонах с плохим интернетом. Это особенно важно для диктовки и перевода речи, «волшебной» ретуши фото, поиска по галерее, редактирования заметок, подсказок в клавиатуре и диалога с компактной языковой моделью прямо на устройстве. Позицию индустрии хорошо иллюстрирует формулировка Тима Кука«мы не принимаем, что между приватностью и интеллектом есть компромисс».

Что такое NPU и чем он отличается от CPU/GPU

NPU (Neural Processing Unit) — специализированный «процессор» для математики нейросетей, которым начали снабжать современные смартфоны. Универсальный CPU справляется со всем понемногу, но неэффективен на массивных матричных операциях. GPU отлично умножает матрицы, но потребляет больше энергии и не всегда удобен для смешанных точностей. NPU можно представить как аппаратный калькулятор для типовых слоёв — свёрток и матричных умножений, — c оптимизированными буферами и конвейерами. Отсюда — высокая производительность на ватт и меньше нагрев на длинных сессиях. Современные мобильные платформы поддерживают вычисления в низких разрядностях (например, INT4/INT8) и оптимизации памяти; в документах Qualcomm для линейки Snapdragon, в частности, упоминаются механизмы, снижающие «узкие места» памяти — Hexagon Direct Link и Micro Tile Inferencing.

Что такое TOPS и почему это не вся правда

Производительность NPU принято измерять в единицах TOPS — «триллионы операций в секунду». Но его считают по‑разному: в INT8, INT4 или FP16, в пиковом или устойчивом режиме. Важнейшую роль играет и пропускная способность памяти, если она мала, очередь из тензоров затормозит даже очень быстрый ускоритель. Поэтому одинаковые цифры TOPS у разных устройств вовсе не гарантируют одинаковое время выполнения задач ИИ.

Как смартфон выполняет ИИ‑задачу без облака?

Типичный путь таков. Сначала подготавливается вход: видео идёт через ISP, речь преобразуется в спектрограмму, текст — в токены. Затем фреймворк (Core ML/Metal на iOS, NNAPI/TFLite/ONNX на Android) раскладывает вычислительный граф и направляет подходящие части на NPU, а оставшееся распределяет между GPU, DSP и CPU. Далее подключаются оптимизации — квантизация в INT8/INT4, сжатие весов, разреженность и слияние операторов — после чего результат проходит постобработку: апскейл и подавление артефактов у фото и видео, детокенизация у речи, выбор температуры и стоп‑слов для текстовых моделей. Наконец, система кеширует словари, эмбеддинги и локальные адаптеры (например, LoRA), чтобы ответы лучше соответствовали вашему стилю. В Android за низкую задержку и актуальность локальной модели отвечает системная служба AICore, через которую Gemini Nano использует аппаратные ускорители и автоматически обновляется на устройстве.

Примеры из мира смартфонов: что уже работает офлайн

У Pixel на базе Gemini Nano без интернета доступны Pixel ScreenshotsCall NotesSummarize в Recorder и офлайн‑вариант Magic Compose; мультимодальность позволяет понимать изображения, звук и речь, поэтому, например, улучшенные описания в TalkBack формируются именно на устройстве. Практические данные подтверждают пользу офлайна: после появления суммаризации в Recorder (система, которая прослушивает аудиозаписи и выдает краткое резюме в текстовом виде) количество сохранённых записей выросло на 24%, а функцией пользуются в среднем 2–5 раз в день; благодаря AICore и тонкой настройке через LoRA фичу удалось доставить примерно за четыре месяца. Как метко сформулировала продакт‑менеджер Pixel Кристи Брэдфорд«держать большую языковую модель на устройстве полезно для пользователей: это даёт больше приватности, меньшую задержку и работу там, где это нужно, — без интернета».

У iPhone реализована офлайн‑логика с облачной подстраховкой через Private Cloud Compute (PCC): если мощности телефона недостаточно, запрос уходит на серверы на Apple silicon с криптографической аттестацией; при этом данные используются только для выполнения запроса, не сохраняются и недоступны никому, включая Apple. Крейг Федериги подчёркивает это ещё прямее: «Ваши данные никогда не сохраняются и не становятся доступными Apple».

Samsung и крупные китайские бренды — Xiaomi, OPPO, vivo, Honor — опираются на NPU из экосистем Snapdragon/Dimensity/Exynos и всё активнее переводят на устройство камеры, переводчики и заметки. При этом прямо декларируется гибридный курс. Президент Samsung MX Ти‑эм Ро сформулировал это так: «Мы выбрали гибрид, объединяющий ИИ на устройстве и в облаке… это позволяет пользователям оставлять часть функций полностью локальными».

Где офлайн‑ИИ полезен уже сегодня

В камере локально считаются HDR‑стеккинг, шумоподавление, портретные маски и «ластик»; голосовые функции — распознавание и перевод в реальном времени, субтитры и диктовка — тоже работают на устройстве; с текстом возможны суммаризация заметок, умные ответы и поиск по содержимому телефона; в задачах доступности Android TalkBack формирует описания изображений офлайн благодаря мультимодальному Gemini Nano; а в вопросах безопасности помогает приватная категоризация фото и выявление типичных схем мошенничества без отправки данных наружу.

Как выбрать «смартфон для ИИ»?

При выборе имеет смысл сначала смотреть на функции «из коробки» — не на маркетинговые цифры, а на то, что действительно доступно офлайн на вашем языке и в вашей стране (для Pixel, iPhone и Galaxy ориентируйтесь на официальные страницы и справку по конкретным функциям). Далее оцените память: для локальных моделей удобны 12–16 ГБ ОЗУ, а 8 ГБ подойдут для компактных сценариев; если планируете держать несколько моделей, разумно брать от 256 ГБ хранилища. Важна экосистема: на iOS это поддержка Core ML в нужных приложениях, на Android — свежие драйверы NPU и интеграция с AICore/NNAPI. Обратите внимание на теплопакет и автономность — длительные задачи быстро выявляют слабое охлаждение. Проверьте настройки приватности: хорошо, когда можно жёстко выбрать «только устройство» или гибрид и видеть, что именно идёт в облако; показательна архитектура PCC с независимой проверкой кода и криптографической аттестацией. И, наконец, ориентируйтесь на реальные метрики: для текстовых моделей это скорость генерации и доступная длина контекста, для фото и видео — время применения эффектов без падения производительности.

Мифы и заблуждения

Миф «больше TOPS — всегда быстрее» не выдерживает проверки: часто всё упирается в пропускную способность памяти и качество софта. Идея «скоро всё станет полностью офлайн» тоже неверна: гибридная модель — когда на устройстве выполняется максимум возможного, а облако берёт на себя действительно тяжёлые задачи — останется нормой, и это прямо признают производители. Наконец, квантизация вовсе не обязательно ухудшает качество: при грамотной калибровке INT8/INT4 дают существенную экономию ресурсов при незаметной для пользователя разнице, тем более что поддержка низких разрядностей давно присутствует в мобильных NPU.

Итог

NPU — не волшебная коробочка, а инструмент, который делает ИИ‑возможности смартфона быстрыми, приватными и доступными везде. Однако сегодня индустрия сходится на гибридной модели: офлайн‑ИИ берёт на себя максимум, а облако подключается лишь там, где без больших моделей не обойтись — именно так формулирует подход и Samsung.

В тренде 🔥
Polaroid Go Gen 3 вышла за $89.99: маленькая камера, где главный расход — каждый кадр
Polaroid выпустила Go Generation 3 — маленькую моментальную камеру, которая делает не файл в галерее, а бумажный снимок. В эпоху смартфонов это звучит почти странно: камера проще телефона, кадры нельзя бесконечно переснимать, а плёнку нужно покупать отдел
Belkin сделала ручку-пауэрбанк для Nintendo Switch 2: 10 000 мА·ч и главный вопрос для России
Belkin выпустила Gaming Charging Grip для Nintendo Switch 2 — аксессуар, который превращает консоль в более удобную портативную приставку и одновременно добавляет ей внешний аккумулятор.
Xiaomi 17T и 17T Pro уже продаются в России: Leica, промо-цены и главный вопрос перед покупкой
Xiaomi вывела на российский рынок смартфоны 17T и 17T Pro. Формально это очередное обновление популярной линейки, но для покупателя здесь важнее не само слово «новинка», а выбор между двумя версиями.
"Garmin за 3 копейки": в сети появились первые отзывы о Amazfit Active Max с оффлайн-картами
В сети наконец появились отзывы пользователей Amazfit Active Max. Рассказываем, какие преимущества и недостатки уже замечены.
Honor Magic 8 Pro Air уже в продаже: сколько просят за 5500 мАч в корпусе толщиной всего 6,1 мм?
Honor Magic 8 Pro Air тоньше iPhone, но живёт дольше: в чём секрет?
Infinix Note 60 Ultra от Pininfarina умеет звонить через спутник
Infinix Note 60 Ultra получил дизайн от Pininfarina! И это далеко не единственная фича новинки!
Реально удобно? Появись первые отзывы об "умных очках без дисплея" от Xioami
Появились первые отзывы об умных очках от Xiaomi. Рассказываем, что говорят пользователи.
Samsung Galaxy A57: 6,9 мм, 1900 нит и 6 лет обновлений — но стоит ли переплачивать 15 000 ₽ за почти тот же смартфон?
Samsung выпустила Galaxy A57 5G — смартфон, который на бумаге выглядит как серьёзное обновление: тоньше, легче, с новым чипом и защитой IP68. Но в реальности всё упирается в деньги. В России модель уже появляется в диапазоне 45–55 тысяч рублей, тогда как
HONOR X9d вышел за пределами Китая: 8 300 мАч и 108 МП в бюджетном классе
Предзаказ HONOR X9d в Непале до 28 января: 8 300 мА·ч против розетки
Смартфон-конструктор толщиной 4,9 мм: TECNO показала магнитные модули на MWC
Модульный смартфон с отстёгиваемой камерой, батареей и телеобъективом — концепт TECNO на MWC 2026 в Барселоне.
Хотите видеть меньше сообщений? Зарегистрируйтесь или войдите в аккаунт