×

Быстрые команды для колонки SberBoom без слова Салют

Раздражает каждое утро говорить ‘Салют, включи музыку’, ‘Салют, громче’, ‘Салют, следующий трек’? Я тоже устал. В 2026 году колонки SberBoom научились выполнять команды без споттерного слова. Теперь можно просто сказать ‘громче’ или ‘пауза’ — и колонка послушается. Рассказываю, как это работает и что умеет.

Какие быстрые команды понимает SberBoom

Теперь можно не говорить ‘Салют’ для частых сценариев:

  • Управление музыкой: ‘следующий трек’, ‘пауза’, ‘выключи’, ‘прошлый’, ‘стоп’.
  • Громкость: ‘громче’, ‘тише’, ‘громкость 8’, ‘громкость 50%’.
  • Управление умным домом: ‘включи свет’, ‘выключи свет’, ‘включи красный свет с яркостью 1%’. Работает с устройствами Sber и партнёров.
  • Управление телевизором/приставкой: ‘открой’, ‘нажми’, ‘домой’, ‘назад’, ‘левее’, ‘выше’.
  • Bluetooth: ‘включи Bluetooth’, ‘выключи Bluetooth’.

Колонка понимает синонимы: ‘назад’, ‘предыдущий’ и ‘прошлый’ — одно и то же. Можно говорить ‘громче громче громче’ с минимальными паузами — это работает (спам-команды).

умная колонка SberBoom
SberBoom — теперь без лишних слов. Источник: Hi-Tech Mail

Как это работает (локально, без интернета)

Обычно, когда вы говорите ‘Салют’, запрос уходит в облако, там распознаётся речь, обрабатывается и возвращается ответ. Быстрые команды обрабатываются локально — прямо на колонке. Это возможно благодаря трём встроенным ML-моделям (нейросетям), которые занимают всего 6 мегабайт на флеш-памяти (меньше одной фотографии).

Три модели:

  1. Распознавание речи — преобразует голос в текст, не дожидаясь конца фразы.
  2. Определение намерений — анализирует поток текста и понимает, чего вы хотите (сделать громче, поставить паузу, включить свет).
  3. Предсказание конца команды — решает, закончили вы говорить или просто задумались. Как только фиксирует ‘договорил’, команда выполняется.

Благодаря локальной обработке многие быстрые команды работают даже без подключения к Wi-Fi.

схема работы
Источник: sberdevices.ru

Как обучали модель (и почему 6 МБ — это круто)

Модели обучали на большом массиве аудиозаписей. Сотни тысяч примеров, где люди отдавали команды, а разметчики вручную отмечали конец фразы. Также добавили записи с фоновым шумом (музыка, ТВ) — чтобы колонка понимала команды даже в шумной обстановке.

6 мегабайт — это достижение, потому что типичные модели распознавания речи занимают сотни мегабайт. Инженеры Sber сделали их сверхфокусированными только на быстрых командах и их синонимах, отбросив всё лишнее.

SberBoom Home и Mini 2
SberBoom Home и SberBoom Mini 2. Источник: Hi-Tech Mail

Что это значит для пользователя:

  • Быстрее: не нужно ждать, пока фраза уйдёт в облако и вернётся.
  • Удобнее: не нужно каждый раз говорить ‘Салют’.
  • Работает без интернета (для большинства команд).
  • Понимает даже в шуме.

В 2026 году быстрые команды есть не только у SberBoom, но и у Yandex Станций (‘Алиса, выключи свет’ — можно без ‘Алиса’? Увы, пока нет). Но Sber здесь впереди. Если у вас есть колонка SberBoom, попробуйте просто сказать ‘громче’ во время музыки — и вы удивитесь. Работает.

Возможно, вы пропустили