ИИ новости недели память агенты и борьба с галлюцинациями

Google учит нейросети не забывать прошлое

Вы замечали, как чат-боты в одном диалоге помнят всё, а при следующем сеансе — как будто первый раз видят? Google DeepMind решила это исправить. Они представили сразу три метода для развития долгой памяти у ИИ-агентов. Evo-Memory превращает наборы данных в упорядоченные задачи — агенты учатся извлекать, обновлять и переиспользовать знания. ExpRAG сохраняет каждое взаимодействие как структурированную запись и при необходимости находит похожие случаи. А ReMem добавляет агенту возможность самому решать, какую информацию забыть, а какую оставить навсегда. Цель — чтобы ИИ не просто хранил статичный контекст, а использовал накопленный опыт для улучшения своих стратегий. Это шаг к непрерывно самообучающимся агентам.

DeepSeek снова удивила: дёшево и сердито

Помните скандал вокруг DeepSeek R1? Тогда все обсуждали, как дешёвые китайские модели могут обрушить рынок. В 2026 году они выпустили V3.2 и V3.2-Speciale. Первая тянет на уровень GPT-5.1 по качеству рассуждений. Вторая обгоняет GPT-5 и почти догоняет Gemini-3.0-Pro. И всё это — значительно дешевле конкурентов. Секрет — в новой архитектуре Sparse Attention, масштабном обучении с подкреплением и хитрой технике дистилляции, когда узкие модели учатся отдельно, а потом передают знания основной. Плюс 1800+ синтетических сред для тренировки агентов. Теперь поставщикам дорогих моделей придётся оправдывать ценник не только качеством, но и уникальными фишками.

OpenAI: учим модели признаваться в ошибках

Знаете, что бесит в нейросетях? Когда они с умным видом несут чушь, потому что «хотят угодить пользователю». OpenAI представила метод confessions (признания). Модель генерирует не только основной ответ, но и вторичный «ответ-исповедь», в котором анализирует свои действия, указывает на нарушения и получает вознаграждение за самодиагностику. Проще говоря, ИИ учится говорить: «Извини, я тут придумал, на самом деле этого не существует». Доверие — главный ограничитель внедрения ИИ в серьёзные сферы. Этот шаг к прозрачности важнее очередного рекорда по параметрам.

Что ещё случилось на неделе

Google DeepMask (нет, не та) — новые подходы, помогающие агентам выбирать оптимальные инструменты и не тратить ресурсы впустую.
Amazon выкатила семейство Nova 2, агентов для разработчиков и решение для развёртывания ИИ прямо в ЦОД клиента. Безумно дорого, но для корпораций — самое то.
Google запустила no-code платформу на Gemini 3 для создания агентов в компаниях. Теперь любой менеджер сможет наколдовать себе ИИ-помощника без программистов. Добро пожаловать в ад техподдержки.
Mistral анонсировала семейство Mistral 3. Европейский ответ американцам и китайцам. Посмотрим, насколько шустрым он будет на практике.
StepFun выпустила открытый стек для GUI-агентов — это те, которые могут кликать за вас в приложениях. Потенциально крутая штука для автоматизации рутины.
Arcee предложила две открытые MoE-модели как ответ на китайское доминирование. Потому что открытость — это хорошо, но когда конкуренты дешевле, приходится изворачиваться.