Новые ИИ агенты которые помнят всё и думают как люди

Вы когда-нибудь просили нейросеть найти что-то в вашей корпоративной базе, а она выдавала какой-то бред? Я — постоянно. Потому что обычные языковые модели тупят, когда документов много и они закрытые. Но в 2026 году ситуация меняется. Databricks и Accenture показали агентов, которые реально умеют думать, помнить и искать — и делают это быстрее и дешевле, чем GPT-5. Давайте разбираться.

KARL: корпоративный детектив с обоснованными выводами

Компания Databricks выпустила KARL (Knowledge Agents via Reinforcement Learning). Звучит сложно, но на деле это агент, который умеет копаться в больших закрытых базах данных, вытаскивать оттуда нужные куски и делать на их основе выводы. Причём не «наобум», а с обоснованием. Представьте себе аналитика, который штудирует тысячи документов, помечает важное, а потом пишет отчёт. Только в 33 раза дешевле и на 47% быстрее.

Разработчики создали специальный бенчмарк KARLBench — набор задач от простого поиска сущностей до сложного анализа заметок. И обучили агента методом Agentic Synthesis: он сам исследует базу, придумывает вопросы и отбирает полезные примеры. Плюс метод пост-обучения OAPL — более стабильный и дешёвый вариант обучения с подкреплением. В тестах KARL обошёл Claude 4.6 и даже GPT-5.2 в корпоративных задачах.

Почему это круто: компаниям теперь не обязательно покупать огромные дорогие модели. Компактная система, обученная эффективным стратегиям поиска, даёт тот же результат. Следующий этап — агенты, которые сами выстраивают стратегию работы с данными. Это как дать сотруднику не просто поисковик, а целого персонального помощника.

Memex(RL): память как у слона, расход как у воробья

Accenture придумали Memex(RL) — подход, который даёт ИИ-агентам индексированную память. Обычно модель работает только с тем, что влезает в её «контекстное окно» (а это ограниченный объём текста). Если задача длинная — агент забывает начало. Memex(RL) позволяет сохранять опыт прошлых действий и извлекать нужное по запросу. Это как если бы вы вели конспект и делали закладки — только агент сам решает, когда и что сохранить, а когда выкинуть.

Результат впечатляет: в тестах ALFWorld успешность выполнения задач выросла с 24,2% до 85,6%. А расход токенов контекста сократился почти вдвое. То есть агент не забывает важные детали и не тратит ресурсы на перечитывание всей простыни текста.

Почему это важно: агенты начинают эффективно работать на длинных дистанциях — например, когда задача растянута на часы или требует сотен шагов. Это реальный шаг к тому, чтобы ИИ мог вести полноценный проект от начала до конца.

Что ещё случилось на этой неделе в мире ИИ

OpenAI выпустила набор из 14 тысяч сложных задач для оценки способности моделей контролировать рассуждения с ограничениями на скрытые шаги.
Microsoft Research показала фреймворк для повышения безопасности ИИ-агентов при работе с внешними инструментами — чтобы не натворили делов.
Princeton University превратил взаимодействие пользователя с агентом в источник непрерывного обучения. То есть чем больше вы общаетесь, тем умнее становится система.
Meta (запрещена в РФ), OpenAI и xAI описали систему непрерывного улучшения моделей для чатов — чтобы боты не тупели со временем.
Perplexity анонсировала ИИ-агента, который работает локально на Mac mini. Без облака, без задержек — всё на вашем устройстве.
NVIDIA выпустила модель Nemotron 3 Super — очередной монстр для тяжёлых вычислений.
Google представила Gemini Embedding 2 — первую нативно мультимодальную эмбеддинг-модель. Она понимает и текст, и картинки одновременно.
Microsoft совместно с Anthropic выпустила инструмент для выполнения сложных задач от имени пользователя в экосистеме Microsoft 365. Представьте: агент сам ходит по вашим папкам, ищет, анализирует и делает презентацию.

Если честно, 2026 год становится годом ИИ-агентов. Они больше не просто болтают — они делают. И делают это дёшево, быстро и с памятью, которой позавидует любой клерк. А вы как думаете: когда ваш рабочий компьютер сам начнёт отвечать на письма и составлять отчёты?

Новости предоставлены аналитическим центром red_mad_robot.