Vectorize Hindsight — это open-source платформа агентной памяти на базе MCP-сервера, которая позволяет AI-агентам не просто хранить информацию, а учиться на каждом взаимодействии, запоминать пользователей между сессиями и со временем улучшать свои решения. В отличие от традиционных retrieval-систем, Hindsight не только извлекает факты, но и анализирует ошибки, выявляет паттерны и формирует суждения, превращая разрозненные наблюдения в консолидированные знания, доступные всем агентам экосистемы. Система занимает первое место в бенчмарке LongMemEval с результатом 94.6%, опережая Supermemory (85.2%), Zep (71.2%) и GPT-4o (60.2%).
Ключевые особенности:
Четыре сети памяти: Полноценная система обучения включает хранение фактов (Retain), быстрый параллельный поиск релевантных воспоминаний менее чем за 100 мс (Recall), синтез разрозненных наблюдений в консолидированные знания (Reflect) и структурированное извлечение информации (Iris Extract), что обеспечивает многоуровневую работу с контекстом.
Обучение на ошибках: Когда вызов инструмента завершается неудачей или пользователь корректирует агента, этот опыт сохраняется как обучающий пример. При следующей аналогичной ситуации агент автоматически извлекает этот опыт и избегает повторения ошибки, постепенно нарабатывая лучшее суждение.
Автоматическое выявление паттернов: Слой рефлексии (Reflection layer) самостоятельно анализирует накопленные факты и синтезирует из них обобщенные ментальные модели без необходимости ручной разметки или тегирования — паттерны emerge из данных естественным образом.
Персистентность между сессиями: Контекст сохраняется неделями и месяцами. Предпочтения пользователя, история решений и предыдущие взаимодействия доступны при каждом новом обращении, что исключает проблему “холодного старта” и необходимости повторно объяснять контекст.
Общий контекст между агентами: Агент A узнает предпочтение пользователя, и агент B автоматически применяет это знание при взаимодействии с тем же пользователем. Память работает как разделяемый слой для всех агентов в экосистеме, а не как изолированное хранилище каждого отдельного агента.
MCP-сервер из коробки: Hindsight поставляется со встроенным MCP-сервером, который регистрирует инструменты remember, recall и reflect для любого MCP-совместимого агента. Установка сводится к одной команде npx add-skill vectorize-io/hindsight —skill hindsight-docs, после чего агент самостоятельно читает документацию, пишет конфигурацию и настраивает свою память.
Модель-агностическая архитектура: Слой памяти не привязан к конкретному провайдеру LLM — можно менять языковые модели без потери накопленного агентами опыта и знаний.
Для кого: Разработчики AI-агентов и MCP-клиентов, которым нужна память, выходящая за рамки простого retrieval-поиска — с возможностью обучения на ошибках и накопления суждений. Команды, создающие агентов для клиентского сервиса, где критично запоминать предпочтения пользователей между сессиями. Enterprise-компании, строящие экосистемы из множества взаимодействующих агентов, которым нужен общий слой памяти. Стартапы, экспериментирующие с автономными агентами и желающие начать с бесплатного self-hosted решения без ограничений.
Сценарии использования:
Агент клиентской поддержки, который учится на каждом обращении: запоминает предпочтения пользователя, усваивает успешные паттерны решения проблем и автоматически избегает подходов, которые ранее приводили к негативной обратной связи.
Экосистема агентов с общей памятью: агент по продажам узнает о бюджетных ограничениях клиента, и агент технической поддержки того же клиента автоматически применяет это знание, не предлагая неподходящие тарифные планы.
Долгосрочное сопровождение пользователя: агент помнит контекст проекта спустя недели после последнего взаимодействия — включая принятые решения, отвергнутые альтернативы и обоснования — и продолжает работу без необходимости повторного ввода в курс дела.
Автоматическое формирование экспертизы: агент начинает работу как новичок в предметной области, но с каждым взаимодействием слой рефлексии синтезирует ментальные модели, и агент постепенно нарабатывает суждение, сопоставимое с опытным сотрудником.
Параллельный вызов множества инструментов с памятью: агент выполняет recall параллельно по всем четырем сетям памяти, получая релевантный контекст менее чем за 100 мс, и принимает решение на основе полной истории взаимодействий.
Цены и доступность: Self-hosted версия полностью бесплатна и распространяется под лицензией MIT без ограничений по использованию, телеметрии и количеству запросов. Развертывается одной Docker-командой со встроенным PostgreSQL. Облачная версия Hindsight Cloud работает по модели pay-as-you-go с оплатой за токены: Retain (хранение воспоминаний) — 15.00/млнтокенов, Recall(извлечение) — 15.00/млнтокенов, Recall(извлечение) — 0.75/млн, Reflect (синтез паттернов) — 3.00/млн, IrisExtract(структурированноеизвлечение) — 3.00/млн, IrisExtract(структурированноеизвлечение) — 7.50/млн, Mental Model Retrieve — 0.25/млн, MentalModelRefresh — 0.25/млн, MentalModelRefresh — 3.00/млн. Стартовые кредиты предоставляются бесплатно для тестирования. Enterprise-план включает развертывание в собственном облаке клиента, кастомные SLA до 99.95% и поддержку с 30-минутным временем реакции.