trieve

Сайт	https://github.com/devflowinc/trieve
Цена	Бесплатный доступ
Основные направления	Поиск, RAG, Рекомендации

Trieve — это all-in-one платформа для поиска, рекомендаций, RAG (Retrieval-Augmented Generation) и аналитики, предоставляемая через единый API. Решение объединяет семантический векторный поиск, full-text/нейронный поиск с устойчивостью к опечаткам, гибридный поиск с cross-encoder реранкингом и удобные RAG-маршруты, позволяющие подключать практически любые LLM через OpenRouter. Платформа интегрируется с embedding-моделями OpenAI и Jina, использует Qdrant для хранения и поиска векторов, а также поддерживает полноценный self-hosting в вашем VPC или on-prem с готовыми гайдами для AWS, GCP, Kubernetes и Docker Compose.

Ключевые особенности:

Self-Hosting в вашем VPC или on-prem: Полные руководства по self-hosting для AWS, GCP, Kubernetes и Docker Compose, доступные в документации, позволяют развернуть платформу в собственной инфраструктуре с полным контролем над данными.

Семантический векторный поиск: Интеграция с embedding-моделями OpenAI или Jina и векторной базой Qdrant обеспечивает семантический поиск, понимающий смысл запроса, а не только точные совпадения слов.

Нейронный поиск с устойчивостью к опечаткам: Каждый загруженный чанк векторизуется с помощью модели naver/efficient-splade-VI-BT-large-query, что дает устойчивый к опечаткам нейронный sparse-vector поиск высокого качества.

Подсветка совпадений на уровне предложений: Платформа подсвечивает совпадающие слова или предложения внутри чанка и выделяет их при поиске, заметно улучшая UX для конечных пользователей.

Рекомендации: Recommendation API позволяет находить похожие чанки или файлы при группировке — особенно полезно для платформ с избранным, закладками и системой голосования за контент.

Удобные RAG-маршруты: Интеграция с OpenRouter дает доступ к любым LLM для RAG, включая полностью управляемый RAG с управлением памятью на основе тем или RAG с собственным контекстом.

Подключение собственных моделей: При необходимости можно подключить собственные text-embedding, SPLADE, cross-encoder re-ranking и/или LLM модели и встроить их в инфраструктуру Trieve.

Гибридный поиск с cross-encoder реранкингом: Для наилучших результатов используется гибридный поиск с оптимизацией реранкинга через BAAI/bge-reranker-large.

Смещение по свежести: Лёгкое смещение результатов поиска в сторону самого свежего контента предотвращает устаревание выдачи.

Настраиваемый merchandizing: Релевантность можно подстраивать с помощью сигналов вроде кликов, добавлений в корзину или цитирований.

Фильтрация: Поддерживаются фильтры по диапазону дат, подстроке, тегам, числовым значениям и другим типам, что дает точный контроль над выборкой.

Группировка: Объединение нескольких чанков в один файл и поиск на уровне файла гарантируют, что один и тот же результат верхнего уровня не появится в выдаче дважды.

Для кого: Платформа ориентирована на разработчиков AI-приложений, data engineering-команды, продуктовые команды и компании, которым нужен быстрый, точный и масштабируемый поиск, рекомендации и RAG без необходимости самостоятельно строить поисковую инфраструктуру. Особенно полезна для построения поисковых движков, RAG-ассистентов, рекомендательных систем, баз знаний и аналитических платформ.

Сценарии использования:

Семантический поиск — поиск по документам, статьям, продуктам и базам знаний с пониманием смысла запроса, а не только ключевых слов, что повышает качество и релевантность результатов.

RAG-приложения — построение AI-ассистентов и чат-ботов с доступом к актуальному контексту через управляемые RAG-маршруты, что обеспечивает точные ответы на основе ваших данных.

Рекомендательные системы — формирование рекомендаций похожего контента, товаров или материалов на основе пользовательского поведения и истории взаимодействий.

Поиск по базам знаний — быстрый и устойчивый к опечаткам поиск по корпоративным базам знаний и технической документации для сотрудников и клиентов.

Поиск для e-commerce — поиск по каталогам товаров с настраиваемым merchandizing и реранкингом, повышающий конверсию интернет-магазинов.

Аналитика — анализ поисковых запросов, кликов и поведения пользователей для постоянного улучшения релевантности и качества выдачи.

Цены и доступность: Trieve предлагает бесплатный тариф (1k chunks free) для тестирования и разработки, а также платные планы для production-нагрузок. Платформа доступна как облачное решение через dashboard.trieve.ai, так и для self-hosting в собственной инфраструктуре. Стоимость зависит от объёма данных, количества запросов и используемых ресурсов. Для интеграции доступны Typescript SDK, Python SDK, полная OpenAPI-спецификация и подробная документация.

Похожие MCP

actors mcp server

agentql mcp

mcp neo4j

mcp server rag web browser

vectorize mcp server

Бесплатный доступ к Chat GPT и другим нейросетям