MCP-серверы

mcp ragdocs mcp ragdocs логотип

Сайт https://github.com/hannesrudolph/mcp-ragdocs
Цена Бесплатный доступ
Основные направления Инжиниринг данных и извлечение, МСР для RAG

RAG Documentation MCP Server — это сервер Model Context Protocol (MCP), который предоставляет AI-ассистентам возможность семантического поиска, извлечения и обработки документации через векторную базу данных, дополняя ответы моделей релевантным контекстом в реальном времени.

Ключевые особенности:

search_documentation: Инструмент для семантического поиска по всей проиндексированной документации на естественном языке. Возвращает ранжированные по релевантности фрагменты с контекстом, поддерживая запросы от общих формулировок до конкретных терминов и фрагментов кода.

extract_urls: Краулер, который принимает URL веб-страницы, извлекает все гиперссылки с неё и опционально автоматически добавляет их в очередь на индексацию для последующего включения в базу знаний.

list_sources и remove_documentation: Инструменты для управления источниками — отображают полный список проиндексированных ресурсов с URL и датами обновления, а также позволяют точечно удалять устаревшую или нерелевантную документацию из базы.

Управление очередью индексации (list_queue, run_queue, clear_queue): Полный контроль над процессом обработки документации. Можно просмотреть ожидающие источники, запустить процесс индексации с прогрессом и обработкой ошибок, или полностью очистить очередь для начала нового цикла наполнения.

Векторный поиск на базе Qdrant: Использует векторную базу данных Qdrant для хранения эмбеддингов документов и эмбеддинги OpenAI для преобразования текста, что обеспечивает быстрый и точный поиск по смыслу, а не только по ключевым словам.

Для кого: Инструмент ориентирован на разработчиков, исследователей и технических писателей, работающих с большими объёмами постоянно обновляемой документации. Особенно полезен тем, кто использует AI-ассистентов для разработки и хочет, чтобы модель оперировала актуальной информацией из внутренних вики, API-спецификаций или внешних ресурсов, а не полагалась на устаревшие данные из памяти LLM.

Сценарии использования:

Создание AI-ассистента разработчика, который способен отвечать на вопросы о коде и архитектуре, опираясь на самую свежую внутреннюю документацию компании, проиндексированную в векторной базе.

Автоматизация онбординга новых сотрудников: индексация всей корпоративной вики и предоставление возможности мгновенно получать точные ответы на вопросы о внутренних процессах через AI-интерфейс.

Улучшение качества ответов AI-агентов поддержки, которые могут искать решения не в статичной базе знаний, а динамически подгружая релевантные фрагменты из технической документации продукта по мере выхода обновлений.

Исследовательский инструмент для сбора, индексации и кросс-референсного семантического поиска по разрозненным научным статьям и спецификациям, собранным из интернета через функцию extract_urls.

Цены и доступность: Сам сервер является проектом с открытым исходным кодом, распространяемым по лицензии MIT, и не имеет собственной стоимости. Для его работы требуется сторонняя инфраструктура: API-ключ OpenAI для генерации векторных представлений текста (оплачивается по тарифам OpenAI) и доступ к развёрнутой инстанции векторной базы данных Qdrant (доступна как в бесплатном облаке, так и в self-hosted вариантах).