MCP-серверы

any chat completions mcp any chat completions mcp логотип

Сайт https://github.com/pyroprompts/any-chat-completions-mcp
Цена Бесплатный доступ
Основные направления AI-инфраструктура и MLOps, МСР для инференса

Any Chat Completions MCP — это универсальный MCP-сервер-посредник, который позволяет любому AI-ассистенту, подключенному по протоколу MCP, динамически обращаться к десяткам различных LLM-провайдеров. Он выступает в роли хаба, маршрутизируя запросы к OpenAI, Anthropic, Ollama, Groq, Google Gemini и многим другим через единый стандартизированный интерфейс.

Ключевые особенности:

Динамическое переключение между AI-провайдерами: Позволяет в реальном времени выбирать, какая именно LLM будет выполнять конкретный запрос, просто указывая ее имя. Поддерживает OpenAI, Anthropic Claude, Google Gemini, Ollama, DeepSeek, Groq, OpenRouter и любые OpenAI-совместимые API.

Выполнение промптов как инструментов: Превращает вызовы LLM в стандартные MCP-инструменты, которые могут быть встроены в цепочки вызовов других серверов. Это позволяет одному AI-ассистенту использовать другие модели для выполнения подзадач.

Создание специализированных AI-агентов: Поддерживает конфигурирование “пресетов” — предварительно настроенных агентов с заданными системными промптами и конкретной моделью, оптимизированных для определенных задач (например, агент для код-ревью или для суммаризации текстов).

Гарантированная структура ответов: Может принудительно запрашивать ответы в формате JSON (structured output), что делает его идеальным для построения пайплайнов, где выход одной модели служит входом для другого инструмента.

Легковесный прокси-сервер: Работает как простой HTTP-сервер, который принимает стандартные запросы чат-комплишенов и форвардит их выбранному бэкенду, абстрагируя различия в API разных провайдеров.

Для кого: Ориентирован на разработчиков сложных AI-систем и MCP-клиентов, которым необходимо динамически задействовать различные LLM (включая локальные) без хардкода провайдеров в коде, а также строить multi-agent архитектуры.

Сценарии использования:

Создание multi-agent систем: Главный AI-ассистент может делегировать подзадачи специализированным моделям (например, быстрой и дешевой Groq для классификации и мощной Claude для глубокого анализа).

Абстрагирование от вендора LLM: Приложение может работать через MCP-сервер, переключаясь между OpenAI, Azure и локальной Ollama без изменения кодовой базы, что упрощает тестирование и снижает зависимость от одного провайдера.

Использование локальных моделей через MCP: Позволяет MCP-клиентам, которые по умолчанию не поддерживают Ollama, легко взаимодействовать с локально запущенными моделями.

Автоматический A/B-тестинг промптов: AI-ассистент может отправлять один и тот же промпт разным моделям и сравнивать результаты для выбора наилучшего ответа.

Цены и доступность: Сервер является проектом с открытым исходным кодом (лицензия MIT) и полностью бесплатен. Затраты могут быть связаны только с использованием API-ключей сторонних коммерческих провайдеров (OpenAI, Anthropic). Сам сервер может использовать и полностью бесплатные локальные модели через Ollama.