Any Chat Completions MCP — это универсальный MCP-сервер-посредник, который позволяет любому AI-ассистенту, подключенному по протоколу MCP, динамически обращаться к десяткам различных LLM-провайдеров. Он выступает в роли хаба, маршрутизируя запросы к OpenAI, Anthropic, Ollama, Groq, Google Gemini и многим другим через единый стандартизированный интерфейс.
Ключевые особенности:
Динамическое переключение между AI-провайдерами: Позволяет в реальном времени выбирать, какая именно LLM будет выполнять конкретный запрос, просто указывая ее имя. Поддерживает OpenAI, Anthropic Claude, Google Gemini, Ollama, DeepSeek, Groq, OpenRouter и любые OpenAI-совместимые API.
Выполнение промптов как инструментов: Превращает вызовы LLM в стандартные MCP-инструменты, которые могут быть встроены в цепочки вызовов других серверов. Это позволяет одному AI-ассистенту использовать другие модели для выполнения подзадач.
Создание специализированных AI-агентов: Поддерживает конфигурирование “пресетов” — предварительно настроенных агентов с заданными системными промптами и конкретной моделью, оптимизированных для определенных задач (например, агент для код-ревью или для суммаризации текстов).
Гарантированная структура ответов: Может принудительно запрашивать ответы в формате JSON (structured output), что делает его идеальным для построения пайплайнов, где выход одной модели служит входом для другого инструмента.
Легковесный прокси-сервер: Работает как простой HTTP-сервер, который принимает стандартные запросы чат-комплишенов и форвардит их выбранному бэкенду, абстрагируя различия в API разных провайдеров.
Для кого: Ориентирован на разработчиков сложных AI-систем и MCP-клиентов, которым необходимо динамически задействовать различные LLM (включая локальные) без хардкода провайдеров в коде, а также строить multi-agent архитектуры.
Сценарии использования:
Создание multi-agent систем: Главный AI-ассистент может делегировать подзадачи специализированным моделям (например, быстрой и дешевой Groq для классификации и мощной Claude для глубокого анализа).
Абстрагирование от вендора LLM: Приложение может работать через MCP-сервер, переключаясь между OpenAI, Azure и локальной Ollama без изменения кодовой базы, что упрощает тестирование и снижает зависимость от одного провайдера.
Использование локальных моделей через MCP: Позволяет MCP-клиентам, которые по умолчанию не поддерживают Ollama, легко взаимодействовать с локально запущенными моделями.
Автоматический A/B-тестинг промптов: AI-ассистент может отправлять один и тот же промпт разным моделям и сравнивать результаты для выбора наилучшего ответа.
Цены и доступность: Сервер является проектом с открытым исходным кодом (лицензия MIT) и полностью бесплатен. Затраты могут быть связаны только с использованием API-ключей сторонних коммерческих провайдеров (OpenAI, Anthropic). Сам сервер может использовать и полностью бесплатные локальные модели через Ollama.