Last9 MCP Server — это MCP-сервер, который соединяет AI-ассистентов напрямую с инфраструктурой наблюдаемости Kubernetes через единый API платформы Last9, позволяя моделям самостоятельно запускать расследования инцидентов, выполнять PromQL-запросы, анализировать логи, алерты и управлять правилами мониторинга без участия дежурного инженера.
Ключевые особенности:
Прямые запросы метрик через PromQL: Инструмент query_metrics позволяет AI-ассистенту выполнять мгновенные и диапазонные запросы PromQL к совместимым хранилищам (Prometheus, Thanos, Mimir, Cortex), извлекая метрики CPU, памяти, латентности и любых кастомных показателей в реальном времени.
Динамическое исследование топологии Kubernetes: Инструменты list_* дают модели возможность сначала изучить структуру кластера — неймспейсы, поды, сервисы, ноды, деплойменты, — а затем точечно запрашивать связанные метрики или логи, снижая объем передаваемых данных.
Управление алертами и recording rules: AI-агент способен создавать, обновлять и удалять алерты через manage_alert_rules и управлять правилами предварительной агрегации метрик через manage_recording_rules, полностью автоматизируя настройку мониторинга.
Интерпретация активных алертов: Инструменты get_active_alerts и get_rule_groups предоставляют модели полную картину текущих инцидентов и конфигурации правил, что позволяет AI находить корреляции между срабатываниями и первопричинами.
Тонкий контроль доступа: Администратор может ограничить видимость неймспейсов для AI-агента, а каждая операция предваряется планом действий, требующим явного одобрения пользователя перед выполнением.
Готовый демо-кластер для тестирования: Для быстрого ознакомления доступен публичный демо-токен, открывающий доступ к живому Kubernetes-кластеру с реальными данными без необходимости регистрации.
Для кого: Ориентирован на SRE-команды, платформенных инженеров и DevOps-специалистов, управляющих инфраструктурой Kubernetes и стеком мониторинга Prometheus/Thanos. Подходит для организаций, желающих разгрузить дежурных инженеров, передав рутинные расследования и настройку алертинга AI-ассистентам, работающим в Claude Desktop.
Сценарии использования:
Расследование инцидентов на естественном языке: SRE спрашивает “почему payment-api замедлился 10 минут назад”, и AI-агент через query_metrics извлекает графики латентности, через get_active_alerts проверяет связанные срабатывания, а через query_logs находит стек ошибок.
Автоматическая настройка алертов: инженер просит “создай алерт на превышение p95 латентности checkout-сервиса выше 500 мс”, и модель сама вычисляет порог на основе исторических данных через manage_alert_rules.
Поиск аномалий после деплоя: AI сравнивает метрики до и после релиза через query_metrics с разными временными диапазонами, выявляет рост ошибок или потребления ресурсов и предлагает откат.
Аудит конфигурации мониторинга: обход всех get_rule_groups и get_active_alerts для документирования текущих правил и выявления устаревших или конфликтующих алертов.
Цены и доступность: Сам MCP-сервер имеет открытый исходный код (Apache 2.0 License), написан на Go и распространяется через GitHub. Для работы требуется аккаунт Last9 с API-токеном. Доступны два тарифных плана: Pro ($1,150/мес) включает 1 млрд событий в месяц, неограниченную команду, 90 дней хранения метрик, 14 дней хранения логов и трейсов, SLA 99.9% на запись и поддержку в Slack/MS Teams. Enterprise — индивидуальное ценообразование с кастомным хранением, собственным облаком и поддержкой 24×7×365.