Kaggle-MCP — это MCP-сервер, который интегрирует платформу Kaggle с AI-ассистентами, позволяя им напрямую искать датасеты, загружать данные, сабмитить решения и управлять ноутбуками через единый протокол.
Ключевые особенности:
Поиск и загрузка датасетов: AI-ассистент может искать датасеты на Kaggle по ключевым словам, категориям и тегам, получать детальную информацию о них и автоматически загружать нужные файлы данных в локальное окружение для анализа.
Работа с соревнованиями: Сервер предоставляет инструменты для получения списка активных и завершённых соревнований, чтения их описания, правил и метрик, скачивания предоставленных данных и финального сабмита прогнозов модели.
Управление Kaggle-ноутбуками: Позволяет AI просматривать список своих ноутбуков на Kaggle, создавать новые, редактировать код в ячейках и запускать их на выполнение прямо в облачной среде платформы.
Поиск и анализ Kaggle-моделей: Предоставляет возможность искать опубликованные модели, изучать их метаданные, версии и производительность, чтобы AI мог использовать лучшие практики или брать готовые архитектуры за основу.
Прозрачная аутентификация через API: Для работы использует официальный Kaggle API, требуя от пользователя один раз настроить учётные данные (файл kaggle.json), после чего все операции выполняются от его имени с соблюдением прав доступа.
Для кого: Data Scientists, ML-инженеры и аналитики, которые активно участвуют в соревнованиях на Kaggle, используют платформу для поиска данных и моделей и хотят делегировать AI-помощнику рутинные операции — от поиска подходящего датасета до сабмита решения, — не покидая рабочую среду (например, VS Code или чат с Claude).
Сценарии использования:
Подготовка к соревнованию: Пользователь просит AI-ассистента найти соревнование по прогнозированию цен на жильё, скачать данные, исследовать их структуру и создать базовый Kaggle-ноутбук с шаблоном решения для первого сабмита.
Поиск релевантных данных: Исследователь говорит: “Найди датасеты с медицинскими снимками лёгких за последние два года и загрузи тот, у которого больше всего голосов”, — и AI выполняет всю цепочку от поиска до скачивания.
Итеративная разработка модели в облаке: AI по запросу пользователя создаёт ноутбук на Kaggle, добавляет в него код для обучения модели, запускает его, а после завершения анализирует логи и метрики, чтобы предложить улучшения.
Массовый анализ моделей сообщества: AI сканирует опубликованные модели под конкретную задачу, собирает их характеристики и метрики в сводную таблицу, помогая выбрать наиболее перспективный подход.
Цены и доступность: Kaggle-MCP является полностью бесплатным сервером с открытым исходным кодом (лицензия MIT), распространяемым через GitHub и npm. Для работы требуется Node.js 18+, учётная запись на Kaggle и установленный локально файл с API-ключами. Доступ ко всем функциям Kaggle (GPU в ноутбуках, участие в призовых соревнованиях) регулируется тарифами самой платформы.