Markdownify — это MCP-сервер, который конвертирует практически любые типы файлов и веб-контент в формат Markdown, предоставляя AI-ассистентам единый набор инструментов для обработки PDF, изображений, аудио, офисных документов и веб-страниц.
Ключевые особенности:
Конвертация офисных и архивных документов: Преобразует в Markdown файлы PDF, DOCX, XLSX и PPTX, извлекая текстовое содержимое и базовую структуру для дальнейшего анализа или обработки AI-моделью.
Обработка изображений и аудио: Извлекает текст и метаданные из изображений (OCR), а также транскрибирует аудиофайлы, превращая неструктурированный мультимедийный контент в доступный для поиска и анализа текст.
Извлечение веб-контента: Специализированные инструменты для конвертации веб-страниц, транскриптов YouTube-видео и даже результатов поиска Bing в чистый Markdown, что упрощает сбор и систематизацию информации из интернета.
Безопасная работа с файлами: Поддерживает переменную окружения MD_ALLOWED_PATHS для ограничения доступа сервера только к указанным директориям, что предотвращает несанкционированное чтение файлов за пределами разрешённого периметра.
Гибкая интеграция и развёртывание: Может работать локально через Node.js или Bun, а также в Docker-контейнере с возможностью монтирования только нужных хост-директорий, что упрощает изолированное использование в production-средах.
Для кого: Разработчики, исследователи, контент-менеджеры и технические писатели, которые работают с AI-ассистентами и нуждаются в быстрой унификации данных из десятков разнородных источников (сканы договоров, записи совещаний, веб-статьи, презентации) в единый, удобный для машины и человека текстовый формат.
Сценарии использования:
Анализ юридических документов в AI-чате: Пользователь передаёт AI-ассистенту PDF-файл с договором, сервер конвертирует его в Markdown, после чего модель может проанализировать пункты, найти риски или составить саммари.
Создание конспектов вебинаров: Загружается видео с YouTube, Markdownify получает его транскрипт и преобразует в структурированный текст, а AI-ассистент выделяет ключевые тезисы и составляет план действий.
Пакетная обработка корпоративных документов: AI-модель последовательно обрабатывает набор DOCX-отчётов и XLSX-таблиц, конвертируя их в Markdown для объединения в единую базу знаний или аналитическую сводку.
Исследование конкурентов: AI-ассистент по запросу пользователя конвертирует в Markdown несколько веб-страниц конкурентов и их презентации в PPTX, чтобы затем выполнить сравнительный анализ и выделить ключевые преимущества.
Цены и доступность: Markdownify — это полностью бесплатный опенсорс-проект (лицензия MIT), который можно установить локально через клонирование репозитория и сборку. Для работы некоторых функций (транскрипция аудио, OCR) требуется установка полного пакета зависимостей markitdown[all]. Доступен также Docker-образ с урезанным функционалом (только PDF).