LiteLLM — это open-source инструмент для разработчиков, который предоставляет универсальный API-прокси для вызова более чем 100 языковых моделей от разных провайдеров в OpenAI-совместимом формате. Решает проблему вендор-лока и сложности интеграции разных LLM, позволяя переключаться между моделями без изменения кода и управлять расходами централизованно.
Ключевые особенности: Единый прокси-сервер с OpenAI-совместимым API: Все модели — от OpenAI, Anthropic, Azure, Hugging Face, Ollama и других — вызываются через один endpoint. Поддержка более 100 LLM: Переключение между моделями происходит изменением одного параметра без переписывания интеграции. Централизованное управление расходами и лимитами: Отслеживание токенов, бюджета и установка rate-limit’ов на уровне организации. Балансировка нагрузки, fallback’и и retry: Повышает отказоустойчивость AI-приложений, автоматически переключая запросы между провайдерами.
Для кого: Инструмент ориентирован на разработчиков и платформенные команды, которые используют несколько LLM-провайдеров и хотят иметь единый слой управления, бюджетирования и мониторинга.
Сценарии использования: Миграция между моделями без изменения кода: Команда заменяет GPT-4 на Claude, поменяв одну строку конфигурации. Контроль бюджета AI-проекта: Менеджер задает дневной лимит в долларах на каждого пользователя, LiteLLM отклоняет превышающие запросы. Балансировка нагрузки между провайдерами: При отказе одного API запросы автоматически уходят на другой. Локальное тестирование и продакшен: Разработчик использует одну и ту же интеграцию для экспериментов с локальными моделями и боевых запросов к облачным провайдерам.
Цены и доступность: LiteLLM является open-source и предлагает бесплатную версию с базовыми возможностями прокси и логирования. LiteLLM Cloud предоставляет управляемый хостинг прокси с платными тарифами, которые не раскрыты публично. Enterprise-тариф включает расширенные функции безопасности и dedicated support.