AI Gateway

LiteLLM — Proxy LLM open source pour plus de 100 fournisseurs

LiteLLM est un proxy open source qui normalise plus de 100 API LLM derrière le SDK OpenAI. Placez-le devant Claude, Gemini, Ollama, Bedrock, Vertex ou Azure — un seul client, des appels unifiés.

Site officiel GitHub

Why LiteLLM

LiteLLM est la réponse « un seul SDK pour tous les LLM », plus un serveur Proxy complet pour les équipes qui veulent un gateway hébergé qu'elles contrôlent. Le SDK seul normalise les entrées et sorties : completion(model="claude-3-5-sonnet", messages=[...]) fonctionne à l'identique de l'appel OpenAI. Le Proxy ajoute le routage, les budgets, la gestion des clés, le logging et une UI Swagger.

C'est le gateway OSS le plus populaire (25K+ étoiles GitHub) et la référence standard pour un accès multi-modèles indépendant du framework. LangChain, LlamaIndex et CrewAI supportent tous LiteLLM comme model provider d'entrée de jeu. Si vous avez lu « pointez-le sur n'importe quel endpoint compatible OpenAI » dans une douzaine de READMEs, LiteLLM est ce qui fait tourner la plupart de ces setups.

Ce que vous abandonnez : le polish. Le dashboard existe mais reste fonctionnel, pas magnifique. L'observabilité est présente mais pas profonde — la plupart des équipes associent LiteLLM Proxy à Langfuse ou Helicone pour les traces. Pour un produit libre et gratuit, vous échangez l'UX contre du contrôle.

Quick Start — SDK or Proxy

Le SDK est le chemin le plus rapide vers le support multi-fournisseurs — aucun serveur à faire tourner. Le Proxy est un petit serveur FastAPI qui expose des endpoints compatibles OpenAI ; pointez n'importe quel SDK OpenAI dessus. Le routage piloté par config permet de changer de fournisseur ou de stratégie de load-balancing sans toucher au code applicatif.

# Option A: SDK only (no server needed)
# pip install litellm
from litellm import completion

resp = completion(
    model="anthropic/claude-3-5-sonnet-20241022",
    messages=[{"role": "user", "content": "Hello from LiteLLM"}],
)
print(resp.choices[0].message.content)

# Option B: Run the Proxy for team use
# pip install 'litellm[proxy]'
# litellm --config config.yaml --port 4000
#
# config.yaml:
# model_list:
#   - model_name: fast
#     litellm_params:
#       model: gpt-4o-mini
#       api_key: os.environ/OPENAI_KEY
#   - model_name: fast
#     litellm_params:
#       model: claude-3-5-haiku-20241022
#       api_key: os.environ/ANTHROPIC_KEY
# router_settings:
#   routing_strategy: usage-based-routing-v2

# Now call the proxy as if it were OpenAI
from openai import OpenAI
client = OpenAI(base_url="http://localhost:4000", api_key="sk-proxy-token")
r = client.chat.completions.create(model="fast", messages=[{"role":"user","content":"hi"}])
# Proxy load-balances between gpt-4o-mini and claude-3-5-haiku based on usage.

Fonctionnalités clés

100+ fournisseurs

OpenAI, Anthropic, Gemini, Bedrock, Azure, Vertex, Ollama, Together, Fireworks, Anyscale, Groq, Mistral, Cohere, HuggingFace et bien d'autres. Tous via la même signature completion().

Serveur Proxy

Serveur FastAPI de niveau production : routage, load-balancing, retries, cache, gestion des clés et budgets utilisateurs. Déploiement Docker ; exposez-le comme endpoint interne compatible OpenAI.

Budgets et rate limits

Budgets par utilisateur, par équipe et par clé appliqués au niveau du Proxy. Alertes à 80 % / 100 % de dépense. Essentiel pour les setups multi-tenant ou platform-as-a-service interne.

Hooks Langfuse / Helicone / Sentry

Intégrations callback natives. Couplez LiteLLM Proxy avec Langfuse pour les traces, Helicone pour l'observabilité, Sentry pour les erreurs. Configurable dans le YAML du proxy.

Fallback et retry

Listes de fallback déclaratives : tentez Claude, basculez sur GPT-4o, puis sur gpt-4o-mini. Backoff exponentiel intégré. Configurable par route.

Auth et RBAC personnalisés

Le Proxy génère des clés virtuelles par utilisateur ; le contrôle d'accès par rôle décide quels modèles et budgets chaque utilisateur peut atteindre. S'intègre à votre SSO existant via OIDC.

Comparaison

	License	Deployment	Dashboard	Best For
LiteLLMcelui-ci	MIT (SDK) + proxy	Self-host	Functional	Teams wanting OSS gateway + unified SDK
Portkey	Gateway Apache 2.0; cloud proprietary	Managed + self-host	Polished	Teams wanting managed UX
OpenRouter	Proprietary	Managed only	Web UI	Quick multi-model experiments
Cloudflare AI Gateway	Proprietary	Managed only	Web UI	Edge caching, simple setup

Cas d'usage

01. Plateforme AI interne

L'équipe plateforme exploite LiteLLM Proxy ; les équipes produit tapent sur un seul endpoint compatible OpenAI. Contrôle central des fournisseurs, des clés et des budgets ; aucun déploiement central quand une équipe veut un nouveau modèle.

02. Applis multi-modèles

Des Agents qui arbitrent entre modèles rapides/peu chers et lents/puissants. La signature completion() unifiée de LiteLLM ramène la logique de routage à 10 lignes, plutôt qu'une intégration par fournisseur.

03. Hybride local + cloud

Ollama pour le dev et l'inférence pas chère, OpenAI/Claude pour la production. Même chemin de code — on bascule via le nom de modèle.

Tarification et licence

LiteLLM : licence MIT, gratuit. Pas de SKU de support entreprise — le projet est maintenu par BerriAI et une communauté grandissante. Pour du support commercial, litellm.ai propose des tiers hébergés et entreprise avec SLA.

Coût opérationnel : petite VM pour le Proxy (2 vCPU / 4 Go absorbent en pratique plusieurs milliers de RPS), plus votre dépense LLM sous-jacente. Aucun frais gateway par requête.

Ce que vous payez en complexité cachée : le self-hosting veut dire que vous possédez l'uptime, les upgrades et le debug. Pour les équipes qui veulent « payer et oublier », Portkey ou Cloudflare allègent la charge ops au prix de la liberté sans licence.

Assets associés sur TokRepo

LiteLLM Cost Tracking — Per-Project LLM Spend Dashboard

LiteLLM ships a built-in cost dashboard. Track LLM spend by project, user, model, tag. Hard budgets that block at the proxy. SOC2 / SSO via Pro tier.

LiteLLM Proxy — Unified Gateway for 100+ LLM APIs

LiteLLM Proxy maps 100+ LLM providers (Anthropic, OpenAI, Bedrock, Vertex) to one OpenAI-compatible endpoint. Auth, rate limit, cost track, fallbacks.

LiteLLM Router — Smart Failover & Load Balancing in Python

LiteLLM Router routes LLM endpoints with retry, fallback, latency-based, weighted A/B. Pure Python — drop into any codebase, no separate proxy needed.

LiteLLM — Unified Proxy for 100+ LLM APIs

Python SDK and proxy server to call 100+ LLM APIs in OpenAI format. Cost tracking, guardrails, load balancing, logging. Supports Bedrock, Azure, Anthropic, Vertex, and more. 42K+ stars.

Questions fréquentes

LiteLLM SDK ou LiteLLM Proxy — lequel me faut-il ?+

Le SDK pour les applis isolées : vous voulez des appels completion() unifiés, sans serveur. Le Proxy pour les équipes / plateforme interne : plusieurs applis partagent le gateway, clés et budgets centralisés, endpoint compatible OpenAI pour les outils qui en demandent un.

LiteLLM ajoute-t-il de la latence ?+

SDK : ~0 (in-process). Proxy : 3 à 10 ms de surcoût sur le hot-path. Le cache et le load-balancing économisent souvent bien plus qu'ils ne coûtent sur du trafic réaliste.

Comment LiteLLM se compare-t-il à OpenRouter ?+

OpenRouter est un SaaS managé en pay-per-token sur l'ensemble des fournisseurs. LiteLLM est self-hosted avec vos propres clés. OpenRouter pour l'expérimentation rapide ou quand vous voulez une seule facture ; LiteLLM quand vous voulez contrôler les clés, les budgets et le flux de données.

LiteLLM est-il prêt pour la production ?+

Oui — déployé en production par de nombreuses grandes organisations. Consultez le README GitHub pour la liste des adopters actifs. Précautions attendues : surveillez le changelog pour les ruptures occasionnelles dues au développement rapide ; upgradez en staging avant la production.

Fonctionne-t-il avec Claude Code / Cursor / Cline ?+

Oui. Tout outil qui accepte un endpoint compatible OpenAI (base URL + API key) fonctionne. Pointez Cursor ou Cline sur votre LiteLLM Proxy, et l'intégration « OpenAI » de l'outil route désormais par votre gateway multi-fournisseurs.

Comment ajouter un nouveau fournisseur ?+

La liste /providers de LiteLLM couvre la plupart des LLM mainstream. Pour des fournisseurs nouveaux ou custom, enregistrez un endpoint générique compatible OpenAI dans la config model_list — aucun changement de code nécessaire.

Comparer les alternatives

OpenRouter — Unified API for 300+ Models, One Invoice Portkey — AI Gateway with Prompt Management & Observability Langfuse — Open-source LLM Engineering Platform Helicone — Zero-Code LLM Observability Platform