AI Gateway

OpenRouter — API unifiée pour plus de 300 modèles, une seule facture

OpenRouter est un routeur managé qui expose plus de 300 LLM (OpenAI, Claude, Gemini, modèles open source via Groq/Together/Fireworks) derrière une unique API compatible OpenAI et une facture consolidée.

Site officiel

Why OpenRouter

OpenRouter résout une douleur précise : « je veux essayer 10 modèles cette semaine sans signer 10 contrats fournisseurs ». Vous rechargez du crédit une fois, accédez à tous les principaux modèles fermés et open source derrière une seule API key, et changez de modèle en modifiant une chaîne. Le pricing est pay-per-token — une petite marge sur les prix fournisseurs directs en échange de zéro setup et d'une facturation unifiée.

C'est le moyen le plus rapide de benchmarker des modèles sur votre charge réelle. Le prompt caching, le streaming, les tool calls et la vision fonctionnent tous uniformément. Vous pouvez A/B tester Claude 3.5 Sonnet face à Gemini 2.0 Pro face à Llama 3.3 70B en une après-midi.

Là où ce n'est pas la bonne réponse : quand vous avez besoin de relations directes avec les fournisseurs (contrats entreprise, SLA zéro-retention, résidence régionale des données) ou quand la marge par token compte à votre volume. À 10M+ tokens par mois, passer en direct avec LiteLLM qui proxifie vos propres clés est souvent moins cher et vous donne du levier contractuel.

Quick Start — OpenAI SDK + Model String

HTTP-Referer et X-Title sont optionnels mais recommandés — ils font apparaître votre appli sur le leaderboard OpenRouter (utile pour l'attribution). Les noms de modèles suivent le format fournisseur/model-slug. Le modèle « openrouter/auto » laisse le routage à l'optimiseur de coût d'OpenRouter.

# pip install openai
from openai import OpenAI

client = OpenAI(
    api_key="sk-or-...",
    base_url="https://openrouter.ai/api/v1",
    default_headers={
        "HTTP-Referer": "https://tokrepo.com",
        "X-Title": "TokRepo AI Gateway Example",
    },
)

# Switch models by changing the string — same code path
for model in [
    "anthropic/claude-3.5-sonnet",
    "openai/gpt-4o-mini",
    "google/gemini-2.0-flash-001",
    "meta-llama/llama-3.3-70b-instruct",
]:
    resp = client.chat.completions.create(
        model=model,
        messages=[{"role": "user", "content": "Name one thing you do best."}],
        max_tokens=80,
    )
    print(f"{model}: {resp.choices[0].message.content.strip()}")
    print(f"  cost: $ {resp.usage.total_tokens} tokens")

# Advanced: let OpenRouter pick cheapest available provider
# model="openrouter/auto"  → auto-routes based on cost + availability.
# Or use OR-specific params for provider preferences and fallbacks.

Fonctionnalités clés

300+ modèles derrière une seule API

Modèles fermés (OpenAI, Anthropic, Google, Cohere), grands modèles open source (Llama, Mistral, Qwen, DeepSeek) et modèles spécialisés (Perplexity online, modèles vision). Une seule API key pour tout.

Fallback automatique entre fournisseurs

OpenRouter conserve plusieurs fournisseurs upstream par modèle open source (Groq, Together, Fireworks, Anyscale). Si l'un est down ou lent, il retente avec un autre de manière transparente.

Pay-per-token, sans minimum

Rechargez du crédit, payez uniquement ce que vous consommez. Pas de frais mensuels, pas d'abonnement par fournisseur. Coût visible par requête dans les headers de réponse.

Préférences de fournisseur

Headers à l'envoi de la requête pour privilégier des fournisseurs, régions ou tiers de pricing spécifiques. Utile pour la compliance (« fournisseurs UE uniquement ») ou la performance (« préférer Groq »).

Modèles en tier gratuit

Un ensemble tournant de modèles gratuits (par exemple certaines variantes Llama et Gemma plus petites) pour expérimenter. Rate-limités mais utiles pour le prototypage.

Attribution d'appli

Les applis peuvent s'enregistrer chez OpenRouter pour les leaderboards et les règles de routage par défaut. Bon canal de distribution pour les outils AI publics.

Comparaison

	Type	Model Count	Billing	Self-host?
OpenRoutercelui-ci	Managed router	300+	Unified (topup + per-token)	No
LiteLLM	Self-host proxy + SDK	100+ providers	BYO keys per provider	Yes
Together AI	Hosted open-source inference	~50 OSS models	Per-token	No
Groq	Specialty fast inference	~20 OSS models	Per-token	No

Cas d'usage

01. Benchmarking de modèles

Exécutez vos vrais prompts sur une douzaine de modèles en une après-midi. Comparez qualité et coût avant de vous engager sur un fournisseur principal.

02. Prototypage rapide

Projets perso, hacks du week-end, démos — un seul rechargement, tous les modèles dispos. Évite la friction « je veux juste 5 $ de Claude » à l'inscription directe chez le fournisseur.

03. Applis qui laissent le choix du modèle aux utilisateurs

Chatbots et wrappers AI qui exposent le choix de modèle aux utilisateurs finaux. OpenRouter est la voie la plus propre pour proposer 10+ options sans 10+ intégrations.

Tarification et licence

Pricing au token : coût upstream direct plus une petite marge (généralement 5 à 10 %). Tarifs exacts par modèle sur openrouter.ai/models. Pas de frais mensuels.

Tier gratuit : modèles gratuits limités (rate-limités, liste tournante) pour expérimenter. Utile pour le dev/test sans dépense.

À l'échelle, comparez avec le direct : pour les charges mono-modèle à fort volume, les relations directes avec les fournisseurs battent souvent la marge OpenRouter. OpenRouter gagne sur la flexibilité et le coût multi-modèles ; le direct gagne sur les remises de volume et la compliance.

Assets associés sur TokRepo

OpenRouter — Unified API for 300+ LLMs with Auto Failover

OpenRouter is one OpenAI-compatible endpoint for 300+ LLMs across 60+ providers. Transparent pricing, no markup, automatic failover when a route is down.

OpenRouter MCP — One Server for 300+ LLMs in Claude Code

OpenRouter MCP exposes all 300+ OpenRouter models to Claude Code, Cursor, Codex CLI as one MCP server. Switch models per task, BYO routing, no extra SDKs.

OpenRouter Auto Routing — Pick the Best Model per Query

OpenRouter Auto routes each query to the optimal model balancing cost, latency, capability. Set model=openrouter/auto, the router decides per-prompt.

OpenRouter — Unified API for 200+ AI Models

Single API to access 200+ AI models from OpenAI, Anthropic, Google, Meta, Mistral, and more. OpenAI-compatible format, automatic fallbacks, and usage-based pricing.

Questions fréquentes

OpenRouter ou LiteLLM ?+

OpenRouter est un service managé (ils détiennent les clés, vous facturent, prennent une marge). LiteLLM est un proxy self-hosted (vous détenez les clés, recevez les factures directes des fournisseurs). OpenRouter pour la vitesse et la flexibilité ; LiteLLM pour le contrôle et la compliance.

De combien OpenRouter majore-t-il les prix fournisseurs ?+

Généralement une marge de 5 à 10 %, selon le modèle. Certains modèles open source coûtent moins cher sur OpenRouter que le prix fournisseur affiché grâce aux accords de volume d'OpenRouter. Comparez sur openrouter.ai/models pour le tarif courant de chaque modèle.

OpenRouter supporte-t-il les tool calls / function calling ?+

Oui — sur les modèles qui le supportent (OpenAI, Claude, Gemini, de nombreux modèles open source via leurs runtimes respectifs). L'API reprend la forme des tool calls d'OpenAI.

Puis-je utiliser OpenRouter avec Claude Code / Cursor / Cline ?+

Oui. Ces outils acceptent n'importe quel endpoint compatible OpenAI. Pointez-les sur https://openrouter.ai/api/v1 avec votre clé OpenRouter et choisissez n'importe quel modèle supporté.

Y a-t-il un sujet de rétention des données ?+

OpenRouter loggue par défaut des métadonnées (quel modèle, tokens, latence). Le logging du contenu prompt/réponse est opt-in par requête via des headers. Pour du zéro-retention complet, vérifiez les fournisseurs spécifiques et activez le header « OpenRouter ignore » — ou utilisez LiteLLM avec les clés directes des fournisseurs.

Comparer les alternatives

LiteLLM — Open-source LLM Proxy for 100+ Providers Portkey — AI Gateway with Prompt Management & Observability Cloudflare AI Gateway — Edge Proxy for LLM Traffic Helicone — Zero-Code LLM Observability Platform