Local LLM
Jan — Open-source ChatGPT Alternative That Runs Offline logo

Jan — alternative open source à ChatGPT qui fonctionne hors ligne

Jan est une application de bureau sous licence MIT qui exécute des LLM en local avec une expérience à la ChatGPT. Hub de modèles intégré, assistants, extensions et serveur local compatible OpenAI — l’alternative open source à LM Studio.

Why Jan

La thèse de Jan : « l’expérience LM Studio, mais open source et privacy-first ». C’est une app de bureau basée sur Tauri pour Windows, macOS et Linux, avec une UI familière façon ChatGPT, un hub de modèles intégré et un onglet serveur local. Les utilisateurs qui valorisent l’open source ou qui se méfient des apps d’inférence à code fermé ont une alternative claire.

Sous le capot, Jan utilise llama.cpp (via un moteur cortex embarqué) et peut aussi se connecter à des endpoints distants — OpenAI, Anthropic, Groq, ou tout serveur compatible. Vous pouvez faire tourner un modèle local, un modèle distant, ou les deux simultanément et basculer entre eux dans le dropdown du chat. Ce mode hybride est subtilement utile : modèle cloud rapide pour les questions rapides, modèle local pour les questions sensibles.

Compromis face à LM Studio : la GUI de Jan est fonctionnelle mais paraît plus jeune — moins de raffinements (support MLX, sélecteur de quantification explicite, navigateur de modèles soigné). Là où Jan gagne : licence MIT, position explicite zéro-télémétrie, SDK d’extensions et la CLI headless du moteur cortex pour les serveurs.

Quick Start — Install, Download, Chat

Jan livre à la fois l’app de bureau et un moteur headless (cortex) que vous pouvez faire tourner sur des serveurs Linux sans l’UI. L’app de bureau appelle cortex en local ; sur un serveur, vous pouvez sauter la GUI et lancer cortex comme service système exposant une API compatible OpenAI.

# 1. Download the installer from https://jan.ai
#    macOS .dmg, Windows .exe, Linux .AppImage / .deb

# 2. Open Jan:
#    - "Hub" tab → search "Llama 3.2 3B Instruct Q4" → Download
#    - "Chat" tab → select the model → chat offline

# 3. Start the local API server (Jan settings → Local API Server → Start)
#    Listens on http://localhost:1337/v1 with OpenAI shape.

# 4. Point any OpenAI SDK at it
python - <<'PY'
from openai import OpenAI
c = OpenAI(base_url="http://localhost:1337/v1", api_key="jan")
r = c.chat.completions.create(
    model="llama3.2-3b-instruct",
    messages=[{"role":"user","content":"Give me a 2-sentence Jan summary."}],
)
print(r.choices[0].message.content)
PY

# 5. Headless: use Cortex (Jan's engine) on a server without the GUI
curl -s https://raw.githubusercontent.com/janhq/cortex/dev/engine/templates/linux/install.sh | sudo bash
cortex models pull llama3.2:3b-instruct-q4
cortex run llama3.2:3b-instruct-q4   # server on :3928

Fonctionnalités clés

Application de bureau open source

Build Tauri + React, sous licence MIT. Lisez le code, forkez, auto-hébergez. À l’opposé du binaire à code fermé de LM Studio.

Hub de modèles intégré

Modèles curatés avec des quantifications recommandées. Téléchargement en un clic. Couvre les familles Llama, Qwen, Mistral, Gemma, DeepSeek, Phi.

Endpoints distants et locaux

Connectez-vous à OpenAI, Anthropic, Groq, OpenRouter ou tout serveur compatible OpenAI à côté des modèles locaux. Basculez par conversation.

Assistants et connaissances

Assistants façon persona avec des prompts système et des connaissances attachées (PDF, URL). RAG local sans infra supplémentaire.

Extensions / plugins

SDK d’extensions pour ajouter des outils (recherche web, exécution de code, intégrations personnalisées). L’écosystème grandit mais reste plus petit que celui de text-generation-webui.

Privacy-first

Pas de télémétrie par défaut, pas de compte requis, toutes les données restent sur l’appareil sauf si vous ajoutez explicitement un endpoint distant.

Comparaison

 LicenseUX PolishBackendBest Fit
Jancelui-ciMIT (open)Good, improvingCortex (llama.cpp-based)OSS-purist desktop users
LM StudioClosed-source freeExcellentllama.cpp + MLXDesktop users who prefer polish over license
OllamaMITCLI-firstllama.cppDevelopers
GPT4AllMITVery goodllama.cpp (modified)Offline-first CPU users

Cas d'usage

01. Remplacement open source de ChatGPT

Les utilisateurs qui veulent une UX ChatGPT familière mais qui refusent les apps d’inférence desktop à code fermé. Jan coche les deux cases.

02. Chat mixte local + cloud

Routez les questions sensibles vers un modèle local, les questions banales vers Claude ou GPT — le tout dans une seule app. Le switcher d’endpoint de Jan rend ça indolore.

03. Serveur headless avec cortex

Faites tourner cortex sur un serveur Linux sans la GUI pour exposer une API locale compatible OpenAI. Alternative à Ollama sur serveurs avec une simplicité similaire et un vrai open source.

Tarification et licence

Jan : open source sous licence MIT. Utilisation commerciale gratuite. GitHub.

Moteur cortex : également MIT. Binaire séparé pour usage headless / serveur. Pas de palier payant.

Coût matériel : identique à tout outil basé sur llama.cpp — évolue selon la taille du modèle et la quantification. 8 Go de RAM minimum pour des modèles 3B-7B.

Assets associés sur TokRepo

Questions fréquentes

Jan vs LM Studio ?+

La parité fonctionnelle est proche. Jan est open source MIT ; LM Studio est gratuit à code fermé. LM Studio a une UX un peu meilleure et le support MLX sur Apple Silicon. Jan a un SDK d’extensions publié et une position privacy explicite. Choisissez selon l’axe qui vous importe.

Jan vs Ollama ?+

Jan est GUI d’abord avec une UI de chat ; Ollama est CLI/API d’abord. Les deux exposent des endpoints compatibles OpenAI. Beaucoup d’utilisateurs installent les deux : Jan pour le chat interactif, Ollama pour l’intégration outils.

Jan peut-il fonctionner sans internet ?+

Oui — après l’installation initiale de l’app et le téléchargement unique du modèle. Pas de télémétrie ni de phone-home requis. Mode airgap explicite disponible dans les paramètres pour les environnements sensibles.

Jan supporte-t-il MLX sur Apple Silicon ?+

Cortex ajoute des backends façon MLX ; en 2026, Jan utilise principalement llama.cpp avec Metal. Si vous voulez la vitesse absolument maximale sur Apple Silicon, le MLX de LM Studio ou MLX brut donne un avantage.

Comment utiliser des modèles distants depuis Jan ?+

Settings → Model Providers → ajoutez OpenAI (API key), Anthropic (API key), Groq, OpenRouter ou un endpoint personnalisé compatible OpenAI. Les modèles distants apparaissent ensuite dans le sélecteur de modèles à côté des locaux.

Comparer les alternatives