[{"data":1,"prerenderedAt":-1},["ShallowReactive",2],{"pack-detail-self-hosted-ai-fr":3,"seo:pack:self-hosted-ai:fr":66},{"code":4,"message":5,"data":6},200,"操作成功",{"pack":7},{"slug":8,"icon":9,"tone":10,"status":11,"status_label":12,"title":13,"description":14,"items":15,"install_cmd":65},"self-hosted-ai","🏠","#059669","stable","Stable","IA Auto-Hébergée","Tabby, Onyx, LibreChat et un starter kit n8n — gardez vos données sur votre propre serveur.",[16,28,36,44,51,58],{"id":17,"uuid":18,"slug":19,"title":20,"description":21,"author_name":22,"view_count":23,"vote_count":24,"lang_type":25,"type":26,"type_label":27},216,"1a1d4061-a148-4566-a3d7-ab40e6f2a972","tabby-self-hosted-ai-coding-assistant-1a1d4061","Tabby — Self-Hosted AI Coding Assistant","Self-hosted AI code completion and chat assistant. Privacy-first alternative to GitHub Copilot. Supports 20+ models, repo-aware context, and IDE integrations. 33K+ stars.","TokRepo精选",1141,0,"en","skill","Skill",{"id":29,"uuid":30,"slug":31,"title":32,"description":33,"author_name":34,"view_count":35,"vote_count":24,"lang_type":25,"type":26,"type_label":27},390,"e1fd7c46-bbda-4956-8649-9c3ed579ff25","whisper-cpp-local-speech-text-pure-c-c-e1fd7c46","whisper.cpp — Local Speech-to-Text in Pure C\u002FC++","High-performance port of OpenAI Whisper in C\u002FC++. No Python, no GPU required. Runs on CPU, Apple Silicon, CUDA, and even Raspberry Pi. Real-time transcription.","Script Depot",1949,{"id":37,"uuid":38,"slug":39,"title":40,"description":41,"author_name":42,"view_count":43,"vote_count":24,"lang_type":25,"type":26,"type_label":27},321,"210679a0-712f-4ec5-8d69-e0a016361c95","onyx-self-hosted-ai-chat-40-connectors-210679a0","Onyx — Self-Hosted AI Chat with 40+ Connectors","Onyx (formerly Danswer) is a self-hosted AI chat with RAG, custom agents, and 40+ knowledge connectors. 20.4K+ stars. Enterprise search. MIT.","AI Open Source",383,{"id":45,"uuid":46,"slug":47,"title":48,"description":49,"author_name":42,"view_count":50,"vote_count":24,"lang_type":25,"type":26,"type_label":27},284,"850494fb-7737-4388-8104-f8860a0d2d41","librechat-self-hosted-multi-ai-chat-platform-850494fb","LibreChat — Self-Hosted Multi-AI Chat Platform","LibreChat is a self-hosted AI chat platform unifying Claude, OpenAI, Google, AWS in one interface. 35.1K+ GitHub stars. Agents, MCP, code interpreter, multi-user auth. MIT.",318,{"id":52,"uuid":53,"slug":54,"title":55,"description":56,"author_name":42,"view_count":57,"vote_count":24,"lang_type":25,"type":26,"type_label":27},483,"92d3cc62-6199-4b1c-a7f1-1b73a1da86a0","self-hosted-ai-starter-kit-local-ai-n8n-92d3cc62","Self-Hosted AI Starter Kit — Local AI with n8n","Docker Compose template by n8n that bootstraps a complete local AI environment with n8n workflow automation, Ollama LLMs, Qdrant vector database, and PostgreSQL. 14,500+ stars.",369,{"id":59,"uuid":60,"slug":61,"title":62,"description":63,"author_name":42,"view_count":64,"vote_count":24,"lang_type":25,"type":26,"type_label":27},870,"f05a11a5-33e5-11f1-9bc6-00163e2b0d79","typebot-visual-ai-chatbot-builder-you-can-self-host-f05a11a5","Typebot — Visual AI Chatbot Builder You Can Self-Host","Build advanced chatbots visually with 34+ blocks. Embed anywhere, collect results in real-time. OpenAI integration, custom themes, analytics. Self-hostable. 9,800+ stars.",349,"tokrepo install pack\u002Fself-hosted-ai",{"pageType":67,"pageKey":8,"locale":68,"title":69,"metaDescription":70,"h1":13,"tldr":71,"bodyMarkdown":72,"faq":73,"schema":89,"internalLinks":99,"citations":112,"wordCount":125,"generatedAt":126},"pack","fr","IA Auto-Hébergée : Tabby, Onyx, LibreChat, n8n Starter Kit","Tabby, Onyx, LibreChat, n8n — six ressources IA auto-hébergées qui remplacent Copilot, ChatGPT et Zapier sur votre serveur. Installez via TokRepo.","Six ressources IA auto-hébergées éprouvées — Tabby (remplace Copilot), Onyx (recherche d'entreprise), LibreChat (clone ChatGPT) et un starter kit n8n AI. Gardez vos données sur votre propre serveur.","## Ce que contient ce pack\n\nCe pack rassemble les **six ressources IA auto-hébergées** qui reviennent constamment quand les équipes quittent le SaaS pour des raisons de compliance, coût ou souveraineté. Trois sont des remplaçants coding\u002Fchat (Tabby, LibreChat, Onyx). Trois sont des pièces d'infrastructure (n8n AI starter kit, STT local, gateway de modèles).\n\n| # | Ressource | Type | Ce qu'elle remplace |\n|---|---|---|---|\n| 1 | Tabby | service auto-hébergé | GitHub Copilot |\n| 2 | Onyx | service auto-hébergé | Glean \u002F ChatGPT entreprise |\n| 3 | LibreChat | UI auto-hébergée | ChatGPT pour l'équipe |\n| 4 | n8n AI starter kit | docker-compose | Zapier avec nœuds IA |\n| 5 | Whisper STT (local) | service | Otter \u002F Rev \u002F STT cloud |\n| 6 | Gateway de modèles local | service | LiteLLM avec routing local-first |\n\n## Pourquoi c'est important\n\nLe stack IA par défaut 2026 suppose que vous êtes OK pour envoyer votre code, chats et données client à OpenAI \u002F Anthropic \u002F Google. Pour la plupart des apps grand public ça va. Pour les industries réglementées (santé, finance, juridique), le travail gouvernemental, ou toute équipe où votre IP *est* le produit, c'est rédhibitoire. Ce pack est la réponse assemblée : un stack que vous pouvez faire tourner sur une seule workstation ou un petit cluster Kubernetes qui vous donne des outils dev équivalents à Copilot, du chat équivalent à ChatGPT et du retrieval équivalent à la recherche d'entreprise — entièrement sur votre propre matériel.\n\nLes trois remplaçants phares :\n\n- **Tabby** est le substitut de Copilot. Auto-hébergez-le, pointez votre IDE dessus, et vous obtenez de la complétion inline soutenue par le modèle local que vous chargez (DeepSeek-Coder, Qwen-Coder, etc). Sur une seule 3090 vous égalez la qualité Copilot sur la plupart des langages.\n- **Onyx** (anciennement Danswer) est le substitut de la recherche d'entreprise. Connectez-le à votre Confluence, Notion, GitHub, Slack, et il construit un ChatGPT interne qui répond aux questions depuis vos docs. Recherche hybride vecteur + keyword avec citations.\n- **LibreChat** est le substitut du ChatGPT-d'équipe. Multi-utilisateur, multi-modèle (fonctionne avec Ollama local ou APIs cloud en fallback), historique, bibliothèque de prompts. L'UI par défaut quand vous voulez donner à votre équipe \"un ChatGPT\" sans payer par siège.\n\nLes trois pièces d'infra comblent les trous. Le starter kit n8n vous donne Docker compose pour n8n + Postgres + Qdrant + un modèle local — automatisation de workflow sur votre propre matériel. Whisper local signifie que les transcriptions de meetings et notes vocales ne quittent jamais votre réseau. Le gateway route entre modèles locaux et cloud pour que vous ne tombiez sur Claude que quand le local ne peut pas répondre.\n\n## Installer en une commande\n\n```bash\n# Installe le pack entier\ntokrepo install pack\u002Fself-hosted-ai\n\n# Ou choisissez la pièce dont vous avez besoin\ntokrepo install tabby\ntokrepo install onyx\ntokrepo install librechat\ntokrepo install n8n-ai-starter-kit\n```\n\nLe TokRepo CLI installe les fichiers docker-compose, templates d'environnement, et les fichiers de règle \u002F subagents pour votre outil IA qui expliquent *quand* invoquer le stack local vs le cloud. Lancez `docker compose up -d` après l'install et les services sont joignables sur localhost.\n\n## Pièges courants\n\n- **Ne lancez pas un modèle 70B sur 16GB VRAM.** Adaptez la taille du modèle à votre GPU. Le DeepSeek-Coder-7B de Tabby tient sur une carte 12GB et c'est largement suffisant pour la complétion. Pour le chat, Qwen-2.5-32B en 4-bit est le sweet spot si vous avez 24GB.\n- **Les connecteurs Onyx limitent en silence.** Quand vous pointez Onyx vers un Confluence 50k pages, la sync initiale prend des heures et certains connecteurs vont s'arrêter. Surveillez les logs ; ne faites pas confiance à la barre de progression de l'UI les 24 premières heures.\n- **n8n + workflows IA fuitent les credentials.** Le starter kit livre des credentials Postgres par défaut en clair. Changez-les, et mettez n8n derrière Cloudflare Tunnel ou un reverse proxy avec auth avant de l'exposer.\n- **Permissions LibreChat plates par défaut.** Sortie d'usine chaque utilisateur voit chaque conversation. Configurez RBAC et whitelist de modèle par utilisateur avant d'onboarder une équipe.\n- **Les backups ne sont pas automatiques.** Auto-hébergé = auto-backup. Planifiez pg_dump pour LibreChat\u002FOnyx et snapshot du cache modèle Tabby ; budgétez stockage 3× votre dataset actif pour les restore points.\n\n## Relation avec les autres packs\n\nCe pack s'apparie naturellement avec deux autres. **MCP Server Stack** vous donne les connecteurs niveau-protocole (filesystem, navigateur, base de données MCP servers) qui routent à travers votre gateway de modèles local — ainsi même Claude Code peut appeler vos services locaux. **LLM Observability** importe plus ici que sur les APIs cloud parce que vous possédez la surface d'échec ; Langfuse self-hosted est dans ce pack et s'intègre proprement avec Onyx et LibreChat.\n\nSi vous démarrez de zéro, ordre d'installation : 1) LibreChat (valeur immédiate utilisateur), 2) Tabby (valeur développeur), 3) Onyx (recherche org-wide), 4) n8n + gateway quand vous commencez à construire des automatisations dessus.",[74,77,80,83,86],{"q":75,"a":76},"Tabby est-il gratuit ?","Oui, Tabby est open-source sous Apache 2.0 avec une édition Community auto-hébergée gratuite. Il y a un tier Enterprise payant pour SSO, audit logs et SLAs, mais Community est complet pour usage individuel et petites équipes. Vous payez seulement le GPU où vous le faites tourner. Même modèle pour Onyx, LibreChat et n8n — tous OSS avec tiers payants optionnels.",{"q":78,"a":79},"Est-ce que ça marche avec Cursor ou Codex CLI au lieu de Claude Code ?","Les services auto-hébergés sont tool-agnostiques — Tabby expose une API compatible Copilot que tout IDE supportant Copilot peut utiliser (VS Code, JetBrains, Vim). LibreChat est une UI web donc indépendante de l'outil. Le TokRepo CLI installe la config spécifique outil IA (règles Cursor, AGENTS.md, subagents Claude Code) qui dit à votre agent que les services locaux existent.",{"q":81,"a":82},"Comment Tabby se compare-t-il à Cursor avec un modèle local ?","Le support de modèle local de Cursor est limité à des endpoints spécifiques ; Tabby est conçu pour la complétion code self-hosted avec télémétrie, model warmup et un vrai backend. Si vous voulez Copilot self-hosted IDE-agnostique multi-équipe, Tabby gagne. Si vous voulez spécifiquement l'UX Cursor avec un modèle local derrière, voyez le gateway local de ce pack — il peut faire endpoint compatible Cursor.",{"q":84,"a":85},"Quelle est la différence avec le pack MCP Server Stack ?","MCP Server Stack concerne les connecteurs niveau-protocole pour que les outils IA puissent lire votre filesystem, navigateur, base de données. Self-Hosted AI concerne le remplacement intégral du LLM\u002FUI\u002Fassistant IDE cloud par des services sur votre propre matériel. Ils sont complémentaires : les serveurs MCP peuvent être configurés pour router à travers votre gateway local, vous donnant un stack agent entièrement on-prem.",{"q":87,"a":88},"Quand ne PAS auto-héberger ?","Quand la latence importe plus que la souveraineté (voix temps réel, complétion code sub-300ms contre petit modèle est dur), quand votre usage est trop faible pour justifier un GPU (100$\u002Fmois d'API est moins cher qu'une 4090 amortie sur 3 ans), ou quand vous n'avez pas de support ops pour gérer backups, upgrades modèle et l'OOM inévitable à 2h du matin. L'auto-hébergement est du vrai travail ops ; budgétez-le.",{"@context":90,"@type":91,"name":92,"description":93,"numberOfItems":94,"publisher":95},"https:\u002F\u002Fschema.org","CollectionPage","Self-Hosted AI","Tabby, Onyx, LibreChat, and an n8n starter kit — keep your data on your own metal.",6,{"@type":96,"name":97,"url":98},"Organization","TokRepo","https:\u002F\u002Ftokrepo.com",[100,104,108],{"url":101,"anchor":102,"reason":103},"\u002Ffr\u002Fpacks\u002Fmcp-server-stack","Stack de Serveurs MCP","les MCP câblent les modèles locaux dans les outils IA",{"url":105,"anchor":106,"reason":107},"\u002Ffr\u002Fpacks\u002Fllm-observability","Observabilité LLM","monitorer votre stack auto-hébergé",{"url":109,"anchor":110,"reason":111},"\u002Ffr\u002Ftools\u002Fcline","Cline","agent VS Code qui se marie bien avec Tabby local",[113,117,121],{"claim":114,"source_name":115,"source_url":116},"Tabby is a self-hosted AI coding assistant alternative to GitHub Copilot","TabbyML\u002Ftabby on GitHub","https:\u002F\u002Fgithub.com\u002FTabbyML\u002Ftabby",{"claim":118,"source_name":119,"source_url":120},"LibreChat is an open-source ChatGPT clone supporting multiple LLM backends","danny-avila\u002FLibreChat on GitHub","https:\u002F\u002Fgithub.com\u002Fdanny-avila\u002FLibreChat",{"claim":122,"source_name":123,"source_url":124},"n8n is a fair-code workflow automation platform with self-hosting support","n8n.io\u002Fself-hosted","https:\u002F\u002Fdocs.n8n.io\u002Fhosting\u002F",833,"2026-05-02T15:00:00Z"]