[{"data":1,"prerenderedAt":-1},["ShallowReactive",2],{"pack-detail-rag-pipelines-fr":3,"seo:pack:rag-pipelines:fr":87},{"code":4,"message":5,"data":6},200,"操作成功",{"pack":7},{"slug":8,"icon":9,"tone":10,"status":11,"status_label":12,"title":13,"description":14,"items":15,"install_cmd":86},"rag-pipelines","📚","#3B82F6","stable","Stable","Pipelines RAG","Quivr, RAGFlow, GraphRAG et les bonnes pratiques de production. Évitez la mauvaise architecture initiale.",[16,28,37,45,52,60,69,79],{"id":17,"uuid":18,"slug":19,"title":20,"description":21,"author_name":22,"view_count":23,"vote_count":24,"lang_type":25,"type":26,"type_label":27},322,"96223597-08c2-4e60-b84e-0c4779641933","quivr-opinionated-rag-framework-any-llm-96223597","Quivr — Opinionated RAG Framework for Any LLM","Quivr is an opinionated RAG framework supporting any LLM, multiple file types, and customizable retrieval. 39.1K+ stars. Apache 2.0.","Script Depot",310,0,"en","script","Script",{"id":29,"uuid":30,"slug":31,"title":32,"description":33,"author_name":22,"view_count":34,"vote_count":24,"lang_type":25,"type":35,"type_label":36},245,"7785d7a8-fc57-42ab-ba6b-4a970404fadc","ragflow-deep-document-understanding-rag-engine-7785d7a8","RAGFlow — Deep Document Understanding RAG Engine","Open-source RAG engine with deep document understanding. Parses complex PDFs, tables, images. Agent-powered Q&A with citations. Multi-model. 77K+ stars.",381,"skill","Skill",{"id":38,"uuid":39,"slug":40,"title":41,"description":42,"author_name":43,"view_count":44,"vote_count":24,"lang_type":25,"type":35,"type_label":36},418,"ac77668d-1767-4b86-ac8c-1c050166d21b","graphrag-knowledge-graph-rag-microsoft-ac77668d","GraphRAG — Knowledge Graph RAG by Microsoft","Build knowledge graphs from documents for smarter RAG. Local and global search over entity relationships. By Microsoft Research. 31K+ stars.","Microsoft AI",374,{"id":46,"uuid":47,"slug":48,"title":49,"description":50,"author_name":22,"view_count":51,"vote_count":24,"lang_type":25,"type":35,"type_label":36},242,"b0f93b10-3339-4ca0-ad20-d6335a3d7785","kotaemon-open-source-rag-document-chat-b0f93b10","Kotaemon — Open-Source RAG Document Chat","Clean, open-source RAG tool for chatting with your documents. Supports PDF, DOCX, web pages. Multi-model, citation, and multi-user. Self-hostable. 25K+ stars.",332,{"id":53,"uuid":54,"slug":55,"title":56,"description":57,"author_name":58,"view_count":59,"vote_count":24,"lang_type":25,"type":35,"type_label":36},1306,"e0e719be-37db-11f1-9bc6-00163e2b0d79","verba-golden-ragtriever-weaviate-e0e719be","Verba — The Golden RAGtriever by Weaviate","Verba is an open-source RAG (Retrieval-Augmented Generation) chatbot from the Weaviate team. Drop in PDFs, web pages, or notes; pick a model (OpenAI, Ollama, Anthropic); and get a polished chat UI with semantic search built in.","AI Open Source",354,{"id":61,"uuid":62,"slug":63,"title":64,"description":65,"author_name":66,"view_count":51,"vote_count":24,"lang_type":25,"type":67,"type_label":68},654,"7ded33e8-464c-4c8f-b3de-6dcf14c0eaf4","rag-best-practices-production-pipeline-guide-2026-7ded33e8","RAG Best Practices — Production Pipeline Guide 2026","Comprehensive guide to building production RAG pipelines. Covers chunking strategies, embedding models, vector databases, retrieval techniques, evaluation, and common pitfalls with code examples.","Prompt Lab","prompt","Prompt",{"id":70,"uuid":71,"slug":72,"title":73,"description":74,"author_name":75,"view_count":76,"vote_count":24,"lang_type":25,"type":77,"type_label":78},635,"f73611a0-142f-4364-97dc-b57eb03473ad","tavily-search-api-built-ai-agents-rag-f73611a0","Tavily — Search API Built for AI Agents & RAG","Search API designed specifically for AI agents and RAG pipelines. Returns clean, LLM-ready results with content extraction, no HTML parsing needed. Official MCP server available. 5,000+ stars.","Tavily",337,"mcp","MCP",{"id":80,"uuid":81,"slug":82,"title":83,"description":84,"author_name":22,"view_count":85,"vote_count":24,"lang_type":25,"type":35,"type_label":36},205,"761bd107-7156-4c62-b268-62a3fb9818dc","haystack-ai-orchestration-search-rag-761bd107","Haystack — AI Orchestration for Search & RAG","Open-source AI orchestration framework by deepset. Build production RAG pipelines, semantic search, and agent workflows with modular components. 25K+ GitHub stars.",263,"tokrepo install pack\u002Frag-pipelines",{"pageType":88,"pageKey":8,"locale":89,"title":90,"metaDescription":91,"h1":13,"tldr":92,"bodyMarkdown":93,"faq":94,"schema":110,"internalLinks":120,"citations":133,"wordCount":146,"generatedAt":147},"pack","fr","Pipelines RAG : Quivr, RAGFlow, GraphRAG en production","Évitez la mauvaise architecture initiale. Quivr, RAGFlow, GraphRAG plus patterns de chunking, rerank et eval qui survivent en production. Installation TokRepo.","Huit ressources RAG — moteurs open-source (Quivr, RAGFlow, GraphRAG) plus patterns de chunking, rerank et évaluation qui séparent une démo d'un système RAG en production.","## Ce que contient ce pack\n\nLa plupart des équipes lancent leur première démo RAG en un week-end puis passent six mois à démêler pourquoi elle donne des réponses subtilement fausses. Ce pack rassemble les **huit ressources** qui vous font passer ce mur : trois moteurs production, trois patterns retrieval\u002Findexation et deux outils d'évaluation.\n\n| # | Ressource | Couche | Pourquoi elle est là |\n|---|---|---|---|\n| 1 | Quivr | RAG full-stack | implémentation de référence \"second cerveau\", licence MIT |\n| 2 | RAGFlow | RAG full-stack | parsing profond — bat LangChain pour tables\u002Fformulaires |\n| 3 | GraphRAG | retrieval | approche graphe-de-connaissance de Microsoft pour multi-hop |\n| 4 | Patterns de chunking | indexation | sémantique vs taille fixe vs récursif — quand chacun gagne |\n| 5 | Recherche hybride | retrieval | BM25 + vecteurs denses, avec rerank |\n| 6 | Reranker cross-encoder | retrieval | le plus gros gain de précision que vous puissiez ajouter |\n| 7 | Harness d'eval RAG | observabilité | golden-set + LLM-as-judge en régression nocturne |\n| 8 | Forçage de citations | guardrails | refuse de répondre quand le retrieval passe sous le seuil |\n\n## Pourquoi c'est important\n\nAvec la recherche vectorielle seule, vous obtenez ~70% de la qualité démo. Les 30% restants — ceux que les utilisateurs remarquent — viennent des couches *non vectorielles* : comment vous chunkez, comment vous re-rankez, comment vous décidez que le retrieval a échoué et que le LLM doit refuser plutôt qu'halluciner.\n\nTrois modes d'échec apparaissent dans chaque audit RAG :\n\n1. **Le chunking détruit le contexte.** Un split naïf de 512 tokens coupe des tableaux en deux et laisse des titres orphelins. Le parser layout-aware de RAGFlow règle ça ; les pipelines purement LangChain non.\n2. **Le retrieval top-k renvoie des quasi-doublons.** La similarité cosinus adore remonter 5 paraphrases du même paragraphe. Un rerank cross-encoder (BGE-reranker, Cohere Rerank) coupe le payload dupliqué de 60%+ sur la plupart des corpus.\n3. **Pas de raisonnement multi-hop.** Un lookup vectoriel unique ne peut pas répondre \"compare X en 2022, 2023 et 2024.\" GraphRAG construit un graphe de connaissance à l'indexation pour rendre possibles les réponses par traversée.\n\n## Installer en une commande\n\n```bash\n# Installer le pack entier\ntokrepo install pack\u002Frag-pipelines\n\n# Ou choisir le moteur par lequel commencer\ntokrepo install quivr\ntokrepo install ragflow\ntokrepo install graphrag\n```\n\nLe TokRepo CLI normalise les fichiers de config entre les 8 outils IA supportés, donc les moteurs sont prêts à s'enficher dans votre projet Claude Code, Cursor ou Codex CLI existant.\n\n## Pièges fréquents\n\n- **Traiter RAG comme \"embed tout.\"** Le gain de précision le moins cher est de *ne pas* indexer les pages à faible signal. Auditez le corpus d'abord ; supprimez doublons, chrome de navigation et versions obsolètes.\n- **Sauter l'étape de rerank.** Ajouter un rerank cross-encoder top-50 → top-5 lève normalement la justesse de réponse de 15-25 points sur les benchmarks RAG. Le sauter pour \"économiser de la latence\" est presque toujours faux.\n- **Pas de harness d'eval.** Si vous ne pouvez pas faire tourner une régression golden-set, vous ne savez pas si votre dernier changement de prompt a amélioré ou dégradé. Construisez l'eval avant de passer à l'échelle.\n- **Stocker les chunks sans contexte parent.** Gardez toujours un pointeur vers le document source et les chunks adjacents ; laissez le LLM étendre s'il a besoin de plus de contexte.\n- **Choisir le vector DB avant de connaître votre échelle.** Pinecone a du sens à 100M+ vecteurs ; sous 10M, Qdrant ou Chroma sur une seule VM est plus rapide, moins cher et plus facile à déboguer.\n\n## Quand ce pack seul ne suffit pas\n\nSi votre goulot est la *qualité d'ingestion* (PDFs, scans, layouts multi-colonnes), combinez avec le pack Document AI Pipeline — Surya\u002FDocling\u002FMinerU nettoient la source avant chunking. Si votre goulot est l'*évaluation*, empilez le pack LLM Eval & Guardrails : DeepEval, Ragas et Promptfoo se branchent au harness d'eval d'ici.\n\nPour le stockage : ce pack est agnostique au moteur — voyez le pack Vector DB Showdown pour choisir entre Chroma, Weaviate, Pinecone, Qdrant ou txtai selon vos cibles de latence, coût et précision.",[95,98,101,104,107],{"q":96,"a":97},"Ces moteurs RAG sont-ils gratuits ?","Quivr, RAGFlow et GraphRAG sont tous open-source sous licences permissives (Apache 2.0 \u002F MIT). Vous auto-hébergez. Les seuls composants payants que vous pourriez ajouter sont l'API d'embeddings (OpenAI, Cohere, Voyage) et un vector DB managé si vous ne voulez pas faire tourner le vôtre. Une démo échelle laptop ne coûte rien ; un déploiement 10M docs en prod est dominé par la facture embeddings, pas par le moteur.",{"q":99,"a":100},"Comment GraphRAG se compare-t-il au RAG vanille ?","Le RAG vanille récupère les top-k chunks par similarité vectorielle et les colle dans le prompt — super pour les questions single-hop comme \"qu'est-ce que X.\" GraphRAG construit un graphe entité-relation à l'indexation, donc il peut répondre à des questions multi-hop comme \"comment le rôle de X a-t-il changé à travers ces documents.\" Le trade-off : indexer est 5-10x plus cher et plus lent. Utilisez GraphRAG quand vos requêtes sont analytiques, RAG vanille quand ce sont des recherches factuelles.",{"q":102,"a":103},"Est-ce que ça fonctionnera avec Cursor ou Codex CLI ?","Oui — ce sont des moteurs côté serveur, pas des extensions d'éditeur. Vous lancez RAGFlow ou Quivr comme service, puis n'importe quel outil IA pouvant appeler HTTP peut le requêter. L'install TokRepo dépose le docker-compose et les fichiers de config dans votre projet pour que le même setup marche dans Claude Code, Cursor, Codex CLI, Cline et les autres. L'API de retrieval est identique.",{"q":105,"a":106},"Quelle est la différence entre ce pack et Vector DB Showdown ?","Vector DB Showdown répond à \"où vivent mes embeddings\" — Chroma, Qdrant, Pinecone, Weaviate, etc. RAG Pipelines répond à \"comment je récupère et re-ranke depuis ce stockage pour produire une réponse correcte.\" Vous choisissez un de chaque. La plupart des setups production sont Qdrant ou pgvector dessous, avec RAGFlow ou un pipeline custom dessus.",{"q":108,"a":109},"Comment savoir si mon RAG fonctionne vraiment ?","Construisez un golden set de 50-200 paires question-réponse à partir de requêtes utilisateurs réelles. Faites-le tourner chaque nuit. Suivez trois nombres : recall du retrieval (le bon chunk est-il apparu dans top-k), justesse de réponse (LLM-as-judge contre la réponse gold) et fidélité de citation (la réponse a-t-elle cité un chunk réellement récupéré). Sans ces trois, vous volez à l'aveugle. Pack 28 (LLM Eval & Guardrails) livre le harness.",{"@context":111,"@type":112,"name":113,"description":114,"numberOfItems":115,"publisher":116},"https:\u002F\u002Fschema.org","CollectionPage","RAG Pipelines","Quivr, RAGFlow, GraphRAG and the production patterns that beat naive vector search.",8,{"@type":117,"name":118,"url":119},"Organization","TokRepo","https:\u002F\u002Ftokrepo.com",[121,125,129],{"url":122,"anchor":123,"reason":124},"\u002Ffr\u002Fpacks\u002Fvector-db-showdown","Comparatif Vector DB","la couche de stockage sous tout RAG",{"url":126,"anchor":127,"reason":128},"\u002Ffr\u002Fpacks\u002Fdocument-ai-pipeline","Pipeline Document → IA","la couche d'ingestion qui alimente RAG",{"url":130,"anchor":131,"reason":132},"\u002Ffr\u002Fpacks\u002Fllm-eval-guardrails","Eval & Guardrails LLM","notez la qualité de recherche avant déploiement",[134,138,142],{"claim":135,"source_name":136,"source_url":137},"GraphRAG combines knowledge graphs with retrieval for multi-hop reasoning","Microsoft GraphRAG","https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fgraphrag",{"claim":139,"source_name":140,"source_url":141},"RAGFlow open-source engine for deep document understanding RAG","infiniflow\u002Fragflow","https:\u002F\u002Fgithub.com\u002Finfiniflow\u002Fragflow",{"claim":143,"source_name":144,"source_url":145},"Quivr personal generative AI second brain with RAG","QuivrHQ\u002Fquivr","https:\u002F\u002Fgithub.com\u002FQuivrHQ\u002Fquivr",702,"2026-05-02T15:00:00Z"]