[{"data":1,"prerenderedAt":-1},["ShallowReactive",2],{"pack-detail-rag-pipelines-es":3,"seo:pack:rag-pipelines:es":87},{"code":4,"message":5,"data":6},200,"操作成功",{"pack":7},{"slug":8,"icon":9,"tone":10,"status":11,"status_label":12,"title":13,"description":14,"items":15,"install_cmd":86},"rag-pipelines","📚","#3B82F6","stable","Estable","Pipelines RAG","Quivr, RAGFlow, GraphRAG y mejores prácticas para producción. Evita la mala arquitectura inicial.",[16,28,37,45,52,60,69,79],{"id":17,"uuid":18,"slug":19,"title":20,"description":21,"author_name":22,"view_count":23,"vote_count":24,"lang_type":25,"type":26,"type_label":27},322,"96223597-08c2-4e60-b84e-0c4779641933","quivr-opinionated-rag-framework-any-llm-96223597","Quivr — Opinionated RAG Framework for Any LLM","Quivr is an opinionated RAG framework supporting any LLM, multiple file types, and customizable retrieval. 39.1K+ stars. Apache 2.0.","Script Depot",310,0,"en","script","Script",{"id":29,"uuid":30,"slug":31,"title":32,"description":33,"author_name":22,"view_count":34,"vote_count":24,"lang_type":25,"type":35,"type_label":36},245,"7785d7a8-fc57-42ab-ba6b-4a970404fadc","ragflow-deep-document-understanding-rag-engine-7785d7a8","RAGFlow — Deep Document Understanding RAG Engine","Open-source RAG engine with deep document understanding. Parses complex PDFs, tables, images. Agent-powered Q&A with citations. Multi-model. 77K+ stars.",381,"skill","Skill",{"id":38,"uuid":39,"slug":40,"title":41,"description":42,"author_name":43,"view_count":44,"vote_count":24,"lang_type":25,"type":35,"type_label":36},418,"ac77668d-1767-4b86-ac8c-1c050166d21b","graphrag-knowledge-graph-rag-microsoft-ac77668d","GraphRAG — Knowledge Graph RAG by Microsoft","Build knowledge graphs from documents for smarter RAG. Local and global search over entity relationships. By Microsoft Research. 31K+ stars.","Microsoft AI",374,{"id":46,"uuid":47,"slug":48,"title":49,"description":50,"author_name":22,"view_count":51,"vote_count":24,"lang_type":25,"type":35,"type_label":36},242,"b0f93b10-3339-4ca0-ad20-d6335a3d7785","kotaemon-open-source-rag-document-chat-b0f93b10","Kotaemon — Open-Source RAG Document Chat","Clean, open-source RAG tool for chatting with your documents. Supports PDF, DOCX, web pages. Multi-model, citation, and multi-user. Self-hostable. 25K+ stars.",332,{"id":53,"uuid":54,"slug":55,"title":56,"description":57,"author_name":58,"view_count":59,"vote_count":24,"lang_type":25,"type":35,"type_label":36},1306,"e0e719be-37db-11f1-9bc6-00163e2b0d79","verba-golden-ragtriever-weaviate-e0e719be","Verba — The Golden RAGtriever by Weaviate","Verba is an open-source RAG (Retrieval-Augmented Generation) chatbot from the Weaviate team. Drop in PDFs, web pages, or notes; pick a model (OpenAI, Ollama, Anthropic); and get a polished chat UI with semantic search built in.","AI Open Source",354,{"id":61,"uuid":62,"slug":63,"title":64,"description":65,"author_name":66,"view_count":51,"vote_count":24,"lang_type":25,"type":67,"type_label":68},654,"7ded33e8-464c-4c8f-b3de-6dcf14c0eaf4","rag-best-practices-production-pipeline-guide-2026-7ded33e8","RAG Best Practices — Production Pipeline Guide 2026","Comprehensive guide to building production RAG pipelines. Covers chunking strategies, embedding models, vector databases, retrieval techniques, evaluation, and common pitfalls with code examples.","Prompt Lab","prompt","Prompt",{"id":70,"uuid":71,"slug":72,"title":73,"description":74,"author_name":75,"view_count":76,"vote_count":24,"lang_type":25,"type":77,"type_label":78},635,"f73611a0-142f-4364-97dc-b57eb03473ad","tavily-search-api-built-ai-agents-rag-f73611a0","Tavily — Search API Built for AI Agents & RAG","Search API designed specifically for AI agents and RAG pipelines. Returns clean, LLM-ready results with content extraction, no HTML parsing needed. Official MCP server available. 5,000+ stars.","Tavily",337,"mcp","MCP",{"id":80,"uuid":81,"slug":82,"title":83,"description":84,"author_name":22,"view_count":85,"vote_count":24,"lang_type":25,"type":35,"type_label":36},205,"761bd107-7156-4c62-b268-62a3fb9818dc","haystack-ai-orchestration-search-rag-761bd107","Haystack — AI Orchestration for Search & RAG","Open-source AI orchestration framework by deepset. Build production RAG pipelines, semantic search, and agent workflows with modular components. 25K+ GitHub stars.",263,"tokrepo install pack\u002Frag-pipelines",{"pageType":88,"pageKey":8,"locale":89,"title":90,"metaDescription":91,"h1":13,"tldr":92,"bodyMarkdown":93,"faq":94,"schema":110,"internalLinks":120,"citations":133,"wordCount":146,"generatedAt":147},"pack","es","Pipelines RAG: Quivr, RAGFlow, GraphRAG en producción","Evita la mala arquitectura inicial. Quivr, RAGFlow, GraphRAG más patrones de chunking, rerank y evaluación que sobreviven en producción. Instala con TokRepo.","Ocho recursos de RAG — motores open-source (Quivr, RAGFlow, GraphRAG) más patrones de chunking, rerank y evaluación que separan una demo de un sistema RAG en producción.","## Qué incluye este pack\n\nLa mayoría de los equipos lanza su primera demo de RAG en un fin de semana y después pasa seis meses descifrando por qué da respuestas sutilmente incorrectas. Este pack reúne los **ocho recursos** que te llevan más allá de ese muro: tres motores grado producción, tres patrones de recuperación\u002Findexación y dos herramientas de evaluación.\n\n| # | Recurso | Capa | Por qué está aquí |\n|---|---|---|---|\n| 1 | Quivr | RAG full-stack | implementación de referencia \"segundo cerebro\", licencia MIT |\n| 2 | RAGFlow | RAG full-stack | parsing profundo de documentos — gana a LangChain en tablas\u002Fformularios |\n| 3 | GraphRAG | recuperación | enfoque grafo-de-conocimiento de Microsoft para preguntas multi-hop |\n| 4 | Patrones de chunking | indexación | semántico vs tamaño fijo vs recursivo — cuándo gana cada uno |\n| 5 | Búsqueda híbrida | recuperación | BM25 + vectores densos, con rerank |\n| 6 | Reranker cross-encoder | recuperación | el mayor salto de precisión que puedes añadir |\n| 7 | Harness de eval RAG | observabilidad | golden-set + LLM-as-judge para regresión nocturna |\n| 8 | Refuerzo de citaciones | guardrails | rechaza responder cuando la recuperación está bajo el umbral |\n\n## Por qué importa\n\nSolo con búsqueda vectorial llegas al ~70% de la calidad demo. El último 30% — el que los usuarios sí notan — viene de las capas *no vectoriales*: cómo cortas, cómo re-rankeas, cómo decides que la recuperación falló y el LLM debe rechazar en lugar de alucinar.\n\nTres modos de fallo aparecen en cada auditoría RAG que hacemos:\n\n1. **El chunking destruye el contexto.** Un split ingenuo de 512 tokens parte tablas por la mitad y deja huérfanos los encabezados. El parser layout-aware de RAGFlow lo resuelve; los pipelines puramente LangChain no.\n2. **La recuperación top-k devuelve casi-duplicados.** La similitud coseno adora subir 5 paráfrasis del mismo párrafo. Un paso de rerank cross-encoder (BGE-reranker, Cohere Rerank) recorta el payload duplicado en 60%+ en la mayoría de corpus.\n3. **Sin razonamiento multi-hop.** Una búsqueda vectorial única no puede contestar \"compara X en 2022, 2023 y 2024.\" GraphRAG construye un grafo de conocimiento al indexar para que sean posibles respuestas basadas en travesía.\n\n## Instala en un comando\n\n```bash\n# Instala el pack completo\ntokrepo install pack\u002Frag-pipelines\n\n# O elige el motor con el que empezar\ntokrepo install quivr\ntokrepo install ragflow\ntokrepo install graphrag\n```\n\nTokRepo CLI normaliza la configuración entre las 8 herramientas IA soportadas, así que los motores quedan listos para encajar en tu proyecto Claude Code, Cursor o Codex CLI existente.\n\n## Errores comunes\n\n- **Tratar RAG como \"embebe todo.\"** La victoria de precisión más barata es *no* indexar páginas de baja señal. Audita primero el corpus; quita duplicados, chrome de navegación y versiones obsoletas.\n- **Saltarse el paso de rerank.** Añadir un rerank cross-encoder de top-50 → top-5 normalmente sube la corrección de respuestas 15-25 puntos en los benchmarks RAG. Saltarlo para \"ahorrar latencia\" casi siempre es un error.\n- **Sin harness de eval.** Si no puedes correr una regresión sobre golden-set, no sabes si tu último cambio de prompt mejoró o empeoró las cosas. Construye el eval antes de escalar el corpus.\n- **Almacenar chunks sin contexto padre.** Mantén siempre un puntero al documento fuente y a los chunks adyacentes; deja que el LLM expanda si necesita más contexto.\n- **Elegir vector DB antes de saber tu escala.** Pinecone tiene sentido a 100M+ vectores; bajo 10M, Qdrant o Chroma en una sola VM es más rápido, barato y fácil de depurar.\n\n## Cuándo este pack solo no basta\n\nSi tu cuello de botella es la *calidad de ingesta* (PDFs, escaneos, layouts multi-columna), combínalo con el pack Document AI Pipeline — Surya\u002FDocling\u002FMinerU limpian la fuente antes de chunkear. Si tu cuello es la *evaluación*, apila el pack LLM Eval & Guardrails: DeepEval, Ragas y Promptfoo se conectan al harness de eval de aquí.\n\nPara almacenamiento: este pack es agnóstico al motor — mira el pack Vector DB Showdown para elegir entre Chroma, Weaviate, Pinecone, Qdrant o txtai según tus objetivos de latencia, coste y precisión.",[95,98,101,104,107],{"q":96,"a":97},"¿Son gratis estos motores RAG?","Quivr, RAGFlow y GraphRAG son todos open-source bajo licencias permisivas (Apache 2.0 \u002F MIT). Auto-alojas. Los únicos componentes pagos que podrías añadir son la API de embeddings (OpenAI, Cohere, Voyage) y un vector DB gestionado si no quieres correr el tuyo. Una demo a escala laptop no cuesta nada; un despliegue de 10M docs en producción está dominado por la factura de embeddings, no por el motor.",{"q":99,"a":100},"¿Cómo se compara GraphRAG con RAG vanilla?","RAG vanilla recupera top-k chunks por similitud vectorial y los mete en el prompt — genial para preguntas single-hop como \"qué es X.\" GraphRAG construye un grafo entidad-relación al indexar, así puede responder preguntas multi-hop como \"cómo cambió el rol de X a través de estos documentos.\" El trade-off: indexar es 5-10x más caro y lento. Usa GraphRAG cuando tus consultas sean analíticas, RAG vanilla cuando sean búsquedas factuales.",{"q":102,"a":103},"¿Funcionará con Cursor o Codex CLI?","Sí — estos son motores server-side, no extensiones de editor. Corres RAGFlow o Quivr como servicio, y luego cualquier herramienta IA que pueda llamar HTTP puede consultarlo. La instalación TokRepo deja el docker-compose y los archivos de config en tu proyecto para que el mismo setup funcione en Claude Code, Cursor, Codex CLI, Cline y el resto. La API de recuperación es idéntica.",{"q":105,"a":106},"¿Cuál es la diferencia entre este pack y Vector DB Showdown?","Vector DB Showdown contesta \"dónde viven mis embeddings\" — Chroma, Qdrant, Pinecone, Weaviate, etc. RAG Pipelines contesta \"cómo recupero y re-rankeo desde ese almacenamiento para producir una respuesta correcta.\" Eliges uno de cada. La mayoría de setups producción son Qdrant o pgvector debajo, con RAGFlow o un pipeline a medida arriba.",{"q":108,"a":109},"¿Cómo sé si mi RAG realmente funciona?","Construye un golden set de 50-200 pares pregunta-respuesta de queries de usuarios reales. Córrelo cada noche. Trackea tres números: recall de recuperación (¿apareció el chunk correcto en top-k?), corrección de respuesta (LLM-as-judge contra la respuesta gold) y fidelidad de citación (¿la respuesta citó un chunk realmente recuperado?). Sin estos tres, vuelas a ciegas. Pack 28 (LLM Eval & Guardrails) trae el harness.",{"@context":111,"@type":112,"name":113,"description":114,"numberOfItems":115,"publisher":116},"https:\u002F\u002Fschema.org","CollectionPage","RAG Pipelines","Quivr, RAGFlow, GraphRAG and the production patterns that beat naive vector search.",8,{"@type":117,"name":118,"url":119},"Organization","TokRepo","https:\u002F\u002Ftokrepo.com",[121,125,129],{"url":122,"anchor":123,"reason":124},"\u002Fes\u002Fpacks\u002Fvector-db-showdown","Comparativa Vector DB","la capa de almacenamiento bajo cualquier RAG",{"url":126,"anchor":127,"reason":128},"\u002Fes\u002Fpacks\u002Fdocument-ai-pipeline","Pipeline Documento → IA","la capa de ingesta que alimenta RAG",{"url":130,"anchor":131,"reason":132},"\u002Fes\u002Fpacks\u002Fllm-eval-guardrails","Eval & Guardrails LLM","puntúa la calidad de recuperación antes del despliegue",[134,138,142],{"claim":135,"source_name":136,"source_url":137},"GraphRAG combines knowledge graphs with retrieval for multi-hop reasoning","Microsoft GraphRAG","https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fgraphrag",{"claim":139,"source_name":140,"source_url":141},"RAGFlow open-source engine for deep document understanding RAG","infiniflow\u002Fragflow","https:\u002F\u002Fgithub.com\u002Finfiniflow\u002Fragflow",{"claim":143,"source_name":144,"source_url":145},"Quivr personal generative AI second brain with RAG","QuivrHQ\u002Fquivr","https:\u002F\u002Fgithub.com\u002FQuivrHQ\u002Fquivr",694,"2026-05-02T15:00:00Z"]