[{"data":1,"prerenderedAt":-1},["ShallowReactive",2],{"pack-detail-vector-db-showdown-fr":3,"seo:pack:vector-db-showdown:fr":80},{"code":4,"message":5,"data":6},200,"操作成功",{"pack":7},{"slug":8,"icon":9,"tone":10,"status":11,"status_label":12,"title":13,"description":14,"items":15,"install_cmd":79},"vector-db-showdown","🧲","#6D28D9","stable","Stable","Comparatif Vector DB","Chroma, Weaviate, Pinecone, txtai, Qdrant MCP, plus les APIs d'embedding Cohere et Together — choisissez par latence, coût ou précision RAG.",[16,28,35,43,51,61,71],{"id":17,"uuid":18,"slug":19,"title":20,"description":21,"author_name":22,"view_count":23,"vote_count":24,"lang_type":25,"type":26,"type_label":27},262,"04367306-be4a-4f46-854d-dd2b4d0d429e","chroma-open-source-vector-database-ai-04367306","Chroma — Open-Source Vector Database for AI","Chroma is the open-source vector database and data infrastructure for AI applications. 27.1K+ GitHub stars. Simple 4-function API for embedding, storing, and querying documents. Supports Python, JavaS","AI Open Source",339,0,"en","skill","Skill",{"id":29,"uuid":30,"slug":31,"title":32,"description":33,"author_name":22,"view_count":34,"vote_count":24,"lang_type":25,"type":26,"type_label":27},266,"492f7d14-9545-43b7-8f9c-626f895b912e","weaviate-open-source-vector-database-scale-492f7d14","Weaviate — Open-Source Vector Database at Scale","Weaviate is an open-source vector database for semantic search at scale. 15.9K+ GitHub stars. Hybrid search (vector + BM25), built-in RAG, reranking, multi-tenancy, and horizontal scaling. BSD 3-Claus",332,{"id":36,"uuid":37,"slug":38,"title":39,"description":40,"author_name":41,"view_count":42,"vote_count":24,"lang_type":25,"type":26,"type_label":27},826,"0fc5f7e8-439d-414f-bdaf-b09e05e1af49","pinecone-managed-vector-database-production-ai-0fc5f7e8","Pinecone — Managed Vector Database for Production AI","Fully managed vector database for production AI search. Pinecone offers serverless scaling, hybrid search, metadata filtering, and enterprise security with zero infrastructure.","Pinecone",296,{"id":44,"uuid":45,"slug":46,"title":47,"description":48,"author_name":49,"view_count":50,"vote_count":24,"lang_type":25,"type":26,"type_label":27},285,"b732febc-d945-4500-92c6-f90049c36c56","txtai-all-one-embeddings-database-b732febc","txtai — All-in-One Embeddings Database","txtai is an all-in-one embeddings database for semantic search, LLM orchestration, and language model workflows. 10.4K+ GitHub stars. Vector search + SQL + RAG pipelines. Apache 2.0.","Script Depot",347,{"id":52,"uuid":53,"slug":54,"title":55,"description":56,"author_name":57,"view_count":58,"vote_count":24,"lang_type":25,"type":59,"type_label":60},610,"301ce58e-1c73-48a8-af58-dfa560e8a13c","qdrant-mcp-vector-search-engine-ai-agents-301ce58e","Qdrant MCP — Vector Search Engine for AI Agents","MCP server for Qdrant vector database. Gives AI agents the power to store and search embeddings for RAG, semantic search, and recommendation systems. 22,000+ stars on Qdrant.","MCP Hub",293,"mcp","MCP",{"id":62,"uuid":63,"slug":64,"title":65,"description":66,"author_name":67,"view_count":68,"vote_count":24,"lang_type":25,"type":69,"type_label":70},774,"dde04e91-9c33-4bbb-9cf6-6604b1681582","cohere-embed-multilingual-ai-embeddings-api-dde04e91","Cohere Embed — Multilingual AI Embeddings API","Generate high-quality multilingual embeddings for search and RAG. Cohere Embed v3 supports 100+ languages with specialized modes for documents, queries, and classification.","Cohere",284,"prompt","Prompt",{"id":72,"uuid":73,"slug":74,"title":75,"description":76,"author_name":77,"view_count":78,"vote_count":24,"lang_type":25,"type":26,"type_label":27},779,"da3bf81c-8928-41ba-b5c4-457355af582d","together-ai-embeddings-reranking-skill-agents-da3bf81c","Together AI Embeddings & Reranking Skill for Agents","Skill that teaches Claude Code Together AI's embeddings and reranking API. Covers dense vector generation, semantic search, RAG pipelines, and result reranking patterns.","Together AI",328,"tokrepo install pack\u002Fvector-db-showdown",{"pageType":81,"pageKey":8,"locale":82,"title":83,"metaDescription":84,"h1":13,"tldr":85,"bodyMarkdown":86,"faq":87,"schema":103,"internalLinks":113,"citations":126,"wordCount":139,"generatedAt":140},"pack","fr","Comparatif Vector DB : Chroma vs Weaviate vs Pinecone vs Qdrant","Comparez 7 options vector DB — Chroma, Weaviate, Pinecone, txtai, Qdrant MCP, embeddings Cohere & Together. Choisissez par latence, coût ou précision RAG.","Comparatif côte-à-côte de sept options vector DB sur les niveaux auto-hébergé, managé et embedding API — choisissez par latence, coût ou précision RAG. Installation TokRepo.","## Ce que contient ce pack\n\nCe pack met les **sept options dominantes de bases de données vectorielles** côte-à-côte pour que la décision devienne un exercice de 10 minutes au lieu d'une semaine d'évaluation. L'espace de choix se découpe proprement en trois niveaux : bases auto-hébergées, managées, et APIs d'embedding (qui livrent souvent un store vectoriel basique en bonus).\n\n| # | Ressource | Niveau | Excelle à |\n|---|---|---|---|\n| 1 | Chroma | Auto-hébergé | Simplicité mono-nœud, prototypage local rapide |\n| 2 | Weaviate | Auto-hébergé\u002Fmanagé | Recherche hybride avec BM25 + vecteur intégré |\n| 3 | Pinecone | Managé seul | Scaling zero-ops, p95 prévisible |\n| 4 | txtai | Auto-hébergé | Embed + recherche dans une librairie Python |\n| 5 | Qdrant MCP | Auto-hébergé | Serveur MCP natif pour requêtes d'agents |\n| 6 | Embeddings Cohere | API | Qualité multilingue de pointe |\n| 7 | Embeddings Together | API | Économie de tokens la moins chère en batch |\n\nCe pack est intentionnellement **la couche DB** — ce qui stocke les vecteurs et sert les requêtes plus-proches-voisins. L'orchestration retrieve-and-generate au-dessus (chunking, réécriture de requête, reranking) vit dans le pack **RAG Pipelines** pour que les deux décisions restent indépendantes.\n\n## Pourquoi choisir délibérément\n\nLa plupart des équipes passent leurs six premiers mois sur le mauvais vector DB et ne le découvrent qu'à la casse. Les deux modes d'échec :\n\n- **Démarré avec Pinecone, douleur de facturation à l'échelle.** Le prix par-pod de Pinecone fait sens à 1M vecteurs mais devient cher à 50M. Migrer hors demande une campagne de re-embed.\n- **Démarré auto-hébergé, douleur ops à l'échelle.** Une équipe avec un nœud Chroma accumule un store de 30M vecteurs, puis découvre que les index ANN mono-nœud ne dégradent pas gracieusement — la latence requête passe de 50ms à 800ms en un trimestre.\n\nChoisir délibérément veut dire regarder trois axes :\n\n1. **Recall vs latence à votre nombre de vecteurs.** ANN-Benchmarks publie des courbes recall@10 vs QPS ; Qdrant et Pinecone mènent constamment >10M vecteurs, Chroma va bien sous 5M.\n2. **Besoins de recherche hybride.** Si vos requêtes mêlent filtres par mot-clé et similarité sémantique, le mode hybride de Weaviate et les filtres payload de Qdrant sont les différentiateurs — coller BM25 sur Chroma après coup est douloureux.\n3. **Posture opérationnelle.** Si votre équipe est de deux ingénieurs, le « pas de serveurs à surveiller » de Pinecone gagne. Si vous tournez déjà Postgres à grande échelle, **pgvector** (dans le pack Postgres pour Agents IA) bat souvent toutes les options ici sur le TCO.\n\n## Installer en une commande\n\n```bash\n# Installe le pack entier dans le projet actuel\ntokrepo install pack\u002Fvector-db-showdown\n\n# Ou choisissez des ressources individuelles\ntokrepo install qdrant-mcp\ntokrepo install chroma\n```\n\nLe TokRepo CLI installe des snippets Docker Compose pour les options auto-hébergées, des templates de variables d'environnement pour les APIs managées, et des scripts de benchmark qui chargent 100k vecteurs et mesurent la latence requête p95 sur votre matériel.\n\n## Pièges courants\n\n- **Benchmark avec des vecteurs aléatoires.** Les vecteurs aléatoires ont des distributions de distance plates — tout index paraît aussi rapide. Benchmarkez toujours avec des embeddings réels de votre domaine (les dumps Wikipedia servent de proxy public).\n- **Choisir la mauvaise métrique de distance.** Cosinus vs dot product vs L2 donnent des rankings différents sur les mêmes données. Alignez la métrique avec celle pour laquelle le modèle embedding a été entraîné ; OpenAI text-embedding-3 attend cosinus, certains modèles open attendent dot product.\n- **Ignorer le lock-in modèle d'embedding.** Si vous embed 100M docs avec Cohere et voulez passer à OpenAI, vous re-embedez tout. Certaines équipes stockent *les deux* modèles en parallèle pendant la transition.\n- **Traiter « vector DB » comme une solution RAG complète.** Aucun de ces outils ne fait reranking, réécriture de requête ou évaluation qualité résultats. Pairez avec le pack RAG Pipelines et le pack LLM Eval.\n- **Sous-estimer la cardinalité du filtre.** Pré-filtrer sur un champ haute cardinalité (e.g. user_id) avant la recherche ANN dévaste le recall sur la plupart des moteurs. Utilisez post-filtering ou construisez des index par utilisateur.\n\n## Quand ce pack seul ne suffit pas\n\nSi votre dataset est petit (\u003C1M vecteurs) et que vous avez déjà Postgres, **pgvector** bat toute option ici sur la simplicité opérationnelle — un service de moins à surveiller. Si vos requêtes ont besoin de contraintes géographiques ou de graphe en plus de similarité sémantique, regardez **Neo4j avec GDS** ou **OpenSearch** avec k-NN — tradeoffs différents mais formes plus propres. Et si vous opérez à 1B+ vecteurs, vous avez dépassé ce pack ; parlez aux vendors des tiers dédiés Vespa ou Milvus.",[88,91,94,97,100],{"q":89,"a":90},"Ces vector DBs sont-elles gratuites ?","Cinq sur sept oui : Chroma, Weaviate, txtai et le serveur Qdrant MCP sont open-source sous licences permissives ; vous payez uniquement le compute. Pinecone est managé seul avec un tier starter gratuit (100k vecteurs) ; Cohere et Together facturent par million de tokens sur les appels embedding. Le pack documente les prix OSS et payants pour que vous choisissiez sans surprise.",{"q":92,"a":93},"En quoi cela diffère-t-il du pack rag-pipelines ?","Ce pack est la couche stockage — ce qui contient les vecteurs. Le pack rag-pipelines est l'orchestration au-dessus : chunking, réécriture de requête, ensemble de retrievers et reranking. Vous choisissez un vector DB une fois et le changez rarement ; vous tunez les paramètres RAG constamment. Les garder comme packs séparés vous permet d'upgrader chacun indépendamment.",{"q":95,"a":96},"Ça fonctionnera avec Claude Code ou Cursor ?","Oui. Qdrant fournit un serveur MCP pour que Claude Code interroge le store vectoriel comme un outil — appelez `qdrant.search()` depuis n'importe quel prompt agent. Chroma et Weaviate ont des serveurs MCP communautaires couverts dans les packs Modern CLI Toolbelt et MCP Server Stack. Les utilisateurs Cursor utilisent les mêmes serveurs via intégration MCP standard.",{"q":98,"a":99},"Différence entre Pinecone et Qdrant en production ?","Pinecone est entièrement managé avec latence p95 prévisible et scaling zero-ops, mais le prix par-pod monte fortement passé 50M vecteurs. Qdrant tourne partout — votre laptop, Kubernetes ou Qdrant Cloud — et mène constamment ANN-Benchmarks pour le recall à QPS élevé. Choisissez Pinecone si votre équipe est petite et le budget le permet ; choisissez Qdrant si vous avez besoin d'auto-héberger ou êtes sensible au coût à l'échelle.",{"q":101,"a":102},"Piège opérationnel en migrant entre vector DBs ?","Les vecteurs ne sont pas portables entre modèles d'embedding, mais ils *sont* portables entre DBs si le modèle reste le même. La plupart des migrations cassent parce que les équipes ont touché au pipeline d'embedding (taille chunk, version modèle) pendant le move. Verrouillez le pipeline d'abord, snapshotez les embeddings vers S3, migrez la DB, validez que des requêtes échantillon retournent des IDs identiques — puis itérez sur le pipeline.",{"@context":104,"@type":105,"name":106,"description":107,"numberOfItems":108,"publisher":109},"https:\u002F\u002Fschema.org","CollectionPage","Vector DB Showdown","Compare Chroma, Weaviate, Pinecone, txtai, Qdrant MCP, plus Cohere and Together embedding APIs.",7,{"@type":110,"name":111,"url":112},"Organization","TokRepo","https:\u002F\u002Ftokrepo.com",[114,118,122],{"url":115,"anchor":116,"reason":117},"\u002Ffr\u002Fpacks\u002Frag-pipelines","Pipelines RAG","la couche retrieve+generate au-dessus de votre DB",{"url":119,"anchor":120,"reason":121},"\u002Ffr\u002Fpacks\u002Fdocument-ai-pipeline","Pipeline Document → IA","la couche d'ingestion qui produit les vecteurs",{"url":123,"anchor":124,"reason":125},"\u002Ffr\u002Fpacks\u002Fpostgres-for-agents","Postgres pour Agents IA","pgvector dans Postgres en option hybride",[127,131,135],{"claim":128,"source_name":129,"source_url":130},"Chroma is an AI-native open-source embedding database with Python and JavaScript clients","chroma-core\u002Fchroma","https:\u002F\u002Fgithub.com\u002Fchroma-core\u002Fchroma",{"claim":132,"source_name":133,"source_url":134},"Qdrant offers an MCP server enabling AI agents to query and write to vector collections","qdrant\u002Fmcp-server-qdrant","https:\u002F\u002Fgithub.com\u002Fqdrant\u002Fmcp-server-qdrant",{"claim":136,"source_name":137,"source_url":138},"ANN-Benchmarks tracks recall vs queries-per-second for major vector index implementations","ann-benchmarks","https:\u002F\u002Fann-benchmarks.com",781,"2026-05-02T15:00:00Z"]