AI Memory

Cognitive Weaver — arquitectura experimental de memoria Agent

Cognitive Weaver es una biblioteca de memoria con enfoque de investigación que explora la consolidación de memoria por reflexión — Agent que revisan y reescriben periódicamente sus propios recuerdos, no solo los almacenan.

Sitio oficial GitHub

What Cognitive Weaver explores

La mayoría de las librerías de memoria son write-mostly: extraer hechos, embeber, recuperar. Cognitive Weaver añade un bucle de reflexión — periódicamente, un LLM revisa las memorias recientes, consolida duplicados, promociona hechos importantes y degrada los obsoletos. La idea está tomada de las teorías de consolidación durante el sueño en ciencia cognitiva.

Es código de investigación en fase temprana, no una librería endurecida para producción. Conviene considerarla cuando: (a) tienes un Agent que corre durante meses y acumula hechos contradictorios, (b) necesitas experimentar sobre la calidad de la memoria en investigación, o (c) quieres ver cómo la memoria por reflexión difiere en la práctica de la memoria por extracción.

Si vas a hacer ship de un producto, usa mejor mem0 o Zep. Vuelve a Cognitive Weaver cuando la calidad de tu recuperación se estanque y sospeches que la consolidación de memoria es la pieza que falta.

Quick Start — Reflection Loop Pattern

La API exacta de Cognitive Weaver es experimental y cambia entre versiones. Toma el código de arriba como el patrón: guarda las memorias en bruto en un vector store, ejecuta una pasada de reflexión separada con cierta cadencia, y deja que la consolidación produzca memorias de mayor señal con el tiempo.

# Cognitive Weaver's core idea, implemented against any vector store.
# Treat this as a pattern you can replicate — the repo is experimental.

from datetime import datetime, timedelta
# from cognitive_weaver import MemoryStore, Reflector  # experimental API

store = MemoryStore()          # vector-backed store of raw memories
reflector = Reflector(         # LLM-driven consolidation pass
    llm="gpt-4o-mini",
    window_hours=24,
)

# Normal path — write memories as they arrive
store.write(user_id="u1", text="User asked about Go vs Rust.")
store.write(user_id="u1", text="User prefers Rust for systems work.")
store.write(user_id="u1", text="User mentioned Rust again, with Axum framework.")

# Reflection pass — runs periodically (cron, background worker, etc.)
def nightly_consolidation(user_id: str):
    recent = store.read_since(user_id, since=datetime.utcnow() - timedelta(days=1))
    consolidated = reflector.consolidate(recent)  # LLM merges and scores
    for memory in consolidated:
        store.upsert(user_id=user_id, text=memory.text, importance=memory.score)
    # Low-importance memories decay (soft-delete on next read)

nightly_consolidation("u1")

# Later: a single higher-quality memory appears in retrieval
hits = store.search("what language does the user prefer?", user_id="u1")
# → "User consistently prefers Rust, especially for web services with Axum."

Características clave

Consolidación por reflexión

Revisión de las memorias recientes guiada por LLM. Fusiona duplicados, promociona hechos importantes, degrada el ruido. Se ejecuta como job en segundo plano — no en cada request.

Puntuación de importancia

Cada memoria lleva una puntuación de importancia que se ajusta durante la reflexión. La recuperación se sesga hacia las memorias de alta importancia, acelerando la convergencia hacia "lo que realmente importa".

Decaimiento de memoria

Las memorias de baja importancia pueden soft-borrarse (o archivarse en almacenamiento en frío) tras una edad configurable — el índice caliente se mantiene ligero.

Store intercambiable

Cualquier vector DB que ya uses. Cognitive Weaver es la capa de reflexión por encima, no un nuevo motor de almacenamiento.

Hooks de observabilidad

Se emiten snapshots antes/después de cada pasada de reflexión como eventos estructurados — permite auditar lo que el Agent "reescribió" durante la consolidación.

Friendly para investigación

La base de código es pequeña y legible — ~1,5K LOC en Python. Forkable como punto de partida para investigación de memoria custom.

Comparación

	Maturity	Unique Idea	Production Use?	Best for
Cognitive Weaveresta	Experimental	Reflection-based consolidation	Not recommended yet	Research & experimentation
mem0	Stable	Automatic extraction + dedup	Yes	Production chatbots
Letta	Stable	Agent-directed paging	Yes	Long-running agents
Graphiti	Stable	Temporal bitemporal edges	Yes	History-sensitive domains

Casos de uso

01. Investigación sobre arquitecturas de memoria

Si estás escribiendo un paper o ejecutando experimentos sobre la calidad de la memoria de los LLMs, la pequeña superficie de Cognitive Weaver lo hace fácil de modificar y medir.

02. Prototipar reflexión en sistemas de producción

Toma prestado el patrón (pasada de consolidación nocturna contra tu store de memoria existente) aunque no adoptes la librería. La mayoría de los stacks de producción se benefician de una revisión periódica de memoria.

03. Agent con fuerte drift

Cuando un Agent corre durante meses y empieza a sacar memorias obsoletas o contradictorias, la consolidación por reflexión es una de las pocas contramedidas conocidas.

Precios y licencia

Open source: consulta el repo para la licencia concreta; la mayoría de los proyectos experimentales de memoria publican bajo MIT o Apache 2.0.

Coste: pagas las llamadas LLM de reflexión. Una pasada de consolidación diaria sobre 1K memorias en gpt-4o-mini cuesta ~0,10 $. Escala linealmente con el volumen de memoria y la frecuencia de reflexión.

Alternativa sin adoptar la librería: implementa el patrón tú mismo en ~200 líneas. El valor de investigación está en la idea, no en el código concreto.

Activos relacionados en TokRepo

OpenMemory — Self-Hosted Cognitive Memory Engine for AI Agents

A self-hosted memory engine that gives AI agents persistent long-term memory with multi-sector storage, temporal reasoning, and explainable recall beyond simple RAG.

SuperClaude — Workflow Framework for Claude Code

Adds 16+ slash commands, 9 cognitive personas, and a smart flag system to Claude Code in one pipx install.

Preguntas frecuentes

¿Cognitive Weaver está listo para producción?+

No — trátalo como un proyecto de investigación. Para producción usa mem0, Zep o Letta. Cognitive Weaver es valioso cuando quieres experimentar con memoria por reflexión o forkear el código para investigación.

¿En qué se diferencia la reflexión de la deduplicación?+

La deduplicación elimina memorias casi idénticas. La reflexión va más allá: puede fusionar memorias relacionadas-pero-no-idénticas en un único resumen de mayor señal, re-ordenar la importancia y podar hechos obsoletos. Es una operación semántica, no solo coincidencia de texto.

¿Puedo añadir reflexión a mem0 o Zep?+

Sí. Ejecuta un job programado que consulte las memorias recientes, pida a un LLM consolidarlas y escriba el resultado de vuelta. La funcionalidad graph memory de mem0 ya hace algo similar para relaciones entre entidades; añadir reflexión a nivel de hechos es una extensión limpia.

¿Qué problemas NO resuelve la reflexión?+

Alucinaciones (si la fuente está mal, la consolidación las amplifica), cuellos de botella de precisión en recuperación (la búsqueda híbrida los arregla) y latencia (la reflexión es offline de todas formas). Úsala cuando la calidad de la memoria se degrade con el tiempo — no como solución de propósito general.

¿Dónde aprender más sobre reflexión en Agent de AI?+

Empieza por el paper Reflexion (Shinn et al., 2023) para auto-mejora de Agent, y el paper Voyager (Wang et al., 2023) para aprendizaje permanente con una skill library. Cognitive Weaver está en la misma línea de investigación.

Comparar alternativas

mem0 — Long-term Memory for AI Agents (2026 Guide)Zep — Memory Service for LLM Apps with Built-in Summarization Graphiti — Temporal Knowledge Graphs for AI Agents Letta — Agent Memory OS (formerly MemGPT)