AI Memory
MemGPT — The Paper That Started Paged Agent Memory logo

MemGPT — el paper fundacional de la memoria Agent paginada

MemGPT es el paper y proyecto open source publicado en 2023 por UC Berkeley que introdujo la gestión de memoria estilo OS en Agent LLM. El proyecto continúa hoy como Letta, pero las ideas siguen siendo fundacionales.

What MemGPT introduced

El paper de MemGPT defendía que los LLMs deberían gestionar su propio contexto como un sistema operativo gestiona la RAM: una pequeña "main memory" que se queda en contexto permanentemente, más una "archival memory" mucho más grande que el modelo pagina dentro/fuera vía llamadas de función explícitas. Cuando lees sobre "memoria de Agent" hoy, estás leyendo sobre esa abstracción, aunque la librería que uses la oculte.

En la práctica, la base de código de MemGPT fue renombrada y actualizada a Letta en 2024. El paquete Python memgpt ya no se mantiene; los proyectos nuevos deberían empezar directamente con Letta. El paper original sigue siendo el mejor primer sobre por qué importa esta arquitectura.

Verás "MemGPT" todavía en tres sitios: citas académicas, posts de blog comparando enfoques de memoria, y los tipos de Agent de Letta (Letta incluye un preset MemGPTAgent que reproduce el comportamiento exacto del paper). Trátalo como un nombre histórico que apunta a una familia de ideas, y usa Letta cuando hagas ship.

Quick Start — Use Letta’s MemGPTAgent

El tipo de Agent "memgpt_agent" aplica el conjunto exacto de herramientas del paper: core_memory_append, core_memory_replace, archival_memory_insert, archival_memory_search, conversation_search, send_message. Úsalo cuando quieras específicamente el comportamiento del paper; usa agent_type="letta_agent" para los valores por defecto mejorados de Letta.

# pip install letta-client
# MemGPT lives on inside Letta as the MemGPTAgent preset
from letta_client import Letta

client = Letta(base_url="http://localhost:8283")

# This reproduces the MemGPT paper's agent behavior
agent = client.agents.create(
    name="memgpt-style",
    agent_type="memgpt_agent",   # paged memory with core + archival blocks
    memory_blocks=[
        {"label": "human", "value": "The user's name is unknown."},
        {"label": "persona", "value": "You proactively update your own memory."},
    ],
    model="openai/gpt-4o-mini",
    embedding="openai/text-embedding-3-small",
)

resp = client.agents.messages.create(
    agent_id=agent.id,
    messages=[{"role": "user", "content": "Hi, I'm William."}],
)
# Watch the trace — the agent will call core_memory_replace("human", ...)
# on its own, updating working memory with the newly-learned name.
for m in resp.messages:
    print(m.message_type, getattr(m, "content", None))

Características clave

Arquitectura de memoria paginada

Pequeña core memory en contexto + archival memory más grande fuera de contexto. El LLM decide qué paginar dentro/fuera mediante llamadas de función — sin procesos automáticos en segundo plano.

Core memory auto-editable

El Agent puede sobrescribir sus propios bloques persona y descripción de usuario. Caso de uso clásico: actualizar "el usuario vive en X" cuando el usuario menciona una mudanza.

Búsqueda en archival memory

Búsqueda full-text y vectorial sobre el tier archival. Devuelve snippets que el Agent puede citar o promover a core memory.

Recuerdo de conversación

Separado de la archival memory — el Agent puede buscar en su propio historial de mensajes con conversation_search.

Legado OSS preservado

Letta conserva el tipo de Agent MemGPT por reproducibilidad y comparaciones de investigación. Los papers que citan MemGPT siguen siendo ejecutables hoy.

Base para trabajos posteriores

mem0, Zep y LangMem hacen referencia a MemGPT en sus docs de diseño. Entender el paper ayuda a razonar sobre cualquier librería de memoria moderna.

Comparación

 StatusHow to use todayMaintained?Best for
MemGPT (paper)esta2023 paperRead + cite; runtime via LettaNo — superseded by LettaResearch grounding
LettaActive OSSpip install letta-clientYes — active devProduction paged-memory agents
mem0Active OSSpip install mem0aiYesChatbot personalization
ZepActive OSS + SaaSpip install zep-pythonYesSession-based apps

Casos de uso

01. Proyectos académicos y de investigación

Cuando necesitas reproducir o citar exactamente el comportamiento del paper original — usa el preset memgpt_agent de Letta, cita tanto el paper como Letta, y tienes una implementación de referencia ejecutable.

02. Entender las librerías de memoria posteriores

Leer el paper (30 minutos) es el movimiento de mayor palanca al evaluar mem0 / Zep / Letta / LangMem. Todas se definen en parte por oposición a MemGPT.

03. Enseñar arquitectura de Agent

La metáfora de la memoria paginada es la rampa de acceso más clara para explicar por qué las ventanas de contexto no sustituyen a la memoria — perfecto para workshops y documentación de onboarding.

Precios y licencia

Paper MemGPT: gratis en arXiv (2310.08560).

Paquete Python memgpt legacy: sin mantenimiento desde 2024. No lo uses para proyectos nuevos.

Letta (el proyecto sucesor): open source Apache 2.0, self-host gratis; el Letta Cloud gestionado tiene tarificación por uso. Consulta la página de Letta para los detalles.

Activos relacionados en TokRepo

Preguntas frecuentes

¿Debería hacer pip install memgpt en 2026?+

No. El paquete memgpt en PyPI no se mantiene. Si quieres comportamiento estilo MemGPT, instala letta-client y usa agent_type="memgpt_agent" — ese es el camino soportado.

¿Sigue siendo MemGPT relevante si existe Letta?+

Sí, como ideas y como vocabulario. El paper sigue siendo la articulación más clara de "core vs archival". Los investigadores lo citan; los vendors se posicionan respecto a él. No lo ejecutarás directamente, pero te encontrarás los conceptos constantemente.

¿Qué demostró realmente MemGPT?+

Que un LLM puede gestionar de forma fiable su propio contexto en conversaciones indefinidas si le das las herramientas adecuadas (lectura/escritura/búsqueda para working memory y archival memory). Antes de MemGPT, la "memoria a largo plazo" para Agent era relleno ad hoc de prompts.

¿Hay una alternativa más simple a la arquitectura MemGPT?+

Sí — mem0 y Zep. En lugar de que el Agent gestione explícitamente la memoria vía llamadas a herramientas, ejecutan un extractor en segundo plano que decide qué guardar. Menos transparente, menos turnos LLM, más rápido para hacer ship. Trade-offs en ambos lados.

¿Por dónde empezar si tengo 30 minutos?+

Lee el abstract del paper de MemGPT y la §3 (la sección de arquitectura). Luego instala Letta y ejecuta el quick start de arriba. Tendrás un modelo mental que funciona para cualquier librería de "memoria de Agent" que encuentres después.

Comparar alternativas