AI Memory

MemGPT — l'article fondateur de la mémoire Agent paginée

MemGPT est l'article et le projet open source publiés en 2023 par UC Berkeley qui ont introduit une gestion mémoire de style OS dans les Agent LLM. Le projet vit aujourd'hui sous le nom de Letta, mais les idées restent fondatrices.

Site officiel GitHub

What MemGPT introduced

L'article MemGPT défendait l'idée que les LLMs devraient gérer leur propre contexte comme un système d'exploitation gère la RAM : une petite « main memory » qui reste en contexte en permanence, plus une « archival memory » bien plus grande que le modèle pagine entrant/sortant via des appels de fonctions explicites. Quand vous lisez « mémoire d'Agent » aujourd'hui, vous lisez cette abstraction, même si la bibliothèque que vous utilisez la cache.

En pratique, la base de code MemGPT a été renommée et mise à niveau vers Letta en 2024. Le package Python memgpt n'est plus maintenu ; les nouveaux projets devraient démarrer directement sur Letta. L'article original reste le meilleur primer sur pourquoi cette architecture compte.

Vous croiserez encore « MemGPT » dans trois endroits : les citations académiques, les billets de blog comparant les approches mémoire et les types d'Agent de Letta (Letta livre un preset MemGPTAgent qui reproduit le comportement exact de l'article). Traitez-le comme un nom historique pointant vers une famille d'idées, et utilisez Letta quand vous shippez.

Quick Start — Use Letta’s MemGPTAgent

Le type d'Agent « memgpt_agent » applique le jeu d'outils exact de l'article : core_memory_append, core_memory_replace, archival_memory_insert, archival_memory_search, conversation_search, send_message. Utilisez-le quand vous voulez spécifiquement le comportement de l'article ; utilisez agent_type="letta_agent" pour les défauts améliorés de Letta.

# pip install letta-client
# MemGPT lives on inside Letta as the MemGPTAgent preset
from letta_client import Letta

client = Letta(base_url="http://localhost:8283")

# This reproduces the MemGPT paper's agent behavior
agent = client.agents.create(
    name="memgpt-style",
    agent_type="memgpt_agent",   # paged memory with core + archival blocks
    memory_blocks=[
        {"label": "human", "value": "The user's name is unknown."},
        {"label": "persona", "value": "You proactively update your own memory."},
    ],
    model="openai/gpt-4o-mini",
    embedding="openai/text-embedding-3-small",
)

resp = client.agents.messages.create(
    agent_id=agent.id,
    messages=[{"role": "user", "content": "Hi, I'm William."}],
)
# Watch the trace — the agent will call core_memory_replace("human", ...)
# on its own, updating working memory with the newly-learned name.
for m in resp.messages:
    print(m.message_type, getattr(m, "content", None))

Fonctionnalités clés

Architecture mémoire paginée

Petite core memory en contexte + archival memory plus grande hors contexte. Le LLM décide quoi paginer entrant/sortant via des appels de fonction — aucun processus automatique en arrière-plan.

Core memory auto-éditable

L'Agent peut écraser ses propres blocs persona et description utilisateur. Cas d'usage classique : mettre à jour « l'utilisateur vit à X » quand l'utilisateur mentionne un déménagement.

Recherche en archival memory

Recherche plein texte et vectorielle sur le tier archival. Renvoie des snippets que l'Agent peut citer ou promouvoir en core memory.

Rappel de conversation

Distinct de l'archival memory — l'Agent peut chercher dans son propre historique de messages via conversation_search.

Héritage OSS préservé

Letta conserve le type d'Agent MemGPT pour la reproductibilité et les comparaisons de recherche. Les articles citant MemGPT restent exécutables aujourd'hui.

Fondation pour les travaux ultérieurs

mem0, Zep et LangMem font tous référence à MemGPT dans leurs docs de design. Comprendre l'article aide à raisonner sur toutes les bibliothèques mémoire modernes.

Comparaison

	Status	How to use today	Maintained?	Best for
MemGPT (paper)celui-ci	2023 paper	Read + cite; runtime via Letta	No — superseded by Letta	Research grounding
Letta	Active OSS	pip install letta-client	Yes — active dev	Production paged-memory agents
mem0	Active OSS	pip install mem0ai	Yes	Chatbot personalization
Zep	Active OSS + SaaS	pip install zep-python	Yes	Session-based apps

Cas d'usage

01. Projets académiques et de recherche

Quand vous devez reproduire ou citer exactement le comportement de l'article original — utilisez le preset memgpt_agent de Letta, citez à la fois l'article et Letta, et vous obtenez une implémentation de référence exécutable.

02. Comprendre les bibliothèques mémoire ultérieures

Lire l'article (30 minutes) est le geste à plus fort levier quand vous évaluez mem0 / Zep / Letta / LangMem. Toutes se définissent en partie par opposition à MemGPT.

03. Enseigner l'architecture d'Agent

La métaphore de la mémoire paginée est la rampe d'accès la plus claire pour expliquer pourquoi les fenêtres de contexte ne remplacent pas la mémoire — parfait pour les workshops et la doc d'onboarding.

Tarification et licence

Article MemGPT : gratuit sur arXiv (2310.08560).

Package Python memgpt legacy : non maintenu depuis 2024. Ne pas utiliser pour de nouveaux projets.

Letta (le projet successeur) : open source Apache 2.0, self-host gratuit ; le Letta Cloud managé a une tarification à l'usage. Voir la page Letta pour les détails.

Assets associés sur TokRepo

Letta — AI Agent Long-Term Memory Framework

Build AI agents with persistent memory using MemGPT architecture. Letta manages context windows automatically with tiered memory for stateful LLM applications.

Questions fréquentes

Devrais-je faire pip install memgpt en 2026 ?+

Non. Le package memgpt sur PyPI n'est pas maintenu. Si vous voulez un comportement style MemGPT, installez letta-client et utilisez agent_type="memgpt_agent" — c'est la voie supportée.

MemGPT reste-t-il pertinent si Letta existe ?+

Oui, en tant qu'idées et en tant que vocabulaire. L'article reste l'articulation la plus claire de la distinction « core vs archival ». Les chercheurs le citent ; les vendeurs se positionnent par rapport à lui. Vous ne le ferez pas tourner directement, mais vous croiserez constamment ses concepts.

Qu'a réellement prouvé MemGPT ?+

Qu'un LLM peut gérer de façon fiable son propre contexte à travers des conversations indéfinies si on lui donne les bons outils (lecture/écriture/recherche pour la working memory et l'archival memory). Avant MemGPT, la « mémoire long terme » des Agent se résumait à du bourrage de prompt ad hoc.

Existe-t-il une alternative plus simple à l'architecture MemGPT ?+

Oui — mem0 et Zep. Plutôt que de faire gérer explicitement la mémoire à l'Agent via des appels d'outils, ils exécutent un extracteur en arrière-plan qui décide quoi sauvegarder. Moins transparent, moins de tours LLM, plus rapide à shipper. Compromis des deux côtés.

Par où commencer si je dispose de 30 minutes ?+

Lisez l'abstract de l'article MemGPT et le §3 (la section architecture). Puis installez Letta et exécutez le quick start ci-dessus. Vous aurez un modèle mental opérationnel pour toutes les bibliothèques de « mémoire d'Agent » que vous rencontrerez ensuite.

Comparer les alternatives

Letta — Agent Memory OS (formerly MemGPT)mem0 — Long-term Memory for AI Agents (2026 Guide)Zep — Memory Service for LLM Apps with Built-in Summarization LangMem — LangChain-Native Memory SDK