MemGPT — l'article fondateur de la mémoire Agent paginée
MemGPT est l'article et le projet open source publiés en 2023 par UC Berkeley qui ont introduit une gestion mémoire de style OS dans les Agent LLM. Le projet vit aujourd'hui sous le nom de Letta, mais les idées restent fondatrices.
What MemGPT introduced
L'article MemGPT défendait l'idée que les LLMs devraient gérer leur propre contexte comme un système d'exploitation gère la RAM : une petite « main memory » qui reste en contexte en permanence, plus une « archival memory » bien plus grande que le modèle pagine entrant/sortant via des appels de fonctions explicites. Quand vous lisez « mémoire d'Agent » aujourd'hui, vous lisez cette abstraction, même si la bibliothèque que vous utilisez la cache.
En pratique, la base de code MemGPT a été renommée et mise à niveau vers Letta en 2024. Le package Python memgpt n'est plus maintenu ; les nouveaux projets devraient démarrer directement sur Letta. L'article original reste le meilleur primer sur pourquoi cette architecture compte.
Vous croiserez encore « MemGPT » dans trois endroits : les citations académiques, les billets de blog comparant les approches mémoire et les types d'Agent de Letta (Letta livre un preset MemGPTAgent qui reproduit le comportement exact de l'article). Traitez-le comme un nom historique pointant vers une famille d'idées, et utilisez Letta quand vous shippez.
Quick Start — Use Letta’s MemGPTAgent
Le type d'Agent « memgpt_agent » applique le jeu d'outils exact de l'article : core_memory_append, core_memory_replace, archival_memory_insert, archival_memory_search, conversation_search, send_message. Utilisez-le quand vous voulez spécifiquement le comportement de l'article ; utilisez agent_type="letta_agent" pour les défauts améliorés de Letta.
# pip install letta-client
# MemGPT lives on inside Letta as the MemGPTAgent preset
from letta_client import Letta
client = Letta(base_url="http://localhost:8283")
# This reproduces the MemGPT paper's agent behavior
agent = client.agents.create(
name="memgpt-style",
agent_type="memgpt_agent", # paged memory with core + archival blocks
memory_blocks=[
{"label": "human", "value": "The user's name is unknown."},
{"label": "persona", "value": "You proactively update your own memory."},
],
model="openai/gpt-4o-mini",
embedding="openai/text-embedding-3-small",
)
resp = client.agents.messages.create(
agent_id=agent.id,
messages=[{"role": "user", "content": "Hi, I'm William."}],
)
# Watch the trace — the agent will call core_memory_replace("human", ...)
# on its own, updating working memory with the newly-learned name.
for m in resp.messages:
print(m.message_type, getattr(m, "content", None))Fonctionnalités clés
Architecture mémoire paginée
Petite core memory en contexte + archival memory plus grande hors contexte. Le LLM décide quoi paginer entrant/sortant via des appels de fonction — aucun processus automatique en arrière-plan.
Core memory auto-éditable
L'Agent peut écraser ses propres blocs persona et description utilisateur. Cas d'usage classique : mettre à jour « l'utilisateur vit à X » quand l'utilisateur mentionne un déménagement.
Recherche en archival memory
Recherche plein texte et vectorielle sur le tier archival. Renvoie des snippets que l'Agent peut citer ou promouvoir en core memory.
Rappel de conversation
Distinct de l'archival memory — l'Agent peut chercher dans son propre historique de messages via conversation_search.
Héritage OSS préservé
Letta conserve le type d'Agent MemGPT pour la reproductibilité et les comparaisons de recherche. Les articles citant MemGPT restent exécutables aujourd'hui.
Fondation pour les travaux ultérieurs
mem0, Zep et LangMem font tous référence à MemGPT dans leurs docs de design. Comprendre l'article aide à raisonner sur toutes les bibliothèques mémoire modernes.
Comparaison
| Status | How to use today | Maintained? | Best for | |
|---|---|---|---|---|
| MemGPT (paper)celui-ci | 2023 paper | Read + cite; runtime via Letta | No — superseded by Letta | Research grounding |
| Letta | Active OSS | pip install letta-client | Yes — active dev | Production paged-memory agents |
| mem0 | Active OSS | pip install mem0ai | Yes | Chatbot personalization |
| Zep | Active OSS + SaaS | pip install zep-python | Yes | Session-based apps |
Cas d'usage
01. Projets académiques et de recherche
Quand vous devez reproduire ou citer exactement le comportement de l'article original — utilisez le preset memgpt_agent de Letta, citez à la fois l'article et Letta, et vous obtenez une implémentation de référence exécutable.
02. Comprendre les bibliothèques mémoire ultérieures
Lire l'article (30 minutes) est le geste à plus fort levier quand vous évaluez mem0 / Zep / Letta / LangMem. Toutes se définissent en partie par opposition à MemGPT.
03. Enseigner l'architecture d'Agent
La métaphore de la mémoire paginée est la rampe d'accès la plus claire pour expliquer pourquoi les fenêtres de contexte ne remplacent pas la mémoire — parfait pour les workshops et la doc d'onboarding.
Tarification et licence
Article MemGPT : gratuit sur arXiv (2310.08560).
Package Python memgpt legacy : non maintenu depuis 2024. Ne pas utiliser pour de nouveaux projets.
Letta (le projet successeur) : open source Apache 2.0, self-host gratuit ; le Letta Cloud managé a une tarification à l'usage. Voir la page Letta pour les détails.
Assets associés sur TokRepo
Questions fréquentes
Devrais-je faire pip install memgpt en 2026 ?+
Non. Le package memgpt sur PyPI n'est pas maintenu. Si vous voulez un comportement style MemGPT, installez letta-client et utilisez agent_type="memgpt_agent" — c'est la voie supportée.
MemGPT reste-t-il pertinent si Letta existe ?+
Oui, en tant qu'idées et en tant que vocabulaire. L'article reste l'articulation la plus claire de la distinction « core vs archival ». Les chercheurs le citent ; les vendeurs se positionnent par rapport à lui. Vous ne le ferez pas tourner directement, mais vous croiserez constamment ses concepts.
Qu'a réellement prouvé MemGPT ?+
Qu'un LLM peut gérer de façon fiable son propre contexte à travers des conversations indéfinies si on lui donne les bons outils (lecture/écriture/recherche pour la working memory et l'archival memory). Avant MemGPT, la « mémoire long terme » des Agent se résumait à du bourrage de prompt ad hoc.
Existe-t-il une alternative plus simple à l'architecture MemGPT ?+
Oui — mem0 et Zep. Plutôt que de faire gérer explicitement la mémoire à l'Agent via des appels d'outils, ils exécutent un extracteur en arrière-plan qui décide quoi sauvegarder. Moins transparent, moins de tours LLM, plus rapide à shipper. Compromis des deux côtés.
Par où commencer si je dispose de 30 minutes ?+
Lisez l'abstract de l'article MemGPT et le §3 (la section architecture). Puis installez Letta et exécutez le quick start ci-dessus. Vous aurez un modèle mental opérationnel pour toutes les bibliothèques de « mémoire d'Agent » que vous rencontrerez ensuite.