AI 记忆

AI 记忆系统指南:构建有记忆的聊天机器人与 Agent

长期记忆是 2026 年 AI Agent 的关键缺口。本指南对比 11 种最活跃的记忆方案——从 mem0 语义记忆到 Graphiti 时序图谱——教你选型、部署并接入你的 LLM 应用。

mem0 — Long-term Memory for AI Agents (2026 Guide) logo

mem0 — AI Agent 的长期记忆层(2026 指南)

mem0 是一款开源记忆层,从对话中抽取并检索用户相关事实。接入 OpenAI 或 Claude 调用后,你的聊天机器人不再"失忆"。

VectorOpen sourceManaged
Zep — Memory Service for LLM Apps with Built-in Summarization logo

Zep — 内置会话摘要与混合检索的 LLM 记忆服务

Zep 是面向生产 LLM 应用的记忆服务,负责会话存储、长历史摘要、事实抽取,并通过向量+关键字+图谱混合检索返回。

SessionHybridManaged
Letta — Agent Memory OS (formerly MemGPT) logo

Letta — Agent 记忆操作系统(原 MemGPT)

Letta 是围绕 MemGPT 分页式记忆构建的状态化 Agent 框架。Agent 通过函数调用显式读写自己的记忆——生产中最透明的记忆模型。

MemGPTAgent OSOpen source
Graphiti — Temporal Knowledge Graphs for AI Agents logo

Graphiti — 面向 AI Agent 的时序知识图谱

Graphiti 从流式数据构建时序知识图谱,每条边带有效期。Agent 不仅能查"当前事实",还能查"过去某个时点的事实"。

GraphTemporalNeo4j
MemGPT — The Paper That Started Paged Agent Memory logo

MemGPT — 分页式 Agent 记忆的开山论文

MemGPT 是 2023 年 UC Berkeley 提出的论文与开源项目,首次将操作系统式内存管理引入 LLM Agent。该项目后来演化为 Letta,但核心思想仍是后续所有长期记忆框架的起点。

Paged memoryResearch
Cognitive Weaver — Experimental Agent Memory Architecture logo

Cognitive Weaver — 实验性 Agent 记忆架构

Cognitive Weaver 是偏研究向的记忆库,探索反思式记忆整合:Agent 定期审视并重写自己的记忆,而非仅仅存储。

ExperimentalGraph
Motorhead — Lightweight Redis-Backed Chat Memory Server logo

Motorhead — 基于 Redis 的轻量聊天记忆服务

Motorhead 是一个用 Rust 实现的开源记忆服务,基于 Redis 存储对话历史并维护滚动摘要,提供极简 REST API。为 LLM 应用增加"最近 N 轮 + 摘要"记忆的最简方案。

RedisLightweight
LangMem — LangChain-Native Memory SDK logo

LangMem — LangChain 原生的记忆 SDK

LangMem 是 LangChain 官方的记忆 SDK,提供语义、情景、程序性三类记忆工具,无缝接入 LangGraph Agent 与 LangChain Chain。

LangChainOpen source
LlamaIndex Memory — Built-in Memory for RAG Pipelines logo

LlamaIndex Memory — 内置于 RAG 流水线的记忆能力

LlamaIndex 内置多种记忆模块(ChatMemoryBuffer、VectorMemory、CompositeMemory),只需一个构造参数即可给 RAG 流水线加上记忆能力。

LlamaIndexBuilt-in
ChatGPT Memory — Complete Guide (2026) logo

ChatGPT Memory 完全指南(2026)

2026 年 ChatGPT Memory 工作原理全解:存什么、忘什么、如何控制,以及什么时候应该自建记忆层。

ChatGPTGuide
Vector Memory vs Graph Memory — How to Choose (2026) logo

向量记忆 vs 图记忆 — 如何选型(2026)

两种主流 AI 记忆架构的实战对比:何时用向量嵌入,何时用知识图谱,以及何时组合使用。

ComparisonArchitecture

AI 记忆的三大技术路径

向量语义记忆。mem0 这类工具从对话中抽取事实、做向量化存储,新 prompt 来临时检索最相关的记忆。2024-2025 年的主流模式,因为可以复用现有的向量数据库基础设施。适合聊天机器人的个性化和 CRM 风格的 Agent。短板:多跳关系会变得模糊。

时序知识图谱。Graphiti 构建带时间窗口的实体与关系图——不仅记录事实,还记录这些事实在什么时间成立。像“用户上个月偏好什么、今天偏好什么”这类查询变得轻而易举。适合事实会随时间演化的长期助手。

Agent 原生记忆操作系统。Letta(前身 MemGPT)将记忆视作一个分页操作系统:小段工作记忆常驻上下文,归档记忆由 LLM 通过函数调用按需换入换出。运维成本更高,但这是唯一让 Agent 直接掌控自身记忆的方案。适合长时间无界运行的自主 Agent。

大多数生产应用建议从 mem0 起步(最简单),需要托管基础设施和会话摘要时升级到 Zep,只有当长历史上的检索精度真正出现瓶颈时才进一步上 Graphiti 或 Letta。

常见问题

什么是 AI 记忆?+

AI 记忆是让大模型在多次对话之间保留上下文、事实或用户偏好的机制。不是把所有历史塞进 context 窗口,而是抽取、存储、按需检索相关片段。

mem0 和 Zep 怎么选?+

mem0 是开源 SDK + 可选云服务,自己掌控存储。Zep 是托管服务,自带会话摘要和混合搜索,上手更快。自建选 mem0,业务快速验证选 Zep。

RAG 和 AI 记忆是同一回事吗?+

不是。RAG 是从知识库检索外部文档;AI 记忆是积累关于用户和对话的事实。两者可以叠加:用 RAG 回答领域问题,用记忆维持个性化。

向量记忆和图记忆的核心差异?+

向量记忆按语义相似度检索,擅长“相关内容”;图记忆按实体关系遍历,擅长“多跳推理”。生产系统越来越常见两者结合。