AI 记忆

AI 记忆系统指南：构建有记忆的聊天机器人与 Agent

长期记忆是 2026 年 AI Agent 的关键缺口。本指南对比 11 种最活跃的记忆方案——从 mem0 语义记忆到 Graphiti 时序图谱——教你选型、部署并接入你的 LLM 应用。

mem0 — AI Agent 的长期记忆层（2026 指南）

mem0 是一款开源记忆层，从对话中抽取并检索用户相关事实。接入 OpenAI 或 Claude 调用后，你的聊天机器人不再"失忆"。

VectorOpen sourceManaged

Zep — 内置会话摘要与混合检索的 LLM 记忆服务

Zep 是面向生产 LLM 应用的记忆服务，负责会话存储、长历史摘要、事实抽取，并通过向量+关键字+图谱混合检索返回。

SessionHybridManaged

Letta — Agent 记忆操作系统（原 MemGPT）

Letta 是围绕 MemGPT 分页式记忆构建的状态化 Agent 框架。Agent 通过函数调用显式读写自己的记忆——生产中最透明的记忆模型。

MemGPTAgent OSOpen source

Graphiti — 面向 AI Agent 的时序知识图谱

Graphiti 从流式数据构建时序知识图谱，每条边带有效期。Agent 不仅能查"当前事实"，还能查"过去某个时点的事实"。

GraphTemporalNeo4j

MemGPT — 分页式 Agent 记忆的开山论文

MemGPT 是 2023 年 UC Berkeley 提出的论文与开源项目，首次将操作系统式内存管理引入 LLM Agent。该项目后来演化为 Letta，但核心思想仍是后续所有长期记忆框架的起点。

Paged memoryResearch

Cognitive Weaver — 实验性 Agent 记忆架构

Cognitive Weaver 是偏研究向的记忆库，探索反思式记忆整合：Agent 定期审视并重写自己的记忆，而非仅仅存储。

ExperimentalGraph

Motorhead — 基于 Redis 的轻量聊天记忆服务

Motorhead 是一个用 Rust 实现的开源记忆服务，基于 Redis 存储对话历史并维护滚动摘要，提供极简 REST API。为 LLM 应用增加"最近 N 轮 + 摘要"记忆的最简方案。

RedisLightweight

LangMem — LangChain 原生的记忆 SDK

LangMem 是 LangChain 官方的记忆 SDK，提供语义、情景、程序性三类记忆工具，无缝接入 LangGraph Agent 与 LangChain Chain。

LangChainOpen source

LlamaIndex Memory — 内置于 RAG 流水线的记忆能力

LlamaIndex 内置多种记忆模块（ChatMemoryBuffer、VectorMemory、CompositeMemory），只需一个构造参数即可给 RAG 流水线加上记忆能力。

LlamaIndexBuilt-in

ChatGPT Memory 完全指南（2026）

2026 年 ChatGPT Memory 工作原理全解：存什么、忘什么、如何控制，以及什么时候应该自建记忆层。

ChatGPTGuide

向量记忆 vs 图记忆 — 如何选型（2026）

两种主流 AI 记忆架构的实战对比：何时用向量嵌入，何时用知识图谱，以及何时组合使用。

ComparisonArchitecture

AI 记忆的三大技术路径

向量语义记忆。像 mem0 这类工具从对话中抽取事实、做向量化存储，新 prompt 来临时检索最相关的记忆。2024-2025 年的主流模式，因为可以复用现有的向量数据库基础设施。适合聊天机器人的个性化和 CRM 风格的 Agent。短板：多跳关系会变得模糊。

时序知识图谱。Graphiti 构建带时间窗口的实体与关系图——不仅记录事实，还记录这些事实在什么时间成立。像“用户上个月偏好什么、今天偏好什么”这类查询变得轻而易举。适合事实会随时间演化的长期助手。

Agent 原生记忆操作系统。Letta（前身 MemGPT）将记忆视作一个分页操作系统：小段工作记忆常驻上下文，归档记忆由 LLM 通过函数调用按需换入换出。运维成本更高，但这是唯一让 Agent 直接掌控自身记忆的方案。适合长时间无界运行的自主 Agent。

大多数生产应用建议从 mem0 起步（最简单），需要托管基础设施和会话摘要时升级到 Zep，只有当长历史上的检索精度真正出现瓶颈时才进一步上 Graphiti 或 Letta。

常见问题

什么是 AI 记忆？+

AI 记忆是让大模型在多次对话之间保留上下文、事实或用户偏好的机制。不是把所有历史塞进 context 窗口，而是抽取、存储、按需检索相关片段。

mem0 和 Zep 怎么选？+

mem0 是开源 SDK + 可选云服务，自己掌控存储。Zep 是托管服务，自带会话摘要和混合搜索，上手更快。自建选 mem0，业务快速验证选 Zep。

RAG 和 AI 记忆是同一回事吗？+

不是。RAG 是从知识库检索外部文档；AI 记忆是积累关于用户和对话的事实。两者可以叠加：用 RAG 回答领域问题，用记忆维持个性化。

向量记忆和图记忆的核心差异？+

向量记忆按语义相似度检索，擅长“相关内容”；图记忆按实体关系遍历，擅长“多跳推理”。生产系统越来越常见两者结合。