让你的AI Agent告别“金鱼记忆”：ChromaDB与RAG长期记忆系统构建指南

作者：技术老金

每一个Agent开发者，都面临着一个共同的、核心的痛点：AI的“金鱼记忆”。

一个标准的、无状态的Agent，在一次会话结束后，就会忘记所有事情。你无法让它“记住”上一次任务的成果，更无法让它“借鉴”过去的经验。这种“一次性”的交互，极大地限制了Agent在处理连续、复杂任务时的能力。

在我们的vkflow-agent项目中，我们遇到了同样的问题。但我们通过引入一个强大的开源工具——ChromaDB，成功地为我们的Agent，装上了一颗可以长期存取、并能进行“语义联想”的“记忆海马体”。

今天，我将带你完整地走一遍这个技术攻坚的全过程。

第一部分：技术选型——为何选择“向量数据库”？

在为Agent设计记忆系统时，我们评估了三种主流方案：

方案一：简单的文本文件/JSON。
- 优点： 实现简单。
- 缺点： 只能进行精确的关键词匹配，无法实现真正的“语义理解”和“模糊联想”。
方案二：传统的关系型数据库（如SQLite）。
- 优点： 结构化，可靠。
- 缺点： 同样不擅长处理非结构化的自然语言查询。你很难用一条SQL，去“搜寻所有和‘AI框架选型’相关的记忆”。
方案三（我们的选择）：向量数据库（ChromaDB）。
- 核心优势： 这才是为AI时代而生的记忆方案。它不存储文本本身，而是将文本通过一个“嵌入模型”（Embedding Model），转化为一串代表其“语义”的数字——即“向量”。当我们用一个新的查询去检索时，它会在高维空间中，计算并找到那些在“语义”上最接近的向量，从而找出最相关的原始文本。
- 这，才是真正的“联想”。 即使两个句子的措辞完全不同，只要意思相近，就能被关联起来。
- 我们为什么在众多向量数据库中，选择了ChromaDB？ 因为它开源、轻量、能直接在本地运行，对我们项目初期的快速验证和低成本开发，是最佳选择。

第二部分：实战——构建我们的`VectorMemory`模块

选型确定后，我们便开始动手构建。我们在项目的核心层，创建了一个memory.py文件，并定义了我们的VectorMemory类。

它的核心代码，主要包含三个部分：

1. 初始化 (__init__)

# vkflow_agent/core/memory.py
import chromadb

class VectorMemory(BaseMemory):
    def __init__(self, collection_name: str = "vkflow_agent_memory"):
        # 使用一个内存中的实例，无需搭建复杂服务器
        self.client = chromadb.Client()
        # 获取或创建一个“集合”，类似于数据库中的“表”
        self.collection = self.client.get_or_create_collection(name=collection_name)
        self._next_id = 1

2. 添加记忆 (add)

    def add(self, document: str, metadata: dict = None) -> None:
        doc_id = str(self._next_id)
        self._next_id += 1
        
        # ChromaDB会自动将document转化为向量，我们无需关心这个过程
        self.collection.add(
            documents=[document],
            metadatas=[metadata] if metadata else None,
            ids=[doc_id]
        )

这里最妙的地方在于，我们作为开发者，完全不需要去关心复杂的“向量化”过程。我们只需要把原始的文本document丢给collection，ChromaDB就会在后台，自动调用它内置的嵌入模型（默认为all-MiniLM-L6-v2），完成所有的脏活累活。

3. 查询记忆 (query)

    def query(self, query_text: str, n_results: int = 1) -> List[Any]:
        results = self.collection.query(
            query_texts=[query_text],
            n_results=n_results
        )
        return results.get('documents', [[]])[0]

这是最神奇的一步。我们用一段自然语言query_text去查询，ChromaDB就会在它的向量空间中，找到N个与这段查询文本“意思最相近”的历史文档，并返回给我们。

第三部分：见证奇迹——一个拥有记忆的Agent

理论和代码都有了，现在，是时候见证奇迹了。我们在主程序中，设计了两个连续的任务：

任务一：研究与“存入记忆”

我们先让ResearchAgent去抓取一个关于《A Light in the Attic》这本书的详细网页。在它完成抓取后，我们让它调用了memory.add()，将这篇包含了书本所有细节的、长长的文本，作为一份“记忆”，存入了我们共享的VectorMemory中。

任务二：联想与“读取记忆”

接下来，我们向WriterAgent下达了一个完全不同的、信息极其模糊的新指令：“请写一份关于《A Light in the Attic》的报告”。我们没有给它任何URL或上下文。

在我们的代码中，WriterAgent在开始写作前，会先执行memory.query("请写一份关于《A Light in the Attic》的报告")这一步。

然后，最关键的一幕发生了。我们的运行日志，清晰地打印出了这一行：

[WriterAgent] Retrieved relevant information from memory.

VectorMemory成功地、仅仅通过“语义相似度”，就从我们那模糊的新指令中，“联想”到了我们在上一步存入的那份详细的技术文档！

一个重要的提醒： 从记忆中检索出的信息，只是“原材料”。在实际应用中，我们还需要对这些“原材料”进行加工，比如根据相关性进行筛选、总结，或者截断，以确保最终送入LLM的上下文（Context）既精准又不会超长。这本身就是另一个重要的话题——上下文管理。

最终，WriterAgent利用这份从记忆中检索出的、宝贵的上下文，成功地创作出了一份内容详实、有理有据的高质量报告。

结语：从“一次性工具”到“成长型伙伴”

这次成功的技术攻坚，让我们项目的Agent，发生了质的蜕变。

通过集成ChromaDB，我们的Agent，不再是一个只能被动执行指令的“一次性工具”，而是变成了一个可以积累经验、可以从过去学习、可以举一反三的、真正的**“成长型伙伴”**。

我们为它装上的，不仅仅是一个“记忆模块”，更是它未来能够实现更高级自主规划、更深度个性化服务的、最核心的“大脑基石”。

当然，对于更大规模的数据集或需要多人协作的生产环境，ChromaDB也支持更强大的客户端-服务器（Client-Server）部署模式。同时，业界也有如Milvus、Pinecone等更专业的分布式向量数据库可供选择，以满足更高的性能和并发需求。

这，才是AI Agent最激动人心的未来。

更多相关阅读：

LangGraph入门与避坑指南：从ReAct到复杂流程编排

技术老金同步发布至微信公众号【技术老金】，欢迎关注

我们为何放弃了CrewAI：一个关于AI框架选型的深度复盘 - 技术老金 […] AI写不出“干净架构”：从代码生成到软件匠艺的进阶之路 […]

我们为何放弃了CrewAI：一个关于AI框架选型的深度复盘 - 技术老金 […] 和AI结对编程第一天，我踩了3个大坑，差点项目失败！复盘4条生存法则 […]

你的AI“实习生”为何总是带不动？我们犯了3个“管理”上的致命错误 - 技术老金 […] AI代码生成：是解放生产力的“银弹”，还是架构师的“新噩梦”？当AI能生成“正确”的代码，我们这些35岁+的老程序员，到底“贵”在哪？AI与代码品味：当机器开始“创作”，我们程序员的价值还剩多少？ […]

技术老金文章已同步发布到微信公众号【技术老金】，欢迎关注

技术老金文章已同步发布到微信公众号【技术老金】，欢迎关注。

技术老金同步发布至微信公众号【技术老金】，欢迎关注，有什么问题可以公众号私信

让你的AI Agent告别“金鱼记忆”：ChromaDB与RAG长期记忆系统构建指南

作者：技术老金

第一部分：技术选型——为何选择“向量数据库”？

第二部分：实战——构建我们的`VectorMemory`模块

第三部分：见证奇迹——一个拥有记忆的Agent

结语：从“一次性工具”到“成长型伙伴”

“AI-Native”架构设计：不是调用API，而是重塑系统血脉

终章：未来架构师的宣言——从技术专家到“人机协同的首席设计师”

成本与性能的博弈：设计高性价比的LLM应用架构

终章：未来架构师的宣言——从技术专家到“人机协同的首席设计师”

成本与性能的博弈：设计高性价比的LLM应用架构

“AI-Native”架构设计：不是调用API，而是重塑系统血脉

归档

分类

让你的AI Agent告别“金鱼记忆”：ChromaDB与RAG长期记忆系统构建指南

作者：技术老金

第一部分：技术选型——为何选择“向量数据库”？

第二部分：实战——构建我们的VectorMemory模块

第三部分：见证奇迹——一个拥有记忆的Agent

结语：从“一次性工具”到“成长型伙伴”

“AI-Native”架构设计：不是调用API，而是重塑系统血脉

终章：未来架构师的宣言——从技术专家到“人机协同的首席设计师”

成本与性能的博弈：设计高性价比的LLM应用架构

终章：未来架构师的宣言——从技术专家到“人机协同的首席设计师”

成本与性能的博弈：设计高性价比的LLM应用架构

“AI-Native”架构设计：不是调用API，而是重塑系统血脉

归档

分类

第二部分：实战——构建我们的`VectorMemory`模块