LangChain 构建 RAG Agent

前两篇我们准备了向量存储和检索器。

本篇将它们集成到 Agent 中，构建一个完整的 RAG Agent——能够基于私有知识库回答问题的智能助手。

创建 Retriever 工具

将检索器包装成一个工具，Agent 就能在需要时自动搜索知识库。

如果没有 OpenAI 的 key 可以采用阿里百炼的 Embedding 服务，参考配置 https://www.runoob.com/langchain/langchain-alibailian.html：

# OpenAI 的文本嵌入模型
# 将文本转换为向量（一组浮点数）

# 使用阿里云百炼（DashScope）的通义千问 Embedding 服务
embeddings = OpenAIEmbeddings(
    model="text-embedding-v4",
    api_key=os.getenv("DASHSCOPE_API_KEY"),
    base_url="https://dashscope.aliyuncs.com/compatible-mode/v1",
    check_embedding_ctx_length=False,
    chunk_size=10,
)

实例（OpenAI）

import os
from dotenv import load_dotenv
load_dotenv()

from langchain.tools import tool
from langchain.agents import create_agent
from langchain.chat_models import init_chat_model
from langchain.messages import HumanMessage
from langchain_openai import OpenAIEmbeddings
from langchain_chroma import Chroma
from langchain_text_splitters import RecursiveCharacterTextSplitter

# ----- 步骤 1：准备知识库 -----

# 模拟菜鸟教程 RUNOOB 的知识文档
knowledge_docs = [
"菜鸟教程（RUNOOB）创立于 2013 年，是一个完全免费的编程学习平台。",
"平台已上线 300+ 套教程，涵盖前端、后端、数据库、移动开发等领域。",
"Python3 基础教程是平台最受欢迎的课程，累计学习人次超过 500 万。",
"Python3 基础教程共 30 章，包含环境搭建、基本语法、函数、类、异常处理等内容。",
"HTML 基础教程共 25 章，从 HTML 基本结构讲到表单与多媒体元素。",
"菜鸟教程支持在线运行代码，学习者无需安装任何软件即可编写和运行代码。",
"平台提供移动端适配，用户可以在手机上随时随地学习编程。",
"菜鸟教程的会员服务提供视频课程、项目实战、一对一答疑等增值服务。",
]

# 切分
text_splitter = RecursiveCharacterTextSplitter(
chunk_size=200, chunk_overlap=30
)
chunks = text_splitter.create_documents(knowledge_docs)

# 向量化存储 -- 这里可以修改为阿里百炼的，如果没有 OpenAI 的 key
embeddings = OpenAIEmbeddings(model="text-embedding-3-small")

vector_store = Chroma.from_documents(
documents=chunks,
embedding=embeddings,
)
retriever = vector_store.as_retriever(search_kwargs={"k": 3})

# ----- 步骤 2：创建检索工具 -----

@tool
def search_knowledge_base(query: str) -> str:
"""在菜鸟教程 RUNOOB 知识库中搜索相关信息。

当用户询问关于菜鸟教程的具体信息时（如课程数量、平台历史、功能特性等），
必须使用此工具查询知识库获取准确信息。

Args:
query: 搜索关键词或问题
"""
docs = retriever.invoke(query)
if not docs:
return "知识库中未找到相关信息。"

results = []
for i, doc in enumerate(docs, 1):
results.append(f"[{i}] {doc.page_content}")

return "\n\n".join(results)

# ----- 步骤 3：创建 RAG Agent -----

model = init_chat_model("deepseek:deepseek-v4-flash", temperature=0)
agent = create_agent(
model=model,
tools=[search_knowledge_base],
system_prompt="""你是菜鸟教程 RUNOOB 的智能客服助手。

## 规则
1. 当用户询问关于菜鸟教程的具体信息时，必须使用 search_knowledge_base 工具查询
2. 基于检索到的信息回答，不要编造知识库中没有的内容
3. 如果知识库中没有相关信息，诚实地告诉用户
4. 回答要友好、简洁、准确""",
)

# ----- 步骤 4：测试 -----

questions = [
"菜鸟教程是什么时候创立的？",
"Python3 基础教程有多少章？",
"菜鸟教程一共有多少套教程？",
]

for q in questions:
result = agent.invoke({"messages": [HumanMessage(content=q)]})
print(f"Q: {q}")
print(f"A: {result['messages'][-1].content}")
print("-" * 60)

运行结果：

Q: 菜鸟教程是什么时候创立的？
A: 菜鸟教程（RUNOOB）创立于 2013 年，是一个完全免费的编程学习平台。
------------------------------------------------------------
Q: Python3 基础教程有多少章？
A: Python3 基础教程共 30 章，包含环境搭建、基本语法、函数、类、异常处理等内容。
------------------------------------------------------------
Q: 菜鸟教程一共有多少套教程？
A: 菜鸟教程已上线 300+ 套教程，涵盖前端、后端、数据库、移动开发等多个领域。
------------------------------------------------------------

RAG Agent 的执行流程

对于上面的第三个问题"菜鸟教程一共有多少套教程？"，Agent 的执行流程是：

用户提问
模型判断需要查询知识库 → 调用 search_knowledge_base("菜鸟教程教程数量")
检索器从向量数据库中搜索语义最相似的文档块
将检索结果返回给模型
模型基于检索结果生成准确回答

添加引用来源

专业的 RAG 系统通常会附带引用来源，让用户知道信息来自哪里：

实例

from langchain_core.documents import Document

@tool
def search_with_sources(query: str) -> str:
"""在菜鸟教程知识库中搜索，返回带来源标注的结果。

Args:
query: 搜索关键词
"""
docs = retriever.invoke(query)
if not docs:
return "未找到相关信息。"

results = []
for i, doc in enumerate(docs, 1):
source = doc.metadata.get("source", "菜鸟教程知识库")
results.append(f"[来源 {i}: {source}]\n{doc.page_content}")

return "\n\n".join(results)

# 如需在文档中保留来源信息，可在创建时添加元数据
doc_with_meta = Document(
page_content="Python3 基础教程共 30 章...",
metadata={"source": "Python3 基础教程-课程介绍", "url": "https://www.runoob.com/python3/"}
)

向量存储的持久化

在实际项目中，你不会每次都重建向量索引。Chroma 支持持久化到本地：

实例

# 创建持久化向量存储（首次运行）
embeddings = OpenAIEmbeddings(model="text-embedding-3-small")
vector_store = Chroma.from_documents(
documents=chunks,
embedding=embeddings,
persist_directory="./runoob_vector_db", # 持久化目录
)

# 后续运行直接加载
loaded_store = Chroma(
persist_directory="./runoob_vector_db",
embedding_function=embeddings,
)
retriever = loaded_store.as_retriever()

# 无需重新计算向量！

向量存储的持久化可以大幅提升启动速度。在文档量大的情况下（成千上万篇），重新计算所有向量的 Embedding 可能花费数十分钟。持久化后只需加载即可。

返回顶部