当前位置：首页 > AI > 正文内容

AI Agent 开发实战：从零构建智能助手

廖万里2个月前 (03-20)AI18

2026年是AI Agent爆发元年，从简单的问答机器人到能独立完成复杂任务的智能助手，AI Agent正在重新定义人机交互方式。本文将带你从零开始，深入理解Agent核心架构，并通过实战案例构建一个具备记忆、工具调用和自我反思能力的智能助手。

一、核心概念：什么是 AI Agent？

AI Agent（人工智能代理）是一个能够感知环境、做出决策并执行行动的智能系统。与传统的对话机器人不同，AI Agent具备以下核心特征：

1. 自主决策能力：Agent能够根据目标自主规划执行路径，而不是简单地按照预设规则响应。

2. 工具调用能力：Agent可以调用外部API、数据库、搜索引擎等工具来获取信息或执行操作。

3. 记忆系统：短期记忆维护当前会话上下文，长期记忆存储历史交互和知识积累。

4. 自我反思：Agent能够评估自己的输出质量，并进行迭代优化。

二、AI Agent 核心架构解析

一个完整的AI Agent系统通常由以下核心模块组成：

1. 推理引擎（Brain）

推理引擎是Agent的"大脑"，通常基于大语言模型（LLM）实现。它负责：

理解用户意图
制定执行计划
选择合适的工具
生成最终响应

2. 记忆系统（Memory）

记忆系统赋予Agent"学习"和"成长"的能力：

短期记忆：维护当前会话的上下文信息
长期记忆：存储用户偏好、历史交互、知识库
向量数据库：实现语义检索，如Pinecone、Milvus、Weaviate

3. 工具调用模块（Tools）

工具是Agent与外部世界交互的桥梁，常见的工具类型包括：

搜索工具（Google Search、Bing Search）
数据库查询工具
API调用工具
代码执行工具
文件操作工具

4. 编排模块（Orchestrator）

编排模块负责协调各个组件的工作流程：

任务分解
执行计划制定
工具调用编排
结果整合

三、实战案例：构建智能助手

下面我们使用LangChain框架，从零构建一个具备天气查询、知识检索和任务规划能力的智能助手。

步骤1：环境准备

# 安装必要的依赖包
# pip install langchain langchain-openai langchain-community

import os
from langchain_openai import ChatOpenAI
from langchain.agents import create_tool_calling_agent, AgentExecutor
from langchain_core.prompts import ChatPromptTemplate
from langchain_core.tools import tool
from typing import List, Dict, Any

# 配置API密钥
os.environ["OPENAI_API_KEY"] = "your-api-key-here"

步骤2：定义工具集

# 定义天气查询工具
@tool
def get_weather(city: str) -> str:
    """
    获取指定城市的天气信息
    
    参数:
        city: 城市名称，如"北京"、"上海"、"深圳"
    
    返回:
        天气描述字符串
    """
    # 模拟天气API调用
    weather_data = {
        "北京": "晴朗，气温18°C，空气质量良好",
        "上海": "多云，气温22°C，有轻微雾霾",
        "深圳": "阵雨，气温26°C，湿度较高",
        "成都": "阴天，气温16°C，适宜出行",
    }
    return weather_data.get(city, f"抱歉，暂时无法获取{city}的天气信息")

# 定义知识检索工具
@tool
def search_knowledge(query: str) -> str:
    """
    从知识库中检索相关信息
    
    参数:
        query: 查询关键词
    
    返回:
        检索到的知识内容
    """
    # 模拟知识库检索
    knowledge_base = {
        "Python": "Python是一种高级编程语言，以简洁优雅著称，广泛应用于AI、数据科学、Web开发等领域。",
        "LangChain": "LangChain是一个开源框架，用于构建基于大语言模型的应用，支持链式调用、Agent开发、RAG等。",
        "RAG": "RAG（检索增强生成）是一种结合检索和生成的技术，通过检索外部知识来增强LLM的输出质量。",
    }
    
    for key, value in knowledge_base.items():
        if key.lower() in query.lower():
            return value
    
    return "抱歉，知识库中未找到相关信息，建议使用搜索引擎查询。"

# 定义任务规划工具
@tool
def plan_tasks(goal: str) -> str:
    """
    根据目标生成任务执行计划
    
    参数:
        goal: 用户的目标描述
    
    返回:
        分解后的任务列表
    """
    # 模拟任务规划逻辑
    if "学习" in goal:
        return """
任务分解：
1. 确定学习目标和范围
2. 收集相关学习资源
3. 制定学习时间表
4. 执行学习计划
5. 定期复习和总结
"""
    elif "项目" in goal:
        return """
任务分解：
1. 明确项目需求和目标
2. 进行技术选型和架构设计
3. 制定开发计划和时间节点
4. 分模块开发和测试
5. 集成测试和部署上线
"""
    else:
        return f"已为'{goal}'生成执行计划，请详细说明您的需求以获得更精准的规划。"

# 将所有工具收集到列表中
tools = [get_weather, search_knowledge, plan_tasks]

步骤3：构建Agent

# 初始化LLM模型
llm = ChatOpenAI(
    model="gpt-4o",
    temperature=0.7,  # 适中的创造性
    verbose=True
)

# 定义Agent的系统提示词
prompt = ChatPromptTemplate.from_messages([
    ("system", """你是一个智能助手，具备以下能力：
1. 天气查询：可以查询任意城市的天气情况
2. 知识检索：可以从知识库中检索相关信息
3. 任务规划：可以帮助用户分解复杂任务

请根据用户的问题，选择合适的工具来完成任务。
回答要简洁明了，避免冗长的解释。"""),
    ("human", "{input}"),
    ("placeholder", "{agent_scratchpad}"),  # Agent思考过程
])

# 创建Agent
agent = create_tool_calling_agent(llm, tools, prompt)

# 创建Agent执行器
agent_executor = AgentExecutor(
    agent=agent,
    tools=tools,
    verbose=True,  # 显示详细执行过程
    handle_parsing_errors=True,  # 处理解析错误
    max_iterations=5,  # 最大迭代次数
)

步骤4：运行和测试

# 测试天气查询
print("=== 测试1：天气查询 ===")
result1 = agent_executor.invoke({"input": "北京今天天气怎么样？"})
print(result1["output"])

print("\n=== 测试2：知识检索 ===")
result2 = agent_executor.invoke({"input": "请介绍一下LangChain框架"})
print(result2["output"])

print("\n=== 测试3：任务规划 ===")
result3 = agent_executor.invoke({"input": "我想学习AI开发，帮我规划一下学习路线"})
print(result3["output"])

print("\n=== 测试4：多工具协作 ===")
result4 = agent_executor.invoke({
    "input": "我要去上海出差，帮我查一下天气，并规划一下出差准备任务"
})
print(result4["output"])

步骤5：添加记忆系统

from langchain.memory import ConversationBufferMemory
from langchain_core.messages import HumanMessage, AIMessage

# 创建记忆系统
memory = ConversationBufferMemory(
    memory_key="chat_history",
    return_messages=True
)

# 定义带记忆的提示词
memory_prompt = ChatPromptTemplate.from_messages([
    ("system", "你是一个智能助手，记住用户的历史对话，提供个性化的服务。"),
    ("placeholder", "{chat_history}"),  # 历史对话
    ("human", "{input}"),
    ("placeholder", "{agent_scratchpad}"),
])

# 创建带记忆的Agent（需要使用LangGraph或自定义实现）
# 这里展示概念，实际实现需要更复杂的代码

# 模拟多轮对话
print("=== 多轮对话测试 ===")
memory.chat_memory.add_user_message("我叫小明，我是一名Python开发者")
memory.chat_memory.add_ai_message("你好小明！很高兴认识你，我会记住你是Python开发者。")

# Agent可以记住用户信息
print(f"当前记忆内容: {memory.load_memory_variables({})}")

四、热门AI Agent开发框架对比

框架	特点	适用场景
LangChain	模块化设计，生态丰富，社区活跃	快速原型开发、RAG应用
AutoGen	多Agent协作，可视化界面	复杂任务、团队协作场景
CrewAI	角色定义清晰，流程控制灵活	业务流程自动化
Dify	低代码平台，可视化配置	非技术人员快速搭建

五、最佳实践与踩坑指南

1. 工具设计原则

单一职责：每个工具只做一件事，便于测试和维护
清晰的文档字符串：LLM依赖文档来理解工具用途
类型提示：使用Python类型注解，提高可靠性
错误处理：工具应该优雅地处理异常情况

2. 提示词工程

# 好的提示词示例
good_prompt = """
你是一个专业的技术助手。

当用户提问时：
1. 如果涉及天气，使用get_weather工具
2. 如果涉及知识查询，使用search_knowledge工具
3. 如果需要规划，使用plan_tasks工具

回答要简洁，直接给出结果，避免冗长的解释。
"""

# 不好的提示词示例
bad_prompt = "你是一个助手，请帮助用户解决问题。"