Agent
前言
问题:当 LLM 想要调用工具时,有两种设计方式
一
- 把 MCP Server 中所有工具的信息(名字、描述、参数 Schema、etc.)都要交给 LLM
- LLM 直接把要使用的工具和参数一起返回
二
- 只把 MCP Server 中的所有工具的 名字 和 描述交给 LLM
- LLM 返回要使用的工具名称
- Client 获取指定工具的所有信息交给 LLM
- LLM 返回要使用工具和参数
不管怎么设计,每次交互都要带着前文一起,这 Agent 能力对上下文的占用,也太大了点吧?
在这个例子中,当 AI 设计出来一程序时,如果该程序消耗 Token 过多。在人类不知道原理的情况下,只会跟 AI 说:我的 Token 消耗太多了,帮我减少 Token 消耗。但是 AI 也没法知道什么算多什么算少,应该少到多少算合理。AI 能合理优化代码的前提时人类告诉 AI 如何优化。因为如果 AI 本身就知道,也就不会出现需要优化的问题,也就不会写出来更高 Token 消耗的代码
概述
参考:
B 站 - 老戴Donald,【老戴】用了几天 Clawdbot,我最担心的事开始发生了
B 站 - 飞天闪客,【闪客】20 行代码彻底搞懂小龙虾!男女老少都看得懂哟~
Agent Runtime # 类似 MCP 的 Host,Agent 与模型交互的程序。实现了 ReAct 功能
ReAct # Reasoning and Acting。Agent Runtime 的核心逻辑:循环。
Agent 架构
Agent 流程
Pi-mono
参考:
pi-mono 只保留四个工具:
- read # 读取文件内容,支持文本和图片,可指定行范围
- write # 创建新文件或完全重写,自动创建目录
- edit # 精确替换文本,oldText 必须完全匹配
- bash # 执行命令,返回 stdout 和 stderr,可设置超时
Zechner 的逻辑很直接:编程的本质就是读代码、写代码、改代码、跑代码。这四个工具组合起来能覆盖大部分编程场景。
知乎-北方的狼 智能体
本书目录
本书共分六大部分,20个章节,沿着 “认知 -> 大脑 -> 手脚 -> 骨架 -> 社会” 的逻辑脉络,为您完整复原一个智能体的诞生过程。
第一部分:定义 —— 什么是2025年的智能体?
AI智能体,第1章 从 Copilot 到 Autopilot
第二部分:大脑 —— 推理与规划的原子能力
AI智能体,第3章 结构化输出:JSON Mode 与 Pydantic
AI智能体,第4章 思维链的进化:从 CoT 到 Reasoning Models
AI智能体,第5章 行动的循环:手动实现 ReAct Loop
AI智能体,第6章 元认知:Self-Reflection(自省机制)
第三部分:手脚 —— 标准化工具与MCP协议
AI智能体,第8章 工具调用的本质:Function Calling
AI智能体,第9章 统一连接标准:MCP (Model Context Protocol)
AI智能体,第10章 实战 MCP:构建你的第一个 Server
AI智能体,第11章 视觉行动:Computer Use 与 GUI Agent
第四部分:骨架 —— 状态管理与图编排
AI智能体,第12章 从链到图:LangGraph 核心概念
AI智能体,第13章 状态管理:State Schema 与 Checkpoint
AI智能体,第14章 人在回路:Human-in-the-loop
AI智能体,第15章 记忆系统:Mem0 与 GraphRAG
第五部分:社会 —— 多智能体协作 (Multi-Agent)
第六部分:结语 —— 迈向工业级
——完——
@北方的郎 · 专注模型与代码
反馈
此页是否对你有帮助?
Glad to hear it! Please tell us how we can improve.
Sorry to hear that. Please tell us how we can improve.