Agent

前言

问题：当 LLM 想要调用工具时，有两种设计方式

一

把 MCP Server 中所有工具的信息（名字、描述、参数 Schema、etc.）都要交给 LLM
LLM 直接把要使用的工具和参数一起返回

二

只把 MCP Server 中的所有工具的名字和描述交给 LLM
LLM 返回要使用的工具名称
Client 获取指定工具的所有信息交给 LLM
LLM 返回要使用工具和参数

不管怎么设计，每次交互都要带着前文一起，这 Agent 能力对上下文的占用，也太大了点吧？

在这个例子中，当 AI 设计出来一程序时，如果该程序消耗 Token 过多。在人类不知道原理的情况下，只会跟 AI 说：我的 Token 消耗太多了，帮我减少 Token 消耗。但是 AI 也没法知道什么算多什么算少，应该少到多少算合理。AI 能合理优化代码的前提时人类告诉 AI 如何优化。因为如果 AI 本身就知道，也就不会出现需要优化的问题，也就不会写出来更高 Token 消耗的代码

概述

参考：

B 站 - 老戴Donald，【老戴】用了几天 Clawdbot，我最担心的事开始发生了

B 站 - 飞天闪客，【闪客】20 行代码彻底搞懂小龙虾！男女老少都看得懂哟~

Agent Runtime # 类似 MCP 的 Host，Agent 与模型交互的程序。实现了 ReAct 功能

ReAct # Reasoning and Acting。Agent Runtime 的核心逻辑：循环。

Agent 架构

700

Agent 流程

800

Pi-mono

参考：
GitHub 项目，badlogic/pi-mono
公众号，从 pi-mono 到 OpenClaw：源码拆解，21 万 Star 背后的 Agent 工程减法
公众号，OpenClaw背后的英雄Pi-mono

pi-mono 只保留四个工具：

read # 读取文件内容，支持文本和图片，可指定行范围
write # 创建新文件或完全重写，自动创建目录
edit # 精确替换文本，oldText 必须完全匹配
bash # 执行命令，返回 stdout 和 stderr，可设置超时

Zechner 的逻辑很直接：编程的本质就是读代码、写代码、改代码、跑代码。这四个工具组合起来能覆盖大部分编程场景。

知乎-北方的狼智能体

本书目录

本书共分六大部分，20个章节，沿着 “认知 -> 大脑 -> 手脚 -> 骨架 -> 社会” 的逻辑脉络，为您完整复原一个智能体的诞生过程。

第一部分：定义 —— 什么是2025年的智能体？

AI智能体，第1章从 Copilot 到 Autopilot

AI智能体，第2章解剖学：Agent 的四个象限

第二部分：大脑 —— 推理与规划的原子能力

AI智能体，第3章结构化输出：JSON Mode 与 Pydantic

AI智能体，第4章思维链的进化：从 CoT 到 Reasoning Models

AI智能体，第5章行动的循环：手动实现 ReAct Loop

AI智能体，第6章元认知：Self-Reflection（自省机制）

AI智能体，第7章提示词工程的终结：DSPy 自动优化

第三部分：手脚 —— 标准化工具与MCP协议

AI智能体，第8章工具调用的本质：Function Calling

AI智能体，第9章统一连接标准：MCP (Model Context Protocol)

AI智能体，第10章实战 MCP：构建你的第一个 Server

AI智能体，第11章视觉行动：Computer Use 与 GUI Agent

第四部分：骨架 —— 状态管理与图编排

AI智能体，第12章从链到图：LangGraph 核心概念

AI智能体，第13章状态管理：State Schema 与 Checkpoint

AI智能体，第14章人在回路：Human-in-the-loop

AI智能体，第15章记忆系统：Mem0 与 GraphRAG

第五部分：社会 —— 多智能体协作 (Multi-Agent)

第六部分：结语 —— 迈向工业级

——完——

@北方的郎 · 专注模型与代码

反馈

此页是否对你有帮助？

Glad to hear it! Please tell us how we can improve.

Sorry to hear that. Please tell us how we can improve.

最后修改 April 1, 2026: ai agent add pi-mono (4493573b)