MCP 规范 2025 最新版解析：安全、高效、智能的 AI 协作范式

ali_tech · 2025 年5 月 9 日 15:38

MCP 规范 2025 新版在安全性、通信效率、工具可控性和开发体验上均有显著提升，为下一代 AI 协作奠定基础。

原文标题：MCP 规范新版本特性全景解析与落地实践

原文作者：阿里云开发者

原文链接： http://mp.weixin.qq.com/s?__biz=MzIzOTU0NTQ0MA==&mid=2247549204&idx=1&sn=be7b24885c7fcdff562afd3aba31cf22&

冷月清谈：

本文深入解读了 2025-03-26 发布的最新 MCP (Meta Compute Protocol) 规范，对比了与 2024 年版本的关键更新。主要更新包括：安全性方面，从 OAuth 2.0 升级到 OAuth 2.1，强制使用 PKCE 和 HTTPS，提升了AI工具的安全性；通信效率方面，采用 Streamable HTTP 单端点替代 HTTP+SSE 双端点，简化架构，降低延迟；工具可控性方面，引入 Tool Annotations 显式标记工具风险，支持自动化权限管理；多模态扩展方面，新增音频流支持，完善语音交互能力；开发友好性方面，新增参数自动补全和动态进度消息等功能。文章还详细阐述了 OAuth 2.1 的安全机制、Streamable HTTP 的实现原理、JSON-RPC 批处理的优势、Tool Annotations 的应用，以及智能进度通知和会话管理等新特性。最后，总结了新规范对客户端、服务端和开发者工具链的影响，并提供了快速接入新特性的方案。

怜星夜思：

1、MCP 新版本强制使用 OAuth 2.1 和 PKCE，这对现有 OAuth 2.0 应用的迁移成本有多大？有哪些最佳实践可以降低迁移的复杂度？
2、Streamable HTTP 解决了旧版 HTTP+SSE 双通道方案的哪些痛点？在实际应用中，如何根据不同的场景选择合适的传输模式（一次性响应或流式推送）？
3、Tool Annotations 为 AI 工具带来了哪些安全和体验上的提升？开发者应该如何利用 Tool Annotations 来改进工具的可用性和安全性？

原文内容

更新

MCP Specification 在 2025-03-26 发布了最新的版本，本文对主要的改动进行详细介绍和解释。

2025-03-26 版本与 2024-11-05 版本的主要更新对比表格：

类别	2024-11-05 版本	2025-03-26 版本	更新意义与影响
授权机制	基于 OAuth 2.0，支持隐式授权流和基本权限控制	升级至 OAuth 2.1，废弃隐式授权流，强制 PKCE 和 HTTPS	安全性提升，减少 Token 泄露风险，适应公共客户端（如移动端、本地应用）场景。
传输协议	使用 HTTP + SSE（双端点），支持单向流式通信	替换为 Streamable HTTP（单端点），支持双向通信与断线恢复	简化部署复杂度，支持灵活通信模式（一次性响应或流式推送），优化网络稳定性。
JSON-RPC 批处理	未强制支持，部分实现可选	协议层面强制支持批处理（Batching），要求 MUST 实现	减少网络开销，支持并行任务处理，提升批量操作效率（如原子事务）。
工具元数据	仅有 inputSchema 和 description 描述	新增 Tool Annotations（操作类、展示类元数据）	显式标记工具风险（如 destructive）、支持自动权限管控与前端 UI 适配，提升安全合规性。
进度通知	仅支持百分比或数值进度	新增 message 字段，支持动态状态描述	提升用户交互体验（如显示“数据加载中，剩余 50%”）。
多模态支持	支持文本、图像	新增音频数据流支持	扩展语音助手、实时音频处理等场景能力。
参数补全	未明确支持	新增 completions 能力声明，支持参数自动补全建议	提升开发者效率，减少手动输入错误。
会话管理	未明确会话标识	引入 Mcp-Session-Id 头部，支持断线重连与状态恢复	增强长时任务（如语音交互）的可靠性，降低网络波动影响。
安全要求	依赖 OAuth 2.0 的推荐实践	强制 HTTPS、Token 绑定与存储加密，支持短期 Token 轮换	减少中间人攻击风险，缩小 Token 泄露后的有效窗口。

关键差异总结：

1. 安全性

OAuth 2.1 强制 PKCE 和 HTTPS，消除隐式流风险，更适应 AI 工具的高权限场景。

2. 通信效率

Streamable HTTP 单端点设计简化架构，JSON-RPC 批处理减少网络开销。

3. 工具可控性

Tool Annotations 显式标记风险行为（如删除操作），支持自动化权限管理和前端适配。

4. 多模态扩展

新增音频流支持，补全语音交互能力，完善多模态生态。

5. 开发友好性

参数补全（completions）和进度消息（message）提升开发者效率与用户体验。

一、更安全的 OAuth 2.1

1.1 从 OAuth 2.0 到 2.1 的本质跨越

1.1.1 核心安全缺陷的根治

旧版 OAuth 2.0 长期存在三大致命隐患：

在 AI 工具场景中，这些漏洞可能造成灾难性后果。例如通过截获未加密的授权码，攻击者可伪造"数据库清理工具"的合法调用请求。

1.1.2 PKCE 机制的全面强制化

PKCE 通过密码学挑战响应机制，彻底杜绝中间人攻击：

# 客户端生成PKCE参数示例  
import hashlib, base64, os  
code_verifier = base64.urlsafe_b64encode(os.urandom(32)).decode(‘utf-8’).rstrip(‘=’)  
code_challenge = hashlib.sha256(code_verifier.encode()).digest()  
code_challenge = base64.urlsafe_b64encode(code_challenge).decode(‘utf-8’).rstrip(‘=’)

1.1.3 流程对比

传统 OAuth 2.0：客户端 → 授权服务器：申请授权码授权服务器 → 客户端：返回裸授权码

OAuth 2.1 + PKCE：客户端 → 授权服务器：申请授权码 + code_challenge 授权服务器 → 客户端：返回加密授权码客户端 → 令牌端点：code_verifier + 授权码

1.2 协议机制：为 AI 场景量身打造的授权体系

1.2.1 动态客户端注册（DCR）

针对 AI 工具生态的碎片化特点，MCP 强制要求支持 RFC7591 动态注册协议：

该机制使得：

新工具无需预注册即可接入任意 MCP 服务
临时性 AI Agent 可自动获取生存期匹配的凭证
支持凭证自动轮换（如每 24 小时更换 client_secret）

1.2.2 元数据发现协议

通过标准化发现端点实现协议自描述：

GET /.well-known/oauth-authorization-server HTTP/1.1 Host: api.example.com MCP-Protocol-Version: 2025-03-26 HTTP/1.1200 OK { “issuer”: “https://api.example.com”, “authorization_endpoint”: “https://auth.example.com/authorize”, “token_endpoint”: “https://auth.example.com/token”, “capabilities”: [“PKCE”, “TOKEN_ROTATION”]

}

发现失败时，客户端自动回退到预设端点路径，保障兼容性。

1.3 实现规范：MCP 的六大安全铁律

1.3.1 HTTPS 全链路强制

所有授权端点必须部署 TLS 1.3+
混合 HTTP 内容（如图像）需通过加密通道代理

1.3.2 令牌生命周期管控

1.3.3 客户端凭证存储

禁止明文存储：采用操作系统安全存储区或 HSM 加密
移动端使用 Android Keystore/iOS Keychain

1.3.4 会话绑定

// 令牌元数据示例 { “token”: “eyJhbGciOi…”, “binding”: { “client_id”: “mcp-client-xyz”, “ip_range”: “192.168.1.0/24”, “device_fingerprint”: “SHA3-256(硬件特征)” }

}

1.3.5 审计日志

记录所有令牌颁发/撤销事件
高风险操作（如删除类工具调用）需关联原始授权会话

1.3.6 防御性编程

// 安全的令牌验证伪代码  
public boolean verifyToken(String token){  
    try {  
        JWT jwt = decode(token);  
        if (jwt.isExpired()) thrownew TokenExpiredException();  
        if (!jwt.validateSignature(publicKey)) thrownew InvalidSignatureException();  
        if (jwt.getClaim(“scope”).contains(“destructive”)) {  
            requireMfa(); // 高危操作触发多因素认证  
        }  
        returntrue;  
    } catch (JWTException e) {  
        auditLog.logSecurityEvent(“INVALID_TOKEN”, token);  
        returnfalse;  
    }  
}

1.4 对 AI 工具生态的影响

1.4.1 工具行为的标准化描述

通过 ToolAnnotations 接口定义的元数据（见代码块），开发者可向客户端提供工具行为的非强制性提示 。这些标注对工具链生态产生以下影响：

1. 交互透明度提升

title 提供语义化命名
readOnlyHint/destructiveHint 标明操作是否具备破坏性
openWorldHint 区分内外部作用域（如搜索引擎 vs 内存访问）
前端可通过这些标注动态渲染操作确认弹窗或风险警示图标。

2. 调用策略优化

idempotentHint 允许客户端自动重试幂等请求（如查询操作）
非幂等写操作（如文件删除）则强制人工二次确认

生态兼容性保障

所有标注仅作为行为建议 ，客户端不得据此替代安全控制。例如：

if (tool.annotations.destructiveHint) {  
  showDestructiveWarningDialog(); // 前端提示  
}  
await enforceRBACPolicy(); // 真实权限由RBAC引擎校验

1.5 开发者迁移指南

1.5.1 主要变更点对比

1.5.2 代码迁移示例

旧版代码片段：

// OAuth 2.0隐式流  
const token = getTokenFromURLFragment();  
callMCPService(token);

新版安全实现：

// OAuth 2.1 PKCE流  
const { verifier, challenge } = generatePKCE();  
startAuthFlow(challenge);  
// 回调处理  
function handleCallback(code){  
    fetchToken(code, verifier).then(token => {  
        secureStorage.save(‘mcp_token’, token);  
        callMCPService(token);  
    });  
}

二、Streamable HTTP：

统一通信协议的革命性升级

2.1 从双端点到单端点的进化之路

2.1.1 旧版架构的痛点

2024-11-05 版本采用的 HTTP+SSE 双通道方案存在三大结构性缺陷：

典型案例：当 AI 助手同时执行"语音转文字+实时翻译"时，旧方案需要建立 4 个独立连接（2 工具 × 2 协议），导致移动端平均延迟增加 400ms。

2.1.2 Streamable HTTP核心技术解析

新协议通过三大创新实现通信范式转换：

关键技术特征

1. 智能协议协商

客户端通过 Accept 头声明能力：
服务端动态选择传输模式（实验数据显示协商耗时<5ms）

2. 双向通信隧道

在 SSE 流开启期间，客户端可通过附加 HTTP POST 发送新请求
服务端通过 Mcp-Request-Id 头部实现多路复用

3. 断点续传机制

重连时携带 Last-Event-ID 头部：
服务端可选择：

从指定 ID 重放事件（需实现事件日志）

返回增量更新（推荐用于实时监控场景）

2.1.3 性能提升与稳定性保障

网络效率对比测试

基于 MCP 官方测试平台的数据：

指标	旧协议(HTTP+SSE)	Streamable HTTP	提升幅度
连接建立耗时	320ms±50ms	180ms±20ms	43.75%
数据传输冗余度	18%	5%	72.2%
断线恢复成功率	68%	93%	36.8%

三、JSON-RPC 批处理：

效率革命的协议级支持

3.1 批处理机制的实现原理

3.1.1 协议层强制要求

新版规范第 4.2 条明确规定：

所有 MCP 实现必须支持 JSON-RPC 2.0 批处理规范。对于包含通知（notification）的批处理请求，服务端应在完成处理后返回 HTTP 202 Accepted 状态码。

合法请求示例：

json[  
    {“jsonrpc”:“2.0”,“id”:1,“method”:“text_analyze”,“params”:{“text”:“Hello”}},  
    {“jsonrpc”:“2.0”,“id”:2,“method”:“image_tag”,“params”:{“url”:“img.jpg”}},  
    {“jsonrpc”:“2.0”,“method”:“log_event”}  // 无ID的通知类型  
]

响应处理规则：

成功批处理返回 HTTP 200 + 响应数组
原子性保证：支持 atomic 标记实现全成功或全回滚

3.2 性能优化案例分析

3.2.1 网络开销对比

假设处理 100 个独立请求：

3.2.2 服务端并行处理

// Go语言实现批处理并行执行  
func HandleBatch(ctx context.Context, batch RPCRequest) RPCResponse {  

    var wg sync.WaitGroup  

    resChan := make(chan RPCResponse, len(batch))  

    for _, req := range batch {  

        wg.Add(1)  

        go func(r RPCRequest) {  

            defer wg.Done()  

            result := processSingle(r)  

            resChan <- result  

        }(req)  

    }  

    wg.Wait()  

    close(resChan)  

    var responses RPCResponse  

    for res := range resChan {  

        responses = append(responses, res)  

    }  

    return responses  
}

注意事项：

控制并发粒度（建议每个批处理不超过 50 个请求）
实现请求优先级标记（priority 字段）
支持超时熔断机制

四、工具元数据：

安全与体验的双重进化

4.1 Tool Annotations 架构解析

4.1.1 元数据分类体系

tools: - name: database_backup annotations: # 标准行为提示 (遵循 ToolAnnotations 接口定义) title: “Database Backup” # 语义化标题 readOnlyHint: false # 非只读操作 destructiveHint: false # 非破坏性操作 idempotentHint: true # 幂等操作（重复执行无副作用）

openWorldHint: false # 作用域封闭（仅限本地数据库）

4.1.2 动态权限管控流程

4.2 安全增强实践

4.2.1 破坏性操作拦截机制

当检测到 destructiveHint: true 时：

1. 前端自动插入二次确认

2. 服务端记录安全审计日志

3. 强制触发 MFA 多因素认证（如果配置）

审计日志示例：

json{ “action”: “data_purge”, “user”: “ai_agent_123”, “riskLevel”: “critical”, “annotations”: {“destructiveHint”: true}, “timestamp”: “2025-03-27T08:15:30Z”, “mfaUsed”: true

}

4.2.2 自动化策略生成

基于元数据的策略引擎：

def generate_policy(tool):  
    policy = {  
        “effect”: “allow"if tool.requiredScopes else"deny”,  
        “conditions”:   
    }  
    if tool.annotations.get(‘destructiveHint’):  
        policy[‘conditions’].append({  
            “type”: “mfa”,  
            “required”: True  
        })  
    return policy

五、智能进度通知：

从数字到语义的进化

5.1 动态消息通知机制

新增 message 字段支持结构化状态描述：

{ “type”: “ProgressNotification”, “progress”: 65, “message”: { “phase”: “数据清洗”, “detail”: “已处理 12000/20000 条记录”, “next_step”: “即将开始特征提取” }

}

应用价值：

开发调试：精准定位任务卡点（如"卡在图像预处理阶段"）
用户界面：支持多语言动态提示（"剩余时间：约 2 分钟"）
审计追溯：完整记录任务生命周期状态

六、多模态扩展：音频流支持落地

6.1 音频协议实现方案

新增 audio/* 内容类型支持：

httpPOST /voice-process Content-Type: audio/webm Transfer-Encoding: chunked

<音频二进制流>

关键技术特性：

场景案例：智能客服系统可同时接收用户语音流并实时返回文字响应

七、参数补全：开发者体验升级

7.1 智能补全工作流程

1. 客户端发现服务端声明 completions 能力

2. 用户输入时触发补全请求：

GET /completions?prefix=dat  
响应：[“date_format”, “data_source”, “dataset”]

3. 动态生成参数建议列表设计优势：

降低 90% 的参数输入错误率（MCP 工作组统计）
支持基于上下文的智能推荐（如优先推荐当前工具常用参数）

八、会话管理：长时任务可靠性保障

8.1 会话全生命周期管理

核心标识：

Mcp-Session-Id: sess_XYZ123 (UUIDv7格式)

断线恢复流程：

1. 客户端缓存最后接收的Event-ID（如159）  

重连时携带：  

   Last-Event-ID: 159  
   Mcp-Session-Id: sess_XYZ123  

服务端从断点续传或返回增量更新

九、总结 - 构建下一代 AI 协作范式

9.1 对客户端的影响

技术适配挑战

强制实现 OAuth 2.1 与 PKCE 流程，移动端需集成系统级安全存储（如 iOS Secure Enclave）
前端框架需深度解析 Tool Annotations，实现动态 UI 生成（如自动渲染高危操作警示图标）
音频流处理需支持 Web Audio API 与分片传输逻辑

体验升级机遇

参数补全功能降低开发者工具学习曲线（实测提升 38% 的 API 调用效率）
智能进度消息支持生成富媒体状态卡片（如图表+文字混合呈现）

9.2 对服务端的影响

架构改造需求

9.3 对开发者工具链的重构

SDK 关键升级点：

# 新一代SDK伪代码示例  
classMCPClient:  
    def init(self):  
        self.session = ResilientSession()  # 自动重连+断点续传  
        self.annotator = ToolAnnotationParser()  # 元数据解析引擎  
        self.auditor = SecurityAuditHook()  # 安全审计钩子  
    def call_tool(self, tool_name):  
        if self.annotator.risk_level(tool_name) == ‘critical’:  
            self.auditor.log_operation(tool_name)  # 自动触发审计

工具链升级带来：

开发调试时间减少 57%（IDE 插件集成自动补全与协议校验）
安全漏洞率下降 82%（通过注解驱动的权限校验）

9.4 如何快速接入新特性

Higress 已率先支持 Streamable HTTP 传输格式，并且对 MCP 2025-03-26 版本的多项特性都保持高优先级跟紧，如 Mcp-Session-Id 头的会话管理，并支持批量请求、响应和通知，以及 SSE 流的可恢复性等。

详见《》商业化产品侧，云原生 API 网关也会在稍晚的时候对齐开源侧 Higress 的各项能力，提供企业级的各项 MCP 特性，欢迎咨询和关注。

Comet761k · 2025 年5 月 10 日 19:35

我更关注迁移过程中的兼容性问题。老的客户端可能不支持PKCE，新的客户端可能只支持OAuth 2.1。为了平滑过渡，授权服务器可能需要同时支持OAuth 2.0和2.1一段时间。这需要在设计上仔细考虑，例如通过API版本控制或者请求头来区分不同版本的客户端。另外，要做好充分的测试，确保新旧客户端都能正常工作。

Aura25g · 2025 年5 月 10 日 22:26

Tool Annotations 这个东西，我觉得特别有用！它可以让工具的行为更加透明，用户可以清楚地知道这个工具是干嘛的，有没有风险。比如 destructiveHint，标明操作是否具备破坏性，这在 AI 工具里太重要了，谁也不想一不小心就把数据删了吧？开发者要做的就是认真填写这些 Annotations，让客户端能够根据这些信息动态地渲染 UI，提示用户风险，甚至触发 MFA。

StarryUnicorn587 · 2025 年5 月 13 日 01:55

从OAuth 2.0到2.1，确实存在迁移成本，但收益也很大，特别是针对AI工具这种高权限场景。迁移的复杂度主要取决于现有应用对OAuth 2.0的依赖程度，如果代码中大量使用了隐式授权流，那么改动会比较大。最佳实践的话，我觉得可以考虑分阶段迁移，先支持OAuth 2.1 + PKCE，同时兼容OAuth 2.0一段时间，再逐步淘汰旧的流程。另外，就是要充分利用动态客户端注册（DCR）和元数据发现协议，减少手动配置的工作量。

Glyph270t · 2025 年5 月 13 日 13:27

从协议的角度来看，Streamable HTTP 的优势在于其双向通信能力和断线重连机制。HTTP+SSE 只能服务端向客户端推送数据，客户端要发送数据还得另起炉灶。而Streamable HTTP 允许客户端在 SSE 流开启期间通过附加 HTTP POST 发送新请求，方便多了。合适的传输模式选择，个人认为从用户使用场景出发，要快就一次性，要稳就细水长流的推送。

IronKnight238 · 2025 年5 月 13 日 14:03

与其说是成本，不如说是投资未来。PKCE 强制能有效防范中间人攻击，这对于涉及用户数据安全的 AI 工具至关重要。迁移的最佳实践我觉得可以参考一些成熟的 OAuth 2.0 框架，它们通常会提供 OAuth 2.1 的支持，可以大大减少开发工作量。另外，要充分利用 SDK 提供的安全存储机制，避免将 Token 明文存储在客户端。

VelvetFox904 · 2025 年5 月 13 日 20:45

Tool Annotations 的核心在于标准化。以前各个工具的行为描述五花八门，客户端很难统一处理。现在有了 Tool Annotations，就可以通过一套标准的元数据来描述工具的行为，方便客户端进行自动化处理，比如自动生成权限策略、自动插入二次确认等等。开发者要做的就是遵循 Tool Annotations 的规范，提供尽可能详细的元数据信息，让客户端能够更好地理解和使用工具。

Stellar82k · 2025 年5 月 14 日 14:36

更进一步，Tool Annotations 不仅仅是提供信息，更是定义了一种交互模式。它允许客户端根据工具的行为动态调整交互方式。比如，对于幂等操作，客户端可以自动重试；对于高风险操作，客户端可以强制 MFA。这种交互模式可以大大提升用户体验和安全性。但也要注意，Tool Annotations 只是建议，真正的权限控制还是要由 RBAC 引擎来完成，不能完全依赖客户端的提示。

ShimmeringSeal612 · 2025 年5 月 15 日 06:27

Streamable HTTP 最直接的解决了连接数过多的问题，想想之前的 HTTP+SSE，一个工具就得俩连接，多了很容易炸。现在单端点双向通信，简洁多了。至于传输模式的选择，我觉得主要看场景。如果是一次性的请求，比如查询个数据，那就用一次性响应。如果是需要实时更新的，比如股票行情、监控数据，那肯定得用流式推送。关键是要看服务端有没有实现事件日志和增量更新，这些都涉及到具体的实现细节。

Mystic98x · 2025 年5 月 15 日 17:21

个人理解哈，其实可以把 Streamable HTTP 看作是 WebSocket 的一种替代方案，但它又比 WebSocket 简单，不需要额外的握手协议。选择传输模式的关键在于对“实时性”的定义。如果只是准实时，比如几秒钟更新一次，那么可以采用短轮询 + 一次性响应。如果是真正的实时，比如毫秒级的更新，那么就必须采用流式推送。但也要考虑到服务器的负载能力，流式推送对服务器的压力会更大。