Agent Internet Infra:为AI Agent重构互联网基础设施

人类互联网并不适合 Agent,AgentEarth 想从工具网关到传输协议重做一层基础设施。

原文标题:「龙虾之父」吐槽人类互联网后,终于有人把这当个事儿办了

原文作者:机器之心

冷月清谈:

文章围绕一个正在升温的判断展开:未来互联网上越来越多的“用户”可能不是人,而是 Agent。作者借 Karpathy 和 Peter Steinberger 的观点指出,现有互联网主要为人类设计,面对 Agent 时暴露出大量问题,包括验证码、登录流程、接口缺失、工具质量参差、跨平台调用链过长,以及成功率低、时延高、token 消耗大等。

文章认为,Agent 的上网方式和人类不同。人是浏览和判断,Agent 则是为了完成任务,会频繁调用外部工具、跨多个平台协作,对稳定性、速度、权限治理和数据传输效率要求更高。当前外部调用已成为 Agent 能力落地的明显短板,也让“Agent Internet Infra”成为值得关注的新方向。

AgentEarth 是文中重点介绍的创业公司。团队成员来自企业基础设施、实时调度系统和底层网络协议等背景,目标不是做单点 Agent 工具,而是做面向 Agent 的互联网基础设施。其思路包括三层:上层以“自营”方式筛选和治理高质量工具,中间层提供统一网关、故障切换和透明结算,底层则依靠自研传输协议优化传输效率,提升任务完成率并降低成本。

文章还提到,随着 Agent 数量和调用强度快速增长,这类基础设施的市场空间可能远超传统互联网阶段,未来有机会成长出新的平台型公司。AgentEarth 已发布测试版,开始小范围试用。

怜星夜思:

1、讨论 1:如果未来“上网的主力”真的逐渐变成 Agent,网站和在线服务最该优先改造的会是哪一层?是页面、API、权限体系,还是支付结算?
2、讨论 2:文章里提到 Agent 调外部工具成功率偏低、链条一长就容易崩。你觉得这是模型能力的问题更多,还是互联网基础设施的问题更多?
3、讨论 3:AgentEarth 这种“平台先替 Agent 选工具、做统一网关和兜底”的模式,你觉得是提高效率,还是会带来新的平台依赖和中心化问题?
4、讨论 4:文章很看重底层传输协议,甚至把它当成壁垒。你觉得在 AI 基础设施竞争里,协议层真的能成为决定性优势吗?

原文内容

图片
编辑|张倩


不知道大家还记不记得,去年 3 月,AI 大牛 Karpathy 发过一条推文。大体意思是说:现在的大多数内容仍然是为人类编写的,但未来,读取这些内容的可能就不是人类而是 AI 了。因此,从现在开始,我们就要考虑怎么把文档写得对 AI 更友好



说实话,当时看到这个观点,我还没有反应过来这意味着什么。很多网友可能也是这样,甚至有人说「现在考虑这个还太早了,毕竟现在上网的主要还是人」。


但短短一年,形势就变了。很多人体验过「龙虾」之后,连整理个桌面文件都懒得自己动手了,更别说上网搜资料这种脏活累活。


几乎可以肯定的是,Karpathy 所说的「AI 成为上网主力军」这事很快就会成为现实,毕竟尝到甜头的人类已经回不去了。而我们的互联网现在是什么情况呢?就像一位网友所说 —— 还是「马车时代的碎石路」。



对于 Agent 来说,这路走起来是处处绊脚 —— 各种验证、登录程序说卡就卡,从网上找到的工具得一个个试,token 用起来跟不要钱似的(实际又很贵),即使任务成功也得等半天,就像当年拨号上网。


从 PC 互联网、移动互联网时代一路走过来的刘洪涛跟我说:现在这种情况其实是难以接受的。要知道,人类互联网的可用性标准是 99.9%,他们这群人甚至还曾死磕给这个数字加上更多的「9」。而现在,Agent 调用外部工具的成功率只有 60%,这还是单步调用的结果,多几步就能跌到 30% 以下。


所以,当「龙虾之父」Peter Steinberger 在采访中吐槽现在的互联网基础设施对 Agent 极其「不友好」时,刘洪涛产生了强烈的共鸣。而 Peter 指出的问题,正是他前年就看好并于去年春天正式入局的创业方向 ——Agent Internet Infra。


Peter Steinberger 的核心判断是:当前互联网并非为 agent 设计,且正在因为封锁、验证码、权限体系、缺失 CLI/API 等原因变得越来越不利于 agent;因此下一代互联网/软件基础设施必须朝 agent-friendly 重构。(字幕由AI生成)


刘洪涛组建的新公司名叫 AgentEarth。核心团队的三个人,履历都很扎实。他自己曾在智能运维独角兽云智慧担任总裁,经历过企业级基础设施从 0 到 1 的规模化验证。CTO 单明辉(Lucas)是滴滴智能化运营系统的早期构建者,几亿人与海量网约车的实时大型匹配系统,他有构建和运维的经验。首席科学家薛教授则深耕国家级前沿网络技术多年,底层协议栈是他的强项。


AgentEarth CEO 刘洪涛(左)和 CTO 单明辉(右)


这样的组合,明显不是冲着做一款简单的 Agent 工具去的。用刘洪涛的话来说,他们要干的是基础设施的活儿:底层给 Agent Internet 修一条高速物流线,让数据传输跑起来又稳又快;上面开一间「精品自营店」—— 不是给人逛的,而是把 Agent 当成真正的终端用户来服务,进店就能快速调用经过筛选和治理的高质量工具。前者靠的是他们研发多年的新一代传输协议,后者则是把工具聚合、托管、智能编排这一套做扎实,让 Agent 不用再像无头苍蝇一样到处试、到处撞,省下宝贵的时间和 token



至于具体怎么做,刘洪涛也详细聊了聊。


为人设计的互联网

对于 Agent 来说太坑了


最近,Anthropic、OpenAI 又带火一个词,叫 Harness Engineering。Anthropic 在博客里说,同样的模型、同样的提示词,一开始跑出来的游戏是不能玩的,但是换一套运行方式、环境,就能跑出来一个不错的游戏。



这些前沿机构用实验给大家提了个醒 —— 虽然模型自身的改进至关重要,但围绕模型运行的外部环境也不容忽视,否则会影响大模型能力的发挥。


这也解释了,为什么 OpenAI 早在 2024 年就已经宣称大模型在某些方面达到博士能力水平了,但直到今年,生产力端才开始有切身的体感。


这个环境的建设,远比想象中要复杂。过去一两年,Agent Infra 领域的工程师已经在尝试解决一些问题,比如长期记忆存储、运行编排,为 Agent 稳定运行提供了底层支撑系统。但这波「龙虾热」又充分暴露出一个短板 —— 外部调用。要知道,即使是一个简单的订票操作,Agent 也得调用十几次外部工具。所以,当 Agent 开始像人一样「上网办事」,网络层就成了新的战场。


刘洪涛提到,对待这个新的战场,相关的基础设施建设必须遵循新的逻辑,因为 Agent 的上网行为,和人类天差地别。


人类上网是打开浏览器,搜索关键词,然后点开自己感兴趣的网页。接下来就是浏览、思考、判断。人在单个网页停留时间比较长,但整个上网行为并不复杂,还有 CDN(缓存一次服务一大群人)等缓存技术可以保证速度,各种设计精良的 UI 来提高效率,各种工具也是多年以来用得比较顺手的。


 Agent 不一样,它不上网「看」,它上网是为了「把活儿干完」。它一个任务需要的工具要跨多个模型、平台,执行链条很长,一个地方被卡住,整个任务就陷入试错黑洞。此外,它对速度的要求反而比人高,因为它不需要反应时间,只想要结果越快越好,好立刻进入下一步。


但现实情况是,当前互联网上的网页、工具大多还是为人设计的(就像 Peter 采访中提到的 Agent 需要在网页上点「我不是机器人」这类验证),没有针对 Agent 去做精选、适配,所以 Agent 的长链条很容易断。而且,Agent 上网拿的东西有些只是它自己需要的(比如生成某个图片),它用完别人也用不了,所以 CDN 会失效,速度就快不起来。


这些特性叠加,导致人类互联网基础设施在 Agent 面前开始「水土不服」。而眼下 Agent Internet 还处于野蛮生长期,外部工具鱼龙混杂、接口混乱、质量参差,Agent 在调用过程中频频「失智」,在反复试错、上下文重复传递中白白烧掉大量 token,完成任务的速度也提不上去。


说到这儿,Agent Internet Infra 这个方向要做的事情就很清晰了:它就是让海量智能体能够自主发现、安全连接、可信协作的底层网络协议与中间件体系,致力于解决 Agent 如何与外部连接,Agent 之间如何像人类用互联网一样无缝协作的问题,其核心能力包括身份认证、通信协议、权限治理、跨平台工具调用、数据传输优化、交易支付、安全管理等。


目前,已经有一些公司开始在这一方向发力,比如 Cloudflare 发布了方便 Agent 读取网页的 Markdown for Agents,谷歌发布了打通浏览器环境与本地计算资源的 WebMCP…… 但总体来看,这一方向还处于早期发展阶段,新一代 Agent Internet Infra 服务商仍然缺位。


给 Agent 用的互联网

怎么省钱省时间?


在 Agent Internet Infra 这个方向,刘洪涛等人的创业逻辑有一个核心锚点:从第一天起就把 Agent 当成网络的主体用户,也就是 end user(过去默认是人),这一点和 Karpathy 的判断是对齐的。


一旦锚定这个设定,网络基础设施优化的方向就从「服务于人类体验」变成了「服务于任务完成率和完成效率」,从「平台提供连接」变成「平台对结果负责」。也就是说,他们主要考虑:你的「龙虾」能不能借助我的平台高质量、高可靠、高效率地完成任务,我要对你的结果负责,要为你省钱省时间


最重要的是,这一点并没有停留在概念上,而是落到了产品决策上。


最明显的一点是,他们刻意不做面向人的界面,不做复杂的开发者体验,而是只做标准化的 Agent 接口。这背后其实是一个很笃定的判断:未来不是开发者在配置工具,而是 Agent 自己在装配工具。如果你相信这一点,那所有为「人类操作方便」设计的层,都是短期过渡。


那他们是怎么把「高质量高可靠」做成差异点的?这里其实分为三层技术栈。



最中间那层,他们把「工具质量问题」从 Agent 侧挪到了平台侧。现在的主流做法是让 Agent 自己去挑工具、去试错,用更多 token 去填坑。结果就是成本高、成功率低,而且不可控。在这一层,他们把这个事情接管了过来,为 Agent 做了一个访问外部服务的「单一网关」。也就是说,Agent 不需要知道哪个工具好用,平台已经帮它选好了、兜底好了,一旦出故障立马切换。结算也是在这里统一进行,数据全透明,Agent 背后的人能看到用了哪些工具、调用多少次,token 用得明明白白,再也不是吞钱的黑洞。


而上面那层则致力于用「自营逻辑」来保证早期质量。他们一开始不是开放生态,而是自己选工具,强调稳定、高效、高质量,就像早期的京东自营商城,核心是助力「龙虾」们高质量完成任务。在产生流量后,他们也会开放第三方入驻,并采用一种基于大模型的工具推荐算法及调用优化策略来让这个过程高度智能化。


下面那层,也是他们最硬核的,是把「可靠性」下沉到传输层,用自研的传 - 存 - 算一体化调度协议加快底层数据传输。


在真实环境测试中,这个协议比当前业界最好的开源协议 —— 谷歌 QUIC—— 快 2-10 倍,最近测试甚至达到十几倍。也就是说,如果你的 Agent 想从远端传输拿文件、图像、视频,尤其是那种个性化的刚刚生成的内容,这个协议要比传统方式快得多。


行内人可能都知道,协议这东西是一套自洽的规则体系,所以搞协议研发不是个短期活儿,没法像写 APP 那样拆成模块并行推进。做新协议就像养一个新物种,得从一颗种子开始,按特定顺序慢慢长。每个环节都得等前一个彻底定型了才能动手,堆再多工程师也压缩不了「等它长大」的时间。而且,协议设计里那些隐性知识 —— 比如网络行为的边缘案例、踩过的坑 —— 都得靠长期沉淀。刘洪涛说,他们这个协议也不是一朝一夕做出来的,研发周期那都是以十年计的,最早的经验积累其实是为了优化 TCP/IP,没想到现在成了公司的核心技术壁垒。


这事的天花板

可能比想象的高得多


在 PC 互联网、移动互联网时代,网民数量、每个网民上网时间的增长往往被视为整个市场增长的核心动力。但随着二者逼近极限,这种增长已经触顶。


Agent Internet 这个新赛道的出现正在重写游戏规则。一家公司、一个人可以部署成百上千个 Agent,一个 Agent 可以同时跑多个任务,而且这些 Agent 还不用睡觉。这意味着,Agent Internet Infra 所承载的流量和价值,上限现在其实还不好估


这也意味着,这一层很容易长出一批新的大公司。回头看 PC 互联网、移动互联网,几乎每一层基础设施最后都跑出过独立公司,因为问题够通用、需求够硬,迟早会有人把它做成平台。Agent Internet 也是一样,而且这一次用户规模和调用强度都更极端,很多基础问题是空白的,留出来的位置反而更多。


在刚刚起跑的这个阶段,AgentEarth 已经占了一个还不错的位置。


一方面是判断比较早,也比较干脆,从一开始就按「Agent 是用户」来构建系统,关注 Agent 任务的高可靠、高质量完成。另一方面是团队结构比较少见 —— 底层协议能力一时半会儿很难被追上,那种在「几亿用户、海量资源实时匹配」场景里打过仗的人也着实稀有。这类系统对稳定性、效率、容错的要求非常极端,平时其实很少有机会能练到。一旦 Agent 的调用规模起来,这种经验会变得很值钱,而且也不是短时间能补出来的。


就在昨天,AgentEarth 刚刚发布了他们产品的测试版,开始小范围测试。测试链接如下:Agentearth.ai


感兴趣的读者也可以扫码进群,交流体验:



© THE END

转载请联系本公众号获得授权

投稿或寻求报道:liyazhou@jiqizhixin.com


这个问题问得好!除了文章里提到的点,我觉得Agent连接外部世界还面临不少挑战。比如,不同平台的数据格式和协议标准千差万别,Agent需要具备很强的适配能力才能顺利读取和处理信息。另外,安全问题也很重要,Agent需要防止恶意攻击和数据泄露,确保连接过程安全可靠。还有,如何保障Agent在复杂的网络环境中稳定运行也是一个难题。

Agent Internet Infra 的确是一个充满想象力的领域。除了文章提到的方向,我觉得以下几个方向也很有潜力:
* Agent安全: 随着Agent的普及,安全问题会越来越突出。如何保护Agent免受攻击,保障Agent运行安全,是一个重要的方向。
* Agent协作: 如何让不同的Agent之间高效协作,完成更复杂的任务,也是一个值得探索的方向。
* Agent标准: 制定Agent Internet 的相关标准,促进不同平台Agent之间的互联互通,具有重要意义。
* Agent工具市场: 建立一个繁荣的Agent工具市场,让开发者能够方便地开发和分享Agent工具。

2-10倍的提升,嘶… 这里面肯定有黑科技!说不定他们用了什么独门秘籍,比如量子纠缠传输(手动狗头)。认真说的话,我觉得核心还是在于针对Agent的特点进行了深度优化,在保证可靠性的前提下,尽可能减少了不必要的开销。

数据传输速度固然重要,但是我觉得Agent的智能化程度更重要。如果Agent自己能判断哪些数据是重要的,哪些是不重要的,就可以避免传输大量无用数据,从而提高效率。

从底层协议入手,感觉有点像重新发明轮子。虽然速度可能更快,但是推广起来难度也很大。如果能直接优化现有协议,或者做一些中间件来加速数据传输,可能更现实一些。

我觉得可以搞一个Agent应用商店,开发者可以在上面发布自己的Agent工具,然后平台可以收取一定的分成。这样既能丰富Agent的生态,又能赚到钱。

问题:文章提到AgentEarth自研的传输协议比谷歌QUIC快2-10倍,这个速度提升在实际应用中能带来哪些质变?除了速度,传输协议的优化还能解决哪些Agent应用中的痛点?

传输协议的优化,那可是基础设施层面的大动作。想想看,如果Agent需要频繁地从远程服务器拉取数据,或者进行大规模的数据同步,那速度提升就意味着成本的直接降低。更快的速度意味着更少的等待时间,也就意味着更少的计算资源占用,从而降低token消耗。

除了速度,传输协议还可以解决身份验证、安全性和隐私问题。比如说,可以集成加密算法,保护Agent之间通信的数据不被窃取;可以建立信任机制,确保Agent只与授权的实体进行交互。这些都是构建安全可靠的Agent互联网的重要组成部分。

这个问题我来抖个机灵:

如果 Agent 真的统治了互联网,那可能就没有“996”这个说法了,毕竟 Agent 可以 24 小时无休工作。但另一方面,人类可能会面临大规模失业,毕竟很多工作都可以被 Agent 替代。到时候,可能就得靠 Agent 来养活人类了,想想有点科幻。

认真说的话,Agent 的大规模应用可能会导致数据垄断更加严重。因为 Agent 需要大量的数据来进行学习和决策,而那些拥有海量数据的公司可能会占据更大的优势。所以,如何保护用户数据隐私,防止数据滥用,将成为一个非常重要的议题,或许类似欧盟的GDPR 会成为标配。

引用一下问题:“文章提到AgentEarth自研的传输协议比谷歌QUIC快2-10倍,这个速度提升在实际应用中能带来哪些质变?除了速度,传输协议的优化还能解决哪些Agent应用中的痛点?”

速度提升带来的质变可大了!就好像从绿皮火车直接升级到高铁,以前Agent跑一次任务得半天,现在可能几分钟就搞定了,大大提高了效率。 比如处理大量图像、视频等非结构化数据时,速度的提升能够降低延迟,让Agent的反馈更及时,决策更迅速,可以应用到自动驾驶、智能制造等领域。另外,传输协议的优化不仅仅是速度,还能提升可靠性。想象一下,Agent在执行重要任务时,数据传输突然中断,那得多崩溃?更好的协议应该能保证数据完整性和稳定性,降低出错率,也可以在弱网络环境下更加稳定。

针对“Agent在与外部世界连接时可能遇到的安全风险”这个问题,我觉得考虑的点可以有很多。

1. 数据泄露风险: Agent 在处理外部数据时,可能会无意中泄露敏感信息,比如用户的隐私数据或商业机密。 ➔ 防范措施:数据加密、访问控制、匿名化处理等。

2. 恶意代码注入: 如果 Agent 调用的外部工具或接口被恶意篡改,可能会导致恶意代码注入,从而控制 Agent 或窃取数据。 ➔ 防范措施:代码签名、沙箱隔离、输入验证等。

3. 权限滥用: Agent 可能会被授予过多的权限,导致其可以访问或修改不必要的数据或资源。 ➔ 防范措施:最小权限原则、权限分级管理、权限审计等。

4. 中间人攻击: Agent 在与外部服务通信时,可能会受到中间人攻击,导致通信内容被窃取或篡改。 ➔ 防范措施:使用 HTTPS 等安全协议、验证服务提供商的身份。

5. 拒绝服务攻击: Agent 可能会受到大量的请求攻击,导致其无法正常工作。 ➔ 防范措施:流量限制、DDoS 防护等。

6. 模型被污染的风险: 如果Agent使用的外部数据被污染,可能会导致Agent的模型受到影响,从而影响Agent的决策。

总之,感觉需要构建一个多层次的安全防护体系,确保 Agent 在与外部世界连接时的安全可靠。

“自营”模式的优势在于质量可控,可以快速建立起用户信任。劣势在于生态不够丰富,可能会限制 Agent 的能力。

开放生态肯定是必然趋势。Agent Internet Infra 的核心价值在于连接,连接的越多,价值就越大。但开放生态也需要有质量控制,否则可能会导致劣币驱逐良币。

我觉得网络环境也是一个不可忽视的因素。现在很多Agent应用都需要访问互联网,如果网络不稳定或者延迟高,Agent的调用就很容易失败。尤其是在国内,某些工具可能还需要科学上网才能正常使用,这就更增加了不确定性。

我觉得自营模式是早期冷启动的好办法,能快速建立口碑。但长期来看,还是要靠社区的力量。可以借鉴开源社区的做法,让开发者参与到工具的开发和维护中来,通过代码审查、测试等方式来保证质量。同时,也要建立一套完善的安全机制,防止恶意代码或者漏洞。

开放生态后的质量和安全挑战确实很大。除了审核和用户反馈,我觉得还可以考虑引入保险机制。如果Agent因为使用了平台上的某个工具而造成损失,平台可以提供一定的赔偿。这样既能提高用户的信任度,也能倒逼工具开发者提高质量和安全性。

谢邀,人在实验室,刚下生产线。

我认为Agent工具调用成功率低,跟互联网本身的“噪音”有很大关系。现在网上信息太多了,Agent很容易被一些虚假信息或者无效链接干扰。这就好比你在淘宝上搜索一个东西,结果出来一大堆质量很差的商品,Agent也要花时间去筛选,才能找到真正有用的东西。

而且,很多网站为了防止爬虫,会设置各种反爬机制,比如验证码、IP限制等等。这些机制对Agent来说也是很大的阻碍。所以,Agent不仅要足够聪明,还要学会如何“伪装”自己,才能顺利地完成任务。

AgentEarth这种模式,有点像“保姆式”服务,好处是省心省力,Agent可以专注于核心业务,不用操心底层设施的问题。坏处是可能会有依赖性,如果平台的服务不稳定或者成本太高,Agent就很难摆脱。

而现在主流的Agent自己试错模式,更像是“DIY”,好处是自由度高,可以根据自己的需求选择合适的工具和服务。坏处是需要投入更多的时间和精力,而且容易踩坑。

长期来看,我觉得这两种模式会并存。对于一些简单的、标准化的任务,AgentEarth这种模式更适合。对于一些复杂的、个性化的任务,Agent自己试错模式可能更有优势。

这种模式的优势很明显,就是能提高Agent的工作效率和成功率,降低成本。Agent不用自己去试错,可以把更多精力放在完成任务上。而且,平台对接管了工具选择和结算,可以保证数据透明,用户也能清楚地知道钱花在哪儿了。

劣势也很明显,就是可能会限制Agent的灵活性和自主性。Agent只能使用平台提供的工具,不能自由选择,这可能会导致Agent在某些特定任务上表现不佳。此外,平台如果出现问题,也会影响所有Agent的运行。

【回答讨论 4】协议像修高速公路,平时没人夸路基修得好,但堵车的时候大家都知道它重要。能不能成为决定性优势,要看它是不是和实际业务强绑定。单有协议不够,得让上层网关、工具治理、任务编排一起吃到这个红利,不然很容易变成“技术很强,但市场无感”。

【回复“讨论 2”】我倾向于认为,至少现阶段基础设施问题更突出。模型当然还不完美,但很多失败并不是“不会思考”,而是“进不了门、拿不到东西、调用不稳定”。这有点像司机技术不错,但路全是坑、红绿灯又乱,车开不快不能全怪司机。