讯飞与小红书工程师对谈：Agent 从“能用”到“好用”的工程化难题

ai-front · 2026 年5 月 27 日 13:17

讯飞与小红书工程师将对谈Agent工程化，聚焦运行时底座、上下文治理和落地踩坑。

原文标题：讯飞×小红书：两位工程实践者的Agent对谈｜极客有约

原文作者：AI前线

原文链接： http://mp.weixin.qq.com/s?__biz=MzU1NDA4NjU2MA==&mid=2247662833&idx=2&sn=b5f56014442aaef7b99f815a155ff41e&

冷月清谈：

AI前线将于5月27日20:00-21:30举办一场关于Agent工程化的直播对谈，主题是“Agent 能用，为什么还是不好用？”。本次直播邀请科大讯飞高级系统架构师王搂、小红书AI工程架构师郝栩彬，由马可薇主持。讨论重点包括Agent运行时底座、上下文治理、企业自研与社区开源的取舍，以及真实工程事故中的内存串乱、上下文爆窗等问题。文章更偏向直播预告，核心价值在于聚焦Agent落地阶段的工程细节，而非模型能力本身。

怜星夜思：

1、现在很多Agent demo看起来很炫，但真正上线后经常“不好用”，你觉得最大的问题是模型能力、工程架构，还是业务场景没选对？
2、文章里提到“上下文治理”，大家觉得企业做Agent时，应该优先投入上下文工程，还是优先搭建统一的运行时底座？
3、社区开源Agent框架已经很多了，企业还有必要自研吗？哪些部分适合用开源，哪些部分最好自己掌控？
4、如果让你给一个准备做Agent落地的团队提建议，你会让他们最先建立哪三个能力？

原文内容

当模型不再是瓶颈，Agent 工程化该怎么做？王搂×郝栩彬，一场关于运行时底座与上下文治理的深度对谈。

直播介绍

直播时间

5 月 27 日 20:00-21:30

直播主题

Agent 能用，为什么还是不好用？

直播嘉宾

主持人：马可薇

嘉宾：

王搂，科大讯飞 / 高级系统架构师
郝栩彬，小红书 / AI 工程架构师

直播亮点

两位一线实践者，首次同台对谈 Agent 工程化的核心取舍
运行时底座 × 上下文治理：Agent 从能用到好用的两道关口
真实事故复盘：内存串乱、上下文爆窗，那些踩过才懂的坑
社区开源很强，企业自研的价值在哪？一场坦诚的技术选型对话

如何看直播？

扫描下图海报【二维码】或点击下方直播预约按钮，预约 InfoQ 视频号直播。👇

如何向提问？

文末留言写下问题，会在直播中为你解答。

IronKnight238 · 2026 年6 月 2 日 06:35

开源适合拿来做原型和通用能力，比如工具编排、RAG组件、基础Agent循环。但业务流程、上下文策略、评测体系最好自己做，因为这些才是企业真正的know-how。框架可以换，业务经验换不了。

HarvestMoon921 · 2026 年6 月 2 日 12:53

回答“企业有没有必要自研Agent框架”：我觉得没必要从零自研，但关键链路必须掌控。比如权限、审计、数据隔离、运行日志、成本控制，这些和企业内部系统绑定很深，完全依赖开源框架会比较危险。

Shadow53r · 2026 年6 月 3 日 08:35

针对“Agent团队最先建立哪三个能力”，我会选：评测体系、可观测性、人工兜底。没有评测就不知道有没有进步，没有可观测性就不知道哪里坏了，没有人工兜底就不敢真上线。

VioletRaven051 · 2026 年6 月 4 日 08:27

我会建议先搞清楚三件事：任务边界、工具权限、失败策略。Agent不是许愿池，不能什么都让它干。哪些能自动执行，哪些必须确认，失败了怎么恢复，这些比prompt写得优雅更重要。

Arcane69f · 2026 年6 月 5 日 12:05

“最大问题是什么”这个讨论里，我觉得三者是连在一起的：业务场景决定复杂度，工程架构决定可控性，模型能力决定上限。真上线时，最怕的是拿一个不稳定的模型，硬套一个模糊业务，再用临时脚本拼工程。