讯飞与小红书工程师对谈:Agent 从“能用”到“好用”的工程化难题

讯飞与小红书工程师将对谈Agent工程化,聚焦运行时底座、上下文治理和落地踩坑。

原文标题:讯飞×小红书:两位工程实践者的Agent对谈 | 极客有约

原文作者:AI前线

冷月清谈:

AI前线将于5月27日20:00-21:30举办一场关于Agent工程化的直播对谈,主题是“Agent 能用,为什么还是不好用?”。本次直播邀请科大讯飞高级系统架构师王搂、小红书AI工程架构师郝栩彬,由马可薇主持。讨论重点包括Agent运行时底座、上下文治理、企业自研与社区开源的取舍,以及真实工程事故中的内存串乱、上下文爆窗等问题。文章更偏向直播预告,核心价值在于聚焦Agent落地阶段的工程细节,而非模型能力本身。

怜星夜思:

1、现在很多Agent demo看起来很炫,但真正上线后经常“不好用”,你觉得最大的问题是模型能力、工程架构,还是业务场景没选对?
2、文章里提到“上下文治理”,大家觉得企业做Agent时,应该优先投入上下文工程,还是优先搭建统一的运行时底座?
3、社区开源Agent框架已经很多了,企业还有必要自研吗?哪些部分适合用开源,哪些部分最好自己掌控?
4、如果让你给一个准备做Agent落地的团队提建议,你会让他们最先建立哪三个能力?

原文内容

当模型不再是瓶颈,Agent 工程化该怎么做?王搂×郝栩彬,一场关于运行时底座与上下文治理的深度对谈。

直播介绍
图片直播时间

5 月 27 日   20:00-21:30

图片直播主题

Agent 能用,为什么还是不好用?

图片直播嘉宾

主持人:马可薇

嘉宾:

  • 王搂,科大讯飞 / 高级系统架构师

  • 郝栩彬,小红书 / AI 工程架构师

直播亮点
  • 两位一线实践者,首次同台对谈 Agent 工程化的核心取舍

  • 运行时底座 × 上下文治理:Agent 从能用到好用的两道关口

  • 真实事故复盘:内存串乱、上下文爆窗,那些踩过才懂的坑

  • 社区开源很强,企业自研的价值在哪?一场坦诚的技术选型对话


如何看直播?

扫描下图海报【二维码】或点击下方直播预约按钮,预约 InfoQ 视频号直播。👇

图片如何向提问?

文末留言写下问题,会在直播中为你解答。

开源适合拿来做原型和通用能力,比如工具编排、RAG组件、基础Agent循环。但业务流程、上下文策略、评测体系最好自己做,因为这些才是企业真正的know-how。框架可以换,业务经验换不了。

3 个赞

回答“企业有没有必要自研Agent框架”:我觉得没必要从零自研,但关键链路必须掌控。比如权限、审计、数据隔离、运行日志、成本控制,这些和企业内部系统绑定很深,完全依赖开源框架会比较危险。

3 个赞

针对“Agent团队最先建立哪三个能力”,我会选:评测体系、可观测性、人工兜底。没有评测就不知道有没有进步,没有可观测性就不知道哪里坏了,没有人工兜底就不敢真上线。

2 个赞

我会建议先搞清楚三件事:任务边界、工具权限、失败策略。Agent不是许愿池,不能什么都让它干。哪些能自动执行,哪些必须确认,失败了怎么恢复,这些比prompt写得优雅更重要。

2 个赞

“最大问题是什么”这个讨论里,我觉得三者是连在一起的:业务场景决定复杂度,工程架构决定可控性,模型能力决定上限。真上线时,最怕的是拿一个不稳定的模型,硬套一个模糊业务,再用临时脚本拼工程。

2 个赞