AI大模型如何重塑学习硬件:网易有道AI答疑笔的创新之路

网易有道AI答疑笔:AI大模型驱动学习硬件变革,从工具到伙伴,个性化学习新体验。

原文标题:AI大模型重塑学习硬件:从工具到伙伴 | 网易有道孟旭

原文作者:AI前线

冷月清谈:

网易有道词典笔产品负责人孟旭在AICon大会上分享了AI大模型技术如何推动智能学习硬件从解决单一需求的“学习工具”进化为陪伴学习的“智能伙伴”。他认为,用户需求、硬件创新与AI技术三者的螺旋推进是关键。有道通过AI答疑笔的创新,展示了大模型在语言交互、答疑辅导和多模态交互方面的优势。未来的方向是AI Agent和教育生态的深度融合,以实现更个性化的学习体验,让AI答疑笔成为孩子专属的AI设备。

怜星夜思:

1、有道AI答疑笔通过了高考二模题测试,达到了清北分数线,这是否意味着AI已经可以完全取代老师在某些学科上的作用?
2、文章提到AI答疑笔未来将实现人、内容和流程的整合,你认为在实际应用中,如何平衡AI提供的标准化学习路径和学生的个性化学习需求?
3、文章中提到有道定制了AI芯片以支持离线大模型,你认为未来智能学习硬件在算力方面会如何发展?是继续依赖云端算力,还是更多地转向端侧算力?

原文内容

作者 | 孟旭
编辑 | 李忠良
策划 | AICon 全球人工智能开发与应用大会
在近期举办的 AICon 全球人工智能开发与应用大会·上海站(2025)现场,网易有道词典笔产品负责人孟旭以一款全新的 AI 原生硬件【有道 AI 答疑笔】为例,分享了智能学习硬件在大模型技术催化下的变革逻辑——从解决单一需求的“学习工具”,进化为陪伴学习的“智能伙伴”。

孟旭指出,从多年的经验和认知出发,有道智能学习硬件的进化本质是用户需求、硬件创新与 AI 技术三者的螺旋推进,三者像齿轮一样咬合转动,推动产品进化。即使是在大模型爆发的当下,纯软件升级或者纯硬件创新都更像是炫技,唯有软硬结合才能让技术润物无声地渗入场景,去解决用户的真问题 ,这也是垂类硬件在技术爆发时代的生存法则。

以下根据演讲实录整理(部分内容有删改),供大家深入了解:

大家好,我来自网易有道硬件产品团队,我叫孟旭。

现在 AI 可以说无处不在了,作为智能学习硬件的产品团队,我们也一直在思考:当 AI 教育碰撞,如何让这项前沿技术真正成为孩子学习成长路上的"智慧引路人”? 如何突破传统学习工具的局限,解决孩子在学习过程中遇到的实际痛点,为他们打造更高效、更沉浸、更个性化的学习体验?

今天我会以我们今年推出的全新品类——有道 AI 答疑笔——的创新点来展开说说,大模型催化下的 AI 学习硬件经历了什么样的变革

网易有道被大家熟知是因为有道词典、有道翻译官、有道云笔记等应用,所以我们在查词翻译、语言学习上有非常深的积累,而我们有道词典笔也在智能学习硬件领域深耕多年,今年年初有道词典笔累计销量突破了 1000 万台,这对于我们是一个里程碑,代表了这么多年超过千万的孩子和家长对我们的信任。

在这个过程中,我们发现学习硬件产品迭代过程呈现“需求牵引 - 技术支撑 - 体验升级”的螺旋式发展路径。即先由用户场景需求牵引,推动硬件创新和人工智能技术在产品中的应用;随着硬件和技术的提升,又为用户带来更好的使用体验,而新的体验又会催生用户更多、更高级的需求,如此循环往复,推动智能硬件不断向前演进。

具体来说,

需求牵引

这是智能硬件发展的起点,也是核心驱动力。需求场景虽然会随着时代进行变化,但变化的路径和方向是有迹可循的。我们在最开始推出有道词典笔,解决的是在用户英语学习时候提供一个趁手的智能工具。基于有道词典在语言翻译方面积累了大量的专业数据,同时硬件技术能够实现扫描 - 识别 - 输出的快捷过程,词典笔就应运而生。

后来,我们在大量用户的使用日志中发现,因为扫描翻译这个动作很方便,用户在学习中文遇到不懂的字词,也会习惯性的扫一下,所以我们紧接着丰富了扫描翻译的语种和内容,不光是双语的学习,还引入了小语种和古诗文的释义,乃至文言文的讲解。

再接下来,我们又看到,随着孩子年龄的增长,会面临学习任务的升级,他们也会自然而然地想到,随手拿起词典笔能不能解决下数学、物理、化学这些学科问题,乃至能不能脱离桌面学习的空间,到随时随地都能够互动学习……这就是为什么从需求层面,我们会从词典笔扩展到 AI 答疑笔这个路径上来。

硬件创新

当明确用户需求后,就需要通过硬件创新来实现。这涉及到材料科学、电子工程等多领域技术突破。例如,为了让有道词典笔更便于携带和操作,可能需要在保证性能的前提下,对其外观尺寸、材质进行优化;为了实现更快速的识别和处理速度,要升级芯片等硬件组件。同时,也要考虑规模化的成本问题。可以说,硬件创新是将用户需求转化为实际产品功能的关键环节。

技术迭代

人工智能技术为智能硬件注入了“智慧”灵魂。像图像识别技术能让词典笔精准识别文字;自然语言处理技术使其能够理解用户提问,并给出准确解答。人工智能技术的不断进步,如算法优化、深度学习能力提升等,为智能硬件实现更智能、更人性化的功能提供了技术支撑。

那今天,前沿的 AI 大模型和教育场景碰撞带来了什么新的变化呢?

首先,在语言交互方面,大模型具有先天优势,尤其是在语言学习领域。有道早在 2023 年就在词典笔上落地并优化大模型,优先应用于翻译和多语言学习场景。大模型能够更好地理解自然语言,尤其是结合上下文,从而显著提升翻译的准确度、表达方式、情绪色彩和流畅度。

这里可以提一下,其实我们去年率先在行业内首次落地了端侧离线大模型,主要用于中英离线翻译,团队还在推进文言文翻译和小语种翻译功能的开发。选择离线大模型的原因在于,许多孩子的学习场景中存在无网络或网络不稳定的情况,如学校、图书馆等,离线模型能够保证低延迟、高质量的学习体验,同时降低成本。

为此,有道定制了首颗 AI 芯片,提升芯片算力以满足大模型需求,同时实现超低功耗,满足孩子长时间使用不充电的需求。离线大模型的落地面临诸多挑战,如算力、内存、功耗和成本的限制,但团队成功实现了高质量的翻译,使得离线大模型翻译质量优于原有的 NMT 模型。

其次,推理模型展示了类真人的逻辑思考链,在答疑辅导场景中进行应用,让 AI 更接近真人老师的讲解方式,实现了自然语言交互模拟一对一的对话过程,真正实现了教与学的双向交互。

以我们自己的产品突破为例,在最新的有道 AI 答疑笔上,与传统基于题库的答疑方式不同,小 P 老师能够随时随地解答多学科、新题难题,不限制学科和题目来源,就像前段时间我们拿 AI 答疑笔试了下今年北京海淀的高考二模题,也能拿下不错的成绩,达到了清北分数线。

同时,小 P 老师能够做到分步骤讲解解题思路,单独抽离知识点供用户追问,并提供举一反三的练习,包括真题练习和大模型生成的练习。并且,大模型的知识覆盖面直接拓展到了全学科领域,契合当下教育目标迈向学科融合发展的趋势,能够更好地承担起多学科高效辅助的角色。

这样,大模型解决了传统人力问题,孩子在学习过程中遇到问题可以随时获得精细化讲解,无需等待固定时段询问老师。此外,多模态技术的发展让有道 AI 答疑笔能支持多种交互方式,如扫描、拍照、语音等,也让用户能够拓展更多个性化学习体验,比如拍照朗读不同风格的文章、拍照自定义背单词等功能。

可以看到,目前大模型应用已经能够解决一些以往产品没能很好解决的问题。但是如果看长远一点,我们认为下一个阶段可能是 AI Agent 和教育生态的深度融合,也是我们正在探索的方向。

随着孩子学习方式从以老师为中心转变为以学生为中心,以及从单一学科到多学科融合、从被动接受到主动探索的各种转变,传统学习工具的局限性愈发明显。

比如,我们看到学生在预习课本的时候,就会探究课本以外的发散知识,有的孩子可能会好奇作者的生平,有的孩子可能会想了解文章的写作背景和故事等等,其实就是学习的个性化本质,也是教育的终极诉求。我们一直追求“因材施教”,但现在没有任何一个工具、一个产品能真正做到。

我们也还在往这个方向去努力,哪个孩子不希望自己有个随身家教呢?所以我们一方面在答疑智能化上做功夫,比如让 AI 答疑笔可以根据你的“错题本”记录,提供更好的讲解;另外一个方面,是进一步提高产品层面端到端的成熟度,现在 AI 答疑笔里面有几十个应用,不同的应用处理不同的学习需求,比如背单词有专门的 APP,口语训练又是专门的 APP,然后课内同步学习又是不同的入口。

那未来是不是能把这些散点功能串联成整个学习流程?

基于这样的构想,我们 AI 答疑笔一开始就是定位于 AI 原生智能硬件,软硬件相结合的自研系统具备集成的条件,或许未来能实现人、内容和流程的整合,当 AI Agent 解决孩子各类学习问题的时候,AI 答疑笔就能真正成为孩子专属的 AI 设备

活动推荐

6 月 27~28 日的 AICon 北京站将继续聚焦 AI 技术的前沿突破与产业落地,围绕 AI Agent 构建、多模态应用、大模型推理性能优化、数据智能实践、AI 产品创新等热门议题,深入探讨技术与应用融合的最新趋势。欢迎持续关注,和我们一起探索 AI 应用的无限可能!


今日荐文

图片

你也「在看」吗?👇

我觉得会是“端云协同”的模式。一些对算力要求不高、对实时性要求高的任务,可以在端侧完成;一些对算力要求高、对实时性要求不高的任务,可以在云端完成。例如,AI答疑笔可以在端侧进行快速的文字识别和翻译,在云端进行更复杂的知识推理和个性化推荐。

我觉得平衡的关键在于“度”的把握。AI可以提供标准化的知识框架和学习路径,但必须留有足够的空间让学生进行个性化的探索和实践。例如,AI可以根据学生的学习进度和掌握情况,推荐不同的学习资源和练习题,但学生有权选择自己感兴趣的内容和方式进行学习。
从另一个角度来说,AI可以搜集分析用户平时做题的数据,从而给用户画像,推出更符合用户学习情况和学习习惯的内容。

我有个更激进的想法,可否让学生参与到AI学习模型的训练中?比如,学生在使用AI答疑笔的过程中,可以对AI的讲解进行评价和反馈。这些反馈可以用来改进AI的学习模型,使其更符合学生的学习需求。这样,学生就不仅仅是被动地接受AI提供的知识,而是成为AI学习模型的共同创造者。

个人认为端侧算力会越来越重要。虽然云端算力强大,但受到网络延迟、隐私安全等因素的制约。对于智能学习硬件来说,低延迟、高安全性的本地计算能力至关重要。因此,定制AI芯片,提升端侧算力,是未来的发展趋势。当然,云端算力也不会被放弃,可以作为端侧算力的补充,提供更复杂、更高级的服务。

个人认为取代老师还早得很。高考成绩只是一个结果,学习的过程更为重要。老师的引导、鼓励,同学间的互助,这些都是AI无法提供的。而且AI的解题思路是固定的,缺乏灵活性和创新性,遇到新题型可能就傻眼了。所以,AI可以辅助学习,但取代老师,我觉得是不可能的。

这个问题很有意思!虽然AI答疑笔在高考二模中表现出色,但这并不意味着能完全取代老师。AI擅长快速检索和提供标准答案,但在激发学生学习兴趣、培养批判性思维、提供情感支持等方面,老师仍然具有不可替代的价值。更理想的状态是AI作为辅助工具,帮助老师更好地进行个性化教学。

我持谨慎乐观态度。AI在知识的广度和检索速度上确实超越了人类教师,但教育不仅仅是知识的传递,还包括价值观的塑造、人际交往能力的培养等等。我觉得AI更像是一个强大的助教,可以减轻老师的负担,让老师可以更专注于学生的个性化发展和心理辅导。

其实这取决于技术的发展方向。如果未来电池技术取得突破,能够提供更持久的电力,那么端侧算力可能会更受欢迎。但如果量子计算、光子计算等新兴技术取得突破,云端算力可能会更具优势。所以,未来的发展趋势充满了不确定性,让我们拭目以待。

同意楼上的观点,个性化推荐很重要。此外,我认为还可以引入“学习风格”的概念。不同的学生有不同的学习风格,比如视觉型、听觉型、触觉型等等。AI答疑笔可以根据学生的学习风格,提供定制化的学习体验。例如,对于视觉型学生,可以提供更多的图表、视频等视觉材料;对于听觉型学生,可以提供更多的音频讲解和讨论。