谷歌NotebookLM新增中文播客功能:你的AI知识助手已就位

谷歌NotebookLM现已支持中文播客!上传资料,即可获得AI播客节目,更生动地学习和工作。安卓/iOS App即将上线,随时随地提升效率。

原文标题:谷歌NotebookLM终于说中文了!这可是最火的大模型播客产品

原文作者:机器之心

冷月清谈:

谷歌NotebookLM迎来重大更新,正式支持包括中文在内的50多种语言的音频播客功能。用户现在可以将文本、网页、视频等多种格式的资料上传至NotebookLM,并将其转化为具有主持人、对话和情绪起伏的AI播客,从而更生动地理解信息。该功能基于Gemini 2.5 Flash模型,能够处理高达50万token的上下文,并提供可靠的信息梳理和效率提升。此外,谷歌还宣布即将推出NotebookLM的安卓和iOS App,预计将在Google I/O大会上正式发布,届时用户可以随时随地使用包括音频概览在内的多项功能,甚至与AI主持人互动。但需要注意的是,高级功能可能仅面向Gemini Advanced订阅用户开放。

怜星夜思:

1、NotebookLM的音频播客功能,在学习和工作场景中,你觉得哪些应用场景最具潜力?
2、文章提到NotebookLM的AI播客主持人声音自然、口语化,你认为这种拟人化的设计对于用户体验有什么影响?你更喜欢偏正式还是轻松的风格?
3、NotebookLM即将推出App,并且音频概览等高级功能可能需要订阅Gemini Advanced才能使用,你觉得这种付费模式合理吗?你愿意为哪些功能付费?

原文内容

机器之心报道

编辑:Sia

NotebookLM 正在变成谷歌 AI 路线里最靠谱的选手之一:现在除了支持中文播报,还要上移动 App,变身日常学习办公神器。

能将音频源转化为引人入胜、类似播客的对话,NotebookLM 自从去年推出开始,就圈粉无数。

数天前,备受大家喜爱的这款大模型产品终于支持中文播客了!


这一功能的推出标志着NotebookLM向真正的多语言AI知识助手又迈进一步。

工具链接:https://notebooklm.google.com/

作为谷歌旗下 AI 文档助手,NotebookLM 有不少功能,包括摘要、时间线等常规内容,还有互动脑图。

图片
但真正让它出圈的还是音频概览( Audio Overviews )功能 ——  上传一些文本、网页、视频,Audio Overviews 就能把它们变成一段有主持人、有对话、有互动、有情绪起伏的 AI 播客。 

据说现在 10 个 NotebookLM 用户,恨不得有 9 个人都在使用这个功能。

虽说是神器,很多国内用户抱怨听不了中文播客也是白搭。等了大半年,Audio Overviews 终于支持超过 50 种语言,包括中文。

仅需在「设置」的「输出语言」中找到中文,选定即可。

我们也简单体验了一把。

为了比较分析两位女导演,我们上传了 BBC 对奥斯卡获奖导演赵婷的专访(英文视频)和国内关于邵艺辉的一些采访(中文文本)。



几分钟后,就得到了一个时长 8 分钟的中文播客节目。

内容上,AI 大模型对两位导演的采访信息进行了整理:

赵婷讲了自己在好莱坞的经历、对边缘人群的关注、以及她对行业结构的思考;邵艺辉则谈到女性题材、两性关系以及她如何在片场营造友善平等的氛围。

访谈共同展现了两位导演在各自文化背景下对电影艺术的独特视角和对社会议题的关注。

AI 总结出的关键词、对比点还比较准,而且播客中的「主持人」是一男一女两位 AI :

声音听起来很自然,比微信读书的「听书」好听太多;说话有停顿、有插话,而且很口语化,这些都让对话显得更加自然逼真。

当然,你还可以继续提高材料来源多元性。

例如,有关宫崎骏的最新消息很多都是日文,就算不懂日文也可以通过 AI 播客快速 get 报道内容。



这一次,我们选择了台湾腔中文播报(繁体中文),听听效果如何:

进一步讲,哪怕是英文、法语、日文、西班牙语等,只要是产品覆盖到的语言,最后都可以变成中文节目,破译其中内容。

作为谷歌目前最受欢迎的 AI 产品,NotebookLM 底层是谷歌 Gemini 2.5 Flash ( thinking model ),虽然不是最强的 Pro 版本,但也能支持最大 200MB 的上传内容,一次性处理 50 万个 token 上下文,足以扮演一位「可查询、可对话」的 AI 知识专家。



重点是:它只围绕你上传的资料说话,引用明确、查证方便,不会满嘴跑火车。

相比大多数 AI 助手,它的实用性更落地——不抢你流程,不乱猜内容,就是帮你梳理信息、提升效率。

目前 NotebookLM 依然只能通过网页使用,虽然手机浏览器能打开,但体验不太行。

好消息是,谷歌已经官宣即将上线安卓 App,并已开放 Play 商店页面预注册。 iOS 版也已上架预注册,预计会在 5 月 20 日的 Google I/O 大会上正式发布。



包括音频概览在内的多项功能都将在 App 中支持,甚至还有加入 AI 对话功能,让你能和 AI 主持人互动

但注意,高阶功能(比如音频概览)可能只面向 Gemini Advanced($20/月)订阅用户开放。免费用户估计每天只有一两次薅羊毛的机会。


© THE END 

转载请联系本公众号获得授权

投稿或寻求报道:[email protected]


我觉得在学习复杂文献的时候特别有用。以前啃论文,密密麻麻的字看得头大,现在可以直接让NotebookLM生成播客,上下班路上就能听,相当于随时有个AI在帮你解读,效率提升不止一点点!

从心理学角度分析,拟人化的设计能够激发用户的情感共鸣,从而提升用户满意度。然而,需要注意的是,AI的拟人化程度应适度,过度拟人化可能会引发用户的认知偏差,甚至产生不信任感。在风格选择上,应根据具体应用场景和用户群体进行调整,以达到最佳的用户体验效果。

当然是拟人化好啊!想想以前那些冷冰冰的AI语音,听着就想关掉。现在这种有情绪、有停顿的播客,感觉就像真人在跟你聊天,更容易集中注意力。关键是,听起来不那么枯燥啊!

羊毛不能使劲薅啊,人家也要恰饭的嘛!我觉得提供免费版本让大家体验没问题,但如果高级功能真的能大幅提升效率,付费也OK。毕竟时间就是金钱,能节省时间的工具都是好工具!

我个人更喜欢轻松一点的风格。毕竟是用来学习或者工作的,如果主持人太严肃,反而会让人感到有压力。而且,轻松的风格也更容易让人接受AI的存在,减少抵触情绪。

工作场景下,快速了解行业报告或者竞品分析很有帮助。比如,把一堆市场调研报告扔给NotebookLM,生成一个几分钟的播客,就能迅速抓住重点,省去了大量阅读时间。而且,还能边听边做笔记,简直不要太方便。

如果音频概览的质量真的像文章里说的那么好,而且我日常使用频率很高,我会考虑付费。毕竟,高质量的AI服务还是值得投资的。但如果只是偶尔用一下,那还是用免费版本好了。

从比较学术的角度来看,NotebookLM的音频概览提供了一种全新的知识获取方式,有望推动教育领域的创新。通过将知识以更具吸引力的播客形式呈现,可以激发学生的学习兴趣,提升学习效果。此外,该功能还有助于知识的传播和共享,促进学术交流。

从商业模式的角度来看,采用订阅模式是AI产品常见的盈利方式。这种模式能够为企业提供稳定的收入来源,并激励企业不断优化产品和服务。然而,企业需要充分考虑用户的需求和付费意愿,制定合理的定价策略,才能吸引更多的用户付费。对我而言,我更愿意为那些能够显著提升工作效率、提供个性化服务的AI功能付费。