天玑9500:端侧AI实力飞跃,智能手机AI迈向实用新纪元

天玑9500:端侧AI能力革命性升级,本地运行大模型与智能体,开启AI手机新纪元。告别云依赖,个人助理更智能。

原文标题:这一次,天玑9500的端侧AI能力,友商赶不上了

原文作者:机器之心

冷月清谈:

联发科此次发布的天玑9500旗舰5G智能体AI芯片,标志着端侧AI能力从“尝鲜”正式迈入“好用”阶段。该芯片在手机端实现了多项AI应用的突破,例如大语言模型处理128K字符文本仅需2秒完成会议纪要总结,图像生成速度也大幅提升,4K画质的Diffusion Transformer生图可在10秒内完成。所有这些应用均能在本地运行,无需云端传输数据,且功耗比前代降低一半。

文章指出,生成式AI的关键词已转向“实用化”,AI智能体(Agent)的爆发使其从工具进化为能自主规划和执行任务的“数字员工”,如谷歌Pixel 10系列的“魔法提示”和指令修图功能。未来的AI手机将更加个性化和主动。技术层面,天玑9500基于第三代3nm制程工艺,NPU性能峰值提升111%,功耗降低56%,AI Benchmark跑分高达15015。其全链路优化包括双NPU架构(超性能+超能效)、Transformer专用固化电路设计、以及率先支持BitNet 1.58bit量化推理框架,大幅减少端侧AI运算存储需求。

尤其值得关注的是,超能效NPU首次采用存算一体(CIM)架构,显著降低低功耗小模型运行时功耗,使得AI功能得以“Always on”。联发科还通过天玑AI开发套件和开发工具集,提供标准化AI开发范式,支持DeepSeek等关键技术,推动端侧AI生态扩展。目前vivo和OPPO等手机厂商已宣布将搭载天玑9500,并在各自新机上展示定制化AI功能,如vivo的个性化AI美颜和OPPO的AI意图搜索。这预示着搭载智能体的AI手机将成为真正懂用户的智能伙伴,加速AI颠覆式体验的到来。

怜星夜思:

1、文章提到未来AI手机会越来越多地在端侧完成任务。大家觉得,在哪些具体场景下,端侧AI的优势会远超云端,甚至成为不可替代的选择?有没有哪些情况,是端侧AI目前或者未来很长时间都无法做到的?
2、文章里把AI智能体(Agent)比作“数字员工”,说它能自主规划、执行任务。大家觉得,这种“智能体”最快会在哪些领域或场景颠覆我们的手机使用习惯?会像Siri一样,虽然概念很美好,但实际用起来还是“人工智障”吗?
3、文章着重提到了天玑9500的“存算一体”架构NPU,听起来特别黑科技。除了性能提升和功耗降低,大家觉得这种新架构对手机的续航、散热,甚至未来的手机形态会有什么意想不到的影响?这会是移动芯片的下一个“真大招”,还是营销噱头大于实际意义?

原文内容

机器之心报道

编辑:泽南


9 月 22 日下午,联发科推出的新一代旗舰 5G 智能体 AI 芯片 —— 天玑 9500,并展示了一系列新形态端侧的 AI 应用,在公众层面首次推动端侧 AI 从尝鲜到好用。


联发科技董事、总经理暨营运长陈冠州正式发布了新一代旗舰手机芯片天玑 9500。


现在,让手机端大语言模型(LLM)处理一段超长的文本,最长支持 128K 字元,它只需要两秒就能总结出会议纪要,AI 还能自动修改你的错别字。


图片


各种漫画风格的图像生成,如果用 GPT-5 要等一分钟,豆包要等 30 秒,现在在手机端输出图像只需要 10 秒,而且画面细节丰富,保证了与原图的一致性,没有次数限制。


图片


手机还可以支持高达 4K 画质的 Diffusion Transformer 生图。你只要输入简单的想法,不到 10 秒钟时间就能出图,达到了接近生产力、专业级的效果。


图片


与过去发布会上偏炫技的各种能力不同,这些手机上跑的 AI 应用能满足我们各种真实场景的智能化需求。它们不仅速度极快,而且完全跑在本地,无需向云端上传任何数据,处理同样的任务时,功耗也比去年的天玑 9400 低了一半。


天玑 9500,为一系列端侧生成式 AI 体验打开了大门。


AI 智能体

应用奇点已来 


生成式 AI 今年的关键词,是「实用化」。


DeepSeek R1 等模型在 AI 技术上的突破,已经大幅降低了推理成本。基于新一代基础模型,智能体(Agent)技术的爆发让 AI 从「工具」进化成为能自主规划、执行任务的「数字员工」。多模态方向上的进展则让 AI 拥有了能融合处理文本、图像、音频等多维度信息的能力,并开始向物理世界延伸。


不论是 OpenAI、谷歌等北美科技巨头,还是国内各类创业公司,在继续探索 AI 前沿技术的同时,都在研究如何让 AI 具有自我意识,能够成为人类的帮手。相比于需要学习的常规应用,以 Agent 为代表的 AI 新应用主打一个简单直接,在很多时候还能化被动为主动。


在上个月发布的谷歌 Pixel 10 系列,我们已经看到了这样的趋势。


比如 Pixel10 演示的「魔法提示」功能,有点像我们常用的验证码快速输入,手机会自动收集你在应用、邮件、短信、截图、日程上的信息,然后在需要用到的时候主动提供。全新的 AI 个人总结,可以把你一天的行程安排做一个简报式的总结,并把其中的重点推送出来。还有广受好评的指令修图能力,你只需要直接告诉 AI 你想把图改成什么样,想要增加或删除什么物体,手机就会根据你的指令调整、重绘图片。


可见,未来的 AI 手机不再是简单地完成任务,而是变得更加像人:它能理解你的习惯,知道你每天的生活日程,会在你需要的时候提醒要做的事,甚至可以在没有发出指令的情况下发挥主观能动性。生活将从此变得更轻松。


AI 手机背后的技术发展趋势也在逐渐清晰:复杂的任务需求接入云端大模型,主动、个性化的任务则交由端侧模型来完成,端侧的占比会越来越高。但另一方面,基于智能体的 AI 能力,要求手机上的模型能够接触人们日常生活中的各类数据,在端侧不断训练,充分理解人们的意图,并 24 小时持续不间断地提供推理结果,这对于手机上的算力提出了前所未有的考验


在端侧进行生成式 AI 的推理,成为了 AI 技术落地最迫切的需求。


不止是 AI 性能翻倍

架构革新 + 全链路优化


AI 应用落地的新需求,正在推动移动芯片快速进化。在联发科的天玑 9500 上,架构的进步、先进量化技术和优化方法的应用,给端侧的 AI 体验带来了全方位的提升。


天玑 9500 基于最新的第三代 3nm 制程工艺和新一代全大核架构打造,集成了超过 300 亿个晶体管。这块芯片在基础性能实现跨越式升级之外,NPU 性能和上代相比峰值性能提升了 111%,同峰值性能功耗还降低了 56%


它在最新版的 AI Benchmark 基准平台上跑分高达 15015,分数接近于上代的两倍,毫无疑问地成为了当前 AI 算力最强移动芯片。




在 AI 性能大幅提升的背后,是覆盖全链路的优化,包括但不限于:


  • 超性能 + 超能效双 NPU 架构

  • 超性能第九代 AI 处理单元 NPU990

  • 超能效 NPU,首次采用存算一体(存内计算 CIM)芯片架构;

  • 首发支持 BitNet 1.58 bit 量化推理框架;

  • 首发支持 4K 超高清画质图像生成。


首先,天玑 9500 采用了双 NPU 设计,超性能+超能效双核心,带来了不同以往的端侧 AI 体验:




在全新的生成式 AI 引擎 2.0 中,联发科升级了 Transformer 专用固化电路设计,可以让端侧 AI 运行的速度更快、功耗更低。


在提升大模型算力关键的量化技术上,天玑 9500 率先端侧支持前沿的 BitNet 1.58bit 推理框架,可以大幅减少端侧 AI 应用运算存储的需求,相比天玑 9400 的 FP8 精度功耗降低 50%。


端侧的 AI 模型训练,是目前业界正在突破的方向。去年的天玑 9400 上,联发科首次带来了对于端侧训练的支持。这次针对端侧模型训练的前向、反向传播,天玑 9500 实现了内存的进一步优化,在模型训练上只需要不到 2G 内存。


最为值得关注的是,联发科在超能效 NPU 上率先采用了存算一体架构,运行低功耗小模型时功耗下降 42%


作为计算架构未来的重要发展方向,存算一体的核心是将存储与计算完全融合,大幅降低数据在处理过程中传输的延迟与功耗,以新的高效运算架构进行二维和三维矩阵计算,结合后摩尔时代先进封装、新型存储器件等技术,能有效克服传统架构瓶颈,实现计算能效的数量级的提升。


在 CIM 的范式上,运算单元与内存 cache 合体,相当于存储器本身具备了算力,对于大模型计算这样的数据密集型任务,能够显著提升数据处理效率和能效比,让 NPU 可以支撑起低功耗 AI 模型的 Always on 模式。


因为新架构和一系列优化,天玑 9500 的 Diffusion Transformer 推理性能有了翻倍提升,率先在端侧支持了 4K 画质的文生图,同时端侧长文本处理能力达到 128K,相当于 10 个小时的录音内容。很多此前无法想象的能力,现在有了可行性。


从目前联发科提供的 demo 中我们可以看到,手机端 AI 应用的三个层面,包括系统级的任务调用(如 AI 语音转录),拍照的图像优化、风格迁移,以及基于大模型的个性化能力,都在使用 NPU 算力。


在不断「卷」手机芯片性能的同时,联发科也一直致力于为开发者提供完善的开发支持。


今年 4 月的天玑开发者大会上,联发科推出的天玑 AI 开发套件引发了人们的关注,其率先支持 DeepSeek 四大关键技术,包括混合专家模型(MoE)、多 Token 预测(MTP)、多头潜在注意力(MLA)和 FP8 推理,它们都得到了天玑芯片的底层优化。现在,天玑平台已可以在端侧运行 7B 参数的 AI 大模型。



联发科还推出了天玑开发工具集,将端侧模型开发的全部流程统一,减少了人们从开发到部署的时间。


正是因为天玑提供了一套标准化的 AI 开发范式,越来越多的开发者看到了端侧 AI 应用的潜力,原生 AI 应用的生态正在不断扩大。


可以说,天玑 9500 的 AI 能力升级,为未来 AI 手机的全面智能化体验打好了基础。


vivo、OPPO 领衔

下一代旗舰机曝光


在联发科天玑 9500 的发布会上,多家手机厂商也宣布很快即将发布搭载新一代旗舰 SoC 的手机,包括 vivo、OPPO 等。在即将发布的手机上,我们看到了相比以往不同的 AI 技术趋势。


vivo 将在下个月发布的 X300 系列上搭载业界首个量产个性化定制 AI 端侧美颜功能,蓝心大模型的端侧全家桶,包括语言、语音和图像模型现在可以在本地持续学习进化,达成全场景 AI 端侧高性能加速。


图片


利用超能效 NPU,新一代手机具备了极致的追焦能力,实现了毫秒级运动追焦与快门相应。


OPPO 即将发布的 Find X9 则把天玑的 AI 能力用在了全新小布识屏、AI 意图搜索上,可以在复杂 AI 任务实现异构加速,提升 NPU 的硬件使用率。


图片


这些 AI 能力,背靠顶尖的大模型,全新架构的手机芯片,不仅在对手机的使用范式进行未知的探索,也切实解决了我们日常生活、工作中的痛点,未来搭载智能体的 AI 手机,会是一个真正懂你的智能伙伴。


或许就像 OpenAI CEO 山姆・奥特曼在《温柔的奇点》中所说的那样,很快,AI 带给我们的惊叹会从写出优美的文字,变成写出优美的小说;从能够做出救命的医疗诊断,转变成能够研发出治愈方法;或者,从惊叹它能够编写一个小型程序,转变为好奇它何时能够创建一家公司。


智能体 AI 带来的颠覆式体验,正在慢慢到来,而联发科正在努力将这样的愿景,变为现实。


© THE END 

转载请联系本公众号获得授权

投稿或寻求报道:liyazhou@jiqizhixin.com

问端侧AI的优势在哪,我觉得很明显就是那种“秒出结果、还不能联网”的场景。比如手机拍照后的AI修图,你拍完就想看效果,等上传云端再下载回来,黄花菜都凉了。还有一些办公场景,比如文中说的会议纪要总结,涉及公司内部敏感信息,本地处理就安全很多。而且,很多时候我们就是图个快!云端再快也有延迟,本地零延迟的感觉是云端给不了的。

至于端侧做不到的,那可太多了!像生成那种几分钟的超高清4K视频、编写复杂软件代码或者搞什么大型科研模拟,这种“烧钱烧算力”的任务,估计手机再牛X也得甘拜下风。端侧AI更像是个私人助理,做做日常小事,但真正的大活儿,还得是“超级计算机”的活。

针对AI智能体的问题,我认为它将首先在“复杂任务简化”和“多模态交互”方面带来颠覆。举个例子,用户仅需通过语音或文本表达一个高层级意图,比如“帮我准备一份关于最近环保政策的简报,并配上相关图表”,智能体就能自主调用搜索、文本生成、图片生成甚至数据分析工具,最终输出一份完整的简报。这远超Siri那种单点任务的处理能力。Siri之所以被称为“人工智障”,核心在于其缺乏任务分解、跨工具协作和情境理解能力。智能体理论上拥有这些设计,所以它成功的可能性比Siri大得多,它不是简单的“回答”,而是“完成”。如果能真正实现,它将是效率工具的终极形态。

关于‘存算一体’架构的影响,从技术角度来看,它绝对是移动芯片的“真大招”而非噱头。数据频繁在存储和计算单元之间移动是能耗的主要来源,而“存算一体”(CIM)直接将计算能力融入存储单元,显著减少了数据传输的延迟和功耗。这对于手机续航来说,意味着在执行AI任务时能耗更低,从而延长整体续航时间。同时,功耗降低也直接关联着发热量减少,有助于优化手机散热设计,避免因过热导致的性能下降。长远来看,CIM这种高能效架构可能会促使手机内部空间分配更加灵活,甚至为更小的电池、更轻薄的机身设计创造条件,因为它减少了对传统复杂散热模组的依赖。它变革的是底层计算范式,其潜力深远。

端侧AI的优势嘛,我感觉最直接的体现在“个性化”和“即时反馈”上。你想啊,它能根据你的使用习惯,不断在本地学习你的偏好,比如你修图最喜欢什么样的风格,你通常会在什么时间段查看哪些信息,手机直接在本地分析,懂你胜过你妈!这种深度定制的体验,云端大数据分析虽然也能做,但总隔着一层,而且隐私风险更高。

但要说端侧做不到的,除了算力限制,我觉得还有“群体智能”的体现。比如通过分析全球用户海量非敏感数据,来发现某病毒的传播趋势或某个新词汇的流行度,这种需要庞大样本和不断交叉验证的全球性任务,端侧AI是没办法单独完成的。它就是个好用的独立个体,但不是一个能够统领全局的“大脑”。

关于‘端侧AI的优势会远超云端’这个问题,我觉得最显著的场景就是隐私保护和实时性要求极高的地方。比如人脸识别解锁、指纹支付、个人健康数据分析(心率、睡眠模式等)。这些数据太太太私人了,如果每次都要上传到云端,哪怕加密,也总让人心里打鼓。端侧处理就是天然的堡垒。还有一些弱网或无网环境下的应用,比如野外探险时的地图识别、植物识别,或者地下室里需要本地NPU支持的AR导航。至于端侧做不到的嘛,那就是需要海量数据训练、持续更新且计算资源无限扩张的通用大模型,比如新的全球级知识问答系统,或者需要实时处理全球新闻流、分析趋势的宏观智能分析。这些真的不是手机那点算力能轻易搞定的。

要我说‘AI智能体’,咱们就别抱太高期望了,免得又一次被“人工智障”伤透心(手动狗头)。但如果真能像文章说的那么牛,我觉得最实用的是“信息筛选与个性化提醒”。每天推送那么多信息,我根本看不过来。如果智能体能帮我把邮件里的重点提炼出来、把新闻里的核心观点总结好,甚至在我忘记某个重要的生活服务缴费时自动提醒并引导我完成,那会大大减轻信息过载的焦虑。它甚至可以在我开会分心的时候,自动录音并总结会议纪要。不过,会不会像Siri那样,你问它个复杂点的问题就“我没法帮到您”?拭目以待吧!

‘存算一体’这概念听起来就特别未来,就跟科幻电影里的脑机接口似的。我作为一个普通用户,最直观的感受肯定是续航。如果我的手机在平时刷抖音、拍照片的时候,AI模型一直在背后“默默地”工作,但电量却不怎么往下掉,甚至比现在省电,那它就赢了!这比跑分高了多少、什么架构听着都更实在。

散热方面也是,现在随便玩个游戏手机就变暖宝宝,如果AI任务能跑得凉快点,我就能多用一阵子,或者手机能塞个更小、更轻的散热模块?至于未来形态,如果技术足够成熟,也许手机内部可以省下很多复杂的布线和芯片外围电路,可能会让手机的内部空间利用率更高,甚至出现更灵活或者更薄的设备形态。反正只要能解决续航和发热这两个大痛点,对消费者来说就是“真大招”!

问到‘存算一体’是不是真大招,我觉得看实际效果吧,但理论上挺厉害的!我最关心的是续航和发热。手机再智能,一天两充甚至三充我是真的受不了。如果这个技术能让我在大量使用AI功能(比如生图、视频剪辑)的时候,手机不那么烫手,电量掉得慢一点,那就是最大的惊喜了!至于手机形态…嗯,可能散热模力可以做得小一点,手机就能更薄?或者腾出空间塞更大的电池?

至于是不是噱头,我觉得现在大家都很重视AI功能,谁家芯片AI跑得快又省电,那肯定是卖点。就算有营销成分,也得有真实技术支撑才行,不然很快就被用户骂回去了。我个人觉得AI对性能要求越来越高,这种底层的架构优化肯定是趋势,就像原来CPU从单核到多核一样,是必然的发展方向。

就‘AI智能体(Agent)’的问题,我是比较乐观的。我认为它最快可能颠覆的是日常事务管理、行程规划和跨应用信息整合。想象一下,你设定一个目标“下周带家人去旅行”,智能体可以自主查询机票酒店、比价、规划景点路线,甚至在你知道可能堵车时提前提醒你出发,并自动预定餐厅。这比现在Siri仅仅是定个闹钟或查个天气要高级太多了,它有上下文理解和主动行动的能力。Siri的“智障”在于它缺乏这种全局观和执行力,智能体如果能真正做到“规划+执行”,那体验将是质的飞跃,不再是简单的语音助手了,而是真正的“私人管家”。