首届魔搭开发者大会:七大论坛揭示AI项目新灵感与发展趋势

首届魔搭开发者大会揭示AI最新趋势:开源、多模态、小模型、具身智能、Agent、生成式AI深度应用等,并推出开发者激励计划。

原文标题:你的下一个AI项目灵感,藏在首届魔搭开发者大会的七大论坛里

原文作者:机器之心

冷月清谈:

首届魔搭开发者大会汇聚了众多AI领域的专家和开发者,展示了AI开源社区的蓬勃发展。魔搭社区已成为中国最大的AI开源社区,拥有海量的模型和用户,并提供全链路服务。大会通过七大主题论坛,揭示了AI领域的多个关键趋势:

1. **开源**: 开源已成为AI发展的重要驱动力,中国企业在开源模型方面表现突出,推动了AI技术生态的构建和应用。
2. **多模态与世界模型**: AI正朝着多模态和理解物理世界规律的方向发展,能够处理多种类型的数据,并进行推理和预测。
3. **小模型与侧端应用**: 为了提高效率和保护隐私,小规模的边缘AI模型日益受到重视,可以在各种设备上运行。
4. **具身智能**: AI与机器人结合,使AI能够感知环境并执行复杂任务。
5. **Agent与MCP**: 为了确保AI Agent的可控性,模型上下文协议(MCP)等交互范式成为研究重点。
6. **生成式AI的深度应用**: 生成式AI在科学发现、工程设计、软件开发等专业领域展现出巨大潜力。

此外,魔搭社区还推出了开发者激励计划,以鼓励更多开发者参与社区建设,共同推动AI技术的发展。

怜星夜思:

1、文章提到开源是中国AI发展的关键驱动力,你认为开源模式对于国内AI产业的崛起有哪些具体优势和潜在风险?
2、文章中提到了“具身智能”,你认为未来哪些行业会最先受益于具身智能的发展?它可能会给我们的生活带来哪些颠覆性的改变?
3、文章提到MCP(模型上下文协议)旨在确保AI Agent的可控性,你认为除了MCP之外,还有哪些方法可以提高AI Agent的可靠性,避免其产生不可预测的行为?

原文内容

机器之心报道

编辑:+0


此刻我们正处在什么样的时代?是姚顺雨笔下的「AI 的下半场」,是 Andrej Karpathy 定义的「软件 3.0 时代」,也是一个创造者与 AI 协同进化,重新定义「可能」的时代。


层出不穷的创新模型以前所未有的速度涌现,深刻地改变着世界的每一个角落。对于开发者而言,这既是充满无限机遇的黄金时代,也带来了前所未有的挑战:如何紧跟技术前沿,高效地获取、使用并创造 AI 模型?


开放、协作、共享的社区生态成为推动 AI 浪潮奔涌向前的核心动力。正是在这样的背景下,一个能够汇聚顶尖智慧、提供全方位支持、连接创造者与使用者的平台,显得至关重要。魔搭社区(ModelScope)正是顺应这一需求而发展的。


6 月 30 日,首届魔搭开发者大会在北京举办。自 2022 年 11 月初成立以来,历经两年多高速发展,社区已汇聚超 500 家贡献机构,托管的开源模型数量已超 7 万个,增长超 200 倍,用户数量从 2023 年 4 月的 100 万扩展至如今 1600 万,增长约 16 倍。



魔搭社区已形成全链路服务,支持开发者体验、下载、调优、训练、推理、部署模型,覆盖 LLM、对话、语音、文生图、图生视频、AI 作曲等多个领域,并提供 4000+ MCP 服务和调试工具。目前,魔搭社区已成长为中国最大的 AI 开源社区,业界头部模型均在魔搭社区率先开源。


通过将先进的开源模型汇聚在社区,魔搭可以让广大的模型开发者,迅速获取到最新最好的模型;与此同时,魔搭也为这些模型提供了迅速触及潜在的用户以及下游生态的桥梁,模型贡献者与模型使用者在魔搭上的双向奔赴,使得模型应用的无限可能,得以被激发。



七大主题论坛解锁 AI 最新趋势


魔搭社区是一个开放、中立、非盈利的组织。本次开发者大会由国家信息中心指导、魔搭社区主办。一场主旨论坛加六大主题论坛,大会覆盖了前沿模型与工具、MCP 和 Agent、科研智能等 65 个主题,国内外知名 AI 开源模型团队均现场参会分享。


从这次论坛中,我们可以观察到 AI 发展的一些新趋势。



开源


2025 年,全球 AI 开源浪潮汹涌,而中国已成为其中最关键和独特的驱动力量。这一年,开源不再是少数派的选择,以阿里巴巴(通义千问)、深度求索(DeepSeek)等为代表的中国企业,持续推出性能比肩世界顶尖水平的开源模型。以 Qwen 系列为代表的开源模型,已逐渐成为全球 AI 开发者的首选工具之一,推动了从学术研究到产业应用的广泛创新。



它们既是打破技术封锁、实现高水平科技自立自强的途径,也是构建自主可控 AI 技术生态、赋能庞大制造业体系的基石。这种模式催生了独特的生态:一方面,开发者社区(如魔搭 ModelScope)异常繁荣;另一方面,开源与国家级新基建(如算力网络)的结合更为紧密,推动 AI 在公共服务、工业制造等领域的深度应用。


多模态与世界模型


AI 不再仅仅满足于处理文本或图像。多模态 AI 的发展达到了新的高度,能够同时理解和生成文本、图像、音频、视频甚至 3D 信号。这使得 AI 能够与世界进行更自然、更全面的交互。既有 GPT 4o、即梦在图片方面的以假乱真,又有 Veo 3、可灵在视频方面的震撼表现,让网友大呼「现实不存在了」。



与此紧密相关的是世界模型(World Models)的兴起。AI 开始构建对物理世界运行规律的内部表征和理解,而不仅仅是识别模式。这意味着 AI 能够进行简单的推理、预测物理互动的结果,并更好地理解人类的意图。例如,视频生成模型不仅能「画」出动态,更能「理解」画面中的因果关系。这为机器人、自动驾驶和更高级的虚拟助手的发展奠定了基础。



小模型与侧端应用


在追求更大、更强的模型的同时,业界也愈发关注效率和成本。随着 AI 应用的普及,在云端运行庞大的模型变得既昂贵又不切实际。因此,2025 年 AI 发展的另一个重要方向是模型压缩、量化和蒸馏等技术。



这催生了性能强大但规模更小的「边缘 AI」模型。这些模型可以直接在个人电脑、智能手机甚至更小的物联网设备上运行,不仅降低了延迟和云端依赖,也更好地保护了用户隐私。



清华大学电子工程系系主任、无问芯穹科技有限公司发起人汪玉在会上分享了硬件创新与侧端 AI 的技术突破与挑战,并介绍了该公司开源的端侧解决方案中的全模态理解小模型 Megrez-3B。


具身智能


如果说多模态 AI 是让 AI 有了「五官」,那么具身智能就是让 AI 拥有了「身体」。2025 年,我们看到了更多 AI 技术与机器人实体相结合的突破。结合了先进视觉语言模型的人形机器人开始走出实验室,尝试在真实世界的非结构化环境中执行复杂任务,例如仓库分拣、家庭服务等。


关键词不仅在于硬件的进步,更在于「大脑」与「身体」的协同。AI 模型需要实时地将多模态感知转化为物理世界的具体行动,并从互动中学习和适应。


清华大学特别研究员、星海图联合创始人赵行在会上聚焦具身智能开发者生态构建,围绕本体、数据、模型与应用等关键要素,分享星海图在推动具身智能开发者生态构建的探索与思考。


Agent 与 MCP


2025 年,能够自主理解、规划并执行复杂任务的 AI Agent 成为行业焦点。然而,如何确保这些强大智能体的行为可控、可靠,是其走向大规模应用的关键挑战。


为此,业界正积极探索新的交互范式,让 Agent 从难以预测的「黑箱」,转变为透明、可控的智能伙伴。其中,以「模型上下文协议」(Model Context Protocol, MCP)为代表的框架成为重要突破。它通过标准化的沟通模式,使 Agent 在行动前能主动澄清目标、展示规划并请求授权,从而确保人类的最终控制权,推动 AI Agent 实现了从「可用」到「可靠」的关键飞跃。



生成式 AI 的深度应用


继文本和图像生成之后,2025 年生成式 AI 开始在更专业的领域展现价值:


  • 科学发现:AI 被用于加速新材料的发现、药物设计和复杂的科学模拟。


  • 工程与设计:工程师和设计师使用 AI 来生成和优化复杂的 3D 模型、电路设计和工业流程。


  • 软件开发:AI 不仅能编写代码片段,更能理解整个代码库的逻辑,辅助进行重构、调试和文档生成,成为开发者的「结对程序员」。


  • 个性化内容与娱乐:实时生成、可交互的虚拟世界和游戏体验成为可能,影视制作流程也深度整合了 AI 技术。



开发者激励计划


大会现场发布了魔搭开发者勋章激励计划,为在平台上作出贡献的开发者赋予荣誉和奖励,激励开发者持续成长。勋章获得者可以获得平台免费 GPU 算力支持,以及 AIGC 专区高阶训练券、高阶生图券等奖励,用于模型生成、模型训练、应用搭建等场景。未来,魔搭开发者勋章激励计划还将面向代码搭子、布道搭子等开发者贡献群体开放,同时也会推出针对社区活跃行为的勋章激励。


魔搭社区发起人周靖人表示,魔搭将打造为广大 AI 开发者交流的首选社区,实现开发者与社区的共同成长。期望有更多的开发者不仅能在魔搭找到优质模型,还能找到志同道合的「搭子」,让更多的创新想法在魔搭社区碰撞,更多的 AI 应用在魔搭社区进行孵化,推动下一波人工智能技术的发展。


© THE END 

转载请联系本公众号获得授权

投稿或寻求报道:[email protected]

从学术角度讲,开源确实能打破技术壁垒,促进知识共享。国内AI企业通过开源,可以快速学习和借鉴国际上的先进技术,缩短研发周期。但是,过度依赖开源也可能导致自主创新能力不足,长期来看不利于产业的健康发展。此外,开源协议的合规性也是一个需要关注的问题。

我认为最根本的还是要加强对AI伦理的研究和监管。AI Agent的能力越强,潜在的风险就越大。我们需要制定明确的伦理规范和法律法规,明确AI Agent的责任和义务,确保其行为符合社会价值观。否则,技术发展再快,也可能带来灾难性的后果。

我觉得最先受益的肯定是制造业和物流业。想象一下,如果工厂里的机器人能像人一样灵活地组装产品,仓库里的机器人能准确地分拣货物,那效率得提高多少啊!至于颠覆性的改变,我觉得最大的可能是服务业的智能化,比如家庭服务机器人,可以帮我们做家务、照顾老人小孩,彻底解放劳动力。

我个人觉得开源最大的好处是降低了创业门槛!很多小公司或者个人开发者,可以基于开源的项目快速搭建自己的应用,这对于整个生态的繁荣非常有帮助。不过,开源项目的质量参差不齐,选择合适的项目并进行二次开发也是一个挑战。

与其说颠覆性改变,不如说是更高效的生活。我觉得具身智能会让我们的生活更便捷,比如自动驾驶汽车,能让我们在通勤的路上节省时间;智能家居系统,能让我们通过语音控制家里的电器。但同时也需要警惕过度依赖技术带来的负面影响,比如人与人之间的交流减少,身体机能退化等等。

这个问题问得好!我觉得开源的优势在于加速创新,避免重复造轮子。大家可以站在巨人的肩膀上,快速迭代。而且开源还能促进技术交流,吸引更多人才加入。至于风险,主要是知识产权保护的问题,还有就是可能出现安全漏洞,需要社区共同维护。

从技术角度看,可以尝试使用可解释性AI(XAI)技术,让AI Agent的决策过程更加透明化,方便我们理解和干预。另外,还可以研究基于规则的AI Agent,通过明确的规则来约束其行为,降低出现不可预测行为的风险。当然,这需要我们在算法设计上做出更多创新。

这个问题很关键啊!除了MCP,我觉得可以从以下几个方面入手:一是强化AI Agent的训练数据,确保数据质量和多样性;二是引入人类反馈机制,让人类专家参与到AI Agent的决策过程中;三是建立完善的监控系统,实时监测AI Agent的行为,及时发现和纠正问题。

个人认为医疗领域会是具身智能的重要应用场景。例如,远程手术机器人可以让专家在异地为患者进行手术,康复机器人可以帮助患者进行肢体功能的恢复训练。这些应用不仅能提高医疗水平,还能改善患者的生活质量。当然,伦理问题也需要我们认真思考。