Mistral 发布 Medium 3 模型叫板 DeepSeek,开源策略引社区争议

Mistral发布Medium 3模型,性价比高但开源策略引争议。社区对其“开放权重”承诺表示质疑,未来发展引关注。

原文标题:Mistral 拿出杀手锏叫阵 DeepSeek!性价比卷出天际、开源模型却断供,社区粉丝失望透顶

原文作者:AI前线

冷月清谈:

Mistral AI 发布了新的 Medium 3 模型,该模型在性能上达到了 Claude Sonnet 3.7 的 90%,但成本更低。Medium 3在编程和多模态理解等专业场景中表现突出,并提供混合部署等一系列企业级功能。虽然 Medium 3 在性能和价格上都具有优势,但其开源策略受到了社区的质疑,因为自 Mistral 7B 之后,该公司没有推出足够有竞争力的开源模型,引发了用户对于其“开放权重”承诺的质疑。文章还提到了 Mistral 在 AI 竞赛中面临的挑战,以及其在市场上的定位和未来发展方向,包括可能被收购的命运。

怜星夜思:

1、Mistral Medium 3 在成本和性能上都优于一些竞品,但为什么社区对其开源策略如此不满?开源对于大模型公司来说,到底有多重要?
2、文章提到 Mistral 可能面临被收购的命运,你认为对于欧洲 AI 产业来说,Mistral 被美国科技巨头收购是好事还是坏事?
3、Mistral 一直强调成本效率,但文章也提到这可能是一种战术失误。在大模型领域,成本效率和模型规模之间,应该如何平衡?

原文内容

整理 I 褚杏娟

当地时间 5 月 7 日,法国 AI 初创公司 Mistral AI 宣布推出新模型 Mistral Medium 3。总的来说,新模型有三个亮点:

  1. 引入一个全新的模型类别,兼顾 SOTA 性能、成本大降 87.5%,并以支持以更简单的部署方式,加速企业落地应用。
  2. 在编程和多模态理解等专业场景中表现突出。
  3. 具备一系列企业级功能,包括:混合部署或本地 / 虚拟私有云(VPC)部署、定制化的后训练及可集成至企业工具和系统中。

据官方介绍,在各项基准测试中,Mistral Medium 3 能达到或超过 Claude Sonnet 3.7 的 90%,但成本却低得多(每百万 token 输入 0.4 美元 / 输出 2 美元)。定价方面,无论是 API 还是自部署系统,该模型优于 DeepSeek V3 等模型。

“在性能方面,该模型超越了领先的开源模型(如 Llama 4 Maverick)以及企业级模型(如 Cohere Command A)。在价格方面,它也优于 DeepSeek V3 等低价模型,无论是在 API 使用还是自部署系统方面都更具优势。”官方表示。

据介绍,Mistral Medium 3 在编码和 STEM 任务中尤其突出,在这些任务中,它的表现与参数大但速度慢得多的竞争对手相差无几。

除了学术基准测试外,Mistral 还发布了更能代表实际用例的第三方人工评测。“Mistral Medium 3 在编码领域继续大放异彩,其全面性能远超一些参数规模更大的竞争对手。”

此外,Mistral Medium 3 支持在任意云平台部署,包括配置为四块 GPU 及以上的自托管环境。

“可惜 Mistral 已经过时了。写小说效果差,编程还行,但也不算特别出色。Qwen 3 30B、Gemma 3 27B、GLM-4 很难被超越。”有网友评价道。

失去了开源口碑

2023 年 9 月,开源 Mistral 7B 模型以超越同量级竞品的性能和选择开放性的 Apache 2.0 许可证引发社区轰动,这也让这家刚成立不久的大模型公司迅速进入公众视野。

Mistral 并非所有模型都开源,这无可厚非。问题是,自 Mistral 7B 后, Mistral 再没有一个拿得出手的开源模型。而 Mistral 更先进模型的应用,例如其广受好评的一款新编程工具,目前仅在商业平台上销售,且已经与微软、亚马逊和谷歌达成了云分销协议。以至于,网友都在呼吁 Mistral 赶紧出下一个开源模型。

“非本地版本,没有开放权重,无法与 Qwen3 进行比较,又一个不相关的版本。” Medium 3 发布后网友 AaronFeng47 给出的评价。

对于 Mistral 在官博中写的“即便是我们的中等规模模型,在性能上也远超旗舰级开源模型(如 Llama 4 Maverick),我们对未来‘开放’发布的内容充满期待。”有网友怒道:

“开放”是吧?他们的行为真的有些奇怪。最初在1 月 30 日那篇博客文章中,他们让社区充满期待,仿佛要从他们专有的“开放权重”许可MRL转向 Apache-2.0 许可:“我们重申对在通用模型上使用 Apache 2.0 许可的承诺,并将逐步淘汰 MRL 许可的模型。 ”


然而在接下来的四个月时间里,他们至少发布了三款更加受限的“开放权重”模型(Saba、Mistral OCR 和 Mistral Medium 3),这些模型仅能供企业客户在本地自托管部署。


如果不是因为他们对“承诺”的不断漠视,我也不会因此指责他们。搞笑的是,他们在这段期间里几乎只发布了一款真正开源的模型——Mistral Small 3.1(相较 Mistral Small 3 只是小幅更新),而社区对此反响平平。






“现在我希望他们能发布一个开源权重模型,其质量至少能与 GPT-4.1 mini 相媲美,但模型规模最多与当前的 Mistral Small 一样,或者如果是 MoE 模型,则规模可与新推出的 Qwen 3 30B A3B 相当。我们总可以做个美梦,对吧?”有网友讽刺道。

在 AI 领域,一年是很长的时间。随着人们发现 Mistral 在 AI 竞赛中难以追赶更大规模的竞争对手,大家最初的热情开始冷却。

成也“高效率”,败也“高效率”?

Mistral AI 的三位创始人都有在美国大型科技公司从事 AI 研究的背景,这些公司在巴黎也有重要业务。CEO Arthur Mensch 曾在 Google 的 DeepMind 工作,CTO Timothée Lacroix 和首席科学官 Guillaume Lample 则是前 Meta 员工。这三个人被誉为“将欧洲最终推上科技顶尖舞台的英雄。”

“我们曾协助他们进行早期融资,并在公司架构初期提供支持……但真正去执行这些的,还是他们自己,”巴黎健康保险初创 Alan 创始人兼 CEO Jean-Charles  Samuelian-Werve 说道,“对于欧洲在生成式 AI 领域实现战略自主的想法固然重要,但 Mistral 更希望成为一个全球性的佼佼者。”

Mistral 一直将成本效率视为最大的优势。“我们使用的算力比美国竞争对手少了 100 倍,但我们已经能够开发出几乎处于前沿水平的模型,”Mensch 在接受《金融时报》采访时表示。

这一策略为 Mistral 赢得了包括微软在内的支持者。微软与该初创公司签署了合作协议并入股少量股份,这是微软在 OpenAI 之外对大模型公司的首笔投资。基准测试网站(如 RankedAI.co)也将 Mistral 列为全球十大模型开发者之一。

但 Mistral 正在被包括 DeepSeek 在内的新兴竞争对手超越。经济咨询公司 Entext 创始人 Sean Maher 表示:“中国无疑已经接过了这一接力棒,成为 OpenAI 及其美国竞争对手的‘快速追随者’。”他将 DeepSeek 的最新模型 V3 称为“令人瞠目结舌的时刻”,并认为“它将改变整个行业的经济格局”。

尽管一些支持者认为这证明了 Mistral 的做法是正确的,但也有人认为这是对其提供负担得起的“开放”AI 商业模式的威胁。甚至一些欧洲科技创始人和投资者认为,在前沿大模型开发者几乎可以获得无限资本的时期,Mistral 选择聚焦“高效率”是一种战术上的失误。

“全欧洲的希望”最好的归宿是“卖身”?

法国总统马克龙也对这家初创公司给予了热情支持,他被 Mistral “主权化”且更“开放”的 AI 承诺所吸引,非常认同其完全独立于美国大型科技公司的定位。欧盟在 2023 年底讨论其首部旗舰人工智能法规时,马克龙等人还警告布鲁塞尔政府不要用过多的繁文缛节来阻碍这一新兴行业的发展。

尽管欧洲还有一些前景可期的 AI 初创公司,如英国的 Wayve、德国的 DeepL 和 Black Forest Labs,以及法国的 Poolside,但目前没有一家在开发大模型。曾被寄望成为德国本土大模型冠军的 Aleph Alpha,去年已离开大模型领域,这使 Mistral 成为欧洲唯一的重量级选手。

随着面临着更大的竞争压力,去年市场上开始传出 Mistral 被收购的消息。

在今年的达沃斯论坛上,Mensch 回避了关于 Mistral 是否会像许多较小玩家那样不得不出售给大型科技公司的提问。但他坚称不会出售 Mistral,并希望公司有朝一日可以上市。“我们认为,作为一家独立公司所做的事情非常重要,”他说道,“所以这不在考虑范围内。”

不过,一位 Mistral 投资人在私下里并不那么乐观。“我们开始看到不好的征兆,”该人士说道,“他们需要出售自己。”

Mistral AI 成立不足两年,却已在去年 6 月完成了 6 亿欧元的融资,估值接近 60 亿欧元,但批评者认为该公司正处于 AI 初创企业的尴尬困境:筹资规模过大,无法悄然退出市场;但又不足以在全球 AI 竞赛中保持领先地位。

目前,Mistral AI 的员工人数约为 150 人,而其美国竞争对手拥有数千名员工。

当被问及 Mistral 是否计划在今年筹集更多资金时,Mensch 表示:“可能吧,尽管我们不一定需要。市场上确实已经有人对此感兴趣。”

Maher 预测,Mistral 的发展可能会效仿 Adept 和 Inflection 等 AI 初创企业,最终被大型科技公司“人才收购”。不过,这种情况是否会发生,还取决于布鲁塞尔的反垄断监管机构是否允许这样一个具有战略意义的欧洲资产被美国买家收购。“形势已经发生变化,(Mistral)需要找准自己的定位,否则就会被淘汰。”

领先的 AI 企业已筹集了超过 500 亿美元的资金——远远超过 Mistral

如今,Mistral AI 通过 Le Chat 的付费层来获取部分收入。Le Chat Pro 计划在今年 2 月推出,定价为 14.99 美元 / 每月。在 B2B 领域,Mistral AI 通过基于使用量定价的 API 来变现其旗舰模型。企业也可以为这些模型购买许可证,公司可能还从其战略合作伙伴关系中获得了可观的收入份额。

熟悉 Mistral 财务状况的投资者称,其年化运行率 (ARR) 已达数千万美元。与此同时,据报道,Anthropic 去年销售额接近 10 亿美元,而 OpenAI 的营收则接近 40 亿美元。

硅谷风投公司 Menlo Ventures 的一项研究显示,Mistral 在企业级 AI 市场中排名第五,去年市占率仅为 5%,不到 Google 或 Meta 的一半,远远落后于 OpenAI。

参考链接:

https://mistral.ai/news/mistral-medium-3

https://techcrunch.com/2025/05/05/what-is-mistral-ai-everything-to-know-about-the-openai-competitor/?utm_source=chatgpt.com

https://www.ft.com/content/fa8bad75-dc55-47d9-9eb4-79ac94e54d82?utm_source=chatgpt.com

声明:本文为 AI 前线整理,不代表平台观点,未经许可禁止转载

直播预告

🔍 大模型如何啃下客服 / 财务 / 营销“硬骨头”?

3 位技术负责人亲授:从实验室到生产环境的「最后一公里」,看大模型在三领域实践,欢迎预约直播,届时拍砖与交流。


今日荐文

图片

你也「在看」吗?👇

与其说好坏,不如说是无奈。欧洲现在在 AI 领域确实落后于美国和中国,Mistral 作为欧洲唯一的希望,如果能独立发展起来当然最好。但如果自身实力不足,被收购也许是更好的选择。毕竟,技术无国界,只要能推动 AI 发展,被谁收购都一样。

不过,从政治角度来看,欧洲肯定不希望自己的核心技术被美国掌控。所以,最终结果如何,还得看各方博弈。

我个人理解,开源对于大模型公司来说,重要性体现在以下几个方面:

1. 社区力量:开源能够吸引更多开发者参与,共同完善模型,提高模型的鲁棒性和泛化能力。
2. 快速迭代:开源能够加速模型的迭代速度,快速发现和修复 bug。
3. 技术普及:开源能够降低技术门槛,促进大模型技术在各行各业的应用。
4. 品牌效应:开源能够提升公司的品牌影响力,吸引更多人才。

但同时,开源也意味着商业机密和技术壁垒的丧失,需要公司在开源和闭源之间找到平衡点。Mistral 的问题在于,它可能高估了闭源带来的收益,而低估了开源社区的价值。

我觉得社区不满主要是因为期望落空吧。Mistral 7B 开源的时候惊艳四座,大家觉得它会坚持开源路线。结果现在更像是把开源当成一种营销手段,真正核心的模型反而捂得严严实实,这让早期支持者感觉被背叛了。

至于开源的重要性,我觉得得分情况看。对于小型团队或者研究机构来说,开源可以降低使用门槛,促进技术交流。但对于商业公司来说,开源就意味着放弃一部分商业利益,需要找到其他的盈利模式。像 Mistral 这样,可能觉得开源带来的好处不如闭源带来的收益大,所以调整了策略。但这种策略是否长久,还得看市场反馈。

其实我觉得 Mistral 的策略没错啊。在 AI 领域,不是只有“大力出奇迹”这一条路可走。Mistral 可以通过算法优化、模型压缩等方式,在同样的算力下,做出性能更强的模型。这才是真正的技术创新。

当然,Mistral 也需要在模型规模上有所提升,但更重要的是,要找到适合自己的发展路径,而不是盲目跟风。

其实这事儿也挺复杂的,咱们换个角度想想。如果 Mistral 完全开源,那它怎么跟 DeepSeek 这种卷价格的对手竞争?开源意味着大家都用一样的代码,那最终肯定是谁的算力更强、谁的优化更好,谁就能胜出。Mistral 作为一家小公司,可能觉得拼算力拼不过,所以选择了差异化的策略。一方面开源一些不太核心的模型,维持社区热度;另一方面,把核心模型闭源,卖服务或者授权,赚取利润。

这种策略对不对,不好说。但至少说明 Mistral 在努力寻找自己的生存之道。

这事儿挺纠结的。从短期来看,被美国巨头收购,Mistral 肯定能获得更多的资金和资源,加速技术发展。但从长期来看,这可能意味着欧洲 AI 产业失去了一个重要的自主力量。以后欧洲在 AI 领域的话语权,可能就要看美国公司的脸色了。

所以,如果能保持独立当然最好,但如果实在不行,被欧洲本土企业收购,可能也是一个可以接受的选择。

成本效率和模型规模,说白了就是“要面子还是要里子”的问题。Mistral 选择了“里子”,一开始靠低成本吸引了一批用户,但现在发现光靠低成本不行,还得提升模型的能力,才能在市场上站稳脚跟。

这就跟咱们买东西一样,一开始可能觉得便宜就行,但用久了还是觉得质量更重要。所以在 AI 领域,最终还是得靠技术实力说话。

我觉着吧,这得看怎么看了。一方面,Mistral 背后有法国政府的支持,马克龙肯定不希望看到它被美国公司买了,这关乎到欧洲的科技主权。但另一方面,如果 Mistral 自己发展遇到瓶颈,卖给美国公司也能让它的技术得到更广泛的应用,也算是为人类做贡献了,虽然有点无奈。

说白了,就是理想和现实的差距。理想很丰满,现实很骨感啊!

我觉得这个问题的核心是“性价比”。单纯追求低成本,模型能力不行也没用;单纯追求大模型,成本太高也难以落地。关键是要在成本和性能之间找到一个平衡点,让模型在特定场景下发挥最大的价值。

对于 Mistral 来说,可能需要在继续保持成本优势的同时,适当加大对模型规模的投入,提升模型的能力。毕竟,在 AI 领域,规模有时候也是一种竞争力。