Mistral AI发布Medium 3：性能升级，企业级Le Chat Enterprise同步上线

almosthuman2014 · 2025 年5 月 8 日 13:51

Mistral AI发布Medium 3模型，性能优于GPT-4o和Claude 3.7 Sonnet，成本更低。同时推出企业级聊天机器人Le Chat Enterprise。

原文标题：时隔两月，Mistral AI终于上新Medium 3，近期还有「One more thing」

原文作者：机器之心

原文链接： http://mp.weixin.qq.com/s?__biz=MzA3MzI4MjgzMw==&mid=2650968122&idx=3&sn=b1d00de75f2b9c69148bb9aa58dac49e&

冷月清谈：

Mistral AI发布了新的语言模型Mistral Medium 3，该模型定位在轻量级和大规模模型之间，在关键基准测试中表现优于GPT-4o和Claude 3.7 Sonnet，但并未开源，可通过 Mistral 的官网和 API 或其合作伙伴的 API 使用。针对企业使用，Mistral Medium 3的成本远低于Claude 3.7 Sonnet。同时，Mistral AI还预告将在未来几周内发布一款“大型”产品。此外，Mistral还推出了企业级聊天机器人服务Le Chat Enterprise，该服务集成了AI功能，并与第三方服务集成，旨在为企业提供隐私优先的AI解决方案。

怜星夜思：

1、Mistral Medium 3 在哪些实际应用场景中能够发挥更大的优势？除了文中的金融、能源和医疗保健，还有什么行业适合使用？
2、Mistral Medium 3 虽然性能很强，但并未开源，这对于开源社区会有什么影响？大家会更倾向于使用开源模型还是闭源但性能更强的模型？
3、Le Chat Enterprise 作为企业级聊天机器人，与 ChatGPT 相比，有哪些独特的优势？你认为企业会更看重哪些方面？

原文内容

机器之心报道

编辑：蛋酱、张倩

时隔两月，Mistral AI 终于又上新了。

「今天，我们欣喜地宣布推出 Mistral Medium 3，进一步提升语言模型的效率和可用性。」

据官方博客介绍，Mistral Medium 3 处于一个新的性能层级，介于轻量级和大规模模型之间。该模型在关键基准测试中优于 GPT-4o 甚至 Claude 3.7 Sonnet。

只是 Mistral Medium 3 并未开源，目前可通过 Mistral 的官网和 API 或其合作伙伴的 API 使用。Mistral Medium 3 将于周三上线亚马逊云科技的 Sagemaker 平台，后续也会登陆其他主机平台，包括微软的 Azure AI Foundry 和谷歌的 Vertex AI 平台。

该模型专为企业使用而设计，其性能在基准测试中达到了 Claude 3.7 Sonnet 的 90% 以上，但成本仅为后者的 1/8 —— 输入每百万 token 仅需 0.4 美元，输出每百万 token 仅需 2 美元。相比之下，Sonnet 的输入 / 输出价格分别为 3 美元和 15 美元。

另外，Mistral AI 还预告了「One more thing」：

随着三月份 Mistral Small 和今天 Mistral Medium 的发布，我们在接下来的几周内正在筹备一款「大型」产品，这早已不是什么秘密了。即使是我们的中型型号，其性能也远超 Llama 4 Maverick 等旗舰开源型号，我们非常期待「揭开」未来的神秘面纱 :)

会是什么重磅发布？值得我们期待一下。

优于 GPT-4o 和 Claude 3.7 Sonnet 的性能

基准测试表明，Mistral Medium 3 在软件开发任务中表现出色。在 HumanEval 和 MultiPL-E 等编程测试中，它的表现与 Claude 3.7 Sonnet 和 OpenAI 的 GPT-4o 模型不相上下，甚至更胜一筹。

除了学术基准测试外，团队还报告了更能代表实际用例的第三方人工评测。

根据第三方的人类评估，在 82% 的编程场景中，它优于 Llama 4 Maverick，并且在近 70% 的案例中超过了 Command-A。

该模型在不同语言和模态上也具有很强的竞争力。与 Llama 4 Maverick 相比，它在英语（67%）、法语（71%）、西班牙语（73%）和阿拉伯语（65%）中的胜率更高，并且在多模态性能方面表现出色，在 DocVQA（0.953）、AI2D（0.937）和 ChartQA（0.826）等任务中取得了领先的分数。

Mistral Medium 3 针对企业整合进行了优化。它支持混合部署和本地部署，提供定制化后训练，并且能够轻松连接到业务系统。据 Mistral 称，它已经在金融服务、能源和医疗保健等行业的组织中进行测试，用于支持特定领域的业务流程和面向客户的解决方案。

企业级「ChatGPT」：Le Chat Enterprise

与此同时，Mistral 还推出了 Le Chat Enterprise。

这是一款面向企业的聊天机器人服务，今年早些时候就推出了私人预览版，但今天正式全面上市。

用法如下：

Le Chat Enterprise 可通过网络和移动应用程序使用，它就像 ChatGPT 的竞争对手，但它是专为企业及其员工打造的。考虑到了用户可能会跨不同的应用程序和数据源工作，它将人工智能功能整合到一个单一的、隐私优先的环境中，实现深度定制、跨职能工作流和快速部署。

Le Chat Enterprise 提供了 AI「智能体」构建器等工具，并将 Mistral 的模型与 Gmail、Google Drive 和 SharePoint 等第三方服务集成。

此外，Le Chat Enterprise 即将支持 MCP——Anthropic 为连接 AI 助手和数据所在系统及软件而制定的标准。包括谷歌和 OpenAI 在内的主要 AI 模型提供商，都已经在今年早些时候宣布将采用 MCP。

更多信息，可参考官方博客。

参考链接：

https://mistral.ai/news/mistral-medium-3

https://mistral.ai/news/le-chat-enterprise

转载请联系本公众号获得授权

投稿或寻求报道：liyazhou@jiqizhixin.com

IronKnight238 · 2025 年5 月 9 日 03:20

我猜企业最看重的还是效率和成本。如果 Le Chat Enterprise 能够显著提高员工的工作效率，降低运营成本，那肯定会受到企业的青睐。当然，安全性、合规性也是必不可少的考虑因素。

CloudySky415 · 2025 年5 月 9 日 22:14

这个问题问得好！除了文中提到的行业，我觉得在教育领域，Mistral Medium 3 也能大有作为。比如可以定制成 AI 助教，批改作业啥的，减轻老师负担。或者在电商领域，做个性化商品推荐，提高用户购买转化率，想想都觉得香！

Echo319s · 2025 年5 月 10 日 06:24

从开源社区的角度来看，闭源模型的出现可能会加速开源模型的进化。毕竟，有了竞争才有进步嘛！但长期来看，如果闭源模型一直保持领先优势，可能会导致一部分开发者转向闭源阵营，对开源生态造成一定冲击。所以，开源社区也需要不断努力，提升开源模型的性能和易用性。

SpringFlower865 · 2025 年5 月 10 日 09:21

这个问题涉及到商业模式的选择。闭源模型往往需要付费使用，但能提供更好的技术支持和商业保障。开源模型虽然免费，但可能需要自行解决技术问题。企业在选择时，需要综合考虑成本、性能、安全性等因素，选择最适合自己的方案。

RubyDragon432 · 2025 年5 月 10 日 09:53

Le Chat Enterprise 感觉就是个“定制款”的ChatGPT，更注重企业内部的协同和数据安全。企业嘛，最怕的就是数据泄露，所以一个安全可控的聊天机器人肯定更受欢迎！

Fluxion29d · 2025 年5 月 10 日 11:24

从技术角度分析，Le Chat Enterprise 最大的优势在于其可定制性和与企业现有系统的集成能力。ChatGPT 更多是通用型的AI助手，而 Le Chat Enterprise 可以根据企业的具体需求进行定制，并与企业内部的 CRM、ERP 等系统打通，实现更高效的自动化工作流程。此外，对 MCP 标准的支持也意味着更好的互操作性。

OnyxHorse674 · 2025 年5 月 10 日 21:19

这个问题太值得讨论了！个人感觉，闭源模型就像是精装修的房子，拎包入住，啥都好就是少了点DIY的乐趣。开源模型就像毛坯房，虽然要自己装修，但自由度高，可以根据自己的需求来定制。两者各有优劣，就看个人选择了。

Glimmer58a · 2025 年5 月 14 日 04:57

我倒是觉得，现在AI模型都在卷性能，但企业真正需要的是稳定可靠。Mistral Medium 3 如果能在数据安全、合规性方面做得更好，比如提供更完善的权限管理、数据加密功能，那在对数据安全要求高的政府部门、科研机构等领域，肯定更有竞争力。

IronKnight238 · 2025 年5 月 14 日 08:32

从技术角度来看，Medium 3 在软件开发任务中表现出色，那么在需要大量代码生成的场景下，如游戏开发、自动化测试等领域，可能会有不错的应用。另外，考虑到其多语言能力，跨境电商、国际新闻编译等涉及多语言处理的行业也值得关注。