DeepSeek V4要来了?万亿参数模型匿名开测引发猜测

OpenRouter上新神秘模型Hunter Alpha和Healer Alpha,或为DeepSeek V4?万亿参数+百万Token,免费尝鲜!

原文标题:DeepSeek V4真要来了?万亿参数模型匿名开测,免费跑龙虾

原文作者:机器之心

冷月清谈:

文章报道OpenRouter平台上新两款神秘模型:Hunter Alpha和Healer Alpha,引发社区广泛猜测。Hunter Alpha拥有1万亿参数和100万token上下文,专为智能体工作流设计;Healer Alpha为全模态交互模型,具备26万tokens上下文窗口,能够感知视觉和音频输入。两款模型目前均免费使用,但会记录用户提示词与生成结果用于模型改进。社区猜测这两款模型可能来自DeepSeek、小米等中国公司,但具体归属仍是谜团。

怜星夜思:

1、如果Hunter Alpha真的是DeepSeek V4,你认为它在哪些应用场景中最具优势?会给国内大模型格局带来什么影响?
2、Healer Alpha作为全模态模型,声称可以原生感知视觉和音频输入,你觉得它在哪些方面可能会超越现有的多模态模型?我们普通用户能如何利用这种能力?
3、OpenRouter 平台允许模型提供商记录用户提示词和生成结果,你如何看待这种做法?这对大模型的迭代优化有什么影响?作为用户,你会因此而避免使用这类模型吗?

原文内容

图片
机器之心编辑部

昨天晚上,推特博主「青龍聖者」发了一张截图,似乎「预示」了 DeepSeek V4 马上要来。



不过紧接着,这位博主进行了澄清,表示自己不确定上述截图信息是否真实,并判定另外一张显示 DeepSeek V4 更详细参数的截图为假消息。



而就在今天早上,全球知名大模型聚合平台 OpenRouter 突然上新了两个神秘模型,分别是Hunter Alpha「Healer Alpha」


前者为 1  万亿(1T+)参数和 100 万 token 上下文的大模型,专为智能体工作流、长周期复杂任务和深度工具调用设计;



后者为全模态交互模型,上下文窗口为 26 万 tokens,能够原生感知视觉和音频输入,跨模态进行推理,并以精确和可靠的方式执行复杂的多步任务。



其中,「Hunter Alpha」还专门强调,它具有 OpenClaw 等「龙虾」框架所需的可靠性和指令遵循精度。OpenRouter 的统计也显示,不少用户已经用这两个模型在跑「龙虾」了。




现在,和所有其他「隐身模型」一样,这两个模型都是免费的,并且模型提供商会记录它们的所有提示词与生成结果,这些数据可能会被用于改进模型。



它们到底是谁家的?


这两个神秘模型登场之后,社区里关于它们「到底是谁」的猜测便蔓延开来。


有人从对话风格入手,说 Healer Alpha 用起来有 Gemini 的「Google 味」,但也有人说它某些方面像 Claude。



还有人猜测它们是两款中国模型,其中 Healer Alpha 很可能是 DeepSeek V4 或 V4 Lite。




对于 1T 参数版本的 Hunter Alpha,猜测对象更多了,除了 DeepSeek V4,还有 Kimi K3、Grok 4.2、Claude 以及 GPT 5o 或 5.5 instant。毕竟,这么大的参数量和上下文组合,目前看来只有几家大厂能做到。






有人在通过 open-webui 实测之后猜测,「Hunter Alpha 可能来自 DeepSeek,Healer Alpha 可能来自小米(mimo 系列)。」



还有海外博主通过 OpenRouter 平台挖掘到 Hunter Alpha 来自中国的信息:



至于这两款模型究竟出自谁家,目前仍是谜团,答案只能等官方揭晓。


© THE END

转载请联系本公众号获得授权

投稿或寻求报道:liyazhou@jiqizhixin.com

我觉得可以理解,毕竟免费使用,肯定得付出一些代价。OpenAI之前也用类似的方法来改进模型。只要他们能明确告知用户数据的使用方式,并提供退出选项,我觉得是可以接受的。

超越现有模型?那得看它在跨模态推理上有多强了。如果Healer Alpha能真的做到理解图像和音频之间的深层联系,那在医疗诊断、工业质检这些领域应该大有可为。普通用户的话,也许可以用它来自动生成视频字幕、或者根据描述来搜索音乐。

这很明显是数据驱动的策略,通过收集用户数据来改进模型。但对于用户来说,隐私风险是存在的。如果你对隐私比较敏感,最好还是选择那些不记录数据的模型。

我更关注它在智能体方面的表现。如果它能够可靠地执行复杂任务,那么在自动化工作流程、智能客服等领域会有很大的应用前景。至于影响嘛,我觉得会促使国内大模型更加注重实际应用和落地。

数据是AI的燃料,没有数据,模型就无法进化。但如何平衡数据利用和用户隐私,这确实是一个难题。也许可以考虑使用差分隐私等技术来保护用户数据的匿名性。

感觉在需要复杂推理和长期记忆的任务上,DeepSeek V4 会很有优势,比如科研、金融分析或者游戏AI。如果它真的足够好,肯定会加速国内大模型市场的竞争,逼着其他厂商也得拿出真本事。

我更关心它的数据隐私问题。能够感知视觉和音频,意味着它能收集到很多敏感信息。提供方要如何保证用户的数据安全?这非常关键。

理论上,Healer Alpha 这种模型在无障碍辅助方面潜力巨大。比如,它可以帮助视障人士理解周围环境,或者帮助听障人士理解语音信息。当然,前提是它的准确性和可靠性足够高。

从技术角度看,万亿参数的模型对算力要求极高,DeepSeek如果能做到免费使用,背后肯定有强大的技术支撑。这可能会引发新一轮的算力竞争。但是,最终还是要看实际效果,如果只是参数大,能力不行,也没用。