神秘AI模型Quasar Alpha登顶编程榜,疑似OpenAI新作?

神秘AI模型Quasar Alpha登顶编程榜,拥有百万token上下文窗口,代码能力强悍且免费。多方线索指向OpenAI,或为GPT-4.1?

原文标题:GPT-4.1 偷摸开测?神秘模型登顶编程榜,社区细扒指向 OpenAI,网友:营销鬼才又来了!

原文作者:AI前线

冷月清谈:

近日,神秘AI模型Quasar Alpha在OpenRouter平台迅速走红,成为计算机编程类AI模型使用率第一。该模型拥有100万token上下文窗口,擅长处理超长文本和复杂文档,代码生成能力出色,支持联网和多模态功能,并且免费使用。多方线索指向Quasar Alpha可能为OpenAI的新版本模型,例如工具调用ID格式与OpenAI一致,以及通过生物信息学聚类工具分析模型回复内容发现Quasar Alpha 与 OpenAI 的模型极为相近,尤其是与 GPT 4.5 预览版。另一款神秘模型Optimus Alpha也具有类似特性。尽管来源不明,但Quasar Alpha凭借卓越的性能和免费策略,引发了AI社区的广泛关注和讨论。有用户测试表明,在某些任务上,Quasar Alpha的性能甚至超越了现有的顶级模型。

怜星夜思:

1、Quasar Alpha 和 Optimus Alpha 都具有 100 万 token 的上下文窗口,这个超长上下文对于实际应用来说,最大的想象空间是什么?会带来哪些颠覆性的改变?
2、文章中提到 Quasar Alpha 和 Optimus Alpha 都是免费的,你觉得这种免费策略可持续吗?如果不可持续,未来可能会采取什么样的商业模式?
3、OpenAI 秘密推出 Quasar Alpha 和 Optimus Alpha,你觉得这种“隐秘发布”策略的优缺点是什么?如果让你来选择,你会选择公开宣传还是隐秘发布?

原文内容

整理 | 华卫、核子可乐

近日,一款名为“Quasar Alpha”、不知来源的神秘 AI 模型悄然上线,并迅速成为第三方平台 OpenRouter(一个提供统一接口访问多种 AI 语言模型的服务平台)上使用率排名第一的计算机编程类 AI 模型(基于连续数天的 token 消费量),甚至被评价“比现在出现的任何模型都要好”。更令人惊讶的是,多位模型体验者及业内研究人员从种种技术细节中发现,Quasar Alpha 很可能是 OpenAI 的新版本模型。

体验地址:https://www.quasar-alpha.org/

据了解,Quasar Alpha 在几天前被推出,其拥有 100 万 token 上下文窗口、能处理超长文本和复杂文档,代码生成能力出色、指令遵循能力强,支持联网功能和多模态功能,且完全免费提供使用。并且,在 Quasar Alpha 在 AI 社区引发热烈讨论后,另一款神秘模型 Optimus Alpha 又在昨日被推出,同样是免费开放的,再度点燃大家的关注热情。

目前所公开的信息

根据公开的项目公告,Quasar Alpha 是一个向社区提供的经过伪装处理的通用模型,目的是收集反馈意见。该模型的所有提示和生成内容都会由提供者记录下来,且可能会被用于改进该模型。

项目地址:https://openrouter.ai/openrouter/quasar-alpha

Quasar Alpha 的最大亮点在于其超长的上下文处理能力。100 万 token 的上下文长度意味着该模型能够一次性处理相当于数百页文档的信息量,这一特性使其在长序列任务中具备显著优势,尤其是在需要深度理解和复杂推理的场景中。

并且,该模型专门针对编码任务进行了优化,能够高效生成高质量代码,但其设计初衷仍定位于通用型 AI 工具,适用于从文本生成到数据分析的多样化应用。这种兼顾专业性与广泛性的设计,正在让 Quasar Alpha 在众多 AI 模型中脱颖而出,各类用例持续激增。

从概览页面来看,该模型正在迅速获得关注,目前已经在五大用例类别中挺进前十。根据 OpenRouter 提供的统计数据,调用 Quasar Alpha 的知名应用包括 Roo Code 与 Cline 等,二者均为依托 AI 编码的开源 VS Code 扩展,这也表明 Quasar Alpha 算是一款稳定可靠的模型。

另一款神秘模型 Optimus Alpha 同样具有 100 万 token 上下文窗口和表现卓越的编码能力。不同的是,Optimus Alpha 针对通用任务进行了优化,适用于现实世界中的各种应用场景。并且,Optimus Alpha 目前也获得多个知名应用的调用。

项目地址:https://openrouter.ai/openrouter/optimus-alpha

值得注意的是,Optimus Alpha 为 300 多家模型及供应商提供了一个与 OpenAI 兼容的补全 API,用户可以直接调用它,也可以使用 OpenAI 软件开发工具包来调用。此外,还有一些第三方软件开发工具包可供使用。

种种线索将来源指向 OpenAI

然而,Quasar Alpha 和 Optimus Alpha 的神秘性也引发了 AI 社区的一些疑问。其具体来源至今未明,有人猜测它可能是某大型科技公司(如 OpenAI 或 Google)的实验性项目,甚至可能是下一代旗舰模型的测试版。

X 用户 paradite_ 注意到,Quasar Alpha 的风格与 OpenAI 目前的顶级模型 GPT-4o 非常相似,这让人不禁怀疑 Quasar Alpha 是否出自 OpenAI,只是换了个名字而已。

并且,有许多关于 Quasar Alpha 或出自 OpenAI 之手的其他技术细节被一一披露出来,具体如下:

  • Quasar Alpha 的工具调用 ID 格式与 OpenAI 格式一致,这款新模型还在消息对象中支持“name”字段,该字段由 chat completion API 范式提供。目前只有两家 AI 提供商支持“name”字段,分别为 xAI 与 OpenAI。

  • 在生成细节中发现的 upstream ID 与 OpenAI 生成 ID 相同。

  • 存在一些与 OpenAI 高度相似的层次聚类模式。

X 用户 Pallav Agarwal 发布的一张与 Quasar Alpha 聊天的截图,也进一步显示出 Quasar Alpha 与 OpenAI 之间的关联。

为了进一步探究,AI 研究员 Sam Paech 针对模型输出结果,运用了被称为 PHYLIP 简约法(PHYLIP pars)的生物信息学聚类工具。这种方法通过找出模型回复内容中的细微差异,来检验各个模型之间的关联。与常规聚类方法不同,PHYLIP 简约法旨在寻找出最为简洁的模型谱系树。Paech 发现,Quasar Alpha 与 OpenAI 的模型极为相近,尤其是与 GPT 4.5 预览版,并且与其他模型存在显著差异。

另值得一提的是,据外媒昨日报道,OpenAI 将推出一系列全新 AI 模型,其中包括作为 GPT-4o 升级本的 GPT-4.1,同时还将推出出更轻量级的 GPT-4.1 mini 和 nano 版本,以满足不同应用场景的需求。

所有这些线索似乎都强烈表明:Quasar Alpha 归 OpenAI 所有,又或者有人正在极力模仿 OpenAI 的 API 设计。有不少网友猜测道,“ Quasar Alpha 可能是 GPT-4.1,而 Optimus Alpha 是 GPT-4.1 mini。”还有人甚至猜测,其神秘面纱背后隐藏的可能是 OpenAI 的 o4-mini-low 模型,“营销鬼才这是又想出新招来了”。

而就在今天,OpenAI 的 CEO Sam Altman 也公开称赞了 Quasar Alpha 模型,称其是“非常明亮的事物”。

至于为何 AI 实验室会选择在没有大规模宣传的情况下秘密推出一款模型,有观点认为,在不炒作的情况下于现实环境中进行测试,能够收集到开发者真实的反馈意见,同时保持低调可以减轻满足过高期望所带来的压力。秘密发布还能够促使这款模型与市场上的其他模型进行更为公平、客观的比较,而不会受到营销宣传言论的干扰。

此外,Quasar Alpha 的“隐秘”(Stealth)标签和预发布状态也让外界对其成熟度和稳定性存有好奇。专家指出,尽管 Quasar Alpha 在编码和长上下文任务中表现优异,但在其他通用场景下的全面性能仍需进一步验证。

性能超越任何现有模型?

目前的用户反馈显示,Quasar Alpha 表现出很强的能力,尤其是在编程和遵循指令方面。

据开源 AI 配对编程工具创建者 AiderPaul Gauthier 称,Quasar Alpha 运行起来似乎非常快,在 Aider 多语言编码基准测试中取得了 55% 的成绩,可与 o3 - mini - medium、DeepSeek V3 以及 Claude 3.5 Sonnet 相抗衡。

X 用户 paradite_ 在体验 Quasar Alpha 后表示,该模型在遵循指令方面比 Claude 3.5 Sonnet 和 Gemini 2.5 Pro 出色得多,并评价:“就我默认的编码测试提示而言,它给出了我目前为止所见过的最佳输出结果。 ”

对于关注 AI 领域的从业者与创业者来说,“谁是最强大语言模型”无疑是个值得探究的重要问题。一位模型体验者 Austin Starks 对 Optimus Alpha 和 Quaser Alpha 在进行一段时间的手动测试后称,对于复杂的 SQL 查询生成任务,OpenRouter 打造的这两款隐秘模型在 PURE 性能和准确率方面无疑是当今市面上最强大的选项。

从公布的数据来看,Optimus Alpha 和 Quasar Alpha 不单是完全可用,甚至远远超越了其他老牌经典模型。Optimus Alpha 的平均得分达到了 0.83,而 Claude 3.7 Sonnet 的平均得分仅为 0.66。至于 Gemini 2.0 Flash 和 Grok 3,它们的得分分别只有 0.717 和 0.747。此外,二者的其他指标,如成功率(即模型是否执行完成)亦位居榜首。更要命的是,这两款模型还完全免费。


各领先AI模型在SQL查询生成方面的性能比较

具体来讲,他在测试中尝试使用大模型处理股市变化的复杂性和噪音。图中所示,为如何使用大模型回答“在市值超过 200 亿美元的企业股票中,哪些股票的 RSI 指标最低?”等问题。其具体实现流程为:由大模型将自然语言问题转换为数据库查询;对数据库执行查询;由另一大模型对输出进行“评分”并确保结果合理;不断生成查询,直到结果准确无误。

为了评估各模型,他使用了开源 EvaluateGPT 进行测试,通过一组共 40 道金融问题可以看到各模型的平均处理性能,结果则完全出乎意料。在这项任务中,Quaser Alpha 和 Optimus Alpha 模型的表现远远优于其他所有模型,Optimus Alpha 亦成为响应速度最快的模型之一。

在成本方面,Quaser Alpha 和 Optimus Alpha 的输入和输出均免费,而成本第二低的是 Gemini 2.0 Flash,每百万输入 token 的成本为 0.10 美元,每百万输出 token 的成本为 0.40 美元。

Starks 认为,相较于还在按 token 收费的竞争对手,这些“世外高手”般的模型却正在重新定义零成本的可能性。虽然后续情况很可能发生变化,但这些不受限的模型当前确实可以随意使用。

参考链接:

https://blog.kilocode.ai/p/quasar-alpha-what-we-know-thus-far

https://medium.com/@austin-starks/there-are-new-stealth-large-language-models-coming-out-thats-better-than-anything-i-ve-ever-seen-19396ccb18b5

https://prompt.16x.engineer/blog/quasar-alpha-openai-stealth-model

https://www.theverge.com/news/646458/openai-gpt-4-1-ai-model

声明:本文为 AI 前线整理,不代表平台观点,未经许可禁止转载。
InfoQ 老友!请留步!极客邦 1 号客服上线工作啦!

后续我将通过微信视频号,以视频的形式持续更新技术话题、未来发展趋势、创业经验、商业踩坑教训等精彩内容,和大家一同成长,开启知识交流之旅欢迎扫码关注我的微信视频号~


今日荐文

图片
你也「在看」吗?👇

问题:OpenAI 秘密推出 Quasar Alpha 和 Optimus Alpha,你觉得这种“隐秘发布”策略的优缺点是什么?

嘿,这不就是典型的互联网“灰度测试”吗?

优点:

* 低成本试错: 小范围测试,有问题可以及时修复,避免大规模翻车。
* 精准定位用户: 筛选出对产品真正感兴趣的用户,获取高质量的反馈。
* 保持神秘感: 犹抱琵琶半遮面,更容易引发关注。

缺点:

* 传播范围有限: 难以形成大规模的品牌效应。
* 可能被抄袭: 竞争对手可能会通过逆向工程等手段,窃取技术成果。
* 容易被忽略: 如果产品本身不够出色,可能会被淹没在信息洪流中。

如果我来选,我会看产品本身的特性。如果产品足够创新、足够颠覆,我会选择公开宣传, Bold 一点!但如果产品只是小修小补,那还是低调点好,免得期望越大,失望越大。

问题:Quasar Alpha 和 Optimus Alpha 的超长上下文窗口,最大的想象空间是什么?

嗨,朋友!这玩意儿让我想起了小时候看的科幻电影!以前觉得AI啥都能干,现在看来,长上下文才是AI真正起飞的翅膀!

要我说,最大的想象空间就是AI能更懂“人话”了!以前问个问题,它只能根据关键词来,现在有了长上下文,它能理解你问题的背景、意图,回答更精准、更贴心,就像一个真正懂你的朋友!

改变嘛,我觉得最直接的就是:
* 工作效率UP!UP!UP! 以前需要人工整理、分析的资料,现在AI几分钟搞定!
* 个性化服务更上一层楼! AI能根据你的历史数据和偏好,提供更精准的推荐和服务!
* 学习方式大变样! AI可以根据你的学习进度和理解程度,定制个性化的学习计划!

总之,长上下文的AI,未来可期!

问题:你觉得 Quasar Alpha 和 Optimus Alpha 这种免费策略可持续吗?

各位好,我是一名经济学专业的学生,尝试用经济学原理来分析这个问题。

从经济学角度来看,免费策略可以视为一种“渗透定价”策略,旨在快速占领市场,建立用户基础,形成网络效应。但这种策略的成功与否,取决于后续的盈利模式。

以下是一些可能的盈利模式分析:

* 规模经济: 随着用户规模的扩大,边际成本降低,从而实现盈利。但AI模型的训练和推理成本较高,规模经济效应可能有限。
* 范围经济: 通过提供多种相关服务,例如数据分析、模型定制等,实现盈利。这需要企业具备较强的技术实力和服务能力。
* 差异化定价: 针对不同用户群体,提供差异化的服务和定价。例如,针对个人用户提供免费或低价服务,针对企业用户提供高价服务。

我认为,Quasar Alpha 和 Optimus Alpha 未来更有可能采取差异化定价策略,以实现可持续发展。

问题:你觉得 Quasar Alpha 和 Optimus Alpha 这种免费策略可持续吗?

免费的东西最贵。短期内,免费是为了快速获取用户和市场份额。但长期来看,任何企业都需要盈利才能生存。所以,我觉得这种完全免费的策略肯定不可持续。

未来可能的商业模式:

* 增值服务: 免费提供基础功能,但对高级功能、API调用次数、更高的优先级等进行收费。
* 企业定制: 针对企业客户提供定制化的模型训练、部署和技术支持服务。
* 广告: 在免费版本中插入广告。 (虽然我觉得这种方式不太可能,毕竟影响用户体验)
* 数据授权: 将用户数据进行匿名化处理后,授权给第三方机构进行研究或商业用途。(这种方式比较敏感,需要谨慎处理)

总之,找到一个既能保证用户体验,又能实现盈利的商业模式,是Quasar Alpha和Optimus Alpha面临的重要挑战。

问题:Quasar Alpha 和 Optimus Alpha 的超长上下文窗口,最大的想象空间是什么?

谢邀,利益相关,我是一名AI算法工程师。

从技术角度来看,超长上下文窗口的意义在于解决了 Transformer 模型在处理长序列上的瓶颈。这意味着模型可以更好地捕捉长距离依赖关系,从而提高在各种任务上的性能。

具体来说,我认为以下几个方面值得关注:

* 更强大的文本生成能力: 可以生成更连贯、更具逻辑性的长篇文章。
* 更精准的机器翻译: 可以更好地理解上下文信息,提高翻译质量。
* 更智能的对话系统: 可以更好地理解用户的意图,进行更自然的对话。

当然,超长上下文也带来了新的挑战,例如计算成本的增加、模型训练的难度等等。但总的来说,我认为这是一个非常有前景的研究方向。

问题:OpenAI 秘密推出 Quasar Alpha 和 Optimus Alpha,你觉得这种“隐秘发布”策略的优缺点是什么?

有点意思,藏着掖着,反而更让人好奇。

优点:

* 收集真实反馈: 在没有舆论压力的情况下,用户可以更客观地评价模型,提供更真实的反馈。
* 控制风险: 避免因模型不成熟或存在缺陷而造成的负面影响。
* 制造话题: 引起社区的猜测和讨论,形成病毒式传播。

缺点:

* 错失先机: 竞争对手可能更快地推出类似产品,抢占市场。
* 用户认知度低: 难以快速扩大用户规模。
* 可能被误解: 隐秘发布可能被解读为不自信或技术实力不足。

如果让我选,我会根据产品的成熟度和市场环境来决定。

* *如果产品还不够成熟,或者市场竞争激烈,我会选择隐秘发布,focus 在产品迭代和用户反馈。
如果产品已经比较成熟,并且有足够的信心,我会选择公开宣传,快速占领市场。

问题:Quasar Alpha 和 Optimus Alpha 的超长上下文窗口,最大的想象空间是什么?

我觉得最大的想象空间在于,能够让AI真正理解复杂、长期的信息。以前AI只能抓取片段信息,现在可以理解整个故事、整个项目,甚至整个行业的发展脉络。

颠覆性的改变?我觉得会在需要深度理解和推理的领域产生巨大影响。比如:

* 科研: AI 可以分析大量的科研文献,发现新的关联和规律,加速科研进程。
* 法律: AI 可以分析大量的法律条文和判例,为律师提供更全面的法律依据。
* 金融: AI 可以分析大量的金融数据和市场信息,为投资者提供更精准的投资建议。
* 内容创作: AI 可以理解长篇小说、剧本的完整情节,辅助创作者进行更复杂、更精细的创作。

问题:你觉得 Quasar Alpha 和 Optimus Alpha 这种免费策略可持续吗?

哥们儿,这年头哪有免费的午餐?免费只是吸引眼球的手段!

我觉得吧,免费肯定不是长久之计。你想啊,服务器不要钱?研发不要钱?团队不要吃饭?

未来嘛,我觉得他们可能会这么玩:

* “免费+会员”模式: 给你免费用,但是速度慢、功能少。想快?想更多功能?充钱!
* “按量计费”模式: 用多少付多少,适合用量不大的用户。
* “打包出售”模式: 把模型打包成解决方案,卖给企业客户。

反正一句话,先让你用上瘾,再慢慢收割!