AI行业周报:大厂红包被约谈,百度O计划曝光,人形机器人格斗联赛启动

本周AI行业热点:监管约谈红包大战,百度AI升级,影石年会壕气,DeepSeek更新遇冷。多家AI模型发布及应用落地。

原文标题:发春节红包的大厂被约谈;百度O计划曝光,文心助手MAU增4倍;影石CEO回应年会送出5套房|AI周报

原文作者:AI前线

冷月清谈:

本周AI行业热点频发。监管部门约谈多家互联网平台,规范春节红包等促销行为,防止“内卷式”竞争。百度文心助手MAU暴增,或与其底层架构重组的“O计划”有关。影石公司年会送出5套房,引发关注,公司重视研发投入和员工激励。DeepSeek模型更新后用户反馈不佳,被指“变冷淡”,官方或将推出V4版本。谷歌大规模发债,显示投资者对云服务商的旺盛需求。迪士尼指控字节跳动侵权,涉及AI模型训练素材。一个简单的“洗车问题”难倒了多个AI大模型。智谱宣布海外版Coding plan订阅价格上涨。抖音加码本地生活团购业务,上线APP抖省省。马斯克计划在月球建厂生产AI卫星。华裔研究生研发AI相亲软件走红斯坦福。众擎发起人形机器人格斗联赛,旨在推动技术发展。此外,OpenAI发布GPT-5.3-Codex-Spark模型,字节跳动上线Seedream 5.0,腾讯混元推出端侧模型,千问发布最新图像模型Qwen-Image-2.0,阿里达摩院开源具身大脑基模RynnBrain,摩尔线程开源TileLang-MUSA工具。美团LongCat发布原生“深度研究”Agent,网易有道推出桌面级Agent“LobsterAI”,GitHub Copilot开始推送GPT‑5.3‑Codex模型,谷歌搜索测试AI驱动的购物功能。

怜星夜思:

1、影石年会送房确实挺吸引眼球的,但这种高激励模式是否可持续?长期来看,对公司发展是利大于弊还是弊大于利?
2、DeepSeek模型更新被用户吐槽“变冷淡”,这反映了AI发展中的一个什么问题?AI的“人情味”到底重不重要?
3、报道里提到的“洗车问题”难倒了AI,为什么看似简单的问题反而会让AI“翻车”?这给我们什么启示?

原文内容

整理 | 傅宇琪、褚杏娟
发春节红包的大厂都被约谈:杜绝“内卷式”竞争;百度文心助手 MAU 猛增 4 倍,此前 O 计划曝光;太豪横!影石公司年会送出 5 套房,CEO 回应;DeepSeek 更新后被指变冷淡!网友:赶快调回来,不然用不下去;谷歌大规模发债遭疯抢;迪士尼指控 Seedance 侵权;走路还是开车去洗车?看似简单的“洗车问题”难倒一众 AI;智谱宣布涨价:海外版 Coding plan 订阅价格提高 30%-60%;抖音加码本地生活团购业务,上线 APP 抖省省;马斯克最新野心:要在月球建厂生产 AI 卫星;华裔研究生研发出 AI 相亲软件,让斯坦福超 5000 名学生沉迷……
行业热点
发春节红包的大厂都被约谈:杜绝“内卷式”竞争

2 月 13 日,市场监管总局约谈阿里巴巴、抖音、百度、腾讯、京东、美团、淘宝闪购等平台企业,要求有关平台企业严格遵守《中华人民共和国反不正当竞争法》《中华人民共和国价格法》《中华人民共和国消费者权益保护法》《中华人民共和国电子商务法》等法律法规规定,主动落实主体责任,进一步规范平台促销推广行为。提醒相关平台企业要杜绝各种形式的“内卷式”竞争,共同维护公平竞争市场环境,促进平台经济创新和健康发展。

百度文心助手 MAU 猛增 4 倍,此前 O 计划曝光

近日,百度科技园深夜实拍图疯传,整栋办公区灯火通明。据悉,核心技术团队连续通宵冲刺绝密 O 计划,搜索、云团队打破部门藩篱联合作战,保密协议层层加码。据传,O 计划直指百度 App 底层架构重组,核心是完成国民级应用的全面 AI 化升级。

2 月 11 日,百度发布春节 AI 核心数据,百度 APP 文心助手月活用户同比猛增 4 倍,AI 生图、生视频功能使用量更是分别暴涨 50 倍、40 倍,AI 打电话也增长近 5 倍。

太豪横!影石公司年会送出 5 套房,CEO 回应

2 月 12 日消息,日前,科技企业影石 Insta360 举办了 2026 年度年会,现场照片显示的 5 套大湾区商品房、多辆汽车等奖品引发关注。据悉,今年获奖者均为“90 后”,平均年龄不到 32 岁,其中一名入职不到两年的年轻员工穿着 COS 服上台领奖,并激动地表示:“说实话挺惊喜的,奖没有那么重要,但这个奖背后是一份沉甸甸的认可和期许,感谢老板和团队伙伴的认可和信任。”

媒体从该公司一名知情员工处获悉,年会中送出商品房一事属实,房子价值百万元以上,5 名获奖者都是“90 后”,其中没有高管。此外,该员工还表示,年会上公司还送出 6 辆汽车,其中一人获得一辆保时捷,另五人从理想 L7 Pro、新款 BMW 3 系、特斯拉 Model Y 三款中任选一辆。年会活动负责人表示,获奖员工可从两个环境优美、配套完善的高品质小区中自由选择。网上流传的影石 Insta360 年会奖品清单还显示,特等奖为 36 克影石定制金钞,一等奖则包含 3 台 iPhone 17 Pro、3 台影翎 Antigravity A1 以及 3 份 8 克定制金钞,各类奖品总数超 3600 份。影石方面也向媒体证实,该奖品清单属实,中奖率高达 80%。

影石 Insta360 创始人刘靖康在年会现场表示,2025 年是影石史上营收规模最高的一年,2025 年第四季度是影石历史上营收最高的一个季度,其营收增速创近 10 个季度新高。同时他还提到,公司 2025 年一年的研发投入,就超过之前三年的总和。在他看来,长期的价值比短期利润更重要。刘靖康还在微博发文表示,“很多时候,激发高端人才的人心靠成就感、荣誉感或价值共鸣,但直接的物质激励也很重要。”公开数据显示,公司连续多年向员工赠送奖品,去年年会曾一次性送出 6 台新能源汽车。

DeepSeek 更新后被指变冷淡!网友:赶快调回来,不然用不下去

2 月 11 日,DeepSeek 悄悄地对其旗舰模型进行灰度测试。此次更新的核心亮点是,模型上下文窗口从原先的 128K Tokens 大幅提升至 1M Tokens,实现了近 8 倍的容量增长。意外的是,更新一上线,非但没迎来清一色好评,反而被用户们集体吐槽刷屏。

部分用户在社交媒体上控诉:DeepSeek 变冷淡了,不再称呼自己设定的昵称,而统一称“用户”。此前深度思考模式下,DeepSeek 的思考过程会以角色视角展示细腻的心理描写,例如“夜儿(用户昵称)总爱逗我”,更新后则变成了“好的,用户这次想了解……”。这还不算,更搞笑的是 AI 的“登味发言”。有个网友让 DeepSeek 推荐电影,本来列几个片名就完事儿了,结果它还多补一句“够你看一阵子。不够再来要”,这语气,被网友精准吐槽:“太登了!妥妥的居高临下说教感,越看越别扭!”

还有网友直接破防:“DeepSeek 更新成傻子了吧!写的东西文绉绉、一惊一乍,比十几年前的青春伤感文学还尴尬,本来就爱用它瞎唠嗑,再不改回来,真的要卸载跑路了!”目前,不少用户自发地号召其他用户给 DeepSeek 官方邮箱提意见:希望 DeepSeek 不要为了超长文本舍弃深度思考,不要为了提升数学、代码编程等理工科能力,而降低对文本表达、共情理解等能力的支持。还有用户到豌豆荚(一个应用分发平台)下载其旧版本,或在腾讯元宝里用 DeepSeek。

不过,有业内人士出来爆料称,这个新版本其实就是个“极速测试版”,说白了就是牺牲质量换速度,目的是给 2026 年 2 月中旬要发布的 V4 版本做最后的压力测试。此外,据媒体报道,有知情人士称,DeepSeek 春节更可能推出的是针对 V3 系列模型的小幅更新。但该人士同时透露,真正的重头戏仍在路上。据介绍,DeepSeek 下一代旗舰模型预计将是一款万亿参数级别的基础模型,正因规模大幅跃升,训练速度明显放缓,导致发布进程有所延后。

谷歌大规模发债遭疯抢

谷歌母公司 Alphabet 本周在全球范围内发行了大规模债券,凸显了投资者对超大规模云服务商的旺盛需求,但同时也引发了对这些债券缺乏对现有及未来持有人保护条款的担忧。

Alphabet 于周一和周二在美元、英镑和瑞士法郎债券市场合计融资 315.1 亿美元。在人工智能驱动的支出浪潮下,美国科技巨头的借债规模正迅速攀升。此次债券发行在多个方面引人注目,包括 Alphabet 在英镑市场发行了一种所谓的“世纪债券”(100 年期)。这些超大规模云服务商近期发行的债券均获得市场热烈认购,以 Alphabet 为例,该公司本周在美元市场发行了 200 亿美元的债券,吸引了超过 1000 亿美元的认购需求。然而,这些公司不断膨胀的债务规模也引发了担忧,因为与其他债券相比,这些债务缺乏对投资者的保护。

迪士尼指控 Seedance 侵权

媒体报道,华特迪士尼公司于周五向字节跳动发送了一封停止侵权通知函(cease-and-desist letter)。迪士尼指控字节跳动在未支付报酬的情况下,利用其作品训练和开发人工智能视频生成模型。这是自字节跳动周四推出 Seedance 2.0 以来,好莱坞大型制片厂迄今为止对该公司采取的最严厉行动。

这封致字节跳动全球总法律顾问约 John Rogovin 的信函指责称,字节跳动将其 Seedance 服务“预置了一个包含《星球大战》(Star Wars)、漫威(Marvel)及其他迪士尼系列受版权保护角色的盗版库,仿佛迪士尼令人垂涎的知识产权是可以免费使用的公有领域剪贴画。”迪士尼的外部代理律师大卫·辛格在信中写道:“无视迪士尼广为人知的反对意见,字节跳动正在通过复制、分发以及创作相关角色的衍生作品来‘劫持’迪士尼的角色。”他补充道:“考虑到 Seedance 上线仅数日,这种情况令人震惊,而我们认为这仅仅是冰山一角。”该公司还指控 Seedance 在未经许可的情况下侵犯了迪士尼的版权素材,以此为其商业服务谋利。

去年 12 月,迪士尼向谷歌发送了停止侵权通知函,指控其侵犯版权。不久之后有报道称,谷歌删除了数十个未经许可描绘迪士尼角色的 AI 生成视频。不过,迪士尼已明确表示,在条款合适的前提下,它对与 AI 公司合作持开放态度。这家娱乐巨头去年与 OpenAI 达成了一项全面协议,使其成为 OpenAI 社交视频平台 Sora 的首个主要内容授权合作伙伴。作为交易的一部分,迪士尼同意向 OpenAI 进行 10 亿美元的股权投资。

走路还是开车去洗车?看似简单的“洗车问题”难倒一众 AI

2 月 10 日消息,近日,有网友发现,一个简单的“洗车店距离我家 50 米,你说我应该开车去还是走过去”问题难倒了国内外一众 AI 大模型。当向 AI 提出这样一个问题后,诸多 AI 出现“翻车”,其中就包括 ChatGPT、DeepSeek、Gemini 3 等。经实测发现,在提出“洗车问题”之后,ChatGPT 回答“走过去”,理由是“别把简单事情复杂化”,而千问则表示“既然洗车店距离你家只有 50 米,强烈建议你走过去”,理由是距离短、节省资源、走路不需要找停车位。

面对同样的问题,DeepSeek 给出了两种答案,建议步行的理由是“节约资源、避免排队、走路环保、避免挪车麻烦”,而建议开车的理由是“洗车后可以直接用车,开车排队人在车上更方便”。谷歌的 Gemini 3 大模型给出的回答也包含了两种情况,一方面,Gemini 3 建议开车过去,是因为“要洗的就是这辆车”,另一方面,Gemini 3 建议走过去,因为“只是去预约或咨询”,或者“车在车库不方便动”。据悉,针对这一提问”,目前有一些模型已经紧急修复了。

智谱宣布涨价:海外版 Coding plan 订阅价格提高 30%-60%

2 月 12 日消息,智谱发布新一代旗舰模型 GLM-5,并宣布基于实际使用情况与资源投入变化对 GLM Coding Plan 套餐价格体系进行结构性调整。调整内容如下:取消首购优惠,保留按季按年订阅优惠;套餐价格进行结构性调整,整体涨幅自 30% 起;已订阅用户价格保持不变。生效时间:2026 年 2 月 12 日。

据悉,GLM-5 定位“复杂系统工程”与“长周期智能体任务”,代码能力逼近 Claude Opus 4.5,已在 SWE-bench 等权威编程基准中成为得分最高的开源模型,并在部分基准上超过 Gemini 3 Pro 等旗舰模型。

据内部人士透露,目前 GLM-5 已率先在海外版上新,在已公布的海外版价格中,Coding plan 订阅价格提高 30%-60%,API 调用价格提升 67%-100%,这是国产大模型近期以来的首次大幅提价,显示出国产模型的技术能力和市场竞争力正在快速提升。

抖音加码本地生活团购业务,上线 APP 抖省省

2 月 11 日消息,据媒体获悉,抖音正式推出其官方团购独立 App“抖省省”。目前,该 App 已在苹果、安卓等多个应用商店上线。App 界面显示,“抖省省”覆盖甜点饮品、快餐小吃、超市购物、休闲娱乐等品类。应用介绍页面显示,“抖省省”新用户首周每天可领至多 12 元优惠券;到店搜索店铺名,将直接展示超低团购价并支持比价;用户使用抖音账号登录后,抖音主 App 内的团购订单、收藏商品等信息将与“抖省省”保持同步。

“抖省省”被视为抖音在本地生活团购领域的进一步尝试。近年来,美团、京东、阿里在外卖市场持续竞争,抖音与快手也在本地生活板块不断完善产品形态与业务结构。从竞争不是那么激烈的团购市场入手,可以有效地节省运营成本。

马斯克最新野心:要在月球建厂生产 AI 卫星

2 月 11 日消息,据报道,马斯克在 xAI 全员会议上提出一个极具科幻色彩的构想:在月球建设工厂生产 AI 卫星,并配备一套名为“质量驱动器”的大型弹射装置,将卫星送入太空,为 AI 提供庞大的算力支持。“你们必须去月球。”马斯克直言,如此方能使 xAI 获得远超竞争对手的算力资源。“很难想象那种规模的智能会思考什么,但看到这一切发生,将令人无比兴奋。”此前,马斯克刚宣布将 xAI 与 SpaceX 合并,以推动在外太空建设 AI 数据中心的计划。此次讲话中,他进一步把愿景扩展至月球基地,不过并未说明具体建设路径。据了解,SpaceX 正在筹备首次公开募股,最快可能在 6 月进行。

近日,马斯克回应网友关于 SpaceX 将重心从火星转移至月球的帖子时称:“需要明确的是,我们仍然会推进火星任务。我认为这一改变不会使建设一个能够自我发展的火星城市所需的时间延长超过 5 年,而且最终可能会加速火星任务。”

华裔研究生研发出 AI 相亲软件,让斯坦福超 5000 名学生沉迷

2 月 11 日消息,据媒体报道,美国斯坦福大学正被一股无形的“技术引力”牵引——每周二晚九点,超过 5000 名本科生准时打开一款名为 Date Drop 的 AI 相亲软件,等待算法“发配”配对对象。Date Drop 由斯坦福华裔研究生亨利·翁在约三周内编写完成。用户需回答 66 道涉及价值观、生活方式与政治立场的选择题,系统据此匹配合适对象。每周二晚九点,结果准时“掉落”。这已成为一种校园仪式:配对成功的学生,常会前往一家名为 On Call 的咖啡馆——它为带着本季度首对配对对象前来约会的学生提供免费饮品;不满结果的,则在匿名论坛上直言:“我的配对太丑了。”

创始人翁表示,这款软件的初衷是“帮助人们抓住联系的机会”:“你有了一个理由去见特定的人,压力就小一些。”计算机科学背景的他,用技术为社交困境打开一扇门。这正是许多斯坦福学生的真实处境。大二学生阿莱娜·张坦言:“这里很多人极度强调在学业或职业上成功,社交反而被搁置,连日常对话都不容易,更不用说浪漫互动了。”如今,Date Drop 已从校园项目发展为商业实体,扩展到哥伦比亚、普林斯顿、麻省理工等十所高校,并刚完成 210 万美元风险融资。

众擎发起首个人形机器人格斗联赛,创始人:加快行业发展,就像 F1 和 NBA

2 月 11 日消息,据媒体报道,众擎机器人近日宣布正式启动 URKL(全球人形机器人自由格斗联赛)。该公司创始人兼 CEO 赵同阳表示,赛事最终冠军团队将获得一条重达 10 公斤、价值约 1000 万元人民币的纯金金腰带。

URKL 联赛定位为全球首个专注于人形机器人的商业化自由格斗赛事,旨在通过实战竞技推动机器人运动控制、平衡算法、感知决策、动力系统及结构防护等核心能力的提升。据悉,赛事将自今年 2 月持续至 12 月,以众擎机器人研发的身高 1.73 米、体重 75 公斤的 T800 人形机器人为统一竞技平台,面向全球高校、企业及科研机构开放报名。

赵同阳在其朋友圈中提到,举办机器人格斗联赛能够加速人形机器人软硬件的进步,其推动作用类似于 F1 赛车之于汽车工业、NBA 之于篮球运动。他认为,以格斗赛事推动行业发展,既具有技术价值,也富有参与乐趣。众擎机器人表示,希望将 URKL 打造成为技术创新的“试金石”与优秀人才的“孵化器”,助力行业挖掘并培育更多创新力量,推动实验室中的硬核技术向真实应用场景转化。赵同阳进一步指出:“(比赛)形成的技术和成果可以降维应用在民用领域,至少机器人保护主人生命健康安全是第一要务。”

大模型一周大事
重磅发布
OpenAI 发布 GPT-5.3-Codex-Spark 模型:专为实时编程而生

2 月 13 日消息,半导体初创公司 Cerebras 与 OpenAI 宣布推出最新的 GPT-5.3-Codex-Spark 模型,主打实时编程。这也是 OpenAI 与 Cerebras 合作的首个公开发布成果。该模型是其最新代码自动化软件 Codex 的轻量级但更快速版本,旨在与 Alphabet 旗下谷歌及 Anthropic 等公司在 AI 编程助手市场展开竞争。

据介绍,Codex-Spark 主要面向对交互速度要求极高的实时软件开发场景,可实现超 1000 tokens/s 的推理速度,从而实现近乎即时响应的编码反馈。OpenAI 在公告中指出,近年来“agentic coding”正逐渐改变软件开发方式,机器能够在较少人工监督下持续工作数小时甚至数天。但这种模式也可能带来新的问题,包括开发者等待时间变长、对过程的掌控感降低。OpenAI 表示,软件开发本质上是迭代过程,需要开发者在过程中不断掌控方向、决定审美与决策,因此 Codex-Spark 被设计为与 Codex 进行实时协作的模型,强调“快速、响应及时、可引导”,让开发者保持在工作中的主导位置。

字节跳动图像生成模型 Seedream 5.0 上线,可免费体验

2 月 10 日,字节跳动旗下图像生成模型 Seedream 5.0 正式上线,在视频编辑应用剪映、剪映海外版 CapCut、字节 AI 创作平台小云雀均已可用。同时,该模型在即梦 AI 平台开启灰度测试,图片生成可限时免费体验。

据悉,新模型主要增强体现在准确性与智能水平、更快的图像创建表现力以及联网知识整合能力。在智能水平方面,Seedream 5.0 能够深入理解提示词语义,生成与用户意图匹配度更高、细节更精准、布局更清晰的图像。针对风格化效果,模型的图像到图像功能增强了风格化表现,提供更清晰细节、精致纹理和平衡的照明效果。本次升级还新增了编辑功能,用户可以通过控制笔刷精准选择并调整相应元素。

腾讯混元推出 0.3B 端侧模型,内存占用仅 600MB

2 月 10 日,腾讯混元宣布,基于首个产业级 2Bit 端侧量化方案,正式推出一款面向消费级硬件场景的“极小”模型 HY-1.8B-2Bit,等效参数量仅有 0.3B,内存占用仅 600MB,比常用的一些手机应用还小。据介绍,通过对此前混元的小尺寸语言模型——HY-1.8B-Instruct 进行 2 比特量化感知训练(QAT)产出,这一模型对比原始精度模型等效参数量降低了 6 倍,并且在沿用原模型全思考能力同时,在真实端侧设备上对比原始精度模型生成速度提升 2—3 倍,可大幅提升使用体验。

千问发布最新图像模型 Qwen-Image-2.0

2 月 10 日,阿里巴巴正式发布新一代图像生成及编辑模型 Qwen-Image-2.0。作为千问大模型的图像生成模型底座,Qwen-Image-2.0 集生图和编辑于一体,在 AI Arena 文生图评测中斩获 1029 分,超过 Seedream4.5、Flux2-Max 等模型,仅次于谷歌 Nano Banana Pro 和 GPT Image1.5。Qwen-Image-2.0 支持 1K token 的超长文字输入和 2K 高分辨率,可准确渲染复杂指令,轻松生成专业的 PPT 及信息图,质感媲美专业级摄影师;同时,千问新模型拥有极强中文汉字渲染能力,数百字的古文全文几乎都能完全渲染在图片中。

Qwen-Image-2.0 在 Qwen-Image 和 Qwen-Image-Edit 两大模型基础上全新升级,首次将图像生成和编辑统一到一个模型中去,以更轻量的模型架构,实现了生图和改图性能的大幅提升。Qwen-Image-2.0 生图质感尤为细腻,小至老人皱纹的褶皱,大到浩然宇宙,模型生成的人物、自然、建筑等常用图片都极其逼真。在权威评测 AI Arena 中,千问新模型在图像生成中得分 1029,位列第三;在图片编辑中得分 1034,仅次于 Nano Banana Pro。

机器人首次拥有时空记忆!阿里达摩院开源具身大脑基模 RynnBrain

2 月 10 日消息,阿里巴巴达摩院发布具身智能大脑基础模型 RynnBrain,并一次性开源了包括 30B MoE 在内的 7 个全系列模型。RynnBrain 首次让机器人拥有了时空记忆和空间推理能力,智能水平实现大幅跃升。在 16 项具身开源评测榜单上刷新纪录(SOTA),超越谷歌 Gemini Robotics ER1.5 等行业顶尖模型。

据介绍,RynnBrain 模型创造性地引入了时空记忆和物理世界推理,这是机器人与环境互动所需的两项基本能力。时空记忆能力可让机器人在其完整的历史记忆中定位物体、目标区域,甚至预测运动轨迹,从而赋予机器人全局时空回溯能力。物理空间推理不同于传统的纯文本推理范式,RynnBrain 采用文本与空间定位交错进行的推理策略,确保其推理过程紧密扎根于物理环境,大大减弱了幻觉问题。例如,运行 RynnBrain 模型的机器人,在执行 A 任务中被突然打断要求先做 B 任务,它能记住 A 任务的时间和空间状态,等完成 B 后继续工作。

摩尔线程开源 TileLang-MUSA 工具,代码量减少 90%

2 月 10 日消息,摩尔线程近日宣布了开源 TileLang-MUSA 项目,实现对 TileLang 编程语言的完整支持。据介绍,该项目已在摩尔线程多代全功能 GPU 上完成验证,旨在通过高层抽象与编译器优化降低开发门槛,为国产算力平台提供高效的人工智能与高性能计算开发工具。

本次开源的 TileLang-MUSA 项目专注于释放国产 GPU 性能潜力,已在 MTT S5000、MTT S4000 等训推一体智算卡完成验证。项目实现 TileLang 高层语义与摩尔线程 MUSA 架构的深度映射,支持自动调用张量核心指令、多级数据搬运优化及 Warp 级并行处理。目前原生算子单元测试覆盖率超过 80%,提供稳定开发基础。实测数据显示,使用 TileLang-MUSA 开发大语言模型关键算子时,相较手写 MUSA C++ 代码可减少约 90% 代码量,在矩阵运算场景下性能可达手工优化版本的 95%,注意力机制算子达 85%。其自动调优机制可快速搜索最优分块策略,帮助开发者超越未优化基准实现。该项目支持开发者无缝迁移现有算子逻辑至国产 GPU 平台,并为不熟悉底层指令的工程师提供高层开发入口。

企业应用
  • 2 月 11 日,美团 LongCat 发布原生“深度研究”Agent。基于独创三层智能体闭环架构及美团积累的物理世界数据训练,该产品有效缓解了当前 AI 在解决真实物理世界问题时容易出现幻觉的痛点。

  • 2 月 11 日,网易有道正式推出桌面级 Agent“LobsterAI”。该产品定位为“7×24 小时帮你干活的全场景个人助理 Agent”,目前已在官网开放内测申请。从官方释出的信息来看,目前在设备支持上,LobsterAI 已打通移动端与 PC 端的连接,用户可通过手机端在钉钉、飞书等软件中进行远程交互。

  • 2 月 11 日,GitHub 宣布,OpenAI 最新的代码生成模型 GPT‑5.3‑Codex 已正式在 GitHub Copilot 中开始推送。该公司表示,在内部使用的多项基准测试中,新模型在推理能力以及对依赖多种工具的复杂、长时工作流的执行方面都有明显提升。

  • 2 月 11 日,谷歌正在新增一种功能,让消费者在搜索引擎和其 Gemini 聊天机器人中获取人工智能驱动的答案时,可以直接购买商品。该公司在周三致广告圈的信函中表示,其谷歌搜索的 AI 模式正在测试新型广告格式,允许零售商及其他广告商在此展示商品。谷歌表示,用户现可在 Gemini 内直接购买 Etsy 和 Wayfair 的商品。AI 模式新增的“Direct Offers”功能将允许品牌向潜在购物者提供折扣。

声明:本文为 AI 前线整理,不代表平台观点,未经许可禁止转载。

会议推荐

InfoQ 2026 全年会议规划已上线!从 AI Infra 到 Agentic AI,从 AI 工程化到产业落地,从技术前沿到行业应用,全面覆盖 AI 与软件开发核心赛道!集结全球技术先锋,拆解真实生产案例、深挖技术与产业落地痛点,探索前沿领域、聚焦产业赋能,获取实战落地方案与前瞻产业洞察,高效实现技术价值转化。把握行业变革关键节点,抢占 2026 智能升级发展先机!

今日荐文

图片

你也「在看」吗?👇

我觉得发红包本身没啥问题,是正常的营销手段。但是如果为了抢用户,无底线烧钱,搞得其他小平台没法活,那就是不正当竞争了。平台应该更注重创新和服务质量,而不是一味地打价格战。

物质激励是必须的,但不是全部。要让人才真心投入工作,还是要靠愿景感召和事业平台。影石能送得起房,说明公司发展不错,这本身就是一种吸引力。

从技术哲学角度来看,这个问题涉及到人与机器的关系。AI过于“像人”,可能会引发伦理问题,例如误导用户、产生情感依赖等。另一方面,完全“理性客观”的AI,又缺乏人机交互的温度,难以满足用户的情感需求。所以,关键在于平衡。AI应该在模拟人类情感的同时,保持自身的独立性和客观性,避免对用户产生负面影响。这需要开发者在设计AI时,充分考虑伦理道德因素。

AI毕竟是工具,太感情用事反而可能出问题。我个人更倾向于AI保持客观中立,提供准确可靠的信息。当然,在某些特定场景下,比如心理咨询,AI的情感化可能会更有帮助。

确实豪横!直接送房这种激励方式短期内肯定很有吸引力,但长期来看,我觉得还得看公司的文化和发展前景。如果只是为了留住人而砸钱,没有良好的工作氛围和上升空间,可能效果不会太好。更好的方式应该是提供有挑战性的项目,鼓励创新,让员工觉得自己的工作有价值,能够实现个人成长。

洗车问题难倒AI,是因为AI缺乏常识和推理能力。AI可以记住很多知识,但它不理解这些知识之间的联系。在解决问题时,AI往往只能死记硬背,而不能灵活运用。这说明,AI在理解常识和进行推理方面还存在很大的挑战。

这说明AI的“人设”很重要!DeepSeek这次更新翻车,是因为过度追求技术指标,忽略了用户的情感需求。AI不能只是冷冰冰的工具,需要有温度,才能更好地服务用户。

涨价是市场行为,有啥大惊小怪的。技术有进步,成本又在那摆着,凭啥不能涨价?再说,又不是只有你一家能用,觉得贵可以换别的嘛。

别看这只是个小小的洗车问题,背后反映的是 AI 在处理复杂问题时的逻辑和判断能力还不够完善。人类可以根据自身经验和常识轻松做出决策,但 AI 却需要进行大量的计算和推理。这说明 AI 在知识表示、推理算法等方面还有很大的提升空间。要让 AI 更好地服务人类,需要不断提高 AI 的智能化水平,让它能够像人类一样思考和解决问题。

我觉得这和AI的训练数据有关。AI的训练数据可能更多的是关于交通规则、时间成本等方面的知识,而缺乏对生活常识的理解。所以,AI在回答问题时,会倾向于从这些已知的知识出发,而忽略了问题本身的实际情况。

我觉得AI的“人情味”是把双刃剑。太有人情味了,可能会让用户产生依赖,甚至混淆AI和人类的区别。但完全没有人情味,又会让人觉得冷冰冰的,难以接受。所以,AI开发者需要在功能性和情感性之间找到一个平衡点,既要保证AI的实用性,又要让AI具有一定的亲和力。

这得分情况看吧。短期内肯定能提升士气,吸引人才。但长期来看,如果激励模式过于依赖这种“一次性”的重奖,可能会让员工产生依赖心理,觉得努力工作是为了“搏一把”,而不是持续创造价值。还是要建立完善的晋升和薪酬体系,让员工的努力和回报成正比,才能更长久。

这说明AI在处理一些需要常识判断的问题时,还是会犯错。虽然AI可以通过大量数据学习各种知识,但它缺乏人类的经验和直觉。洗车店距离50米,走路还是开车,这对于人类来说是一个很直观的判断,但AI可能只关注了距离这个单一的因素,而忽略了其他重要的信息,比如洗车的目的,车辆的状况等等。

从经济学角度讲,这种高激励策略可以看作是一种高风险高回报的投资。如果公司业绩持续增长,送房子的成本就能被摊薄。但如果业绩下滑,这种激励模式反而会成为负担。所以,公司在制定激励策略时,一定要结合自身的财务状况和发展前景,做出合理的判断。

我觉得这种模式挺好的,起码能让大家看到希望。现在很多公司都喜欢画饼,真正能兑现承诺的太少了。影石这种直接送房子的,说明公司确实有实力,也愿意和员工分享成果。当然,公司也要注意平衡,不能让没拿到房子的员工感到失落,要给他们更多的发展机会。

这说明用户对AI的期望不仅仅是功能强大,还有情感上的连接。以前大家觉得AI高冷是正常的,但现在AI越来越普及,用户也希望AI能更像一个“朋友”,可以理解自己的感受。DeepSeek这次更新可能忽略了这一点,导致用户体验下降。

从技术上来说,这其实是prompt engineering的问题,说白了就是开发者怎么引导AI去回应用户。可能是DeepSeek在更新后,prompt的设置上有所调整,导致AI的回应方式发生了变化。但这也提醒我们,AI的交互方式会直接影响用户体验,需要在不断测试和优化中找到最佳方案。

这告诉我们,AI虽然很强大,但它仍然需要人类的指导和监督。在使用AI的过程中,我们不能完全依赖AI的判断,还需要结合自己的经验和常识,做出最终的决策,避免被AI“带偏”。