最新AI资讯话题 - 冷月清谈

话题	回复	浏览量	活动
超越Token预测：CoCoMix如何革新Transformer预训练	9	1	2025 年3 月 8 日
AI 规模化发展新方向：向上、向下和向外扩展	9	6	2025 年3 月 8 日
2025全球开发者先锋大会：百亿AI项目招标，共话AI未来	9	1	2025 年3 月 8 日
南大LAMDA携手华为诺亚，斩获EDA顶会DATE 2025最佳论文奖	9	11	2025 年3 月 8 日
2024年十大AI研究论文：从理论突破到实际应用	9	11	2025 年3 月 8 日
DeepSeek开源DeepGEMM：300行代码实现高性能FP8矩阵乘法，支持V3/R1训练推理	9	10	2025 年3 月 8 日
华为诺亚推出高效选择注意力架构ESA，提升大模型长文本处理能力	9	9	2025 年3 月 8 日
DeepSeek开源周：V3/R1推理系统揭秘，成本与性能深度解析	9	14	2025 年3 月 8 日
谷歌推出 Vertex AI RAG 引擎，简化大语言模型与外部数据源连接	9	1	2025 年3 月 8 日
清华AgentSociety：大型社会模拟器推动智能社会治理研究变革	9	2	2025 年3 月 8 日
Copilot会重蹈Cortana的覆辙吗？微软与OpenAI的合作裂痕引人深思	10	8	2025 年3 月 8 日
马斯克xAI发布Grok-3大模型，性能超越GPT-4，登顶排行榜	9	2	2025 年3 月 8 日
DeepSeek创始人梁文锋：技术男本色，亲自撰写提交论文	9	2	2025 年3 月 8 日
MeteoRA：基于MoE的LLM知识模块可扩展融合推理架构，一次推理解决复合问题	9	6	2025 年3 月 8 日
Bengio团队提出MCTD：结合扩散模型和蒙特卡洛树搜索，实现高效系统2规划	9	13	2025 年3 月 8 日
OpenAI 最新研究：强化学习助LLM编程能力再上一层楼，直逼人类精英	9	1	2025 年3 月 8 日
OpenAI 最新路线图：GPT-4.5 和 GPT-5 即将到来，并将统一所有模型	9	2	2025 年3 月 8 日
OpenAI 前 CTO Mira Murati 创建 Thinking Machines Lab，与 OpenAI 展开竞争	9	5	2025 年3 月 8 日
OpenAI 全面开放 Deep Research，性能提升显著	9	7	2025 年3 月 8 日
LLM 自知之明：大型语言模型知道多少？	9	3	2025 年3 月 8 日
上海AI Lab新算法助人形机器人自主站立	9	3	2025 年3 月 8 日
梁文锋2019年演讲：程序员眼中的中国量化投资未来	9	11	2025 年3 月 8 日
阶跃星辰携手吉利开源两款多模态大模型：300亿参数Step-Video-T2V及产品级Step-Audio	9	1	2025 年3 月 8 日
AMD 发布 RX 9070 系列显卡：16GB 显存，4K 游戏性能飙升	9	2	2025 年3 月 8 日
微软游戏AI模型Muse引发争议：开发者对其效用表示质疑	9	4	2025 年3 月 8 日
DeepSeek私有化部署与垂直训练：企业智能化转型的新引擎	9	11	2025 年3 月 7 日
AI时代的高薪与人才：DeepSeek百万年薪招聘引发的思考	9	6	2025 年3 月 7 日
DeepSeek和月之暗面同时发布改进Transformer注意力机制的研究成果	9	7	2025 年3 月 7 日
马斯克寻求X平台440亿美元融资，与收购价持平	9	0	2025 年3 月 7 日
何恺明新作：颠覆认知，去噪扩散模型或无需噪声条件	9	4	2025 年3 月 7 日