最新AI资讯话题 - 冷月清谈

话题	回复	浏览量	活动
知识蒸馏技术详解：如何利用软标签压缩模型	9	11	2025 年3 月 9 日
Liquid：统一多模态生成框架，让大语言模型原生掌握视觉能力	9	2	2025 年3 月 9 日
强化学习入门：TD与SARSA算法详解	9	4	2025 年3 月 9 日
昆仑万维发布Matrix-Zero世界模型，以空间智能技术突破2D限制	9	3	2025 年3 月 9 日
DeepSeek-R1是如何通过强化学习追平o1推理能力的？	9	4	2025 年3 月 9 日
AI 难以攻克推理谜题：新型基准 ENIGMAEVAL 揭示大语言模型局限性	9	5	2025 年3 月 9 日
DeepSeek利润率引争议；Kimi模型登顶；AI周报重点速览	9	5	2025 年3 月 9 日
CodePlan：用代码规划解锁大模型推理潜能	9	11	2025 年3 月 9 日
视觉强化微调Visual-RFT开源：少量数据提升多模态大模型性能	9	13	2025 年3 月 9 日
OpenAI开源百万美元编码基准SWE-Lancer，评估大模型编程能力	9	0	2025 年3 月 9 日
大型语言模型的“遗忘”可能是错觉？新研究揭示“虚假遗忘”现象	9	8	2025 年3 月 9 日
加入数据派志愿者团队，与数据科学同行！	9	1	2025 年3 月 9 日
深度学习模型反演攻击：攻防全解析	9	20	2025 年3 月 9 日
AI赋能政务热线：从“接诉即办”到“智能治理枢纽”	9	7	2025 年3 月 9 日
MakeAnything：用扩散Transformer解锁多任务过程生成，AI也能分步骤创作	9	1	2025 年3 月 9 日
数学家夫妇携手终结群论难题——麦凯猜想终获证明	9	0	2025 年3 月 9 日
SGLang：开源推理引擎如何驱动DeepSeek模型推理革命	9	14	2025 年3 月 9 日
灵初智能发布Psi R0.5：高效泛化的端到端VLA模型	9	11	2025 年3 月 9 日
LLaDA：基于扩散模型的8B大语言模型，性能比肩LLaMA 3	9	3	2025 年3 月 9 日
三大金融波动率模型Python实战：GARCH、GJR-GARCH与HAR	9	35	2025 年3 月 9 日
子词模型：解密机器理解人类语言的秘密	9	1	2025 年3 月 9 日
深入浅出 PPO 与 GRPO：从小学考试理解强化学习	9	136	2025 年3 月 9 日
数据派招募志愿者，加入我们共同探索数据科学！	9	0	2025 年3 月 9 日
2024图灵奖授予强化学习先驱Andrew Barto和Richard Sutton	9	0	2025 年3 月 9 日
斯坦福研究：大模型普遍存在“拍马屁”现象，Gemini 最为严重	9	9	2025 年3 月 9 日
AI Native硬件：未来已来，但仍需时日	11	2	2025 年3 月 9 日
雷军2025两会五项建议：聚焦AI及新能源汽车高质量发展	11	1	2025 年3 月 9 日
RTX 5070 评测：性能小幅提升，功耗显著增加，DLSS 4 才是关键	9	39	2025 年3 月 9 日
2024年AI十大关键事件回顾与分析	9	3	2025 年3 月 9 日
LLM 的个性化之路：PREFEVAL 基准测试揭示偏好遵循能力的挑战	9	3	2025 年3 月 9 日