从时空数据中学习因果表示:博士论文解读
|
|
9
|
122
|
2025 年3 月 12 日
|
数据派研究部招募志愿者,一起探索数据科学的未来!
|
|
10
|
1
|
2025 年3 月 11 日
|
上海AI Lab推出Mixture-of-Memories(MoM):赋予线性注意力稀疏记忆能力
|
|
9
|
2
|
2025 年3 月 11 日
|
AI时代,工程师如何保持核心竞争力?
|
|
9
|
1
|
2025 年3 月 11 日
|
欧盟《人工智能法案》深度解读:风险分级、合规义务与未来影响
|
|
9
|
101
|
2025 年3 月 11 日
|
解开大语言模型的奥秘:解码策略与优化技巧解析
|
|
9
|
5
|
2025 年3 月 11 日
|
研究质疑DeepSeek模型训练数据:文本风格与OpenAI模型高度相似
|
|
9
|
2
|
2025 年3 月 11 日
|
深入剖析英特尔奔腾FDIV漏洞:一个4.75亿美元的教训
|
|
9
|
51
|
2025 年3 月 11 日
|
谷歌创始人布林呼吁员工每周工作60小时以夺回AI领先地位
|
|
9
|
3
|
2025 年3 月 11 日
|
Python性能优化:五大技巧提升代码执行效率
|
|
8
|
11
|
2025 年3 月 11 日
|
COAT:FP8训练新方法,显存占用降低40%,训练速度提高1.4倍
|
|
9
|
5
|
2025 年3 月 11 日
|
GPT-4.5预览版发布:更具“情商”,API价格上涨30倍
|
|
9
|
0
|
2025 年3 月 11 日
|
DPO-Shift:通过参数控制改进直接偏好优化,缓解似然偏移
|
|
9
|
11
|
2025 年3 月 11 日
|
优化引导神经迭代(OGNI):快速鲁棒的3D重建新方法
|
|
9
|
2
|
2025 年3 月 11 日
|
谷歌创始人拉里·佩奇重返科技前沿,创立AI公司Dynatomics进军智能制造
|
|
9
|
2
|
2025 年3 月 11 日
|
CMU博士论文:用语言模型交互、集成与自动形式化,实现可验证的数学自动化
|
|
9
|
1
|
2025 年3 月 10 日
|
DataMan:浙大&千问团队提出预训练数据管理器,显著提升大语言模型性能
|
|
9
|
11
|
2025 年3 月 10 日
|
迪士尼工程师因免费AI工具下载导致生活和事业受重创
|
|
9
|
7
|
2025 年3 月 10 日
|
RISC-V 正式进军 AI 领域:开源指令集架构如何助力 AI 发展
|
|
9
|
9
|
2025 年3 月 10 日
|
全球首个双足肌肉骨骼仿生机器人Clone即将预售
|
|
9
|
0
|
2025 年3 月 10 日
|
阿里开源QwQ-32B模型,性能比肩DeepSeek R1,参数仅其1/20
|
|
9
|
2
|
2025 年3 月 10 日
|
ICRA 2025:清华团队提出 AVD2 事故视频生成与描述框架,助力自动驾驶安全
|
|
9
|
9
|
2025 年3 月 10 日
|
大规模语言模型的原则性训练与高效服务策略
|
|
9
|
2
|
2025 年3 月 10 日
|
多元推理方法显著提升LLM在IMO、ARC和HLE基准上的推理能力
|
|
9
|
6
|
2025 年3 月 10 日
|
P-sLSTM:释放LSTM在长期时间序列预测中的潜力
|
|
9
|
16
|
2025 年3 月 10 日
|
从两层网络到基础模型:特征学习的训练与适应
|
|
9
|
4
|
2025 年3 月 10 日
|
DeepSeek大模型高效训练:极限AI工程优化解析
|
|
9
|
3
|
2025 年3 月 10 日
|
微软发布全球首个拓扑量子芯片Majorana 1,开启量子计算新时代
|
|
9
|
0
|
2025 年3 月 10 日
|
玄铁C930服务器级CPU即将交付,性能达服务器级,搭载Matrix AI引擎
|
|
9
|
5
|
2025 年3 月 10 日
|
SAMRefiner:一种通用的掩码优化方法
|
|
9
|
14
|
2025 年3 月 10 日
|