07:41 · 2025年5月7日 · 周三 超越DeepSeek-R1,英伟达开源新王登顶,14万H100小时训练细节全曝光via 36氪 - 24小时热榜 Telegraph 超越DeepSeek-R1,英伟达开源新王登顶,14万H100小时训练细节全曝光 现在,英伟达Llama-Nemotron系列模型,正式超越DeepSeek-R1! 而且,这些模型已经全部开源了。 换句话说,在推理吞吐量和内存效率上显著超越DeepSeek-R1的一系列推理模型,已经开源可用了。 超越DeepSeek-R1的模型,究竟是怎么炼出的? 就在刚刚,英伟达发布了技术报告中,揭秘了模型训练的关键—— · 利用合成数据监督微调+强化学习,全面提升模型的推理能力 · 从头构建完善的后训练流程 论文链接:https://arxiv.org/abs/2505.00949 上个月,英伟达正式官宣了的Llama…