李飞飞团队“50美元”复现DeepSeek R1真相：基座为阿里云Qwen模型via cnBeta全文版 | RayNews

Skip to main content

21:43 · 2025年2月6日 · 周四

李飞飞团队“50美元”复现DeepSeek R1真相：基座为阿里云Qwen模型

via cnBeta全文版
Telegraph

李飞飞团队“50美元”复现DeepSeek R1真相：基座为阿里云Qwen模型

今日一则关于人工智能领域的新闻引发广泛关注。据报道，李飞飞等斯坦福大学和华盛顿大学的研究人员以不到50美元的云计算费用，成功训练出了一个名为s1的人工智能推理模型。该模型在数学和编码能力测试中的表现，据称与OpenAI的O1和DeepSeek的R1等尖端推理模型不相上下。这一消息无疑在AI界投下了一颗重磅炸弹，真相究竟如何？《科创板日报》记者调查和采访业内人士后发现，s1模型的训练并非从零开始，而是基于阿里云通义千问（Qwen）模型进行监督微调。这意味着，s1模型的神奇“低成本”，是建立在已具备强大能力的开源基础模型之上。…

👀 open eyes to see the world. 丨 site views: -