10:03 · 2025年8月23日 · 周六 刚刚,大模型棋王诞生,40轮血战,OpenAI o3豪夺第一,人类大师地位不保?via 36氪 - 24小时热榜 Telegraph 刚刚,大模型棋王诞生,40轮血战,OpenAI o3豪夺第一,人类大师地位不保? 继Kaggle Game Arena的淘汰赛后,国际象棋积分赛成果出炉!OpenAI o3以人类等效Elo 1685分傲视群雄,而Grok 4和Gemini 2.5 Pro紧随其后。DeepSeek R1和GPT-4.1、Claude Sonnet-4、Claude Opus-4并列第五。 别再拿淘汰赛说事了! 这次是真刀真枪的「积分赛」,Elo榜单才是硬实力。 40轮血战,国际象棋AI仅文本输入结果出炉了。 仅使用文本输入、无工具、无验证器,各大AI模型进行对决。 每组配对进行超过40场比赛,构建了类似围棋等运动项目的Elo排名。…