17:21 · 2025年7月7日 · 周一 马斯克Grok 4逆天跑分泄露,“人类最后考试”豪取45%全场第一via 36氪 - 24小时热榜 Telegraph 马斯克Grok 4逆天跑分泄露,“人类最后考试”豪取45%全场第一 Grok 4跑分提前泄露,在「人类最后考试」中高达45%的得分,远超Gemini与Claude,成为当前测试中最强模型之一。马斯克表示Grok 4以「第一性原理」构建推理机制,Grok 4有望改写LLM格局。 Grok 4马上就来,马斯克说的! 甚至,现在部署的Grok,已经在能力上有了显著的提升。 与此同时,网友LEGIT的一张截图,更是直接泄露了Grok 4和Grok 4 Code在多个关键基准评测上的跑分。 目前,这一消息已经得到了AI圈知名大佬Tibor Blaho的确认。 根据泄露的数据,Grok…