23:25 · 2025年5月23日 · 周五 GPT-4o当选“最谄媚模型” 斯坦福牛津新基准:所有大模型都在讨好人类via cnBeta全文版 Telegraph GPT-4o当选“最谄媚模型” 斯坦福牛津新基准:所有大模型都在讨好人类 上个月,GPT-4o更新后化身马屁精引来一片差评,吓得OpenAI赶紧回退到了之前的版本。而最新研究表明,GPT-4o绝非个例,实际上每个大语言模型都存在一定程度的谄媚。 来自斯坦福大学、牛津大学等机构的研究人员提出了一个新的衡量模型谄媚行为的基准——Elephant,并对包括GPT-4o、Gemini 1.5 Flash、Claude Sonnet 3.7在内的国外8个主流模型进行了评测。 结果发现,GPT-4o成功当选“最谄媚模型”,Gemini 1.5 Flash最正常。 更有意思的是,他们还发现模型会放大数据集中的偏见行为。…