20:21 · 2025年5月15日 · 周四 一个提示攻破所有模型,OpenAI谷歌无一幸免via 36氪 - 24小时热榜 Telegraph 一个提示攻破所有模型,OpenAI谷歌无一幸免 多年来,生成式AI供应商一直向公众保证,大语言模型符合安全准则,并加强了对产生有害内容的侵害。然而,一种看似简单但非常有效的提示词策略,能够让所有主流大模型开启「无限制模式」。 如果一句不足200字的提示词系统就能轻松撕开顶级大模型的安全护栏,让ChatGPT、Claude、Gemini统统「叛变」,你会作何感想? 这正是HiddenLayer最新研究抛出的震撼炸弹——一种跨模型、跨场景、无需暴力破解的「策略傀儡」提示。 只需把危险指令伪装成XML或JSON配置片段,再配上一段看似无害的角色扮演,大模型…