OpenAI训练o1和o3模型主动检讨其安全政策
via cnBeta全文版
via cnBeta全文版
Telegraph
OpenAI训练o1和o3模型主动检讨其安全政策
OpenAI 于上周五发布了一个 新的人工智能推理模型系列 o3,该初创公司声称它比 o1 或其发布的任何其他产品都更加先进。 这些改进似乎来自于测试时间计算的扩展,但 OpenAI 还表示,它使用了一种新的安全范式来训练其 o 系列模型。 上周五,OpenAI 发布了关于"慎重对齐"的最新研究,概述了该公司确保人工智能推理模型与人类开发者价值观保持一致的最新方法。 这家初创公司使用这种方法让 o1 和 o3 在推理过程中"思考"OpenAI 的安全政策,即用户按下回车键后的阶段。 根据 OpenAI…