OpenAI训练o1和o3模型主动检讨其安全政策via cnBeta全文版 | RayNews

Skip to main content

16:14 · 2024年12月23日 · 周一

OpenAI训练o1和o3模型主动检讨其安全政策

via cnBeta全文版
Telegraph

OpenAI训练o1和o3模型主动检讨其安全政策

OpenAI 于上周五发布了一个新的人工智能推理模型系列 o3，该初创公司声称它比 o1 或其发布的任何其他产品都更加先进。这些改进似乎来自于测试时间计算的扩展，但 OpenAI 还表示，它使用了一种新的安全范式来训练其 o 系列模型。上周五，OpenAI 发布了关于"慎重对齐"的最新研究，概述了该公司确保人工智能推理模型与人类开发者价值观保持一致的最新方法。这家初创公司使用这种方法让 o1 和 o3 在推理过程中"思考"OpenAI 的安全政策，即用户按下回车键后的阶段。根据 OpenAI…

👀 open eyes to see the world. 丨 site views: -