Skip to main content

OpenAI企鹅家族”深夜泄露:代号“皇帝”的新模型,思考延时为0!12月4日凌晨,GitHub 与 DesignArena 同步流出 OpenAI 内部代号“企鹅”(Penguin)的全新模型系列,四档推理预算首次曝光:旗舰模型Emperor:512、中端 模型Rockhopper(Juice:64)、轻量模型 Macaroni(Juice:16)与零推理模型Mumble(Juice:0),覆盖从云端到边缘的全场景需求

  1. OpenAI企鹅家族”深夜泄露:代号“皇帝”的新模型,思考延时为0!

    12月4日凌晨,GitHub 与 DesignArena 同步流出 OpenAI 内部代号“企鹅”(Penguin)的全新模型系列,四档推理预算首次曝光:旗舰模型Emperor:512、中端 模型Rockhopper(Juice:64)、轻量模型 Macaroni(Juice:16)与零推理模型Mumble(Juice:0),覆盖从云端到边缘的全场景需求 。
    内部文件显示,Emperor 模型拥有512单位“juice”推理预算,为现行模型8-10倍,端到端延迟却控制在80ms 以内,实现“零等待”对话体验;代码路径已嵌入实时剪枝与动态计算分配,疑似为明年 GPT-5.2提供底层架构 。

    四档预算=四种 latency:Macaroni 主打极速,Mumble 彻底去推理

    Rockhopper(Juice:64)(中端)定位“推理+速度”平衡,目标替代 GPT-4.5
    Macaroni(Juice:16)面向移动端,首次在8Gen3芯片跑通70B 模型
    Mumble(Juice:0)完全跳过推理步骤,响应时间<50ms,用于高频自动完成与语音打断场景

    记忆搜索同步曝光:一键召回对话上下文

    同批泄露的代码显示,ChatGPT 将新增“Memory Search”按钮,用户输入自然语言即可即时检索历史记忆,无需再手动翻找聊天记录;该功能已内测,预计与企鹅家族模型一同上线 。

    Shallotpeat & Garlic 接踵而至:OpenAI 拉响红色警报

    The Information 补充,OpenAI 下周或发布内部代号 Shallotpeat 的新推理模型,性能已领先 Gemini3;另一款 Garlic 完成预训练,2026年初以 GPT-5.2/5.5形式推出,主打“小参数+高密度知识”路线,直接对标谷歌“预训练飞跃”。

    目前该系列/模型在Design Arena 神秘测试
    Design Arena

    Design Arena

    Design Arena is the largest global crowdsourced benchmark for design. Challenge, Vote, Crown your Winner.

    28 posts - 27 participants

    Read full topic

    via LINUX DO - 热门话题 (author: Bunn)

    Invalid media:
    image
    image
    image
    image
    image
    image
    image
👀 open eyes to see the world. 丨 site views: -