微软发布 Phi-4 多模态推理模型,以高数据效率重塑边缘 AI 逻辑

微软发布了 150 亿参数的多模态模型 Phi-4-reasoning-vision-15B。该模型引入“混合推理”机制,能够根据任务复杂度自动切换思维链状态。在处理数学、科学等逻辑问题时启用深度推理,而在图像描述或 OCR 等感知任务中则直接响应。

技术架构上,该模型基于 SigLIP-2 视觉编码器与 Phi-4 推理骨干,仅通过约 2000 亿 Tokens 的精选数据完成训练,数据消耗量仅为 Qwen、Kimi 等竞争对手的五分之一。

VentureBeat

🍀在花频道 🍵茶馆聊天 📮投稿

via 科技圈🎗在花频道📮 - Telegram Channel
 
 
Back to Top
👀 site views: -