13:15 · 2026年5月1日 · 周五 DeepSeek公开多模态模型技术报告公布:超越GPT-5.4via cnBeta全文版 Telegraph DeepSeek公开多模态模型技术报告公布:超越GPT-5.4 DeepSeek在GitHub上发布了多模态推理模型及技术报告,题为《Thinking with Visual Primitives(以视觉原语思考)》。该模型基于DeepSeek V4-Flash(284B总参数、推理时激活13B的MoE架构)构建,提出了一种全新的多模态推理范式。 论文指出现有多模态大模型存在一个被忽视的根本性瓶颈:“指代鸿沟”(Reference Gap),即模型能够“看见”图片内容,但在推理过程中用自然语言构建思维链时,左边那个大的、靠近中央的红色物体这类模糊描述在密集场景中无法…