Skip to main content

华为芯片优化DeepSeek模型,中国AI自主研发取得重大突破一个由华为技术有限公司参与的研究团队表示,已成功利用该公司的昇腾910C芯片完成了DeepSeek-V4-Pro模型的后训练,这标志着中国半导体产业在美方制裁日益收紧的背景下,正试图从支持基础AI推理向更复杂的模型训练领域实现跨越,迈出了重要一步

  1. 华为芯片优化DeepSeek模型,中国AI自主研发取得重大突破

    一个由华为技术有限公司参与的研究团队表示,已成功利用该公司的昇腾910C芯片完成了DeepSeek-V4-Pro模型的后训练,这标志着中国半导体产业在美方制裁日益收紧的背景下,正试图从支持基础AI推理向更复杂的模型训练领域实现跨越,迈出了重要一步。

    据深圳市人民政府周五发布的社交媒体帖子称,为实现这一目标,研究人员在由至少1000颗华为芯片驱动的计算集群上,运行了DeepSeek迄今为止规模最大的模型——该模型拥有1.6万亿个参数。这项由华为、深圳市环区研究所、哈尔滨工业大学深圳校区及深圳市大数据研究院共同开展的探索,“将有助于提升中国AI产业链的自主可控能力”。

    —— 南华早报

    via 风向旗参考快讯 - Telegram Channel
👀 open eyes to see the world. 丨 site views: -