华为开源盘古大模型openPangu 2.0 Flash，余承东放话"没有第二，只有第一"_AI资讯

6月30日，华为正式宣布开源盘古大模型openPangu 2.0 Flash版本，标志着这家科技巨头在自主大模型领域的开源战略迈出关键一步。此次开源内容涵盖模型权重、基础推理代码及训推算子，已全面上线开源平台，供全球开发者下载使用。

华为开源盘古大模型openPangu 2.0 Flash，余承东放话"没有第二，只有第一"

从封闭走向开放：余承东亲自挂帅

这一时间节点的到来，源于两周前华为开发者大会（HDC 2026）上的一次高调宣告。华为常务董事、产品投资评审委员会主任、终端BG董事长余承东亲自登台，正式发布openPangu 2.0，并宣布将于6月30日起陆续开源7大核心组件，包括模型结构、模型权重、技术报告、推理代码、预训练代码、后训练代码及训练算子。

余承东在演讲中坦言了一段颇为罕见的自我反思：华为在全世界都不知道大模型为何物时，便发布了国内首个大模型，是行业的"绝对先驱"，但后来因种种原因"没做好，不应该"。他透露，去年国庆节前夕，他重新受命负责盘古大模型业务，并随即以一句强硬表态定下基调——"在余承东字典里，没有第二，只有第一。"

双版本格局：Flash先行，Pro七月跟进

openPangu 2.0采用Pro与Flash双轨并行的产品策略，两者均支持512K超长上下文窗口，以覆盖从轻量化部署到旗舰级应用的不同算力需求。

Flash版本作为首发开源版本，总参数量为92B，激活参数量仅为6B，以极高的稀疏比（最大28:1）实现了出色的推理效率，主要面向轻量化部署场景。Pro版本则是旗舰主力，总参数量达到505B，激活参数量18B，大幅强化了Agent任务执行能力，其模型权重与基础推理代码将于7月上线开源平台。更多开源组件将在今年下半年陆续向社区开放。

技术底色：昇腾原生架构与稀疏MoE创新

openPangu 2.0的技术亮点之一，在于其深度适配华为昇腾（Ascend）NPU的架构设计。官方数据显示，在昇腾硬件加持下，该模型单卡吞吐率可达业界主流开源模型的2倍，体现了软硬协同优化的显著红利。

在模型架构上，openPangu 2.0采用了一种名为混合分组专家（MoGE，Mixture of Grouped Experts）的创新设计。该架构在全局路由器之上，将专家网络按设备数量分组，每个Token被约束为在其所属分组内激活固定数量的专家，而非从全局专家池中自由竞选。这一机制从构造上将设备间的负载不均衡得分锁定为零，从根本上消除了传统MoE路由中"某张卡忙死、另一张卡闲置"的经典痛点，使大规模分布式推理的效率与稳定性得到保障。

基准测试表现：优势明显，短板亦存

从第三方基准测试的初步评估来看，openPangu 2.0的思维链（Thinking）模式表现可圈可点：在AIME 2026上位列全球约第8名，在LiveCodeBench V6上排名第9，展现出较强的数学与代码推理能力。相对薄弱的环节则在于博士级科学问答（GPQA-Diamond，约第26名）以及软件工程实战评测（SWE-bench Verified，约第50名），存在进一步提升的空间。

开源战略的更深意涵

openPangu 2.0的开源，是中国头部科技企业在大模型领域持续扩大开放生态的又一缩影。在DeepSeek、通义千问等国产开源模型已积累大量全球开发者社区口碑的背景下，华为此番不仅拿出了模型权重，更同步释放训练算子与推理代码，体现出对全链路开源的更高诚意。

尤为值得关注的是，openPangu 2.0全程基于华为昇腾NPU训练，这意味着整套开源生态——从硬件、芯片软件栈（CANN）到模型本身——均构建于自主可控的技术体系之上，在当前国际芯片供应链高度不确定的环境下，这一点具有超越模型性能本身的战略意义。

目前，模型权重已在开源平台上线，同时提供基于昇腾推理系统、MindIE及vLLM-Ascend的推理示例代码，亦支持在Transformers框架（torch 2.1.0及以上）中运行，量化权重将于近期发布。