一起昇腾，共赢行业智能化 ——2026 昇腾人工智能伙伴峰会核心分享

2026.04.03

来源：鲲鹏昇腾开发者社区

2026 年 3 月 20 日，华为中国合作伙伴大会 2026 期间，以 “与时代，共昇腾” 为主题的昇腾人工智能伙伴峰会在深圳成功举行。华为昇腾计算业务总裁张迪煊发表《一起昇腾，共赢行业智能化》主题演讲，指出 AI 正从生成式 AI 迈向 Agentic AI，2026 年将成为强化学习及 Agent 应用规模落地元年，昇腾将打造大、中、小三大核心算力场景，携手伙伴共探行业智能化落地加速路径。

华为昇腾计算业务总裁张迪煊

一、开源开放筑生态，昇腾与伙伴携手共赢

2025 年是昇腾沉淀技术、拥抱开源的关键一年，同年 8 月昇腾正式宣布 CANN 和 Mind 系列软件全面开源开放、架构解耦，并积极向业界贡献关键特性。其中，联合科大讯飞落地的大 EP 技术贡献至 vLLM 社区，填补了业界多机推理加速能力的空白。

目前昇腾已向三方社区累计贡献超 11 万行代码，在毕昇编译器层构建 AscendNPU IR 平滑对接 Triton，兼容 FSDP2、vLLM 等 50 多个主流开源社区和项目，实现开源模型 0day 支持，让开发者可快速落地训练与推理创新。同时，众多 SOTA 开源模型基于昇腾原生孵化，如智谱基于昇腾仅三个月完成的多模态大模型 GLM-Image，开源 24 小时即登顶 Hugging Face Trending 榜第一。

在一体机产品领域，昇腾在 DeepSeek 发布后快速推出参考配置，使能 80 多家伙伴 2 周内发布自研产品。一年时间里，已有 350 多家伙伴打造 400 多款行业场景一体机，服务 2700 多家客户，占据国内一体机市场 80% 以上份额，加速大模型行业落地。

二、AI 迈入 Agentic 时代，2026 成强化学习 + Agent 应用落地元年

过去三年 AI 行业实现跨越式发展：2023 年 “大模型元年” 让模型从感知理解走向生成创造；2024 年 “大模型推理元年” 确立 Tokens 为 AI 时代新量纲；2025 年国产大模型开源爆发，Tokens 使用量席卷千行万业。

当前 AI 正式迈入 Agentic AI 时代，实现从 “会聊天” 到 “能办事” 的升级。To C 端，OpenClaw 成为现象级开源应用，短时间内收获超 32 万 star、百万新增用户，国内头部互联网纷纷布局智能体入口；To B 端，AI 深度渗透生产决策环节，强化学习成为基座模型落地行业核心场景的必选之路，而海量 Tokens 成为核心支撑，其计算效率直接决定企业核心收益。

三、大中小系列化算力开放，适配全场景差异化需求

结合 AI 发展趋势与客户需求，昇腾打造三大核心算力场景，全方位满足行业差异化需求，助力伙伴深耕行业智能化：

大算力场景：聚焦大模型预训练、强化学习后训练及大规模推理服务，昇腾将打造领先超节点架构及产品，开放灵衢协议、部件及参考架构，赋能企业重塑核心业务；
中算力场景：覆盖辅助医疗、智慧教学等主流行业应用，围绕 “开箱即用” 打造 “快速部署 + 成本可控” 的平衡，开放中心模组 / 刀片，支持伙伴打造大模型应用一体机、高密服务器；
小算力场景：聚焦工业质检、具身智能、科研教学等智能边端领域，针对客户 “灵活高效、成本可控” 的诉求，开放标准模组和板卡，使能伙伴打造多样化边缘算力设备，挖掘海量市场潜力。

四、核心技术创新，打造全场景最佳解决方案

1. 超节点 + 大 EP，破解大规模推理服务痛点

AI Agent 的普及带来百倍级 Tokens 需求和 10ms 级时延要求，传统服务器堆叠模式存在内存独立编址、跨节点交互性能开销大的问题。昇腾 384 超节点实现 48TB 内存统一编址、全局内存共享，共享内存容量较传统方式提升 96 倍，NPU 间通过内存语义直接交互，数据交互效率提升 3 倍，可实现更高 KVCache，满足 Agent 超长上下文需求，成为大规模推理的最优选择。

同时昇腾为伙伴提供三条灵活实现路径：复用 MindIE 成熟大 EP 方案快速部署、合入 vLLM/SGLang 开源推理引擎降低迁移成本、基于 CANN 深度定制极致性能推理引擎。目前硅基流动、清昴智能等伙伴已基于该能力打造推理引擎，为金融行业提供服务，实现多轮任务应答速度提升 3 倍。

2. 异步流式数据引擎 TQ，优化强化学习后训练

针对强化学习后训练场景，昇腾沉淀全流程最佳实践，提供一键部署的 Docker 镜像，解决业界普遍关注的训推资源调度难题。创新推出的 “异步流式数据引擎 TQ” 技术，实现控制流与数据流解耦，样本数据无需经控制器中转，依托超节点内存统一编址实现训推节点快速数据交互，端到端性能提升 40% 以上，该特性已合入 verl 社区并应用于广告、信贷风控等核心场景。

3. 软硬件全面升级，开源 Agent 参考设计打造 “Claw 一体机”

面向国计民生大模型应用场景，昇腾产品分级分档升级：百亿级模型适配 A2 标卡，内存带宽达业界 1.8 倍，实现 100ms 推理时延；千亿级模型搭配单机服务器，算力达业界 2.3 倍；万亿级模型采用双机超节点服务器，为业界唯一可部署 T 级模型的产品，算力达业界 3.78 倍，突破 20ms 低时延。

同时昇腾推出 Agentic 开源参考设计，打包优化后的推理引擎、开源模型权重及 OpenClaw 框架为完整镜像，伙伴只需聚焦业务集成与 Skill 开发，即可快速打造 Agent 应用一体机。基于双机超节点服务器的一体机，可实现每日 20 亿 Tokens 供给，目前已有 20 多家伙伴落地相关产品，服务教育、医疗、金融等核心领域。

4. Atlas 350 加速卡，赋能推荐 / 多模态 / LLM 三大推理场景

昇腾发布 Atlas 350 加速卡，搭载全新昇腾 950PR 处理器，性能较业界同类产品领先 1 至 1.4 倍，聚焦推荐、多模态、LLM 三大核心推理场景：算力内存双升级，单卡算力达业界 2.8 倍以上，支持 mxFP4 低精格式，片上内存最大 112GB，多模态生成性能提升 60%；访存粒度降至 128 字节，海量小算子访存效率提升 4 倍；支持 SIMT+SIMD 混合编程，开发更灵活，满足伙伴多样化需求。

五、深耕行业场景，技术与业务深度融合

2025 年 9 月，昇腾联合 20 多家 ISV 启动金融、能源等 5 大行业应用场景解决方案打造工作，半年内孵化出辅助办公、AI 实训、电子病历等十余个方案，落地 180 多家客户。其中在智慧文旅领域，联合海天瑞声、陕文投打造的多模态 AI 伴游助手 “小七”，已在陕西各大景点投放，为 400 多万游客提供个性化出游服务。

在智能边端领域，昇腾开放多档位、高集成度的模组 / 板卡，结合多 OS 兼容、多场景 SDK，使能伙伴打造多样化产品。软通华方、同泰怡等伙伴基于 Atlas 300I A2 打造的液冷 AI 工作站，具备静音、高密、省电等优势，成为科研仿真、医疗、金融等行业本地算力设备首选。

六、CANN 开源开放升级，降低创新门槛

昇腾 CANN 开源开放实现三大核心升级，进一步提升伙伴开发与部署效率：

部署效率升级：将原有 8 个大包拆分为 29 个独立组件，包大小从 2G 缩减至 0.43G，特性加载时间从 2 分钟缩短至 20 秒；
开发体验升级：实现主流算子编程框架无感对接，2026 年将开源 PyPTO 编程范式，使算子代码量平均减少 70%，可视化调试让复杂算子开发缩短至一周，同时提供开源 Skill 库支持算子自动生成 Agent；
社区资源升级：完善开源社区 CI/CD 流水线，2026 年 6 月将开放 2000 卡免费算力资源，大幅降低开发者创新门槛。

七、五大创新方向，共筑可持续 AI 产业生态

昇腾围绕硬件、算子、加速库、模型、应用五大创新方向，以社区化运作模式赋能伙伴发展：完善激励机制与知识体系，开放能力认证加速伙伴能力转型；下发丰富创新任务，设立 2000 万首批创新激励基金；深化昇腾万里伙伴计划，升级 5000 万 NRE 鼓励伙伴创新，创新成果将上架社区 AI 应用市场，实现联合推广、共享收益。

张迪煊表示，昇腾与伙伴已并肩走过 7 年 AI 发展之路，见证了行业从探索起步到场景落地的全过程。未来昇腾将持续以开源开放为核心，与更多伙伴携手打造可持续、有韧性的 AI 产业生态，共同推动行业智能化迈向新高度，共赢行业智能化时代新机遇。

上一条培育智能原生新业态新模式2026.04.10

下一条抢抓人工智能发展战略机遇期，携手构建网络空间命运共同体2026.03.20

返回列表

视频拼接器

超级视频处理器

专业视频处理器

分布式系统

软件

发送器

接收系列

配件

专业配屏软件

播放器

云平台

云联网播控软件

多媒体播控服务器

软件

服务器配件

智慧会议

智能制造

专业画质测评系统

内容安全

一起昇腾，共赢行业智能化 ——2026 昇腾人工智能伙伴峰会核心分享

华为昇腾计算业务总裁张迪煊

一、开源开放筑生态，昇腾与伙伴携手共赢

二、AI 迈入 Agentic 时代，2026 成强化学习 + Agent 应用落地元年

三、大中小系列化算力开放，适配全场景差异化需求

四、核心技术创新，打造全场景最佳解决方案

1. 超节点 + 大 EP，破解大规模推理服务痛点

2. 异步流式数据引擎 TQ，优化强化学习后训练

3. 软硬件全面升级，开源 Agent 参考设计打造 “Claw 一体机”

4. Atlas 350 加速卡，赋能推荐 / 多模态 / LLM 三大推理场景

五、深耕行业场景，技术与业务深度融合

六、CANN 开源开放升级，降低创新门槛

七、五大创新方向，共筑可持续 AI 产业生态

4008 770 775

视频拼接器

超级视频处理器

专业视频处理器

分布式系统

软件

发送器

接收系列

配件

专业配屏软件

播放器

云平台

云联网播控软件

多媒体播控服务器

软件

服务器配件

智慧会议

智能制造

专业画质测评系统

内容安全

一起昇腾，共赢行业智能化 ——2026 昇腾人工智能伙伴峰会核心分享

华为昇腾计算业务总裁 张迪煊

一、开源开放筑生态，昇腾与伙伴携手共赢

二、AI 迈入 Agentic 时代，2026 成强化学习 + Agent 应用落地元年

三、大中小系列化算力开放，适配全场景差异化需求

四、核心技术创新，打造全场景最佳解决方案

1. 超节点 + 大 EP，破解大规模推理服务痛点

2. 异步流式数据引擎 TQ，优化强化学习后训练

3. 软硬件全面升级，开源 Agent 参考设计打造 “Claw 一体机”

4. Atlas 350 加速卡，赋能推荐 / 多模态 / LLM 三大推理场景

五、深耕行业场景，技术与业务深度融合

六、CANN 开源开放升级，降低创新门槛

七、五大创新方向，共筑可持续 AI 产业生态

4008 770 775

华为昇腾计算业务总裁张迪煊