QQ登录

只需一步,快速开始

广告载入中...
查看: 23|回复: 0

云天励飞 GPNPU 架构与 IFWA 智能融合软件栈完成

[复制链接]
发表于 2026-4-26 10:26 | 显示全部楼层 |阅读模式

马上注册,享用更多功能,让你轻松玩转本论坛。

您需要 登录 才可以下载或查看,没有账号?立即注册

×
4月24日,DeepSeek-V4 系列模型发布。围绕该模型 CSA/HCA 混合注意力机制带来的新型计算需求,云天励飞依托自研 GPNPU 架构及 IFWA 智能融合软件栈,通过 PyTorch 插件 torch_ifwa,完成了面向 GPNPU 平台的关键机制适配验证。
此次适配验证主要面向 DeepSeek-V4 中 CSA/HCA 混合注意力机制的计算特征,验证了 IFWA 软件栈对新型注意力结构的快速响应能力,以及 GPNPU 架构面向前沿大模型演进的适配潜力。该进展为后续 DeepSeek-V4 系列模型在 GPNPU 平台上的工程化部署、算子优化和性能验证奠定了基础。
CSA/HCA 混合注意力机制:DeepSeek-V4长上下文效率优化的重要创新

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

快速回复 返回顶部 返回列表