DeepSeek V3 跟 R1 模子实现海光 DCU 国产化适配并正
IT之家 2 月 4 日新闻,中科曙光国度进步盘算工业翻新核心无限公司昨日发文发布,海光信息技巧团队胜利实现 DeepSeek V3 跟 R1 模子与海光 DCU(深度盘算单位)国产化适配,并正式上线。用户在“光合开辟者社区”中的“光源”板块拜访并下载相干模子,或登录光源官网搜寻“DeepSeek”,即可基于 DCU 平台安排跟应用相干模子。据先容,DeepSeek V3 跟 R1 模子基于 Transformer 架构,采取了 Multi-Head Latent Attention(MLA)跟 DeepSeek MoE 两年夜中心技巧。MLA 经由过程增加 KV 缓存明显下降了内存占用,晋升了推理效力;DeepSeek MoE 则经由过程帮助丧失(auxiliary loss)实现了专家负载的智能均衡,进一步优化了模子机能。IT之家查问得悉,DCU 是海光信息推出的高机能 GPGPU 架构 AI 减速卡,努力于为行业客户供给自立可控的全精度通用 AI 减速盘算处理计划。现在,DCU 已在科教、金融、医疗、政务、智算核心等多个范畴实现范围化利用。
- 上一篇:OPPO K12新品上市 限时优惠1699元
- 下一篇:没有了