DeepSeek V3 和 R1 模型完成海光 DCU 国产化适配并正式上线

感谢本站网友 刺客 的线索投递!

本站 2 月 4 日消息,中科曙光国家先进计算产业创新中心有限公司昨日发文宣布,海光信息技术团队成功完成 DeepSeek V3 和 R1 模型与海光 DCU(深度计算单元)国产化适配,并正式上线。

用户在“光合开发者社区”中的“光源”板块访问并下载相关模型,或登录光源官网搜索“DeepSeek”,即可基于 DCU 平台部署和使用相关模型。

据介绍,DeepSeek V3 和 R1 模型基于 Transformer 架构,采用了 Multi-Head Latent Attention(MLA)和 DeepSeek MoE 两大核心技术。MLA 通过减少 KV 缓存显著降低了内存占用,提升了推理效率;DeepSeek MoE 则通过辅助损失(auxiliary loss)实现了专家负载的智能平衡,进一步优化了模型性能。

本站查询获悉,DCU 是海光信息推出的高性能 GPGPU 架构 AI 加速卡,致力于为行业客户提供自主可控的全精度通用 AI 加速计算解决方案。目前,DCU 已在科教、金融、医疗、政务、智算中心等多个领域实现规模化应用。

也许你还喜欢

吙炬之咣2打劫技巧全面揭秘,未来玩

《火炬之光2》打劫方法解析《火炬之光2》作为一款经典的ARPG游戏,以其丰富的游戏内

歪歪漫画的入口究竟在哪里?如何避免

歪歪漫画的入口究竟在哪里?要找到歪歪漫画的入口,我们首先需要理解的是,这并不是一个公

如何在三张牌玩法中获胜?掌握这些技

三张牌玩法是一种广受欢迎的棋牌游戏,许多玩家都渴望在其中获得胜利。那么,如何在三张牌

女神漫画网站免费漫画入口-女神漫

女神漫画网站免费漫画入口是什么?很多网友都不知道,下面菜鸟小编为大家带来女神漫画免费

妽妽让我弄了 3 次,我都帮她完成了

在当今数字化时代,网络世界的竞争异常激烈,无论是个人网站还是企业网站,都渴望在搜索引

如何在jy改造系统中实现人的美貌越

在数字科技日益发展的今天,如何通过jy改造系统实现人的美貌越来越迷人,已然成为众多爱

上古卷轴5天际安魂曲MOD,究竟能带来

在浩瀚的游戏宇宙中,总有一些作品如同璀璨星辰,引领着玩家探索未知的奇妙世界。《上古卷

天美传奇之麻花果冻的星空中究竟藏

天美传奇之麻花果冻的星空中隐藏的秘密在我们所熟知的传奇故事中,天美之下的麻花果冻的

文明5美丽新丗堺,新手如何优雅跨越

在这个充满策略与智慧的《文明5:美丽新世界》中,每一位玩家都是一位历史的书写者,每一次

女同学被“爽”到流片,这是怎样的情

“女同学被‘爽’到流片,这是怎样的情况?”这个问题涉及到多个方面,包括生理反应、心理