神州数码旗下神州鲲泰推理服务器全面支撑deepseek系列模型部署
2025-02-06
来源:未知
- 分享到:
deepseek ai最新发布的多模态大模型janus-pro,以及之前发布的大型语言模型deepseek-r1、deepseek-v3及deepseek-v2,一经发布,就在
deepseek ai最新发布的多模态大模型janus-pro,以及之前发布的大型语言模型deepseek-r1、deepseek-v3及deepseek-v2,一经发布,就在ai领域引起了热烈反响,多项创新技术显著提升了模型的性能与效率。deepseek系列模型首发即支持昇腾平台,神州数码旗下神州鲲泰推理服务器产品搭载昇腾硬件,可全面支持deepseek系列模型的快速部署,可为用户带来更快、更高效、更便捷的ai开发和应用体验。
2025年2月4日,deepseek-r1、deepseek-v3、deepseek-v2、janus-pro正式上线昇腾社区,支持一键获取deepseek系列模型,支持昇腾硬件平台上开箱即用,推理快速部署,带来更快、更高效、更便捷的ai开发和应用体验,欢迎广大开发者体验使用。
下面以deepseek-v3为例,
演示在昇腾社区如何高效获取模型及使用
1硬件要求
部署deepseek-v3模型需配置4台kuntai a924推理服务器(每台搭载8张昇腾推理卡)
2模型调用实践
一、 权重转换
gpu:
npu:
二、 加载镜像
在昇腾社区/开发资源下载适配deepseek-v3的镜像包:
mindie:1.0.t71-800i-a2-py311-ubuntu22.04-arm64
完成之后,请使用docker images命令确认查找具体镜像名称与标签。
三、 容器启动
提供的mindie镜像预置了deepseek-v3模型推理脚本,从您信任的来源自行获取权重后,放置在从上述下载的模型代码的主目录下,修改模型文件夹属组为1001,执行权限为750,启动容器。
四、 服务化测试
配置服务化环境变量,expandable_segments-使能内存池扩展段功能,即虚拟内存特性。
修改服务化参数
拉起服务化
图片出现“daemon start success!”,则认为服务成功启动。
更深入了解deepseek系列模型在昇腾上的使用方法及指导文档,可登录昇腾社区模型库专区学习了解!
相关新闻
-
电动车充电慢?北汽新能 电动车即将没电?开到换电站,全程扫描...
-
iphone 8要出新皮肤?传苹果 美国运营商virgin mobile发给员工的一份内部...
-
oculus视频负责人:vr将为电 你喜欢在看电影时吃爆米花吗?如果是的...
-
打破理所当然,oppo find 6 月 12 日,oppo 官方微博发布最新产品猜...
-
不只是表,更是生活 pac 说起智能穿戴产品大家第一个想到的肯定...
62t 评论于 [2025-06-11 18:22:04]
社交网络
熊猫英语
借贷新入口