使用腾讯云平台快速部署DeepSeek大模型
发布时间 - 2025-02-04 00:00:00 点击率:次总览
DeepSeek 是由深度求索公司推出的大语言模型。其中: DeepSeek-V3 是在14.8万亿高质量 token 上完成预训练的一个强大的混合专家 (MoE) 语言模型,拥有6710亿参数。作为通用大语言模型,其在知识问答、内容生成、智能客服等领域表现出色。 DeepSeek-R1 是基于 DeepSeek-V3-Base 训练生成的高性能推理模型,在数学、代码生成和逻辑推断等复杂推理任务上表现优异。 DeepSeek-R1-Distill 是使用 DeepSeek-R1 生成的样本对开源模型进行微调得到的小模型,拥有更小参数规模,推理成本更低,基准测试同样表现出色。 本文将介绍如何通过 腾讯云 TI 平台,快速部署 DeepSeek 系列模型。完成模型部署后,即可与模型进行对话体验;或以 API 形式进行调用,接入 AI 应用中。支持的模型列表
腾讯云 TI 平台已上架 DeepSeek 全系模型,详见下表。| 模型名称 | 参数量 | 激活参数量 | 上下文窗口 | 推理资源推荐 |
| DeepSeek-V3 | 671B | 37B | 128K | 多机分布式部署,节点数量:2个,单节点配置:HCCPNV6 机型 |
| DeepSeek-R1 | 671B | 37B | 128k | 多机分布式部署,节点数量:2个,单节点配置:HCCPNV6 机型 |
| DeepSeek-R1-Distill-Qwen-1.5B | 1.5B | – | – | 12C44GB 1卡A10 |
| DeepSeek-R1-Distill-Qwen-7B | 7B | – | – | 12C44GB 1卡A10 |
| DeepSeek-R1-Distill-Llama-8B | 8B | – | 128K | 12C44GB 1卡A10 |
| DeepSeek-R1-Distill-Qwen-14B | 14B | – | – | 16C96G 1卡A100 |
| DeepSeek-R1-Distill-Qwen-32B | 32B | – | – | 32C192G 2卡A100 |
| DeepSeek-R1-Distill-Llama-70B | 70B | – | 128K | 164C948G 8卡A100 |
限时免费体验
平台限时免费开放 DeepSeek 模型的免部署在线体验,支持 DeepSeek-R1 和 DeepSeek-R1-Distill-Qwen-1.5B 两款模型,便于开发者直观比较“最大杯”和“最小杯”的性能差异。进入 DeepSeek 系列模型详情页面后,选择上方 Tab 即可进入在线对话体验页面。 对于其他模型,可按下方模型部署实践自主部署对应模型后体验。模型部署实践
下文我们将选用尺寸相对最小的 DeepSeek-R1-Distill-Qwen-1.5B 模型进行部署实践。其他模型的操作流程类似,仅需注意算力资源的配置差异。前置准备工作
模型:TI 平台已将 DeepSeek 模型内置在大模型广场中,您可直接选择模型并一键部署。 资源:1.5B 的 DeepSeek 模型对算力需求较小,单卡A10即可支持其推理服务。您有多种计费模式选择: 按量计费:对于仅需短时体验或所需算力较小的用户,机器来源推荐选用“从 TIONE 购买”,并选用“按量计费”模式。该模式无需提前准备算力。开始部署时,平台会自动分配资源并进行计费,本实践也将使用该模式进行展开。 包年包月:对于已购买 CVM 机器或需较大、稳定算力的用户,机器来源推荐选用“从 CVM 机器中选择”,并选择对应的资源组。该模式下需要您提前购买好 CVM 机器并添加至 TI 平台资源组,详细操作步骤请参考资源组管理。步骤一:部署模型服务
1. 登录 腾讯云 TI 平台 ,在大模型广场页面,您可看到 TI 内置的开源大模型卡片。 2. 单击进入“DeepSeek 系列模型”卡片,查看模型详细介绍。步骤二:体验模型效果
1. 服务部署完成后,在“模型服务 > 在线服务”页面的列表中,其状态将显示为“运行中”。DeepSeek-R1-Distill-Qwen-1.5B 模型的部署时长预计为1-2分钟。步骤三:调用模型推理 API
腾讯云 TI 平台在线服务模块内置了接口调用测试功能。此外,您还可以使用命令行等工具测试调用 API。测试完成后,您可以以 API 调用方式将模型接入 AI 应用。下文将对模型推理 API 的测试及接入进行示例说明。方式一:使用 TI 平台内置工具测试 API 调用
1. 在“模型服务 > 在线服务”页面的列表中,单击刚部署的服务的名称,跳转到服务详情页。方式二:使用命令行工具测试 API 调用
1. 在上述的“接口信息”版块中,在下图位置1处输入接口名。输入完成后,单击位置2处的复制按钮,复制完整的 API 调用命令头。方式三:使用第三方应用开发工具调用 API
完成模型部署后,如果您需要在您的 AI 应用中接入已部署的模型服务,可以将服务 API 的信息配置到相关平台或系统中。下文以Cherry Studio为例,介绍如何将服务 API 接入应用中。 Cherry Studio 是一个支持多模型服务的开源桌面客户端,可以将多服务集成至桌面 AI 对话应用中。本文仅以此为例介绍 API 调用。如您需要商用 Cherry Studio,请仔细阅读其开源软件协议。 1. 进入您在 TI 平台已部署模型服务的“服务详情页 > 服务调用”Tab,在页面较上方位置找到“调用地址”字段,并单击最右侧复制按钮复制。步骤四:管理推理服务
您可以通过访问“模型服务 > 在线服务 > 服务详情”页面查看并管理推理服务。包括但不限于:停止/重启/删除服务、查看服务配置信息、实例列表、监控图表、容器事件、日志、更新记录等。详细操作指引可参考在线服务运营。不同模型部署的注意事项
对于 DeepSeek 的其他模型,部署流程与前述类似,主要区别在于填写服务参数时配置的资源规格。请参考大模型推理所需资源指南进行资源的合理配置。大小模型的效果对比
基于已部署的“DeepSeek-R1-Distill-Qwen-1.5B”和“DeepSeek-R1”模型服务,我们尝试使用一个相同的问题,简要对比一下大小模型的推理效果。 问题输入在我的厨房里,有一张桌子,上面放着一个杯子,杯子里有一个球。我把杯子移到了卧室的床上,并将杯子倒过来。然后,我再次拿起杯子,移到了主房间。现在,球在哪里?大小模型效果对比
| 对比范围 | DeepSeek-R1-Distill-Qwen-1.5B | DeepSeek-R1 |
| 截图示例 |
|
|
# 平山企业网站建设服务
# 普陀区网站建设前端
# 江门网站建设公司最好
# 清洁网站建设
# 网站建设费用推荐
# 消杀公司网站建设加盟
# 网站建设评选
# 益阳网站建设系统
# 绥芬河响应式网站建设
# 慈善协会网站建设资料
# 福建自适应网站建设
# 西宁网站建设的步骤过程
# 如何自己建立网站建设
# 敦化定制网站建设
# 编程网站建设方案
# 惠州网站的建设公司
# 彭水企业网站建设
# 柳南区热门网站建设推广
# 滁州家装网站建设电话
# 长沙专业的网站建设企业
相关栏目:
【
网站优化151355 】
【
网络推广146373 】
【
网络技术251813 】
【
AI营销90571 】
相关推荐:
Laravel如何使用withoutEvents方法临时禁用模型事件
深圳防火门网站制作公司,深圳中天明防火门怎么编码?
阿里云高弹*务器配置方案|支持分布式架构与多节点部署
网站制作大概多少钱一个,做一个平台网站大概多少钱?
手机怎么制作网站教程步骤,手机怎么做自己的网页链接?
iOS中将个别页面强制横屏其他页面竖屏
微信小程序 canvas开发实例及注意事项
Laravel怎么进行数据库事务处理_Laravel DB Facade事务操作确保数据一致性
如何确保FTP站点访问权限与数据传输安全?
北京网站制作的公司有哪些,北京白云观官方网站?
网站制作软件免费下载安装,有哪些免费下载的软件网站?
如何快速查询网址的建站时间与历史轨迹?
如何利用DOS批处理实现定时关机操作详解
Laravel如何使用Eloquent ORM进行数据库操作?(CRUD示例)
香港服务器建站指南:免备案优势与SEO优化技巧全解析
七夕网站制作视频,七夕大促活动怎么报名?
Python自然语言搜索引擎项目教程_倒排索引查询优化案例
如何在万网主机上快速搭建网站?
如何在宝塔面板创建新站点?
Laravel如何部署到服务器_线上部署Laravel项目的完整流程与步骤
如何在 Go 中优雅地映射具有动态字段的 JSON 对象到结构体
Java Adapter 适配器模式(类适配器,对象适配器)优缺点对比
Java垃圾回收器的方法和原理总结
长沙做网站要多少钱,长沙国安网络怎么样?
北京网页设计制作网站有哪些,继续教育自动播放怎么设置?
太平洋网站制作公司,网络用语太平洋是什么意思?
Laravel如何集成Inertia.js与Vue/React?(安装配置)
Linux网络带宽限制_tc配置实践解析【教程】
Laravel怎么防止CSRF攻击_Laravel CSRF保护中间件原理与实践
Laravel 419 page expired怎么解决_Laravel CSRF令牌过期处理
如何基于PHP生成高效IDC网络公司建站源码?
IOS倒计时设置UIButton标题title的抖动问题
如何在万网自助建站平台快速创建网站?
如何挑选最适合建站的高性能VPS主机?
原生JS实现图片轮播切换效果
Laravel的Blade指令怎么自定义_创建你自己的Laravel Blade Directives
如何在云主机上快速搭建多站点网站?
Laravel如何实现模型的全局作用域?(Global Scope示例)
Laravel Telescope怎么调试_使用Laravel Telescope进行应用监控与调试
企业在线网站设计制作流程,想建设一个属于自己的企业网站,该如何去做?
Linux系统命令中tree命令详解
js代码实现下拉菜单【推荐】
Laravel怎么实现验证码(Captcha)功能
C++时间戳转换成日期时间的步骤和示例代码
桂林网站制作公司有哪些,桂林马拉松怎么报名?
高端建站三要素:定制模板、企业官网与响应式设计优化
如何在阿里云ECS服务器部署织梦CMS网站?
如何在建站宝盒中设置产品搜索功能?
电商网站制作价格怎么算,网上拍卖流程以及规则?
极客网站有哪些,DoNews、36氪、爱范儿、虎嗅、雷锋网、极客公园这些互联网媒体网站有什么差异?
上一篇:Android实现底部弹窗效果
下一篇:《老柚》查看收益方法
上一篇:Android实现底部弹窗效果
下一篇:《老柚》查看收益方法

