阿里云-300-部署-deepseek-R1-8B
如何xxx
#type / howto
#status / evergreen
阿里云-300-部署-deepseek-R1-8B
[!info] related notes
- 相关资源: Deep Seek OCR, Docker, Obsidian知识库静态部署
使用 300 元阿里云学生代金券部署 DeepSeek-R1-Distill-Qwen-8B 是一个非常完美的实践项目。8B 模型的显存需求大约在 5GB-8GB(量化后),这使得我们可以选择性价比极高的 GPU 实例。
以下是针对学生券优化的全流程实操方案,核心思路是:抢占式实例 + Ollama + Open WebUI。
第一步:创建阿里云 GPU 服务器 (ECS)
为了节省资金,我们必须使用抢占式实例。
- 进入 ECS 购买页: 选择“自定义购买”。
- 付费模式: 勾选 “抢占式实例”(价格通常是按量的 1-3 折)。
- 地域: 建议选 华北 6 (呼和浩特) 或 华北 3 (张家口),GPU 资源较多且便宜。
- 实例规格:
- 搜索并选择
ecs.gn6i-c4g1.xlarge(NVIDIA T4,16G 显存,约 1.2 元/小时)。 - 或者
ecs.gn7i-c8g1.2xlarge(NVIDIA A10,24G 显存,约 2.2 元/小时)。 - 注:8B 模型 T4 显卡完全够用,16G 显存还能让你以后尝试 14B 模型。
- 镜像: 选择 公共镜像 -> Ubuntu 22.04,勾选 “安装 GPU 驱动”,驱动版本选默认最新即可。
- 存储: 系统盘选 ESSD,容量设置为 100GB(模型和 Docker 镜像很占空间)。
- 带宽: 选 “按使用流量”,峰值拉到 100Mbps(下载模型快,不求人)。
- 购买: 确认下单。
第二步:配置安全组(开门)
在 ECS 控制台找到你的实例,进入“安全组”配置规则,手动添加:
- 端口 3000: 给 Open WebUI(网页界面)用。
- 端口 11434: 给 Ollama API 用(如果你想在本地调用服务器接口)。
第三步:环境准备(连接服务器)
使用终端(或阿里云自带的远程连接 Workbench)登录服务器。
- 检查 GPU 状态:
nvidia-smi
看到显卡信息说明驱动安装成功。 2. 安装 Docker: (用于运行前端界面)
curl -fsSL https://get.docker.com | bash -s docker
第四步:部署推理后端(Ollama)
Ollama 是目前部署 DeepSeek 蒸馏版最简单、最快的工具。
- 安装 Ollama:
curl -fsSL https://ollama.com/install.sh | sh
- 运行 DeepSeek-R1-8B:
ollama run deepseek-r1:8b
系统会自动开始下载模型。下载完成后,你直接在终端就可以开始对话了。输入 /bye 退出。
第五步:部署图形化界面(Open WebUI)
为了获得类似 ChatGPT 的网页体验,我们部署 Open WebUI。
- 运行 Docker 容器:
docker run -d -p 3000:8080 --add-host=host.docker.internal:host-gateway -v open-webui:/app/backend/data --name open-webui ghcr.io/open-webui/open-webui:main
- 访问界面:
打开浏览器,输入
你的服务器公网IP:3000。 - 注册与登录: 第一次进入需要注册一个管理员账号(这个账号只存在于你的服务器上)。
- 选择模型:
在页面上方的模型列表里选择
deepseek-r1:8b,即可开始沉浸式对话。
💰 财务省钱策略(非常重要!)
由于你只有 300 元,如果不注意,几天就会扣完。请务必遵守以下操作:
- 不用即释放:
- 学生券买的 ECS 是按小时扣费的。当你不需要实验时,在控制台点击 “释放实例”(释放后服务器会消失,不再扣费)。
- 保存成果(快照/镜像):
- 释放前,给系统盘打一个 “快照” 或创建 “自定义镜像”(费用极低,每月几块钱)。
- 下次想玩时,用这个镜像重新买一台抢占式实例,以前装好的环境、下载好的模型都在,5分钟恢复战斗。
- 流量开销:
- 下载模型会产生流量费。DeepSeek-8B 约 5GB,流量费约 4 元。尽量减少重复下载的次数。
总结方案优势
- 配置: gn6i (T4) 实例,16G 显存。
- 模型: DeepSeek-R1-Distill-Qwen-8B。
- 预估成本: 实例 1.2元/时 + 流量 0.8元/GB。
- 体验: 满速 100Mbps 响应,拥有独立的 ChatGPT 风格网页,支持逻辑推理思维链显示。
这个流程走下来,你不仅学会了如何操作云资源,还掌握了目前最主流的大模型私有化部署工具链。