大模型上传服务器
约 703 字大约 2 分钟
2026-04-23
本文记录一次在服务器上使用 ossfs2 挂载 OSS + 下载大模型(Qwen3-14B) 的完整过程,以及踩过的坑和最终优化方案。
🧱 一、环境信息
服务器:乌兰察布(ECS)
OSS Bucket:北京地域
工具:
- ossfs 2.0
- ossutil
模型大小:约 30GB(Qwen3-14B)
⚙️ 二、ossfs2 挂载 OSS
1️⃣ 创建配置文件
sudo touch /etc/ossfs2.conf配置内容:
--oss_endpoint=https://oss-cn-beijing-internal.aliyuncs.com
--oss_bucket=yyfy-ai2️⃣ 设置访问凭证(环境变量)
export OSS_ACCESS_KEY_ID=你的AK
export OSS_ACCESS_KEY_SECRET=你的SK3️⃣ 挂载命令(正确写法)
ossfs2 mount /www/wwwroot/model/ossfs2-bucket \
--oss_bucket=yyfy-ai \
--oss_endpoint=https://oss-cn-beijing.aliyuncs.com \
--log-level debug❗踩坑 1:endpoint 错误
错误现象:
AccessDenied: The bucket you are attempting to access must be addressed using the specified endpoint原因:
👉 使用了错误地域(杭州 vs 北京)
解决:
--oss_endpoint=https://oss-cn-beijing.aliyuncs.com❗踩坑 2:内网 endpoint 连接超时
错误日志:
Failed to connect to 100.x.x.x:443 timeout原因:
👉 内网 endpoint 仅支持同地域 ECS
解决:
👉 必须使用公网 endpoint:
oss-cn-beijing.aliyuncs.com📂 三、挂载性能问题
测试:
time cat model-00001-of-00008.safetensors > /dev/null结果:
2分28秒(非常慢)👉 结论:
❌ ossfs 不适合直接训练大模型 (随机读性能差)
🚀 四、改用 ossutil 下载(推荐)
1️⃣ 安装 ossutil
wget https://gosspublic.alicdn.com/ossutil/1.7.16/ossutil64
chmod +x ossutil64
mv ossutil64 /usr/local/bin/ossutil2️⃣ 配置 ossutil
ossutil config填写:
language: CH
accessKeyID: 你的AK
accessKeySecret: 你的SK
endpoint: oss-cn-beijing.aliyuncs.com
stsToken: (直接回车)❗踩坑 3:AccessKeySecret 为空
错误:
invalid accessKeySecret原因:
👉 配置时未正确输入 SK
解决:
👉 重新执行 ossutil config
📥 五、下载大模型
❌ 错误方式(低效)
ossutil cp -r oss://yyfy-ai/model/Qwen3-14B .问题:
- 速度慢
- 单线程
🚀 正确方式(高并发)
ossutil cp -r oss://yyfy-ai/model/Qwen3-14B . \
--jobs 8 \
--parallel 8 \
--force❗踩坑 4:反复提示 overwrite
cp: overwrite xxx (y or N)?原因:
👉 目录已有残留文件
解决:
rm -rf Qwen3-14B或:
--force❗踩坑 5:并发过高导致限速
现象:
Speed: 172 KB/s原因:
👉 并发过高被 OSS 限流
解决:
--jobs 4 --parallel 4✅ 最终推荐参数
ossutil cp -r oss://yyfy-ai/model/Qwen3-14B . \
--jobs 8 \
--parallel 8 \
--force \
--endpoint oss-cn-beijing.aliyuncs.com⚡ 六、性能对比
| 方式 | 速度 | 适合场景 |
|---|---|---|
| ossfs 挂载 | ❌ 很慢 | 浏览文件 |
| ossutil 下载 | ✅ 快 | 大模型训练 |
🧠 七、训练代码修改
将模型路径改为本地:
MODEL_ID = "/www/wwwroot/model/local_model/Qwen3-14B"🎯 八、最终结论
👉 ossfs:
- 适合挂载查看
- 不适合训练大模型 ❌
👉 ossutil:
- 高速下载
- 适合训练场景 ✅
🔒 九、安全提醒(非常重要)
⚠️ 不要在任何地方泄露:
- AccessKeyID
- AccessKeySecret
如果泄露:
👉 立即删除并重建
📌 总结一句话
👉 训练大模型:不要用 ossfs,直接用 ossutil 下载到本地
如果你也在用 OSS + 大模型,这套方案可以直接复用 👍
版权所有
版权归属:念宇
