秒传机制

基于文件哈希的内容去重实现秒传，避免重复上传相同文件

#type / concept #status / evergreen #tech / dev / backend

[!info] related notes

所属 MOC: 前端工程化 MOC

前置概念: 断点续传机制

并列概念: 完整性校验

关系笔记: 大文件传输系统设计

一句话定义

秒传是通过文件哈希判断内容是否已存在，如果存在则直接创建业务引用，不再要求上传内容。

秒传不是”文件名相同就跳过”，而是”内容相同”

必须依赖 hash 或其他强校验机制。

很多系统还会做：

这就是内容去重。

调用 /upload/init 时，后端可以返回：

{
  "uploadId": "u_123456",
  "chunkSize": 10485760,
  "uploadedChunks": [],
  "needUpload": false,
  "fileExists": true,
  "fileId": "f_001"
}

如果 needUpload: false，前端直接完成，无需上传任何 chunk。