埋点数据质量与治理
通过 schema、类型约束、字典、测试、版本管理和废弃机制保证埋点数据长期可信可用。
#type / concept
#status / growing
#tech / dev / frontend
[!info] related notes
埋点数据质量与治理
一句话定义
埋点系统的长期价值不取决于事件数量,而取决于数据是否稳定、可信、可解释、可维护。
核心内容
- 需要用 schema 约束事件名、必填字段、字段类型和枚举值
- 可以用 TypeScript 类型减少接入时的低级错误
- 埋点字典要记录事件说明、触发时机、字段定义、负责人、上线版本和变更历史
- 核心链路埋点应该进入测试流程,而不是上线后再观察有没有数据
- 要有准入、版本管理、废弃和下游依赖检查机制
常见质量问题
- 重复上报
- 漏报
- 字段缺失或类型漂移
- 新旧版本口径不一致
- 测试数据和机器人流量污染
- 客户端时间不准或事件顺序错乱
治理重点
- 新增事件前先查重,避免同义事件并行存在
- 字段改名、改类型、改触发时机都应该被视为模型变更
- 敏感字段要白名单控制,不能默认进入埋点链路
边界与易混淆点
- 埋点治理不只是技术实现,还涉及产品、数据、测试、运营和合规协作
- “能采到”不等于“能分析”,更不等于“能长期维护”