Phase 1:规范文件名换零配置批跑
一个像 `NN_NNN_ego.mp4` 这样的命名约定,能把整批跑的入参压到只剩一个 CLI 参数。为啥这件事便宜,又为啥它逼你**不**写一些代码。
数据流水线cli
$ whoami
$ ls topics/
$ ls posts/ | head
一个像 `NN_NNN_ego.mp4` 这样的命名约定,能把整批跑的入参压到只剩一个 CLI 参数。为啥这件事便宜,又为啥它逼你**不**写一些代码。
一篇短的警示。LS 的「Cloud Storage → Source Storage」看起来就是为本地数据设计的。用了它,你会得到几万个跟 Import 进去的真任务冲突的幽灵 task。
「每 N 帧抽一张」的均匀采样浪费标注员时间在模型本来就标得好的帧上。四个信号能挑得更准——段边界、段内均匀、低置信度、bbox 跳变。
`mediapipe`、`ultralytics`、`cv2` 导入慢、运行时还要模型权重。把这些 import 写在函数体里、不放在模块顶层,测试套件就能跑得又小又快、不下模型。
为什么视频预标注管线会演化出一个独占路径计算的 `layout` 模块,以及当六个不同部分各自拼路径时会静默地坏掉什么。
$ cat contact