Jack Pan

#计算机视觉

6 篇文章

Phase 1:review 帧采样的四个信号

「每 N 帧抽一张」的均匀采样浪费标注员时间在模型本来就标得好的帧上。四个信号能挑得更准——段边界、段内均匀、低置信度、bbox 跳变。

计算机视觉数据流水线label studio

Phase 1:用懒导入把 mediapipe / cv2 关在测试之外

`mediapipe`、`ultralytics`、`cv2` 导入慢、运行时还要模型权重。把这些 import 写在函数体里、不放在模块顶层,测试套件就能跑得又小又快、不下模型。

python测试计算机视觉

Phase 2:什么算 ground truth

把 Label Studio 导出收回去微调下一版模型时,把导出里**所有东西**都当 ground truth 是「用模型自己的预测训模型自己」的快速通道。一个字节进训练集之前应该跑的几道过滤。

计算机视觉label studio微调

Phase 1:为什么一个 episode 要拆成三个 Label Studio project

视频预标注多 project 模式深挖——什么逼出了拆分、一个 episode 怎么扇成三种 task、以及别和 Label Studio 的数据模型对着干。

计算机视觉label studio数据流水线

Phase 1:视频预标注管线里的两套帧率

推理帧率和 review 帧采样看起来是一回事,其实不是。两个旋钮各能换到什么、混在一起会坏掉什么。

计算机视觉数据流水线mediapipe

Phase 1:做一条视频预标注流水线,几个工程取舍

给一个具身机器人 Pick-and-Place 数据集做的 Phase-1 预标注流水线 —— MediaPipe + YOLO 推理、动作分段、Label Studio 导入,以及那些让它没在半路崩掉的「无聊」决定。

计算机视觉数据流水线label studio