Jack Pan

#hitl

4 篇文章

Phase 2:eval 集**绝不**能见过预标注

多数 HITL 项目搞砸的那一个决定。如果 eval 标签的种子是模型自己的预测,那你以后报的所有 F1 数字都对模型有偏。这件事第一天做很便宜,第四十天做很疼。

评测hitlml ops

Phase 2:什么算 ground truth

把 Label Studio 导出收回去微调下一版模型时,把导出里**所有东西**都当 ground truth 是「用模型自己的预测训模型自己」的快速通道。一个字节进训练集之前应该跑的几道过滤。

计算机视觉label studio微调

Phase 2:别每次导出都重训

每批校验完的 episode 从 Label Studio 导出后,最直觉的动作就是立刻微调。为啥别这么干,以及一个真的「这次重训值得」时才触发的便宜节奏闸。

微调hitlml ops

Phase 2:版本号挂在 slice 上,不挂在 snapshot 上

微调出模型 v3 时你得能回答「哪些导出的校验进了这个模型」。把整个训练集快照下来是显眼的答案、也是错的答案。版本化输入和推导过程;训练集是它们的函数。

ml ops可复现性hitl