数据标注工作室赚钱吗 数据标注行业的前景( 二 )


AI快速发展的背后 , 一批批“老师”换血 , 流动率相当高 。 “做文本标注的人员 , 现在越来越少 , 图像标注的30%的流动率 , 语音、视频常年都是对半开 。 而且现在的95后、00后愿意做的人少了 , 一般呆过三个月就不愿意继续干了” 。
3年时间过去了 , 刘梦缘不断和老同事告别 。 但她从枯燥无味的工作中坚持了下来 , 她记不得自己标注了多少图 , 只觉得自己是踏上了人工智能的大潮 。
对那些新晋的员工 , 刘梦缘也是如此描述 , “我们是走在智能时代前面的一群人” 。
巨头来了
行业的分水岭出现在2019年初:几大互联网巨头纷纷意识到数据的重要性 , 并着手建立自己的“数据工厂” 。

数据标注工作室赚钱吗 数据标注行业的前景

文章插图

据媒体报道 , 截至今年3月 , 百度山西人工智能数据产业基地中 , 就拥有超过3000位标注师 , 主要涉及自动驾驶、人脸识别等内容标注 , 其中86%的员工为90后;字节跳动在北京、天津、济南、武汉各地 , 也招募了4万名数据标注师;腾讯更是直接把平台放到了线上 , 让标注师变成了一种“全民兼职” , 称为“众包” 。
巨头的加入一方面是为了市场和成本 , 另一方面也是出于数据安全考虑 , 所以在内部搭建专门的标注团队显然是一个好选择 。 但是 , “模型的训练和数据需求是周期性的 , 任务不持续 , 今天有活、明天没活 , 人员容易流失 , 管理成本很高” , 刘梦缘能理解大厂摆出“众包”的原因 , “我让手下的人去试过平台的兼职标注 , 单个标注几分钱 , 一个月的收入在2000元左右 , 比起让外包来做 , 省了一半还多 。 ”
“大厂出手之后 , 市场最后拼的就是成本” , 那段时间刘梦缘所在公司业绩下滑了40% , 而且做出的标注数据质量也差很多 。
数据标注工作室赚钱吗 数据标注行业的前景

文章插图

图片来源:Boss直聘
据懂懂笔记了解 , 2018-2020年数据标注师行业平均薪资为5000-6000元 , 如果晋升为项目主管或者更高级别的项目总监后 , 月薪才能向5位数靠拢 。 而这一薪资标准到了2021年 , 在一些求生的外包“小厂”内 , 不升反降 。
数据标注工作室赚钱吗 数据标注行业的前景

文章插图

图片来源:职友集
巨头涌入 , 薪资缩水的“大趋势”下 , 能窥探出标注师行业的“小趋势”:许多数据标注就像被人精心种下的水稻 , 还未到秋收季节稻穗就掉进了土里 。
年初 , 刘梦缘单独接了一个“私单” , 赚了2万元 。
那是一个大厂“丢”出来的单子 , 做无人驾驶的数据标注工作 , 由于公司手头上的人员都扑在另一个项目上 , 她拉了之前的一些老同事和10个兼职学生 , 干了个“包工头”的活 。
已经快1年没有亲自上阵标注文件的刘梦缘 , 只能硬着头皮和所有人一样移着鼠标 , 头顶、脖子、肘部、手腕、膝盖……都要一个个地标出来 。 整整一周 , 一群人完成了几万个点位的标注——他们看似在科技的潮头 , 干的却是苦力活 。
本以为这单生意之后 , 可以继续接小单 , 可好景不长 。 “4月份开始 , 很多新团队出现 , 压价特别狠 , 原来是标注的报价按毛算 , 现在报价单上都出现几分钱了” 。
数据标注行业有一套分工流程:巨头把任务交给中游的数据标注公司 , 再由中游包给下游的小公司、小作坊 , 有的小作坊还会进一步众包给“散户”:比如兼职学生 。 一单生意几经转手 , 就造成了行业众包中介层叠越来越严重 , 利润所剩无几 。
“AI 肯定是未来的大趋势 , 但我们这些小公司很迷茫 , 听说很多公司都不干了 。 ”刘梦缘本想着“私单”做得差不多了之后就出来单干 , 可这样的行业情况下 , 她能感受到的只有压力 。
困境、挣扎
尽管目前的情况不乐观 , 刘梦缘依旧相信 , 数据标注行业最终会大浪淘沙 , 而他们 , 是走到最后的那一批 。
从好的局面来看 , 下游市场陷入混战的同时 , 上游的 AI 市场从未停止过发展 , AI正在成为人们进入这个社会的“入口” , 这让刘梦缘和其他从业者们感到充满希望 。
数据标注工作室赚钱吗 数据标注行业的前景

文章插图

但行业也显露出严峻的一面 , 数据标注在迭代:大模型慢慢替代标注师 , 一些门槛更高、学科更细分的领域正露出头角 。 比如 , 医疗健康领域需要对病理切片等进行标注 , 以腰椎间盘突出的 CT 片为例 , 标注员必须准确识别并标注出间盘的轮廓 。 不过 , 很多医疗专家并没有时间和精力做数据标注 , 而这类工作又是普通的标注师无法胜任的 , 通常需要请医生或医学院的学生来做 , 结果就是成本居高不下 , 这些专业人员的成本是普通标注员的10倍 。

推荐阅读