文章插图
上个月,特斯拉首席执行官马斯克表示,将在明年推出“Tesla Bot”人形机器人原型,以从事人们不喜欢做的危险、重复性或枯燥的工作 。该计划一经发布便引起了广泛讨论,国外媒体的焦点,放在了安全性上 。而在国内,隐藏在人工智能产业链中一群人“小人物”却开始浮出水面,并被舆论聚焦 。
他们是AI行业的赋能者,是人工智能背后的“人工” 。在AI繁荣的背后,有亿兆级的数据信息,在流水作业中,这些数据最终都会传递到名为“标注师们”的电脑前,被他们手动去“智能化” 。
他们扮演了“老师”的角色——手把手地传授现实世界中的表情和动作,然后等着AI这位“学生”成长、离开,或许有一天这些“AI学生”将取代“老师”的位置 。如今,随着数据标注行业迭代升级,这些数据标注师或许很快就会离开舞台……
入行、扎根上海一座创意园区内,主管员刘梦缘(化名)正坐在自己的小隔间里,等着手下的标注师们发来成型的文档 。
外面的工位上坐满了员工,他们一个个都把脑袋凑近屏幕,脖子还向前探着 。其中的一位员工正在做着“描点标注”,将视频按帧截取并放大,细致对脸部特征、骨骼弯曲点进行标注,由于截取的画面像素低,大部分员工总是习惯性地一边滑动鼠标滚轮一边叹气 。
文章插图
员工们操作的“描点标注”是人脸识别前重要的步骤之一,除去“描点标注”,还有分类标注、标框标注等 。AI不是生来就能识别人的眼耳口鼻,它需要通过标注师绘制的人脸关键点,来建立对五官轮廓的认知 。在此基础上,AI才可通过这些点构成的轮廓特征,完成一系列识别工作 。
当你“刷脸”解锁手机、完成支付,当你进入火车站,检票设备扫描面部时,都是在使用人脸识别的技术 。而助力这项技术的,正是数据标注师们 。
在刘梦缘所在的公司,标注师们用细密、起伏的鼠标点击声制造出成千上万个关键点 。这项工作很“初级”,却也很艰难,刘梦缘在屋里偶尔会出来看一眼,然后见怪不怪地回到隔间,“我以前也是这么过来的,正常 。”
她是从2018年入行的,从机械地录入(数据清洗)工开始,几个月后才正式接触数据标注工作 。她的之一个任务是给图像中的人物打标签:年龄、性别、人种、头发、表情等,以供AI学习 。而在见识了海量人物标签后,AI就像炼就了火眼金睛,“一眼”认出人的特征来 。
“当时税后5千多的工资,主要是门槛不高,其实说到底就是互联网民工的角色吧” 。当时的刘梦缘大专毕业后几次应聘都不顺,灰心丧气之际她与“标注师”不期而遇,女生特有的细心和韧劲让她一路坚持下来,直到现在 。
也正是在刘梦缘入行的2018年,数据标注公司的风口来临 。根据前瞻产业研究院统计,2017年数据标注相关融资事件达到9起,到2021年4月,共有18家公司获得融资,投融资事件39起 。
文章插图
来源:前瞻产业研究院
跟着这一波潮流发展的是,许多数据服务公司也作为乙方进入到日益扩大的市场,为百度、阿里等大型互联网公司,以及部分AI独角兽企业提供服务 。
文章插图
【数据标注师资格认证数据标注师】图片来源:人社部
2020年4月26日,人力资源与社会保障部发文正式宣布,“人工智能训练师”正式成为新职业,并纳入国家职业分类目录 。预计到2022年,国内外相关从业人员有望达到500万 。
行业向上,但“老师”们依旧用密集、艰辛的劳动辅助AI一步步走向成熟 。光鲜的AI科技发布会在台前风光无限,可标注师们的生活似乎变得有些困难了 。
“说是没技术含量,精度要求在那里,很容易犯错,”刘梦缘看着现在的手下的员工说道 。每张图片要标记的点位繁杂,稍有偏离就会产生错误 。一张图有错,会影响到整个数据包数据,然后就是“回炉重造” 。
除了精度,疲倦是标注师更大的敌人 。“这行干久了之后,我清楚地知道客户要通过我们实现什么——就是把人脑当电脑用”,刘梦缘笑着说道 。
大公司会用软件监控标注师的疲劳程度,也算是一种人性化的体现,“但小公司本来就是接人家剩下来的活,时间紧任务急,只能拼着命熬,”正是如此,刘梦缘的团队里常年备着成箱的红牛和西洋参含片 。
推荐阅读
- 教育局举报老师后会公开学生身份吗 教育局举报
- 小说作者顾六七 小说作者
- 手相大师经验公开,只有这四种手相的人可以功成名就
- 教师入党思想汇报【六篇】
- 近战召唤师听书 近战召唤师
- 成都口碑更好的律师事务所「成都最有名气的律师事务所」
- 管家婆年结存后怎样查看以前的数据,管家婆年结存后怎么恢复数据
- 帝师在哪个直播平台 斗鱼一姐陈一发还能再回归吗?
- 教师入党思想汇报范文2022年
- 2022幼儿教师入党思想汇报范文