位置:极速分分彩 > 科普 > 正文 >

未来可期?数据标注从业者:我在为人工智能添砖加瓦

2019年09月15日 11:51来源:未知手机版

遥控飞机什么牌子好,秀才遇到兵粤语,周玉蔻大骂康熙来了

人工智能时代,数据标注已经成为一个新兴产业,其上下游相关业务涉及机器学习、虹膜识别、人脸识别、无人驾驶等技术。然而数据标注真正的核心是大量人力投入的标框工作。

目前关于数据标注行业的研究还较为缺乏,更多的是媒体调查报告对该行业的描述。比如,诸多媒体都将该产业定义为劳动密集型,也通常将它与富士康进行类比,称其为“人工智能领域的富士康”。

作为长期观察中国互联网产业发展的一员,我对这个“人工智能领域的富士康”中的从业者群体产生了极大的兴趣:他们究竟是谁?他们真的是人工智能时代的流水线工人吗?

图1: 正在标注中的“产教融合”实习生们。文中图片均由作者提供

在对贵州的“未来”数据标注公司进行为期一周的前期田野调查过程中,我发现,未来公司的从业群体画像与已有媒体报道有所不同:未来公司的高级管理层以未来职业学院的老师为主;中级管理层以该校毕业的学生为主,其中少部分是来自贵州其他院校的本科毕业生;公司里的标注员基本上是来自贵州二十几个院校“产教融合”的实习生以及部分社招人员,其中以未来学院“产教融合”的实习生为主。

标注员一般分为四类:全职的中层管理者,顶岗的实习生,跟岗的实习生和半工半读的学生。顶岗实习生大多是因应教育部的产教融合模式而产生的为期一年的大三实习生。跟岗的多为仅三个月实习的大二学生。半工半读的实习生多为未来学院的少数民族贫困生。

据未来公司的一个项目组长小刘介绍,一条数据标注一般由数据标注员、初审员、终审员三个人共同完成。系统会随机派发词条给数据标注员,标注员完成标框以后,会由对应的初审员审核,再交由终审员审核,最后提交系统。这三者的比例是5:1:1或6:1:1。

也就是说,一个终审员对应一个初审员和五到六个数据标注员。三者之间存在连带关系:初审员和终审员的薪资按照他们手下标注员平均工资来计算;如果其中一个词条连续三次出现错误的话,系统会自动回收词条,负责的组长也会找小团队谈话。

数据标注实习生的身份认同:90后?少数民族?

在去往贵州的路上,我不可避免地充满了许多关于少数民族的想象,甚至一度将它作为田野观察中的一个重要标签。有趣的是,尽管未来公司过半的实习生是少数民族学生,在为期一周的前期观察中,我居然有一种未能抽离日常教学工作的观感:似乎我面对的仍是上海的大学课堂上的那班95后学生。不管是对于工作的认知与自我定位,还是对于未来的想象,这些少数民族的95后学生自始至终将“90后”的身份认同优先于民族身份认同。

图2:数据标注员们正在就餐午休。

未来公司的另一个项目组长小回告诉我,“现在80后是社会顶梁柱,90后赚钱资历不够,有点心高气傲的,就业和择业选择性比较强,所以比较尴尬……其实我们现在90后除了钱还是钱……情怀是什么东西就不知道了。你看以现在的物价,结婚就是二三十万,我要工作多久才能赚到20万?……不管你是哪个民族,目前我们最重要的目标就是赚钱。”

“为自己干”是我在访谈过程中听过最多的未来公司的文化。比如公司的标注员小布就不断强调公司并不要求实习生加班,大家都是“自愿”加班:有些女孩子为了拿到一个月一万多的计件工资,甚至会选择每周工作七天,每天工作11个小时。

批判学研究往往会将这类叙事方式看作典型的“自我剥削”(self-exploitation)的一种外在形式——公司或管理者通过授予文化工作者一定程度的创作自由和空间,诸如掌握自己的工作时间、地点和形式等,并对员工进行“自我管理”的培训,用以控制他们。公司和管理者往往通过这种方式将风险和责任下放到个人身上。

本文地址:http://aeonspoke.com/kepu/192723.html 转载请注明出处!

今日热点资讯