来源:文汇报
用搜索引擎找寻中意的餐厅、在音乐App中根据标签找到想要的歌单、对着手机上的语音助手说出想看的电影……
当我们感叹如今的人工智能(AI)正让日常生活变得越来越便利快捷时,大多数人或许不知道,看似无所不能的人工智能技术,其实是建立在机器学习算法基础上的。在你接触到的人工智能信息和机器学习算法背后,坐着一批有血有肉的“真人”——他或她可能会在道路的影像画面中画出边界框来让无人驾驶汽车识别一棵树、障碍物或一个正在移动的人;辨别并标注智能音箱中那些难懂的方言或口音;也有可能给某些内容加上标签,这样算法就能定义一首“悲伤”的歌……在人工智能这个看似光鲜亮丽的行业,这些为人工智能机器学习算法提供标准化基础数据的人,有一个名字叫做 “微工人”(Microworkers),有时又被称为“微工作”。
说到“微工作”,不能不提到电商巨头亚马逊。早在2005年,当亚马逊CEO贝佐斯建立第一个众包劳务平台Amazon Mechanical Turk(AMT)时,他就将众包微工作称为“人造的人工智能”,而“微工作”正是这一平台的衍生物。当时,亚马逊后台需要筛选清除每天积存下来的超过四百万个重复页面,这些页面内容基本相同,当中只有非常细微的差别,问题是,一般的电脑无法捕捉到其中的差异,为此,亚马逊将这些页面分拣筛选工作分成几千个小的“工作包”,在AMT上招募临时工对此进行人工甄别筛选——领取“微工作”的流程非常简单:只需点击任务链接,它就会显示任务、你需要完成任务的时间,以及完成任务后你能挣多少钱。
目前还没有官方数据显示全世界有多少与数据标注产业相关的“微工人”,但据一份对亚马逊的调查统计显示,每月有数万人在亚马逊的AMT上领取工作,而在不管什么时间,都有多达2500人处于活跃状态,他们主要来自美国和印度。调查显示,这些人的平均年龄为33岁,其中三分之一是女性,而在发展中国家这一比例降至五分之一。
如同一直被指责盘剥基层员工一样,亚马逊、甚至硅谷的其他一些人工智能巨头发起的“微工作”,也经常受到媒体负面报道,因为它被认为报酬过低。不过,对那些生活在经济不发达地区的一些人来说,“微工作”是一个不错的选择。来自南美的米歇尔·穆尼奥斯曾经是名牙医,但由于当地通货膨胀严重,很少人有钱来看牙医,因此,米歇尔在两年前关掉了办公室,成为全球隐形“微工人”大军的一员。米歇尔表示,“微工作”目前是她唯一的收入来源,但即便如此,现在的收入也比她之前勉强维持牙医诊所时更高。她现在的最高纪录是一天赚了80美元,“微工作”一个多月下来,竟然可以买一部现在工作中会用到的智能手机。
在国内,随着近来人工智能产业的崛起,从事与数据标注、筛选相关的“微工作”人群也在迅速增加,其中又以为语音、图片等相关数据进行语义理解及标注服务最为普遍。在各类招聘网站上,可以看到每个月都会有大量写明“鉴别标注智能语音交互产品录音”的“微工作”被分包出去,其中,标识一份一小时有效时长的录音“工作包”,报酬只有100元。有业内人士称,一个新手标注完成这件录音“工作包”,大约需要30个小时,折算下来平均时薪只有三块多钱。
根据相关媒体的报道,国内“微工作”的从业者主要集中在三、四线城市,以刚刚踏上社会的年轻人为主,学历普遍较低。虽然报酬低,但好在几乎没有技术和资金门槛,所以“微工作”对那些欠发达地区、时间有富余的人群来说,还是有一定吸引力的。而且靠着“集腋成裘”的规模效应,这一领域近年来也产生了一批具备相当规模的“头部企业”。以曾经申报科创板的海天瑞声为例,公开资料显示,这家成立于2005年的企业,其主营业务为“人工智能上游的数据资源服务”,服务场景包括人机交互、智能家居等,其客户包括阿里巴巴、三星、腾讯、微软、百度,2018年,来自这五家巨头企业的业务量总计为1.1亿元,贡献了这家公司2018年营业收入的六成。而根据相关媒体的报道,海天瑞声的部分业务,正是依靠兼职外包人员完成的。
法国国家科学研究中心的保拉·图巴罗教授表示,“微工作”不是一种暂时的现象,而是人工智能等新技术发展的结构性现象。“比如说,即使机器学会了如何识别猫和狗,你仍然需要给它们注入更多的细节让机器更好地识别。”这意味着随着人工智能技术应用的普及,机器学习算法的“胃口”会越来越大,大公司对数据输入(其中包括要求更高的人工甄别)的需求只会更加旺盛。美国AI研究机构“感知分析”(Cognilytica)统计,截至2018年,全球数据标注相关产业的产值增长66%达到5亿美元,2023年产值更将翻一番,而由于大部分工作都在“水下”,具体产值目前根本无法准确估算。有专家乐观估计,随着与人工智能产业相关的业务量爆发式增长,未来“微工人”也有可能成为稀缺资源,“微工作”的报酬“水涨船高”,也不是没有可能。