引言 机器里的幽灵
真正驱动许多手机应用程序、网站和人工智能(AI)系统运行的竟是人类的劳动力,但我们很难发现——事实上,这些劳动力往往是被故意隐藏起来的。这是个不透明的雇佣世界,我们称之为“幽灵工作”(ghost work)。1想想你最近一次在网上搜索。也许是一则热门新闻话题、最喜爱球队的最新消息,或是新鲜出炉的名人八卦。你有没有想过,为什么搜索引擎返回的图片和链接既不包含少儿不宜的成人内容,也不是完全随机的结果?毕竟,所有的生意,无论是不是合法,做在线广告时都希望自己的网站在搜索中排名靠前。或者想想你最近一次浏览Facebook、Instagram或Twitter。这些网站都有“无暴力图片”和“无仇恨言论”政策,这些政策是如何执行的?在互联网上,所有人都畅所欲言,只要有机会,人们就会说出各种各样的话。那为什么我们看到的内容是净化过的呢?答案是,人类和软件的协同工作为你和我这样的用户提供着看似自动化的服务。
除了一些基本的决策,今天的人工智能必须依赖人类的参与才能运行。无论是发送相关的新闻提要,还是执行复杂的短信比萨订单,当人工智能出错或无法完成任务时,数以千计的企业会悄悄找人力完成这些项目。这条新的数字流水线把分散在各处的工人汇集起来,形成集体劳动力,而流水线上运转着的不是产品零件,而是一个个项目。这条流水线不分昼夜地运行,横跨多个经济部门。事实上,就业本身正在发生更大规模也更深刻的重组,影子劳动力的崛起只不过反映了这一趋势。这种按需型的就业还有待分类,本质上我们不能断定它是好是坏。但是,如果没有明确的定义,也不让从中受益的消费者知道他们的存在,那么这些工作就很容易沦为幽灵工作。
企业可以把项目交给数以千计的工人完成,并按任务付费。现在,网络连接、云计算、复杂的数据库,以及人类计算(human computation)这样的工程技术,可以把人类联结起来,完成单靠软件本身无法完成的项目。所谓“人类计算”,就是人类与人工智能协同工作。这是代码与人类智慧的融合,它正在迅速发展。根据美国皮尤研究中心(Pew Research Center)2016年的报告《零工、在线销售和家庭共享》(Gig Work,Online Selling and Home Sharing),2015年美国大约有2 000万成年人通过完成按需分配的任务来挣钱。2到2025年,按需工作平台提供的职业白领信息服务预计增加2.7亿美元,约占全球GDP的2%。3经济学家估计,如果保持目前的增长趋势,到21世纪30年代初,仅美国就有38%的职业会随着科技创新而消失,或者半自动化。4如果任其发展,幽灵工作不透明的雇佣行为和人工智能无所不能的陈旧观点结合起来,可能会使数亿人的劳动被隐于无形。
谁在做这样的工作?琼和卡拉。
琼在家工作,和81岁的母亲住在休斯敦的一幢房子里。2012年,母亲因膝盖手术变得虚弱,无法独自生活,所以琼搬过来照顾她。一年后,琼开始通过MTurk在线领取工作。MTurk是“亚马逊土耳其机器人”(Amazon Mechanical Turk)的缩写,是由科技巨头亚马逊公司拥有并运营的庞大市场。琼最赚钱的工作是“审查猥亵图片”。在Twitter和Match.com等社交媒体上,用户会标记出“令人反感的”图片,琼会再为这些图片贴上标签。
企业不能自动处理用户标记的每一段内容,所以会把一些更难评估的材料发送给琼这样的工人。表面上,她的任务很简单:点击图片,然后评估图片内容。这是一张应该删除的X级(1)的阴茎自拍,还是一些无害的G级的身体部位?完成每个任务她都可以得到报酬,并且完成后才能离开电脑。琼已经有好几年经验,现在她平均每天可以挤出10个小时的工作时间,完成任务后能得到大约40美元(2)的收入。
在几千英里之外的印度班加罗尔,卡拉躲在卧室的角落里工作,这是她的临时家庭办公室。5琼和卡拉做着相同的工作,为互联网公司做单词和图片的分类和标记。不同的是,卡拉从一家外包公司手中接活,这家公司为通用人类关联系统(UHRS)提供人力。UHRS是微软公司自建的供内部使用的平台,跟MTurk很像。卡拉43岁,拥有电气工程学士学位,她是家庭主妇,也是两个十几岁孩子的母亲。卡拉把两个孩子叫进房间,指着LED显示屏上一大段话中的一个单词问他们:“这个词是什么意思?是你们不该说的东西吗?”卡拉大声朗读这段话,两个孩子咯咯地笑了起来。他们在取笑卡拉读“小妞电影”(Chick flick)时的发音。两个孩子一致决定,不,这句话不包含成人内容。卡拉在屏幕上点击“否”,窗口就会刷新,出现一个新的短语让孩子们理解。“他们比我更有资格鉴别这些词,”卡拉笑着说,“他们帮助我为其他家庭维持干净和安全的互联网。”卡拉经常找不到足够多的任务,每周的工作时间不到15个小时,但她几乎每天都会登入UHRS,看看是否有新的任务是她有资格做的。卡拉的坚持和运气已经得到了回报。由于她已经学会如何快速浏览和申领任务,所以可以利用做饭和检查孩子作业之间的空闲时间,用卡拉的话来说,她感觉这些时间“富有成效”,因为她通过网络搜寻她关心的额外收入。
有很多新工作依赖于琼和卡拉这样的人,内容审核——从筛查新闻提要和搜索结果,到评判相应内容的争议,从而帮助科技和传媒公司判断哪些内容可以保留,哪些内容需要删除——只是其中一个例子。社交媒体公司试图确保数十亿网站用户每天得到家庭友好型的信息,因此内容审查是普遍存在的,通常也是时效性很强的任务。像琼和卡拉这样的人,有太多网页、照片以及各种语言的推文需要评估。
谷歌、微软、Facebook和Twitter等公司使用软件自动删除尽可能多的“不适合在工作场合出现的内容”。但这些由机器学习和人工智能驱动的软件过滤系统并不完美。它们不能百分百地区别拇指和阴茎,更别提仇恨言论和讽刺了。还记得2012年美国总统大选的经典时刻吗?当时共和党总统候选人米特·罗姆尼(Mitt Romney)说了句“满载女性的活页夹!”,惹恼网民。Twitter需要工人做琼那样的工作,从而及时判断为什么包含在话题标签中的让人摸不着头脑的一句话会飙升到热门话题的最前列。是黑客干的吗?是出故障了吗?真的有人在疯狂地刷Twitter吗?目前的人工智能系统还无法可靠地辨别上述问题。而按需工作指明了一种方向,可以把计算能力与人类的创造力和活力结合起来。
琼、卡拉以及数百万和她们一样的工人在人工智能失灵时介入,本书讲述的就是他们的故事。我们想当然地以为系统是自动的,但他们才是在幕后推动系统的人类。现代的人工智能系统不仅需要人类回答不熟悉的或有难度的问题,最开始还需要人类帮助它们学习如何回答问题。例如,搜索“驼背沙发”的图片,你会得到一大堆靠背呈曲线的沙发。必应、谷歌这样的搜索引擎并不能和我们人类一样看到或理解图像。家具爱好者不到一秒钟就能找出一件漂亮的带曲线靠背的沙发,这种沙发像驼背沙发一样可以让很多人坐在上面。搜索引擎背后的人工智能系统最开始必须输入至少几百张曲线靠背沙发的图片,每张图片都标记为“驼背沙发”。然后,当搜索引擎遇到一张新的沙发图片时,它会运行一种所谓的“分类算法”,这种算法本质上就是在检查,相比于没有被标记为“驼背”的沙发,这张新图片是否更适合被标记为“驼背”沙发。那么,最初的一系列带有标签的图片,也就是所谓的训练数据,是从哪里来的呢?来自贾斯汀。引导大家接单的任务描述不会超过两句话,贾斯汀这样的工人必须在几秒钟内申请工作,否则就会被其他愿意接手的人捷足先登。贾斯汀是个全职爸爸,带着两个年幼的儿子,孩子上学前和午睡时是他工作的时间。他大方地承认,一开始并不知道驼背沙发是什么。“在回答这些问题之前,我必须在谷歌上花很多时间,弄清楚这些术语的含义。”
许多企业提供这样的付费项目,其中猫途鹰(TripAdvisor)、Match.com、谷歌、Twitter、Facebook和微软知名度较高。像贾斯汀这样的人按任务获得报酬,一天24小时,每周7天。每天都有新的企业出现,他们的商业模式依赖于世界各地的工人,这些工人通过软件响应公开选拔,在幕后完成这些工作。这些企业把日常活动外包给独立工人,而不是交给正式雇员。他们利用幽灵工作回答客户的在线咨询,编辑产品评论,或者完成几乎不需要雇员全职参与的工作。