文章主题:数据标注员, AI产业链, 谷歌, 生成式AI
作者 | 袁斯来
编辑 | 苏建勋
在肯尼亚的内罗毕,一群充满激情和好奇心的年轻人汇聚在一起,他们紧密地拥挤在狭小的办公室里,全神贯注地在电脑屏幕上仔细研读着来自地球另一端OpenAI的丰富英文字符。这些年轻人热衷于探索未知领域,追求卓越,他们深知知识的力量,并坚信通过不断学习,可以拓宽视野,提高自己的竞争力。正因如此,他们如饥似渴地汲取着OpenAI提供的先进知识和技能,为自己的未来打下坚实的基础。
在这些工作人员的每日工作流程中,他们需要投入9个小时的时间来完成一项任务。这项任务包括阅读和标注150至200段文本,每段文本的字数范围在100至1000个单词之间。尽管工作强度较大,但他们的薪资却只有每小时1.32至2美元。这样的工作条件显然对于提高工作效率和员工满意度有着显著的影响。
在与Bard和ChatGPT交流的过程中,您可能并未意识到,他们所提供的每一个机智回答,都是建立在大量数据标注人员辛勤付出的基础之上。这些数据标注员们默默无闻地工作,为人工智能系统赋予其强大的语义理解能力,让他们能够识别并应对各种复杂的问题。因此,在与这些智能助手对话时,我们实际上是在与他们的开发者——那些为机器智能付出巨大努力的工程师们进行互动。
在AI产业链中,标注员的角色被严重低估,他们的辛勤工作常常被忽视。然而,正是这些默默无闻的劳动者,为AI模型的智能提升提供了关键支持。他们虽然收入和待遇各不相同,但都肩负着同样一项重复且单调的任务,那就是对海量数据进行精细化的标注。他们就像是AI时代的生产线上的工作者,日复一日,年复一年,用勤劳的双手,为AI的发展添砖加瓦。
近期,谷歌公司的一份内部文件被曝光。根据文件内容,负责标注工作的员工需要在短短三分钟内快速审阅并标注完成Bard的回答。这些来自世界各地的外包工人,为了在最后期限前完成任务,不得不在时间紧迫的情况下阅读他们并不熟悉的专业术语,而时薪仅为区区14美元。
“人们感到害怕、压力大、挣得太少,而且完全不知道正在发生什么。”一位外包标注员这样形容自己的生活。
在全球范围内,数以百万计的标注员分布广泛,其中大部分是外包员工,他们在零工经济中艰难地谋生,收入微薄。尽管他们身处人工智能技术革命的现场,却与台前的光彩照人的故事相去甚远。 industry专家们对ChatGPT和大模型的创新世界前景进行了深入探讨,而这些标注员的生活却没有发生任何变化,他们依然保持着“隐身”的状态,甚至生活状况更为严峻。
大战之下的小兵
谷歌正处于久违的危机中。在生成式AI竞赛中,谷歌已然落后于OpenAI。
在颠覆性创新的大潮中,谷歌感受到了前所未有的恐惧,内部甚至一度发布了极为罕见的红色警报(red code)。为了应对这一挑战,公司CEO Sundar Pichai亲自出征,全权负责AI业务的未来发展。
在2月季度财报的电话会议上,Pichai告诉投资者:“接下来你们会很快看到谷歌的动作。”
接着,它们匆忙推出聊天机器人Bard,5月又发布了大语言模型PaLM 2。
谷歌急迫地上马新项目,对Bard迭代心急如焚,最终的结果就是压力转移到最底层的数据标注员身上。
在谷歌加入人工智能领域的军备竞赛之后,许多合同工表示他们的任务量呈现几何级增长,同时工作内容也变得越来越复杂。这些标注员需要处理包括药物剂量说明、法律文书等在内的专业文件,然而给他们只有短短的三分钟时间,而这些员工甚至没有接受过相关知识的培训。
这种有时间限制,又要求精准的工作让人一直神经紧绷。标注员们的劳动伴随着恐惧,当然会影响工作质量。在一份员工提交的报告中,他们写道:如果一直要求他们这样求快,Bard会变成一个危险和充斥着错误信息的产品。
然而,在白热化的竞争中,谷歌无暇顾及数据标注员的感受。他们受雇于AI数据训练公司澳鹏(Appen)和埃森哲,和谷歌切身利益没有太大关系。
AI是个彻头彻尾的全球化产业。澳鹏的正式员工只有1600人左右,而外包员工数量高达上百万。这家位于澳大利亚悉尼郊区的公司伴随AI行业崛起成长为明星,一年收入6亿澳元。
可以预想,这一次生成式AI的狂欢会催生对标注员更庞大的需求,澳鹏也会从中分得更多利润。
只是,无论ChatGPT迭代多少代,硅谷大厂市值上涨多少倍,最底层的标注员不会得到太多好处。
我们可能摆脱标注么?
标注员的工作是纯粹的人类劳动。他们要比较两则新闻,评估哪条新闻相关性更高。他们也要判断AI给出的答案中有没有“一本正经胡说八道”的事实性错误。标注员们都有本守则,会从6个角度指导他们做出判断。
以目前AI的技术水平,根本无法离开真人训练。AI标注其实就是不断地动用人类主观性做出常识判断。
AI行业其实是一个劳动密集型行业,即便在大模型时代也是如此。
国家之间发展不平等的现状客观存在,所有劳动密集型行业要获得超额利润,必须全球分工。
对当地人来说,这种全球分工其实不是坏事。OpenAI合作的外包公司Sama总部虽然位于旧金山,但它的员工来自乌干达、肯尼亚和外包大国印度。在肯尼亚,这些标注员工的工资为每个月2.1万肯尼亚先令(约合1158元),算当地普通工人的平均水平,而且坐办公室,不用做体力活。
SAMA公司员工,图片来自官网
澳鹏这样的公司会很精明地将工资定在最低工资基准以上,而且还会给一个月70美元的奖金。这对当地人来说是笔不错的收入。
在加尔各答郊区,穆斯林女性因为全球分工获得了工作机会。她们给亚马逊、微软、eBay等等训练AR算法和自动驾驶数据。
一些中国年轻人则很欢迎这样的工作。在贵阳市百鸟河数字小镇,数字标准员中会有刚从高职学校毕业的学生,一个月挣1500元。比起送外卖、当服务员,他们其实更喜欢坐在办公室训练AI。
作者项飚曾经很客观地评估过这种共生关系:“由于IT行业的劳动密集型的特征,如果没有一个巨大的、额外的劳动力储备,该行业或许根本无法快速发展,由此无法向当地工人提供现有的就业机会。”AI需要发展中国家的廉价标注员,而标注员们也需要这份门槛不高的工作维生。他们从来不是受害者,也不是需要人同情的弱者,而是一群努力、勤奋工作的普通人。
当然,我们不能因此将低工资、高压力的工作合理化。国家和国家之间的不平衡也不是压榨标注工人的借口。即便只是自私地为了AI学习数据的质量,这些吝啬的科技公司也应该给标注工人更好的待遇和工作环境。
AI催生了明星公司、百万富翁,它还将改变各行各业,产生难以想象的收益。只是,这些宏大的愿景和坐在乌干达办公室埋头苦干的标注员无关。当某一天,AI进化到不需要标注员时,这群从来不被承认的功臣又会被毫不留情地扫去角落。
“我告诉我的朋友和家人,谷歌、亚马逊、苹果等公司的工程师就像人工智能婴儿的亲生父母和私人教师,而我就是清扫他们的育婴房并给他们洗衣服的女佣之一。”一位标注工这样形容自己的工作。
或许,即便我们不可能短期内改变经济、知识结构的区域不平等,起码可以看见他们,衷心认可他们的价值,承认他们在AI时代的不可或缺。
AI时代,拥有个人微信机器人AI助手!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!