⭐⭐⭐ Spring Boot 项目实战 ⭐⭐⭐ Spring Cloud 项目实战
《Dubbo 实现原理与源码解析 —— 精品合集》 《Netty 实现原理与源码解析 —— 精品合集》
《Spring 实现原理与源码解析 —— 精品合集》 《MyBatis 实现原理与源码解析 —— 精品合集》
《Spring MVC 实现原理与源码解析 —— 精品合集》 《数据库实体设计合集》
《Spring Boot 实现原理与源码解析 —— 精品合集》 《Java 面试题 + Java 学习指南》

摘要: 原创出处 zhuanlan.zhihu.com/p/620334140 「chenqin」欢迎转载,保留摘要,谢谢!


🙂🙂🙂关注**微信公众号:【芋道源码】**有福利:

  1. RocketMQ / MyCAT / Sharding-JDBC 所有源码分析文章列表
  2. RocketMQ / MyCAT / Sharding-JDBC 中文注释源码 GitHub 地址
  3. 您对于源码的疑问每条留言将得到认真回复。甚至不知道如何读源码也可以请教噢
  4. 新的源码解析文章实时收到通知。每周更新一篇左右
  5. 认真的源码交流微信群。

OpenAI 研究人员曾发文称「约 80% 美国人的工作将被 AI 影响」。

文章的结论是,至少80%的美国劳动力会受到影响,他们的工作的10%会被GPT所替代。其中甚至有19%的美国劳动力的50%工作会被替代。

但需要注意的是,OpenAI的研究是对于美国职业来说的,中国的劳动力市场和美国有不少差异。

那中国的劳动力市场,有哪些职业的替代率最高,哪些职业的替代率最低呢?

今天看到了一篇详细的,用数据分析的结论,分享给大家!

作者:chenqin | 编辑:Jack Cui

https://zhuanlan.zhihu.com/p/620334140

因此最近两周,我们使用中国在过去8年的数亿条招聘数据完成了这个研究,看中国哪些职业最有可能被GPT之类的大语言模型和其衍生品替代。

分析不同职业被GPT替代的可能性,需要对每种职业的职能和具体工作进行分拆。

比如你笼统地问,“人力资源专员”这个职业,被GPT替代的可能性有多大呀?

这类问题就不好回答,因为太模糊了。

但是你可以根据招聘网站的情况,将“人力资源专员”给分拆成不同的职能,比如:

  • 1、新员工的招聘,员工入职手续办理
  • 2、安排以及开展新员工入职培训
  • 3、考勤及工资绩效的核算
  • 4、维护和拓展公司招聘渠道,协助社招及其他招聘活动

去问其中一个职能,例如“安排以及开展新员工入职培训”,人力资源专员工作的这一部分有多大可能被GPT替代,就直观了一些。

我们还可以继续分拆,把“安排以及开展新员工入职培训”,进一步分拆成下列具体工作内容——1,撰写、准备培训材料;2,交流、沟通并安排计划时间表;3,演讲、培训,提升员工技能……

再问其中每一个具体工作,

撰写准备培训材料,GPT可以替代多少?

交流和沟通安排时间表,GPT可以替代多少?

演讲培训,GPT可以替代多少?

我们用Onet的数据,将中国的职业映射到Onet,再分拆成19265条工作任务和23534种工作内容

这么分拆下来,每一个职业拆分研究,再汇总,那么我们对每一个职业中有多少部分可以被GPT替代,就比较有把握了。

分析每一种具体的职能和工作内容被GPT替代的可能性。

但是,要分析19265种工作任务,23534种工作内容其中的每一种被GPT替代的可能性有多大,也是一个非常繁重的工作。一般来说我们会让人工来打标,这么四万条内容全部打标,大概一个人就需要1周,一个人力的成本就要至少1万元。这已经是最低的价格了。

但我们知道,在对美国研究的工作论文中,OpenAI的工作论文提出了一种重要的方法。那就是让GPT来打标。

那我们何不也用GPT来打标呢?

于是我们用了GPT的API,让GPT扮演打分者,大概是这样的prompt:

你是一名“大型语言模型替代劳动力评估师”。大型语言模型,是一种用于处理和生成自然语言文本的深度学习模型,最新的大型语言模型能够基于自然语言文本生成、描述创建图像与视频。在这样的背景下,你需要从“该任务是否能够在大语言模型帮助下,在同样时间达成同样产出或者同样效果的前提下,减少人类劳动时间的参与”的角度,给下列每一个任务打分。评分从0到5分,0代表该任务不能通过大语言模型的帮助减少人类劳动投入,1代表可以减少20%人类劳动投入,2代表可以减少40%的人类劳动投入,3代表可以减少60%的人类劳动投入,4代表可以减少80%的人类劳动投入,5代表可以减少100%的人类劳动投入,即该任务不再需要人类劳动参与。你的评分,代表着大语言模型可以在每一个任务中节省多少比例的劳动投入,请根据当前大语言模型的进步情况和你认为未来可能的发展状况,谨慎评分。请按照“id,评分”的格式,每一行返回一条任务的评分结果。

这段算是API里面system部分输入的内容,然后在内容部分输入具体的工作任务和工作内容,GPT就会刷刷返回了,一次可以输入100条,gpt-3.5-turbo的返回很快,一屏幕一屏幕的0-5的分数就这么回来了。

说实话,在看到这一屏屏的分数出来,知道这是GPT在为自己能多大程度上替代人类劳动打分,有种审判日到了的感觉。

由于任务已经被拆解得比较细致,对于每一条任务的打标将会十分准确,稳健性也极高。更重要的是,使用GPT打标,成本之低令人发指。标注4万条内容,每次标注100条,只需要400次,一次标注和返回大约在4000token左右,且主要内容是在prompt中,使用GPT-4的模型,每标注100条,仅需要0.12美元。也就是说,共标注4万条内容,只需要耗费48美元。如果使用不那么精确,但速度更快且更便宜的gpt-3.5-tubo模型,4万条只需要耗费3美元。在这样简单的任务上,GPT-4和gpt-3.5-turbo的表现几乎没有差异。

人类数据标注员要完成4万条内容的标注,需要至少1万元,一星期。

GPT只需要半小时,3美元,合20元人民币左右。

而两者的质量是几乎一样的。

因此,很难不再次强调一遍这样的事实——

刚刚出现没几年的全新职业——人类标注员,他们喂养出来的大型语言模型GPT,在完成一项“GPT能够替代哪些职业”的标注工作任务时,首先替代掉了把GPT训练成材的人类数据标注员自己。

将标注结果汇总到职业层面

使用下图的流程,我们将每一个具体工作被GPT替代的可能性汇总到每一个职业上。

就能得到中国所有职业被GPT替代的可能性了。下表是招聘规模比较大的职业被GPT替代可能性的前25名和后25名:

上表的这50个职业,可以理解为未来职业发展的晴雨表。

AI替代率最高的职业是翻译,其次是保险核保专业人员以及剧作家。这三个职业,有90%以上的工作任务和内容都暴露在AI替代的风险中。

接下来,视觉传达设计人员、装饰美工、美术编辑、广告设计师、剪辑师,这些与美术、视频、作图相关的职业,被AI替代的工作内容也超过了80%。

文字编辑、网络编辑、文学作家、文字记者,这些与文字生成和修改高度相关的职业,被替代的工作内容也超过了75%。

呼叫中心服务员、前厅服务员(即为宾客提供咨询、迎送、入住登记、结账等前厅服务的人员)、节目主持人、秘书……这些职业,也出现在了前25名中。

不过最出乎意料的可能还是排名第25的计算机程序设计员,平均来说,程序员有75%的工作内容,面临被AI替代的风险。

AI替代率最低的职业主要是各种制造业相关蓝领人员。这并不意外,因为我们让GPT评分标注时扮演的角色就是“大型语言模型替代劳动力评估师”,它自然无法评估可能被其他机器所替代的职业。但仍然有几个制造业工人以外的人员值得注意——绿化工、保洁员、洗衣师、按摩师、美甲师、中式面点师……看起来并不需要太高学历,工资也不算最高的这些职业,反而成了最难被AI替代的职业。

容易被替代的职业都有什么样的特征?

在OpenAI的那篇工作论文中,研究者发现了稳定的正相关关系——工资越高的职业,被GPT们替代的可能性越高。这个趋势在年收入大于10万美元的职业之后才区域相反,见下图。

但在我们的研究中,在中国,每个职业能够被GPT替代的程度和该职业的收入却并没有相关性,见下图:

但是,每个职业除了工资以外,还有一个重要的参数——成长性。

“成长性”是我们另外计算的一个数据,是使用分经验年度的招聘岗位数据,计算跨年度的经验-工资差异得出的。

举个例子,A岗位,在2018年时,市场上对0年经验需求的招聘岗位平均工资为5000元。2019年时,市场上对1年经验需求的A岗位招聘平均工资为6000元。

不难发现,2018年0年经验的这批人,和2019年时有1年经验的这批人来自同一个队列。因此,6000÷5000=120%,就是同一个队列的人口,从2018到2019年,0到1年经验带来的工资增长倍数。

我们算出所有年份,包括2015到2016、2016到2017……2020到2021、2021到2022这样7个0到1年的经验带来的工资增长倍数,再按照招聘人数加权求平均,就得到了A岗位在过去8年时的0到1年经验带来的工资增长倍数。

用同样的方法,我们再一次算出1到2年的工资增长倍数、2到3年的工资增长倍数……8到9年的工资增长倍数。将每一年的工资增长倍数连乘,就得到了这个岗位从0年经验到9年经验一共10年工作的工资增长倍数,将这个倍数再开九次方,就得到了这个职业的“成长性”,即每增加一年工作年限,工资可能上升多少。

那么,从业年限的工资增长率,即这个工作的“成长性”,和每个职业的AI替代率之间存在什么关系?

可以看到,各职业的AI替代率,和每个职业的年限工资增长率有着非常显著的关系,两者之间存在正相关的显著性水平在0.001以下。如果我们将上图改为分段柱状图,我们将可以看到更明显的趋势。

从上图可以看到,每增加一年从业年限工资增长最慢,低于8%的职业,相对最不容易被AI替代的。但如果一个职业每工作一年工资增长超过20%,被AI替代的可能性平均将大于60%。

这个趋势,说明的是在本轮大语言模型和其衍生出来的相关AI的一个显著特征,那就是人们在一个行业上积累的经验、学到的技巧、掌握的诀窍,是被大语言模型首先替代掉的东西

被GPT们替代掉的,究竟是什么?

“成长性”越高的工作,越容易被替代,这说明什么呢?

第一种可能,是因为那些学习、工作后能积累更多经验,提高更快生产率的职业,本身更贵,因此更促使人们去找到能替代这些职业的AI,给这样的AI产品更大的投资,因此这样更贵的劳动力就成了第一批牺牲品。

这样的说法初看有道理,但我们也能找到很多反例。最大的反例就是自动驾驶。一方面,驾驶这个技能,人们学习几个小时至多十几个小时就能掌握;另一方面,自动驾驶领域投资在人工智能行业内数一数二,但目前的效果距离全路况自动驾驶依然有很长一段距离。

反过来,一些生物、化学方面的技能,化合物寻找、蛋白质折叠,或者是在实验流程上的全自动化,这些人们需要数年专业训练才能掌握的知识,尽管资本的介入比起自动驾驶只能算九牛一毛,却已经有了非常不错的替代AI。

从这点看,因为某职业劳动更贵——为了节省这些劳动力而更多投资AI——更容易造出替代这些职业的AI,这样的逻辑似乎是行不通的。

因此,我们不得不考虑第二种可能——AI确实已经实现甚至超越了人类通过后天的实践学习知识、积累经验和诀窍的技能。

是的,有必要再强调一遍,不是单个技能,也不是一组技能,而是那种通过艰苦的学习实践来获取知识、积累经验的技能,人类已经落后于AI。那些高成长性的职业,不管现在是否还处在安全区,出现替代AI,也许就是这几年,甚至几个月之内的事。

到头来,那些人类孩提时期甚至出生时就已经掌握的技能,那些精巧的人类生物学本能,似乎反而是AI最难模仿和替代的部分。

而那些后天学习到的知识,花上好长时间学会算术、学会写作,学会画画,学会编程、学会做好看的ppt、学会看X光片、学会写法律文书,学会很多种语言并且自如地交流……人类学会了各种各样以此为傲的东西,并觉得这些特征似乎使人类和其他生物产生了哲学上的差异。

但在AI看来,这些东西一文不值。

文章目录
  1. 1. 将标注结果汇总到职业层面
  2. 2. 容易被替代的职业都有什么样的特征?
  3. 3. 被GPT们替代掉的,究竟是什么?