AI这么“霸道” 离不开这些人手动撑腰
 
2023-03-27 10:20:56 来源:潮新闻客户端   

细数整个3月,AI是绕不过的话题。从ChatGPT展现对人类语言文字的强大掌控力,到GPT-4有了“识图”功能的Buff,GPT的成长速度令人咋舌。

AI是如何快速成长的?据悉,GPT-1使用了几十亿文本档案的语言资料库进行训练,文心一言的“训练课程”更是包含了万亿级网页数据、数十亿的搜索数据和图片数据。然而这些最基础的训练离不开一个职业——人工智能训练师。

饱和的业务

在人工智能行业,有这样一句行话:有多少智能,背后就有多少人工。人工智能训练师就是人工智能领域“劳动密集型”企业的流水线上一颗颗不断运作地“螺丝钉”。

在都市青年逐渐失去调戏ChatGPT的兴趣时,远在陕北小镇的90后李阿倩甚至从未听过这个名词。但她是一名已经入职三年的数据标注员,或者说人工智能训练师,日常工作是通过贴标签、做记号、标颜色或划重点等方式对数据进行加工处理,将一般数据变成AI可识别的数据,以此帮助AI理解和学习各类内容。

微信图片_20230324125406.jpg

李阿倩在工作中。采访对象供图

比如,当在导航软件上输入一个机场的名字,二维地图上除了显示位置坐标,还会出现一个不规则的蓝色图形展示机场的范围。这个不规则图形的就是由“李阿倩们”根据卫星影像图和其他辅助信息一个个手动标注出来的。这一条条被标注完成,并且通过质检后,就成为导航AI学习的内容——在被问到某个地点时,不仅要说出该地坐标,还要说出地域范围。

W020200813391009268063.jpg

数据标注员正在标注数据。新华社图片

如此看来,数据标注工作并不难。然而,李阿倩所在公司的每位人工智能训练师在正式上岗前都需要经过40天的培训。“标注工作的容错率很低,只能在0.5%至1%。”她告诉记者,虽然职业对专业和学历要求并不高,但工作并不轻松,需要高度集中注意力。

事实上,在2020年我国就已经有近20万人工智能训练师,这也意味着简单重复、无需门槛的标注量将会越来越少。提起这一变化,李阿倩也深有体会:“相较于刚入职时的工资和订单量,现在都有所下降。”但对于已经当上公司组长和培训讲师的她而言,在家乡小城有一份收入不错的工作足以令她满意。

增长的需求

很长一段时间里,数据标注企业成为不少城市解决当地就业、扶贫的优质项目。李阿倩所在的公司就来自“围绕用数字技术助力女性发展”的“AI豆计划”。这一由中国妇女发展基金会、蚂蚁集团、蚂蚁公益基金会等发起的数字产业孵化项目,通过培训当地女性、返乡青年等做人工智能训练师,助力在地就业。

可以说,当人们在讨论人工智能如何抢饭碗的同时,它也为不少人提供岗位和机会。随着人工智能逐渐渗入智慧城市、智能制造、自动驾驶、智能医疗、智能农业等社会生产生活的各个角落,数据服务市场规模也加速爆发。据IDC中国2021年《中国人工智能基础数据服务市场研究报告》预测,2025年市场规模将突破120亿元,2020-2025年复合增长率为47%,预计2026达到顶峰,缺口5万人左右。

W020201122676414545873.jpg

观众在“互联网之光”博览会上通过扫码了解数字经济人才招聘信息。新华社图片

除了人工智能训练师,数字化管理师也是近年来人数迅速攀升的新职业,从业者高达230万。“数字化管理师有巨大的市场需求,这些人才覆盖了互联网、零售业、制造业等众多行业,在各行各业的数字化转型中发挥了重要作用。”钉钉总裁叶军说。

近日,在浙江省中华职业教育社与钉钉联合举办的2023年度首届数字经济与职业教育高峰论坛上,钉钉更是放出信号,表示到2025年将为社会培养1000万数字化人才,并与浙江大学、浙江商业职业技术学院等五家单位发起并成立数字化管理与职业教育产教联盟。

W020230213518257997625.jpg

工人在调试智能化生产线。新华社图片

浙江省中华职业教育社主任陈小平认为,一方面,职业教育是最贴近产业和企业、最贴近经济社会发展的类型教育;另一方面,伴随职业教育的高质量发展,职业院校已经具备了服务中小企业技术开发和产品升级的能力。

扩招的专业

2020年,人工智能训练师正式成为新职业并纳入国家职业分类目录。早在2019年,173所高职院校就成功申报人工智能技术服务专业。目前,已经有几百所高职院校开设该专业,其就业核心岗位之一就是人工智能训练师。

人工智能训练师的市场需求从何而来?相关人士坦言,当前的人工智能发展阶段,算法模块化降低了原本的技术门槛,下游数据的准备和批注、系统的维护和优化、工业领域的应用和实操等处于中间层的工作就需要大量专业人才,人工智能训练师是其中之一。

人工智能训练师不等同于数据标注员。他需要和AI产品经理讨论需求,进而制定数据标注规则,并提出产品体验优化建议。与此同时,他还需要和数据标注人员紧密协作,把控好整个流程的输入规则和输出结果,最终输出标注准确的数据。不难发现,人工智能训练师是在数据标注员和AI产品经理之间的桥梁。

W020221028547933628638.jpg

人工智能训练师在进行项目比赛。新华社图片

根据《人工智能训练师国家职业技能标准》,人工智能训练师共设5个等级,各级技能要求和相关知识要求依次递进,高级别涵盖低级别的要求。其中,初级工需要具备数据采集、数据清洗、数据分类、智能系统运维等能力;中级工需要具备数据质量检测、数据处理方法优化、标注数据审核、智能系统维护与优化等能力,高级工需要具备业务流程设计、业务模块效果优化、智能系统监控和优化等能力。

“我们的培养目标是保障学生在毕业时达到中级,争取部分优秀学生能够达到高级水平。”杭州科技职业技术学院人工智能技术应用专业带头人说。浙江省“人工智能训练师职业技能考试题库”正在由北京航天航空大学杭州创新研究院、杭州科技职业技术学院、蚂蚁集团等高校企业联合开发中,预计将于今年下半年推出。

可以预见,在未来人工智能训练师将摆脱“标注员”的称呼,真正成为能够陪伴AI一同成长的老师。

打印本页 关闭窗口

最新要闻

ZUIXIN
YAOWEN