“为什么你需要学习这样一门课?从功利一点的角度来说,掌握深度学习知识会让你以后的工资更高,挣到更多的钱。”正值秋招季,在国内一所知名高校的课堂上,授课老师对台下的学生说。证券时报记者看到,幻灯片上正在展示两页招聘网站上的岗位信息截图,显示着不同岗位的薪酬差距。“假如你是一名硕士,去应聘视觉工程师,年薪可以达到70万元。如果你毕业于一流高校,那薪水只会更高。”授课老师补充说道。
这门课名叫“深度学习前沿”,是开放给硕士与博士的秋季后半学期课程,课容量为30人,早早就已被选满。深度学习是人工智能的一个重要分支和技术路线,过去一年来爆火的大模型,就是一种采用深度学习方法进行训练的庞大神经网络模型。因此,深度学习被视为“解锁”大模型的一把钥匙。而上这门课的学生,正热切期盼拥有这把钥匙,打开一扇通往高薪工作的大门。
今年以来,受大模型技术的驱动,人工智能关键岗位需求大增。一方面,各大技术公司通过各种途径挖掘人才;另一方面,市场上符合要求的人才十分短缺。与此同时,AI技术快速发展变化,求职者一边忙着挤入大模型赛道,一边也深感迷茫,担心这项新技术又只是短暂流行且很快平息的一阵风潮。
算力、数据、算法被称为驱动人工智能大模型发展的“三驾马车”。其中,算法很大程度上决定了一个模型的优劣和智能化水平,而算法的不断调试与优化主要依赖算法工程师。百度智能云副总裁朱勇表示,工程师训练手法不同,就像不同厨师基于同样的原材料,做出的菜口味也不相同。
“目前高端人才主要集中在国外,国内大模型领域的人才比较少,尤其是有实践经验的人特别难找,顶尖人才的年薪可以达到几百万元。”人工智能上市公司云天励飞副总裁罗忆在接受记者采访时表示。
事实上,记者采访的多家人工智能上市公司负责人都有相同的感受。佳都科技副总裁兼中央研究院执行院长周志文告诉记者,作为交通行业大模型公司,佳都科技在AI人才引进上保持着持续的热情,但目前国内大模型人才稀缺且薪资走高,各大厂和主流人工智能实验室的人才竞争趋于白热化,对公司的人才引进带来很大挑战。
脉脉高聘11月发布的《2023人工智能人才洞察》报告显示,2023年1—8月,人工智能新发岗位量已与2022年全年持平。2022年人工智能行业人才供需比为0.63,而2023年1—8月下探至0.39,相当于5个岗位要争夺2个人才。
薪资方面,根据报告,2022年人工智能新发岗位平均每月薪资为43817元,2023年1—8月上涨至46518元,提升了6.16%。值得注意的是,大模型引发的AI创业潮带来了AIGC(生成式人工智能)新发岗位薪资的持续上涨,平均月薪从今年1月的47015元上涨至8月的59638元,涨幅达26.85%。
校园招聘也是观察AI人才市场的一个窗口。牛客是计算机领域应届生经常使用的一个校招平台,其最新发布的《牛客2023秋季校园招聘白皮书》显示,人工智能/算法岗位的企业需求量增长最大,学生投递量同比增长超30%;岗位薪资上,在市场各岗位平均月薪呈下降趋势的大环境下,算法工程师、Java工程师、C++工程师等岗位薪资逆势增长,其中算法工程师平均月薪由2.49万元提升至2.59万元,在所有岗位中遥遥领先。
大模型浪潮下,企业招聘AI人才的需求与渠道都发生了一些变化。周志文告诉记者,以前佳都科技的人才引进聚焦大数据工程师、图像算法工程师,来源以校园招聘及招聘网站为主。如今,公司更加关注大模型工程师及NLP(自然语言处理)算法工程师,来源以猎头招聘科技大厂及人工智能实验室的工程师为主。
“我们希望大模型工程师能独立设计和开发大模型系统,独立完成从数据处理、模型训练到模型部署的全流程。NLP算法工程师则需要对ChatGPT等NLP主流大模型的原理和差异有深入理解,有相关模型开发和应用经验者优先。”周志文说。
“大模型训练本质是个工程问题,实践经验非常重要。”天工智能联席CEO兼昆仑万维2050全球研究院院长颜水成向记者表示,目前昆仑万维最稀缺的是核心算法人才,除了要求候选人具备扎实的编程能力和算法基础,对业务有深入理解以外,还希望候选人拥有大模型训练实践经验以及创新能力。
可以看出,企业招聘人才更加看重实践经验。然而现实是,作为一个由ChatGPT带火的创新项目,国内拥有大模型训练实践经验的人才如凤毛麟角,少之又少。周志文表示,从公司的招聘实践来看,很多候选人存在实践项目经验不足的问题,而市场上为数不多的优秀大模型人才,同时也会受到各大科技巨头的青睐,甚至不惜重金挖猎。
求贤若渴,用于形容企业对高端AI人才的态度毫不为过。佳都科技招聘其首席人工智能科学家王博士的过程,就可谓“三顾茅庐”。据佳都科技介绍,王博士不仅有清华直博学历和公派留学背景,而且有大厂和创业经历,备受有意研发大模型的科技企业关注。前两次见面,公司管理团队与王博士进行了深入的交流,董事长对其也满是欣赏,但王博士当时做了其他的选择。后来,公司与王博士又在各种机会下进行了多次技术交流,这才成功将这名大将收于麾下。
人才少、抢人难,这使得很多企业除了外部招聘以外,也将很多精力放在内部员工的培养上。昆仑万维董事长兼首席执行官方汉表示,公司自2020年开始做大模型,当时市场上做大模型的人才特别少,公司就选择自己培养,招聘时选择对机器学习、深度学习熟悉且有较强自驱力和学习能力的人才,然后让他们学习模型训练方向。
罗忆表示,云天励飞在AI人才招聘数量上没有明显增加,更多依靠的是对已有AI人才的培养。“目前大模型还没有成型,本质上还是得有很强的学习能力。比如国际上有哪些最新发表的论文,别人跑通了哪些实验,能否在最短的时间内复现这些实验结果,这些都非常考验快速学习和工程化的能力。”罗忆说。
门槛高、条件多,这决定了AI人才市场的热闹只属于金字塔塔尖的少数人。一名猎头向记者表示,有时一个岗位收到十几份简历,但能满足要求的只有两份。AI人才市场冷热不均的情况非常突出——极少数的高端人才手握大多数的工作机会,得到了令人垂涎的高薪,剩下的求职者则成为了不被选择的分母,薪资也没有很大提升。
“苦于社招没有足够的成熟人才,只能找高潜力人才自己培养,年轻的校园顶尖科技人才就成为了刚需。”牛客首席执行官叶向宇在接受记者采访时表示。方汉告诉记者,昆仑万维目前更需要有丰富实践积累和工程经验、来自产业的人才,但也会招聘应届毕业生做储备,社招与校招的比例大约是5:1。
然而,大模型训练高度依赖工程能力与实践经验,高校在人才培养上并不具备优势。“和其他传统行业相比,大模型人才培养难题在于大学目前的算力不够。”方汉表示。周志文也向记者分析,大模型研究对算力要求很高,需要高性能计算机、大量的数据存储和计算资源,离不开大量的资金和技术支持。
“给你玩1台机器和给你操作1万台机器,这完全是两码事。”罗忆说,学生在大学中“玩”1台机器,做错了可以重来,可是训练大模型就像操作1万台机器,每次花费的训练时间很长,做错重来的成本非常高,没有相关经验的话很难快速上手。
高校算力不足,学生实践机会少,便只能依靠其他方式“武装”自己。“从数据上看,实习、刷题、看面试经验等仍然是学生们提升求职竞争力的主流方式。此外,随着越来越多企业组织技术竞赛,48.3%的学生更倾向于通过参加企业竞赛、项目来武装自己的简历。”叶向宇说。今年,百度在牛客社区发布了AI主题相关的搜索创新大赛,社区内同学关注度和参与热情很高,线下的参与度也远超预期。“参加这个比赛不但可以提升自己的技术实力,放在简历中绝对能成为求职加分项。”来自西安邮电大学的一名2024届毕业生向记者表示。
不过,记者在采访中了解到,面对大模型这个当下最热门的技术风口,同学们也有很多纠结和焦虑:一方面,对AIGC未来的应用场景不明确,害怕大模型公司“活不久”,“担心又只是一阵风潮,风险较高”;另一方面,AIGC工作机会目前更多集中在大厂,相比其他开发岗位,此类岗位“太卷”,学历、技术能力、论文发表等要求都更高,让一些同学萌生退意。
“而且学生普遍对AIGC的感知会落后于行业和企业,对这种新型岗位的准备较少。这就类似于几年前,机器学习刚兴起时,同学们虽然看到了高薪,但缺乏相应的知识储备和能力匹配。”叶向宇向记者分析,即使是在科技人才活跃的牛客社区,学生对AIGC相关的面试经验和笔试经验分享,在2021年几乎没有,从2022年才开始有少量讨论,到2023年开始飙增,讨论、阅读、发布等相关内容量翻了50倍。
作为一个新兴产业,人工智能的各个技术路线正快速迭代,随时可能涌现出新的趋势与潮流。早些年机器学习还甚为风光,如今已有声音在问,相比深度学习,传统的机器学习算法没落了吗?当前,风头正劲的大模型正席卷AI人才市场,身处其中的每一个人都既兴奋又迷茫,不知道这股热潮是否会冷却,更不知潮水将把自己带向何方。