近日,知名人工智能学者吴恩达发表文章,阐述了他对于人工智能在传统行业中应用缓慢的理解。无论是刷短视频时的个性化推荐,还是外卖配送时的耗时预估,或者是移动支付时的人脸识别,以算法为代表的AI技术在消费互联网行业被应用得“得心应手”。然而提到传统行业,人们却很难快速想起非常成熟的应用人工智能的典型案例。为何AI技术在传统行业的应用速度和范围远不如消费互联网等行业?
消费互联网行业应用AI更具优势
“AI技术的应用主要取决于数据、算力和算法。”天津大学智能与计算学部副教授朱鹏飞介绍,首先数据要达到一定的体量,这是应用的基础,此外算力也要能支持大规模的模型训练,而后算法方面需要达到一定的精度,端侧算力也要具备一定的推理能力。
之所以目前只有消费互联网公司在大规模应用AI技术,主要是在这三方面消费互联网公司都更具优势。
前些年短视频并没有现在这么火爆,例如发展初期的淘宝,也并没有很强的用户黏性。而随着推送越来越精准,用户的体验感也得到了极大的提升,最终呈现井喷式的用户增长。
“精准推送主要依赖于算法精度的提升,而算法精度的提升又离不开海量的数据作为基础。”朱鹏飞解释,在这个单一的场景中,算法模型需要不断进化,终身学习。由于不是封闭数据环境,总有新的数据加入,算法模型需要不断通过学习进行调整、迭代升级,使其精度越来越高,形成一个良性循环。
“与此同时,虽然目前消费互联网行业在算法精度上已经上升到一定的高度,但相比一些传统行业的应用场景,消费互联网行业对于AI算法精度接受的阈值都比较低。比如短视频、淘宝偏好推荐、百度热搜关键词,只需要达到用户产生黏性的目的,只要有一定准确性,用户都可以接受。”朱鹏飞表示,相比之下,在很多传统行业,对于技术精度的要求就高得多。比如基于视觉的AI技术在人脸识别方面的应用,在高铁站、飞机场核实身份,1∶1的比对准确度要高达99.99%甚至更高才可以进行应用。
在算力方面,目前云端算力已经可以支持大规模模型训练和推理,比如短视频、淘宝推荐等。但在大量传统行业应用场景中,智能终端上的端侧算力还无法满足推理的实时性和准确性要求。
“相比于社交网络和电商系统,传统行业应用场景的封闭生态系统使得云端算力无法得到有效应用。”朱鹏飞举例说,以智能无人系统巡检为例,电力巡检、管道巡检、交通巡检、河道巡检以及光伏巡检等要求搭载在无人机和机器人上的算力满足实时巡检要求,由于视频分析的模型复杂度较高,端侧往往无法实现精准高效的实时推理,轻量级网络在满足实时性的同时损失了识别精度。由于算法精度达不到使用要求,使得在很多场景中无法实现AI技术的应用。
传统行业应用AI面临三大挑战
吴恩达认为,在AI应用方面,消费互联网行业之外的其他行业都面临着三大挑战:数据集很小;定制化成本很高;从验证想法到部署生产的过程很长。
对此,朱鹏飞也深有感触,他以传统制造业为例进行了分析。
“传统制造企业在制造向智造转型的过程中,数据是一个很突出的问题。”朱鹏飞介绍,首先在数据的获取方面存在一定难度。传统制造企业的数据是封闭的,因为很多传统企业并不是新型信息化设备,没有传感器收集实时数据,也没有数据中心,因此数据零散,缺失严重,很难获取像消费互联网企业里那种海量、高质量的数据。
其次,行业内部各个工厂的数据很多具有商业价值,因此工厂都严格保密,这导致数据不流通,没有办法进行共享,进而形成了数据孤岛效应,影响了AI算法模型的优化。
“我们在开发一个AI算法模型的时候,因为数据的保密性,往往得到的数据都是经过‘脱敏’的,这也严重地影响了我们的判断。而传统行业的企业中,又缺乏具有AI算法模型开发能力的技术人员,因此双方在合作研发过程中也存在着很高的壁垒。”朱鹏飞说。
此外,传统行业中的数据来源并不像消费互联网领域那样来自单一场景,复杂的业务场景导致数据往往很“脏”,必须进行“清洗”,去掉大量无效信息,AI算法模型才能高效率的学习以提高精度。“这就像我们教小朋友知识,只讲知识点,小朋友们才能学得快,如果在知识点中夹杂着大量无用的信息,小朋友无从分辨,学习效率肯定降低。”朱鹏飞介绍,而给数据标注“知识点”的工作是巨大而繁琐的,需要企业有专人去做,要花费很多时间精力。
“传统制造业要想获得高质量的数据,就必须对生产设备进行信息化、智能化的改造。”朱鹏飞表示,这种改造需要企业投入大量的时间和精力,还会增加生产成本,这也成为AI在传统制造业中应用的壁垒。
高质量数据是应用前提
过去这10年,大部分AI的研发和应用是“以软件为中心”驱动的。在海量数据的支撑下,不断优化软件和算法,来获得更高的算法精度。在传统行业无法提高数据质量和数量的情况下,吴恩达认为,传统行业应该采用“以数据为中心”的模式,把重点放在获得质量更好、匹配度更高的数据上。
“在这种思路下,传统行业也涌现了一些不错的应用案例。比如医学领域的影像识别AI系统,可以帮医生‘看’CT影像片子,对肿瘤等病变加以识别,辅助医生做出判断。”朱鹏飞介绍,由于很多数据都由专业的放射科医生在影像片子上进行了标注,因此数据比较准确,AI算法模型在学习的过程中进步很快。目前很多影像识别系统的准确率都能达到90%以上,由于是辅助医生,最后还需医生做医疗决策,但这个水平的准确率在很大程度上降低了医生的工作强度。
“尽管传统行业有了一些应用AI技术的成功案例,但是要想更好地和AI结合,还得在提高数据质量方面下功夫。”朱鹏飞建议,首先对于已经积累了海量数据的传统行业,在保证数据安全的前提下,主动开放数据。挖掘数据中蕴藏的价值,和需求关联起来,会有很大的发展空间。其次,对于新兴行业,比如新能源汽车等,在构建智能工厂规划的时候,就把获取数据、智能化的因素考虑进去。
不过朱鹏飞强调,在传统行业用好AI技术的同时,也不要滥用AI技术,在应用前做好评估,如果不能提高生产效率,对行业整体有所提升,那么盲目强行使用AI技术,就是对资源的浪费。“比如一些应用场景需要AI算法达到99%以上的精度才可以使用,通过评估,现有模型算法只能达到90%的精度,那么这个场景就没必要强行上马AI技术了。”
“总而言之,对于AI技术的应用要数据先行,有高质量的数据再谈应用,没有好的数据很难有好的应用。”朱鹏飞说。