人工智能芯片热潮再起。近日,全球最大的云服务提供商亚马逊AWS在其发布会A消息:Invent上发布了首款高性能机器学习加速芯片Inferentia。由腾讯领投的AI芯片企业燧原科技也于近日发布了首款云端AI训练芯片邃思DTU及加速卡云燧T10。2019年人工智能技术加快渗透进入实际应用当中,成为业内公认的AI落地之年。而其中关键在于AI芯片,算力的支撑成为人工智能发展的“发动机”。这也使得人工智能芯片市场有望快速成长。
AI芯片开发踊跃
全球最大的云服务提供商亚马逊AWS发布了首款高性能机器学习加速芯片Inferentia。作为全球最大的云服务提供商,亚马逊AWS此举颇为引人关注。根据亚马逊公布的指标,Inferentia芯片能够提供128TOPS的算力,并支持INT-8和FP-16/bfloat-16计算类型。亚马逊同时公布了几种搭载了Inferentia芯片的服务器配置,最高性能的版本可以搭载16颗Inferentia芯片,从而能提供高达2000TOPS的峰值算力。
实际上,关于亚马逊自研AI芯片的情况早有消息传出。2018年美国科技媒体The Information报道称,亚马逊已经开始设计定制人工智能芯片,未来将用在其开发的智能语音设备Echo之上,以帮助Alexa语音助手获得更快的响应速度,从而提升整体的使用体验。2015年,亚马逊斥资3.5亿美元收购以色列芯片制造商Annapurna Labs。Annapurna Labs设计开发的芯片用于数据存储设备、WiFi路由器、智能家居设备和流媒体设备之上。
燧原科技的产品同样引人关注。燧原科技是腾讯投资的第一家国内AI芯片企业,成立不足一年半,就完成超过6.6亿元的累计融资。目前燧原已同腾讯一起针对通用AI应用场景项目展开密切合作,未来也将会扩展到更多AI应用场景。燧原科技CEO赵立东介绍,此次发布的邃思DTU采用格罗方德12nm FinFET工艺,480平方毫米主芯片上承载141亿个晶体管,实现2.5D高级立体封装,算力可达20TFLOPS,最大功耗225W。产品将于2020年第一季度上市。同时,燧原科技发布首款计算及编程平台“驭算”,可支持开源学习平台TensorFlow进行开发。
新应用驱动AI芯片增长
一家大型一家初创,一家国际一家国内,亚马逊AWS与燧原科技先后发布AI芯片,显示了AI芯片当前的火热。实际上,近年来各类势力均在发力AI芯片,参与者包括传统芯片设计、IT厂商、技术公司、互联网以及初创企业等,产品覆盖了CPU、GPU、FPGA、ASIC等。
安富利亚洲供应商及产品管理高级总监钟侨海指出,当前人工智能技术正在快速落地,正在渗透进入实际应用。这是AI芯片快速发展的原因之一。根据Fortunebusinessinsights的预测,2018年全球人工智能市场规模为206.7亿美元,至2026年有望增长到2025.7亿美元。而Gartner则预测,2018年AI芯片市场约为42.7亿美元规模,有望在2022年增长至343亿美元。
人工智能的应用首先是在云端服务器市场展开,这也是当前AI芯片开发的重点。不过随着市场的不断拓展,人工智能将向边缘以及终端领域扩展。未来一段时间,边缘计算将成为AI芯片发展最快的新领域。对此,清华大学电子工程系教授汪玉表示:“在发展过程中,AI芯片首先是受到了云端服务器市场的关注和应用,国际公司如Google的TPU、亚马逊的Inferentia、英特尔的SpringCrest,国内公司如寒武纪的MLU100、百度的昆仑、华为的升腾、比特大陆的算丰,都是面向云计算所开发”不过,随着边缘计算的发展,面向边缘计算的AI芯片也开始受到越来越多的重视。“新的边缘启用,数据密集型应用和工作负载将由AI提供支持。AI将用于分析和解释来自这些应用程序的数据,以帮助人们(在某些情况下,其他机器)实时做出关键决策。”汪玉表示。
钟侨海也表示,人工智能在物联网领域正在迅速展开。在人工智能以及物联网上,安富利已经开发出许多相关的成功案例,如智能制造系统、智能农业系统、智慧城市系统等。“目前区分人工智能在云服务和边缘侧的市场份额还比较难。但是,很多用户都希望在他们原有的物联网系统当中能够加上人工智能的功能。此外,越来越多的企业希望有他们自己的云,他们自己的云可以做训练,他们自己的云可以做数据的分析,这些事情他们可能不希望通过公有云来做。因此,可以预计未来人工智能在边缘侧的市场将会越来越大。”
架构弹性成为关注焦点
虽然前景看好,但是AI芯片在应用落地同样存在挑战。钟侨海认为,人工智能落地还将面临三个挑战:第一,人工智能需要繁多的训练、数据分析、识别、大量计算。所以,AI解决方案应针对不同的应用对网络和性能参数,要求不同速度、延迟、能耗、准确性。第二,神经网络技术需要大量的数据以训练模型,在大量的运算中有数十亿次乘积累加运算以及几十兆字节参数,故需要大量运算符、自定义数学及存储器层次结构。第三,人工智能算法的更新换代较为迅速,在固定架构中会存在很多风险,一旦旧人工智能架构失灵,在新架构出现时,原本的固化架构很大程度上即刻失效。所以,架构的弹性成为业界需要聚焦关注的问题。
汪玉提出建议,目前AI芯片设计面临着太多种的枢架,如TF、Pytorch、Caffe、Mxnet等。同时现存的芯片平台也有很多,如CPU、GPU、FPGA、ASIC等。这就给AI芯片的设计开发带来了极大的挑战。如果能有公司设计开发出一款中间层性质的平台产品,由它来向上支持不同类型的设计框架,向下支持各种芯片平台,并最终服务于各个人工智能公司,将大大降低AI芯片设计中的复杂度,提高工作效率。这其中蕴含着巨大的商机。汪玉也呼吁应当加强产学研的结合,以技术为基本出发点,营造出有利于创新发展的环境。通过这一系列的努力,中国完全可以抓住新一轮由5G商用所趋动的边缘计算市场商机。