车载AI芯片是人工智能行业的珠穆朗玛,也是自动驾驶实现大规模落地的前提。8月30日,乘着2019世界人工智能大会的风,国内首款车规级AI处理器——征程二代芯片在沪亮相。该芯片用于汽车自动驾驶系统,赋能汽车智能化,并在全球5个国家斩获多家前装定点。这意味着征程二代芯片不仅实现了中国车规级AI芯片量产零的突破,也补齐了国内自动驾驶产业生态建设的关键环节。
车规级AI芯片有多难做?
在智能汽车漂亮的外壳下,芯片就像密布在人类身体的神经元网络,只要触碰到相应的传感器,电信号快速奔跑在各个芯片之间,计算、判断、执行,驱动汽车智慧起来。但不同于普通消费电子和工业电子,汽车电子有一套极高的标准,就是“车规级”。
据专家介绍,首先,对于自动驾驶芯片而言,毫秒级的低延迟是安全之根本。自动驾驶技术虽然有望减少96%的车祸率,但这是以芯片拥有超低延迟为前提的。其次,自动驾驶技术带来的海量计算,对芯片的功耗提出了极致要求。在车载环境下的数据吞吐量非常巨大,一辆自动驾驶汽车每天能够产生600-1000TB的数据计算,而且未来将成为主流的新能源汽车本身也是通过电池供能的,在封闭环境中散热很困难。所以车载AI芯片需要具备极低功耗的特性。海量计算还需要更强悍的计算平台资源作为支撑,但这会带来很高的成本。如果芯片的成本能够相对更低,这将为产品的竞争力添砖加瓦。
所谓的“车规级”,像一道分水岭,划分着理想和现实,低端和髙端,新世界和老玩家,泾渭分明。此前有专家表示,在自动驾驶芯片领域,以色列的Mobileye公司(2017年被英特尔收购)占据了全球70%以上的市场份额,而国产芯片几乎没有任何市场。
横亘在国产AI芯片前面的,是一座芯片界的珠穆朗玛峰。
国产AI汽车“芯”征程
征程二代已经通过了AEC-Q100测试标准,该芯片采用台积电的28nm HPC+工艺制造,搭载地平线自主创新研发的高性能计算架构——第二代BPU,可提供超过4 TOPS的等效算力,更重要的是典型功耗只有2瓦。也就是说,配合高效的算法,每TOPS?AI能力输出可达同等算力常规用处理器GPU的10倍以上。同时,较低的功耗大幅降低了散热需求,芯片整体不需要额外的风冷或液冷系统。征程二代芯片缔造者地平线公司的创始人余凯说,“这是科技创新为我们带来的竞争优势。”
基于征程二代芯片,地平线同时推出了面向ADAS市场的视觉感知方案,该方案可在低于100毫秒的延迟下实现多达24大类的物体检测以及上百种的物体识别,每帧高达60个目标及其特征的准确感知与输出,车辆及行人测距测速误差优于国际同等主流方案。此外,针对国内市场的特点,该解决方案还专门针对中国道路和场景进行了优化,如特殊车道线、红绿灯倒计时检测、车辆突然斜向插入等。
从功能场景来看,征程二代能够高效灵活地实现多类AI任务处理,并对多类目标进行实时检测和精准识别,可全面满足自动驾驶视觉感知、视觉建图定位、视觉ADAS等智能驾驶场景,以及语音识别,眼球跟踪,手势识别等智能人机交互的功能需求,全方位赋能汽车智能化。与此同时,征程二代还可提供高精度且低延迟的感知输出,满足典型场景对语义分割、目标检测、目标识别的类别和数量的需求。
车规级芯片产品的开发周期长、难度大,是硬科技的比拼和长跑道的创新。据了解,研发团队需要18-24个月设计处理器流片,包括计算架构设计、后端设计及流片;此后,要用12-18个月的时间进行车规级认证系统方案开发,以及24-36个月用于车型导入与测试验证,其中涉及到项目竞标、整车集成和功能开发、测试验证等多项工作。
目前,征程二代芯片开发套件已完全就绪,可支持客户直接进行产品设计。为此,研发人员提供了一套AI芯片工具链Horizon?OpenExplorer,包含面向实际场景进行AI算法和应用开发的全套工具。
研发团队表示,搭载高性能计算架构BPU3.0的征程三代芯片,预计将于明年正式推出。“全球智能汽车巨头特斯拉的自动驾驶平台算力为144 TOPS,但实际计算中仅用到72 TOPS,功耗约72-100瓦;基于征程三代的自动驾驶平台,算力达192TOPS,算力全部用于计算处理,功耗仅约48瓦。”余凯说。
车规级芯片成功流片后,地平线已在高级别自动驾驶、辅助驾驶(ADAS)、多模交互等方向斩获多达5个国家的客户的前装定点,并有望于明年上半年获得双位数的前装车型定点。率先搭载地平线车规级AI芯片及解决方案的量产车型最早将于明年年初上市。
由于前装市场的高准入门槛,前装定点及量产被视为评判车规级AI芯片大规模商业化能力的首要指标。前装破局,也意味着征程芯片的商业化将迎来爆发式增长。据研发团队负责人透露,征程芯片两年内将有百万量级的前装装车量,五年内则有望完成千万量级的目标。