“飞桨”,顾名思义,想让深度学习领域的开发者顺利渡河靠岸。10月16日,在首届世界科技与发展论坛上,百度发布了飞桨产业级深度学习开源开放平台。
飞桨以百度多年的深度学习技术研究和业务应用为基础,同时与华为等芯片企业深入合作,集深度学习核心框架、基础模型库、端到端开发套件、工具组件和服务平台于一体,于2016年正式开源。它的开源开放,降低了AI技术门槛,已累计服务150多万开发者。
当今时代,“开源”,是一个不断被提起的词。百度首席技术官王海峰在接受科技日报记者采访时表示,开源开放,是人工智能发展的全球趋势之一。
要开源,也要自主可控
“深度学习是新一代人工智能的核心支撑。”王海峰介绍,在人工智能的技术体系中,深度学习框架处于硬件层和应用层之间,其作用相当于个人电脑时代的Windows和移动时代的Android/IOS,堪称智能时代的操作系统。以深度学习框架为核心的深度学习平台,是人工智能技术研发和产业化的关键基础设施。
不过,如果要独立研发深度学习框架,搭建完整的深度学习平台,需要强大的技术支撑。迄今为止,全球范围内能够做出功能完备深度学习平台的企业,只有Google、Facebook等少数几家。而它们推出的深度学习开源平台,也确实在全球人工智能领域占据很大份额,不少国内企业同样使用。
不过,国内企业也不能只想着“背靠大树好乘凉”。毕竟,深度学习框架是如此重要,若只依赖少数几个,难免会有掣肘;况且,不同国家人工智能发展特点并不一样,开发者也需要更能满足自身需求的平台。
而且,开源深度学习平台若与人工智能芯片结合,便能发挥软硬一体优化的技术优势,构筑智能时代的“芯片+操作系统”联盟,掌握话语权。另外,深度学习相关人才稀缺,培养成本高,如果没有自建生态,可能难以持续培养深度学习相关核心人才。
王海峰说,研究和发展技术领先、功能完备、自主可控的深度学习框架和平台,对于推动我国人工智能的技术创新、产业发展和人才培养,实现人工智能技术和产业的自主可控,加速各行各业智能化升级,具有至关重要的作用。
据介绍,飞桨已经在基本功能、性能、芯片支持的完备性等技术指标上与国外框架相当,在中文自然语言处理的算法模型、大规模分布式训练、推理引擎等技术上还领先于国外框架。
“虽然在用户规模、社区活跃度、使用便利性方面还存在短板,但是通过发挥我国在数据和人工智能产业应用上的优势,国产深度学习框架完全可以实现与国外并跑,并有能力领跑。”王海峰说。
建设开源社区的关键是树立开源思维
截至今年8月,开源社区GitHub上已经汇集了4000多万的开发者、210万家公司和机构,拥有超过1亿的代码库。“在GitHub上的热门开源项目中,人工智能类占了很大比例。开源开放是人工智能领域发展的全球主要趋势之一。”王海峰说,人工智能的快速发展,推动开源开放生态越发繁荣;而开源开放同时也推动人工智能快速普及,两者相互促进。
GitHub算是一个开源社区的典范。那么,要如何打造一个真正活跃的开源社区,补上上述所说的短板?
王海峰认为,开源社区要有活力,核心是社区对开发者要有价值;它要能提供大量有益的项目、工具和模型,并为产业创造价值,这样一来,开发者会自发地积极贡献自己的力量,让社区持续繁荣。
“建设开源社区的关键,一是建立我国软件行业的开源思维。”王海峰建议,可以鼓励企业、高校和科研机构建立开源技术人才的评价和激励机制,推动高端人才队伍建设;支持相关企业联合高校、科研院所等开展开源技术和应用的教师培训;在大学的课程教育中,也培养学生的开源意识,开设国产软件相关课程,培养更多的基础软件人才。
他也呼吁加强我国自主可控开源软件及平台的推广和应用,通过政策引导、设立专项等方式,鼓励广大开发者基于我国自主可控的开源软件、平台和社区进行创新。“在国家支持的重大科技和产业化项目中,也可以使用我国自主的开源软件开展科研工作,确保底层自主可控和信息安全。”王海峰说。