目前,大数据+深度学习+大算力构成了人工智能的主要发展模型,但更多的数据、更强的算力和改进的算法却未必会让人工智能更聪明。有专家指出,人工智能未来发展的关键并不是简单提高算力和增加数据,而是要重新思考智能模型。
古希腊哲学家德谟克利特曾言,“我宁可找到一个因果的解释,也不愿意成为波斯人的王”。可见,推理能力,是人类智能的重要体现。目前,尽管人工智能在语音、图像识别等特定领域、特定类别下,水平已经比肩甚至超过人类,但对日常生活中的事情进行推理,AI却是一筹莫展。
例如,电影《教父》里有这么一个场景:一个黑手党对糕饼店老板说:“这个店太漂亮了,但是如果有一把火把这个店烧了,那就太可惜了。”显然,这句话背后的意思,不是劝老板准备好消防设备,而是恐吓老板赶紧交保护费。这个结论对人而言是显而易见的,但对于AI则很难理解。再如,张三问李四:“你最近忙吗?”李四回答道:“我眼圈黑得可以扮熊猫了。”对于AI来讲,李四的回答和张三的问题是风马牛不相及的两句话。
目前AI缺乏因果推理能力
“目前AI所学的语料库里,只涉及数据之间的相关概率,而没有数据之间的因果关系;更关键的是,AI算法里很少包含推理的模块。”8月24日,清华大学心理学系和脑与智能实验室教授刘嘉在北京智源人工智能研究院举行的“人工智能的认知神经基础”重大研究方向发布会上指出,而在人的大脑里有专门的认知结构来进行推理以寻找因果关系。事实上,人类随时随地都在寻找事件的因果解释,甚至会把一些完全无关的东西关联在一起。可以说,因果推理是人的一种本能行为。
有人说,今天的人工智能是大数据+深度学习+大算力,未来的人工智能就是更多的数据、更大的算力加上改进的机器学习算法。这么说对吗?“这么说并没有真正回答问题,属于线性思维。深度学习在人脸识别等方面取得重大进展,但并未真正解决感知问题,例如对抗性图片可以欺骗人脸识别系统,这不是个案,而是揭示了深度学习的根本性缺陷。因此,人工智能未来发展的关键不是简单提高算力和增加数据,而是要重新思考智能模型。”北京大学计算机科学技术系教授、北京智源人工智能研究院院长黄铁军表示。
什么是智能?“我认为智能是系统通过获取和加工信息而获得的一种能力,从而实现从简单到复杂的演化。比如说动力系统,汽车、飞机通过油和电等能量进行运动,但这不是智能,如果一个系统能够获取信息并通过加工信息获得能力增长,它就是智能。”黄铁军说。
黄铁军表示,作为智能载体的系统可以是有机生物体,也可以是无机的机器,包括计算机。寄托在有机体上的智能称为生物智能,以机器为载体的智能称为机器智能。而把人工智能理解为“人工设计制造的智能”是偏颇的。
借鉴生物智能拓展研究途径
“生物智能研究是脑科学的一部分,属于自然科学范畴。如同其他自然科学一样,大脑作为研究对象基本是稳定不变的,人类的进化不会在几十、几百年有多大变化。大脑是已知的最复杂的系统,所以脑科学常常被称为自然科学的最后疆域。”黄铁军指出。
机器智能是技术科学的前沿,黄铁军表示:“因为人工智能这种系统的复杂程度是随着人类的设计、开发以及环境的互动变得越来越复杂,所以机器智能的研究对象是一个不断扩展变化的对象,我认为智能科学是技术科学无尽的开放疆域。”
“生物大脑是亿万年进化的产物,机器智能没必要也不可能再从头进化一遍,而是应该在生物大脑的基础上向前发展。”黄铁军表示。例如,目前的机器视觉采用摄像头和计算机算法,虽然取得了很好的效果,但是存在计算复杂度高、成本高等问题。黄铁军团队研制的新型视觉传感芯片仿照生物采用脉冲方式表示视觉信息,不需要大算力就能完成超高速视觉任务,成果表明可从结构和机理上模仿生物大脑,再通过光电系统特性大幅提高性能,这是人工智能未来发展的重要途径。
据介绍,北京智源人工智能研究院在2019年发布的5个研究方向中,将“人工智能的认知神经基础”作为2020年首个重大研究方向,旨在将神经科学、认知科学和信息科学进行交叉融合,加强人工智能和脑科学的双向互动和螺旋发展,揭示生物智能系统的精细结构和工作机理,构建功能类脑、性能超脑的智能系统,以视觉等功能和典型模式动物作为参照物测试智能水平,为人工智能未来发展探索可行道路。
刘嘉表示,从认知神经的角度考虑,理解智能有3个层级,硬件层面、表征与算法层面以及计算目标层面。对应到生物智能中,分别是脑神经结构与功能、生物神经网络模型以及认知模型。课题组将分别从3个层面进行研究:生物基础、网络模型、生物视觉。其中,将围绕“生物视觉的认知神经基础”用多种脑成像的方法,探究大脑的精细结构、阐明生物视觉的认知功能和计算架构;进行“AI的脑解析”,利用认知神经科学的研究方法打开人工智能(深度学习网络)的黑盒子;探索“类脑的AI”,基于生物视觉认知的研究成果,构建类脑视觉信息处理的模型与算法。
“以认知神经为基础,人工智能将进入一个新的发展轨道,尽管它的发展不会像大家想象那么快,因为很多技术挑战需要解决,但只要方向对头,速度还是比较快的。”黄铁军表示,“如果要实现类似生物那样的智能,我认为各种人工智能探索途径最终都将收敛到生物大脑模型上。”
三学科交叉融合探寻生物智能本质
在自然界中,我们看到生物智能可以实现很多目标。那么,生物智能是怎么工作的?
据介绍,生物界中,线虫神经元的数量是302个,果蝇是25万个,斑马鱼为千万级,小鼠接近1亿,绒猴是10亿级,猕猴差不多百亿级,而人有860亿个神经元。虽然这些生物体神经元之间数量差别达亿倍,但是它们都能够满足生存需要——获得食物,逃避危险,繁殖后代。刘嘉指出,尽管不同的生物在智能的高低上存在差异,但是无论是几百个神经元的线虫,还是有千亿个神经元的人类,他们都具有人工智能梦寐以求的通用智能。所以,从生物智能的角度来看,通用智能并非一定要依赖于非常多的神经元来实现,而是神经元通过某种规则的组合。
但是,生物智能底层的规则是什么,现在尚不清楚。刘嘉强调,“这些规则是可以通过研究来获取的。在过去的几十年里,研究者分别从三种不同角度探究智能的本质:一是自下而上的生物学视角,它是忠实于生物神经基础的仿真;二是自上而下来构建抽象的认知模型,以认知科学为核心。三是最近兴起的折中之路,以深度神经网络为代表的在仿真与模型之间计算科学的道路。”
刘嘉介绍说,今后的研究方向是把神经科学、认知科学和计算科学做深度的交叉。而人工智能的突破可能就在这三个学科的交叉点——它现在虽然是一个无人区,在技术和范式上有很多未知,存在很多挑战,但是充满希望。为在这个交叉点开展工作,必须要有一个底层的支撑,这就是生物智能开源开放平台。
具体而言,研究人员准备构建一个多尺度、多精度、多模态的开源开放平台,把生物神经数据、行为范式数据、认知过程及表征数据,以及相应的生物、计算和认知模型等放进去。在这平台之上,吸引更多的人加入进来,探索智能的本质,构建关于智能的理论。