据最新一期《自然·光子学》杂志报道,美国宾夕法尼亚大学团队开发出首款能够利用光进行非线性神经网络训练的可编程芯片。这项突破有望大幅加快人工智能(AI)的训练速度,同时降低能源消耗,并为研制全光驱动计算机奠定基础。
在此之前,虽然已有研究团队开发出处理线性数学运算的光学驱动芯片,但仅依靠光学方法表示非线性函数的技术难题一直未被攻克。而非线性函数对于深度神经网络训练至关重要,没有它,光子芯片就无法完成深度学习或执行复杂的智能任务。
新进展依赖于一种对光敏感的特殊半导体材料。当携带输入数据的“信号”光穿过这种材料时,另一束“泵浦”光从上方照射下来,调节材料的响应特性。通过调整泵浦光的形状和强度,团队可以根据信号光的强度及材料的反应来控制信号光的吸收、传输或放大方式,从而对芯片进行编程以执行不同的非线性功能。
值得注意的是,这项研究并未改变芯片的基础结构,而是利用光在材料内部形成的图案来重塑光线穿越的方式。这造就了一个可以根据泵浦模式表达多种数学函数的可重构系统,使其具有实时学习能力,能根据输出反馈调整自身行为。
为了验证该芯片的能力,团队用其解决了多项基准AI问题。在简单的非线性决策边界任务中,实现了超过97%的准确率;在著名的鸢尾花数据集问题上,达到了96%以上的准确率。这表明,与传统数字神经网络相比,光子芯片不仅性能相当,甚至更优,而且能耗更低,因为它们减少了对耗电元件的依赖。
此外,实验还显示,只需4个非线性的光学连接就能达到传统模型中20个固定非线性激活函数线性电子连接的效果,展示了该技术的巨大潜力。随着架构的进一步扩展,效率将更加显著。
不同于以往制造后固定的光子系统,这款新芯片提供了一个空白的平台,可通过泵浦光的作用如同画笔般绘制出可编程指令,是现场可编程光子计算机概念的一次实际证明,标志着向光速训练AI迈进的重要一步。