“写诗作画、多轮对答、答疑解惑,甚至还能协助药物开发。然而,人工智能(AI)却又难以完成简单的四则运算或几何问题,无法准确理解空间位置和因果关系。”这不禁让人们产生疑问:AI的未来上限只能是辅助工具吗?
在数字化和智能化快速推进的当下,AI的研究与应用正逐渐渗透至社会的各个角落,推动着技术革新和产业升级,同时也催生了一系列AI技术新的研究方向。日前,一项由北京大学人工智能研究院朱毅鑫助理教授、朱松纯教授,以及北京通用人工智能研究院张驰与贾宝雄研究员组成的科研团队完成的最新研究成果——“人类水平的小样本概念学习”在国际顶级学术期刊《科学·进展》上发表。
据了解,这一成果初次让AI系统在没有大数据训练的情况下,凭借像人类一样通过概念学习和逻辑推理的方式完成任务,并在经典“智商测试”中战胜了高智商人类选手。作为完全由我国科学家独立完成,并在国内实现的AI高水平研究成果,标志着我国在AI领域的研究已跻身世界前列。近日,记者采访了北京大学人工智能研究院助理教授朱毅鑫与北京通用人工智能研究院研究员张驰,就小样本学习、大模型技术等问题进行了深入讨论。
当前广泛应用的AI系统主要以海量数据为基础,利用大量算力和存储进行数据“检索”,其核心范式是深度学习。这类AI在数据拟合和感知层面取得了显著进展,催生了ChatGPT、Copilot、Midjourney等一批热门AIGC应用。
“不是说大数据的效果不好,而是它的成本太高,现在各种算力的堆积、数据的堆积,从成本上考量很多时候是很难达到。把效率这个问题做到最好,甚至超过人的水平,这是我们在这件工作上做的最重要的一件事情。”在讨论中,张驰研究员提到,尽管大模型技术因其强大的数据处理能力而受到广泛关注,但其对大量数据和算力的依赖也导致了成本的显著增加。此外,大模型的训练过程中存在数据标注的难题,这在医疗等专业领域尤为突出。因此在大模型领域,大数据与小样本的研究并行不悖。
事实上,目前的AI方案极大地依赖充分且可得的数据资源以及大量人力标注,通过“暴力学习”的方式不断刷题来取得高分。但它并不具备人类那样对问题进行快速、准确、细致推理的能力,尤其在数据匮乏或仅有少量数据和抽象概念的情况下,这类方法便无能为力。正如我们在做智商测试时,无法通过“刷题”来解决那些需要小样本数据和抽象概念推理的问题。因此,以大数据和深度学习为核心的AI范式,距离人类通用认知能力的智能仍有较大差距,短期内看不到解决办法。
意识到现有研究范式的局限性后,该研究团队另辟蹊径,借鉴了朱松纯教授在90年代提出的最大最小熵思路。这一方法最早应用于计算机视觉领域的图片生成模型。受此经典研究思路的启发,团队将问题形式化为易于求解的优化问题,并按照熵的思路将其描述为概率条件下的熵限制问题,使模型在快速迭代后能取得满意结果。
“大模型好比是在做完形填空,而对于这类推理问题仅仅通过填空是无法实现的,反倒是希望找到它背后的抽象规律。”朱毅鑫助理教授指出,作为AI领域的一个前沿方向,小样本学习旨在通过极少的数据样本实现类似人类的推理能力。这一领域的研究虽然不如大模型那样广为人知,但其重要性不容忽视。小样本学习的核心在于,它能够通过有限的信息进行有效的推理,这与人类学习过程中的举一反三非常相似。
该团队提出的这种超高效解决抽象推理问题的方法,让机器通过快速迭代和建模,获得了既容易得到又具可解释性的问题解决模型。“结果显示,该学习模型在多项测试中均超过了包括北大、清华学生在内的国内顶尖人类选手,标志着我们在迈向通用AI的道路上更进一步。”朱毅鑫还表示,无论是小样本学习还是大模型技术,AI的未来都充满了无限可能。同时,这也提醒我们,在追求技术进步的同时,还需关注科研文化、人才培养以及与产业界的紧密合作。只有在这些方面取得平衡,AI技术才能更好地服务于社会,推动人类文明的进步。