“借助宁波人工智能超算中心的强大算力及人力支撑,产品研发使用的模型训练周期从4天缩短为两天,语义语音识别精度提升到93%。”在宁波新材料(国际)创新中心一栋办公楼里,薄言信息总经理郭文峰向记者介绍“薄言轻语”最新的技能。
宁波薄言信息技术有限公司,位于高新区宁波新材料(国际)创新中心,是一家专注于通用机器学习和自然语言技术研究的科技企业。2003年,作为高层次人才项目,由宁波中科信息技术应用研究院引进孵化。
扎根甬城十年,薄言已是宁波地区估值最高的人工智能创新企业,孕育并迭代了“薄言轻语”,类似人脑思维系统般复杂而精妙的人工神经网络。这个运行在大型GPU(图形处理器)集群上的网络,拥有数十亿神经元参数,能通过深度学习来获取信息,并归纳新知识以及它们之间的联系。
这些年,在各类测试、比赛中,薄言开发的对话机器人在中文、英文领域均处于全球领先水平。其中,2020年,创造中英文阅读理解OpenQA世界纪录;2019年,获评微软MS MARCO阅读理解评测第一名。
值得一提的是,薄言搭建的“轻语”虚拟助手平台,正帮助企业消除垂直领域数据少、训练难的壁垒,快速打造专属AI聊天机器人。目前已与华为、京东、小米、南方等知名企业达成合作,也让上千家中小微企业有了自己的专属AI。
而横空出世的ChatGPT,也让薄言看到了自己所处领域正迎来新浪潮,有了更多可能性。
从本质上来说,ChatGPT是一款基于GPT(预训练生成式转换器)技术的大语言模型。大语言模型极大地改变了自然语言处理领域的研究范式,使得理解、生成、逻辑、记忆人工智能核心基础能力越来越强,更接近拥有人类智慧的通用人工智能。
算力是AI发展的底层土壤。训练大语言模型,算力特别是智能算力要跟得上。以薄言为客户定制的一套即将上线的AI客服系统为例,项目初期每天有十几万条电网相关文本和语音信息要处理和分析,企业内部数据中心难以承受,需要超强算力燃料补给。
今年1月,宁波人工智能超算中心(一期)正式上线运营。作为首批试点企业,薄言依托超算中心的算力进行NLP(自然语言处理)模型训练,搭建全面、专业的任务型机器人资料库。
郭文峰告诉记者,模型训练时间显著缩短,版本迭代速度加快,帮助企业轻松应对云服务产品更新迭代所带来的服务可用性及准确率降低等技术挑战,帮助轻语虚拟助手平台自助解决大部分的产品售后服务问题。“较之上一代,语义语音识别精度提高了10%左右。”
据介绍,通过超算中心智算算力的加持,薄言训练出针对细分行业领域大语言模型,利用领域大模型底层强大的文本阅读、关键信息抽取以及上下文理解能力+领域知识+轻语平台,这三者相互结合给行业带来新的体验。目前,薄言大语言模型的服务方式同时支持公有云和私有化,并已在医疗、电商行业有成功签约案例。
深度学习架构和AI芯片,是大语言模型的算力底座。据了解,目前国产芯片在设计能力上逐步缩小与海外巨头的差距,但AI芯片的软件生态建设、基础架构等还掌握在巨头手中,因此适配性、资源限制、生态系统是国产芯片的突破口。
“架构、编程模式、开发环境都需要相应的学习并对应改造,有可能增加开发者的难度和成本,但有些‘坑’是必须要踩的。”谈及眼下大语言模型的训练及落地应用,郭文峰坦言依旧有重重困难要解决。
“机器能思考吗?”1950年,艾伦·图灵在《思维》杂志上发表其著名论文《计算机器与智能》,开篇发问。在这一问题被抛出之后的岁月里,人工智能技术日新月异,尤其是近两年AI顶流ChatGPT的问世,更让人类对“图灵之问”的答案深信不疑。
“采采芣苢,薄言采之。采采芣苢,薄言有之……”,“薄言”一词来自《诗经》,引申为在大自然里辛勤愉快劳作。
“以大语言模型为代表的人工智能正在深入各行各业,加速产业升级和经济增长。”郭文峰称,薄言将继续扎根宁波,以智能感知共性关键技术和应用技术为主攻方向,为宁波算力生态构建、高质量发展作贡献。