过去的2023年,全球科技界开启了AI大模型的狂欢,除了通用型外,各个垂类大模型的百花齐放,更是备受业内高度关注。
金融业作为数字化、全球化程度最高的行业之一,更是率先与新兴科技进行融合。2023年,金融机构纷纷掀起“百模大战”,行业想要依靠大模型产生新变革。其中乐信、奇富科技、度小满、蚂蚁集团等众多金融科技企业争先布局,先后发布落地了多项金融大模型,金融业正加速走向AI创新应用期,在金融信息触达、产品介绍内容的文本自动生成、市场营销、企业经营管理、构建虚拟客服在线交互以及风险管控等方面,给用户提供更人性的服务,提升了金融机构的工作效率。
IDC的一项调研显示,超半数的金融机构计划在2023年投资生成式人工智能技术,只有10%的金融机构表示没有试验计划。
那么,过去的2023年,国内金融科技企业在大模型方面取得了哪些突破和进展?在各自的大模型发展路径上,又有什么不同?对于业内迫切期望的智能涌现效应,未来金融大模型的发展又将面临着哪些挑战?
2022年11月末,ChatGPT一经上线后,迅速在全球引发AI大模型的热潮。时至今日,这场科技界的大模型狂欢盛宴仍在持续,无论是在通用领域,还是垂直领域,千行百业都掀起了一场“百模竞速”。
对金融大模型来说,金融科技公司都希望抢到“头啖汤”,从去年二季度开始,各家的自研金融行业大模型也是争先亮相。2023年4月,乐信推出了自研的金融垂直大模型LexinGPT;5月,奇富科技、度小满先后发布了“奇富GPT”和“轩辕”;6月份,恒生电子金融行业大模型LightGPT正式面世;8月,马上消费金融发布首个零售金融大模型“天镜”;9月,蚂蚁集团正式发布工业级金融大模型AntFinGLM等等。
除了金融科技公司,基于通用大模型的开发和应用,更多的互联网和科技大厂也推出了针对性的金融行业解决方案。比如百度智能云基于文心大模型开发的金融解决方案“开元”,华为上线了三大类10个场景的金融大模型方案,科大讯飞基于星火认知大模型推出了金融行业大模型V1.0,还有腾讯云发布金融行业大模型解决方案……
随着金融行业数字化转型的加速,越来越多的公司参与布局金融行业大模型。从过去的一年来看,金融大模型已在内容生成、智能营销、获客销售以及风险管理等业务领域开始发挥价值,涉及运营、客服、营销、风控、研究以及贷后等多个场景。尤其是相较于传统模式,大模型的加入更是极大提升了金融行业的运营效率。
乐信在2023年三季报中披露,公司正在加速了AI大模型的落地应用,其中业务交互方面,已经在电销、客服、催收等主要业务流程中全面落地,比如信息流获客效能比一季度提升38.5%,新客的通过率、交易用户数、促成借款额都比对照组有20%以上的提升;生产力提升方面,在研发代码辅助、设计创意生成、数据分析等场景中广泛应用,提升公司整体的运营效率。
在企业经营的智能决策方面,乐信方面还提到,基于海量精准的预测模型,公司开发了“图灵(Turing)决策仿真系统”——系统可以直接模拟多种真实经营场景,相当于企业经营的“模拟考”,并最快只需几十秒内就可以快速输出各项经营关键指标表现,模拟结果的精准度超95%。例如一个撮合匹配的优化策略, 原来实际上线测试几个月可能会耗费高额的成本, 现在通过图灵仿真系统, 90秒内就可以得到置信度非常高的结果。这样的快速反馈和高精准度给了乐信经营更大的灵活性和准确度。
而奇富科技的大模型,目前也已经覆盖了智能营销、反欺诈、贷前额度、贷中调整,以及交易风险和智能机器人等业务的全生命周期,并且在小微业务、机器人、智能营销、研发及商业分析等领域进行了应用。
据了解,去年第三季度末,奇富科技已为中国2450多万小微和家庭兼职小微用户赋予了适用于信贷场景的行业标签,便于今后能更好地根据行业特性服务小微用户的资金周转。具体在智能营销方面,有大约70%的图片素材由大模型生成,并通过大模型对素材进行标注和多维度评级,以实现广告投放的优化,同时大模型让营销素材的客户触达规模提升了21.4%。此外,在电销系统中,语义分析和线索挖掘帮助提升电销线索识别准确率高达98%,同时将转化率提高超过5%。
还有度小满,也将大模型技术应用在各个业务场景,从营销、客服、风控、办公再到研发,已经初见成效。比如在代码助手方面,用大模型辅助生成的代码,采纳率能够达到42%,帮助公司整体研发效率提升了20%;在客服领域,大模型推动服务效率提升了25%。在智能办公领域,大模型目前的意图识别准确率已达到97%。
从国内的AI大模型发展来看,主要分为通用大模型及行业大模型,前者具有更广泛的的应用范围,可以在多个领域内发挥作用;后者针对法律、医疗、金融等某个特定领域或行业,在垂直领域内具有较高专业性和针对性。据熟悉金融科技业务的人士透露,大模型对金融机构的赋能可以是全方位的,涉及金融业务流程中与人相关、人机交互的等各个环节,但现阶段金融大模型的价值,主要在于对大规模数据的理解、加工和分析,以及让工作流程更加流畅和低成本,以实现提质增效。
华西证券的报告指出,随着大模型技术与业务的深度融合,头部金融科技企业有望实现产品和商业模式的革新,实现从产品+服务收费向SaaS订阅收费、运营分润收费的转变。
从各行业来看,金融业沉淀了如金融交易、客户信息、市场分析、风控等各个方面的海量数据,并催生出大量高效处理的技术需求。同时金融行业持续进行数字化转型,以往对数据的收集、处理、清洗等工作也都做得较好,有着良好的数据基础,这也是为什么在大模型演进过程中,金融业走得较快的重要原因。
对于金融机构在GPT产品方面的需求,奇富科技曾在去年5月对104家中小金融机构进行了访谈,其中的结果显示,金融机构对GPT产品的需求主要集中在改善用户体验、辅助风控决策以及资料查询与信息提炼这三个方面。
一般来说,从大模型行业应用路径来看,科技巨头提供通用大模型,或者技术能力强的金融科技公司提供金融行业大模型,具体的金融机构基于这个行业底层模型,用自己的业务数据去做私域训练,然后做私有化的部署和应用。过去的一年,对于那些选择探索开发自有大模型的金融科技公司,在大模型的发展方向以及侧重点方面,其实也呈现出不同的路径选择。
以乐信的LexinGPT为例,依托近2亿优质高成长的年轻用户的行为画像以及真实交易链路数据,其金融大模型更加注重与业务场景的融合应用。通过梳理清晰这些海量数据关系(数据库量级大致在百亿至千亿之间),并形成了不同场景下、用于预测用户行为偏好的众多精准模型,包括:借钱意愿度模型、营销偏好模型、offer满意度模型、还款意愿度模型、客户流失预警模型等,乐信迭代和完善了用户生命周期全局模型,打造出一套领先的全链条量化经营的系统,提升运营效率和客户体验。未来,乐信还会将AI和大模型应用于金融科技全链条实现精细化运营。
而奇富科技所打造的金融大模型方向,是借助自身在“软硬结合”的优势和积累,成为金融领域的“AI专家”。比如通过技术不断加深对金融行业与用户需求的理解,并持续优化数据分析与处理能力、算法与AI技术、夯实算力储备,软与硬相互绑定,以更好地赋能金融行业,更具有普适性。与此同时,奇富科技还特别注重大模型在最终输出答案的可信度和合规性。比如针对大模型在内容真实性与内容合规方面的痛点,奇富科技依靠一系列政策规范文档与条款,形成了丰富的信贷合规处置经验,并以此完成信息围栏的构建,让大模型安全可控。
奇富科技首席算法科学家费浩峻还提到,大模型并不是越“大”越好,如何在有限算力内提升模型效果,使实际业务应用更快更高效,是首先需要平衡的。“我们希望把模型‘做大’后再‘做小’,做大是把它的能力做大,比如像Chat GPT这种千亿参数的模型有很强的能力,保持能力不变的同时把参数做小,结合多种场景运用到垂直领域中,会实现更好的效果。”
此外,也有像华为、马上消费、星环科技这种“另辟蹊径”布局金融领域大模型的玩家。华为依托于盘古大模型,以金融级PaaS解决方案的方式切入金融场景;马上消费的“天镜”大模型则凭借着“三纵三横”技术布局扎根金融行业全链路;数据库厂商星环科技在自研金融大模型“无涯Infinity”的同时,还提供了一站式的企业自建大语言模型工具链,尝试两条腿并行。
对于金融大模型的落地应用途径,中国工程院院士邬贺铨建议,机构可从可控入手开发应用,例如智能客服、智能运营等安全的领域出发。再从人机混合智能切入,例如在初期阶段先让金融大模型与传统模型共存,经应用考验后再将金融大模型逐步替代传统模型。同时还可以通过变换场景,丰富大模型的场景迁移学习能力,或加入反事实的数据来测试,改进AI的学习本质,提高模型的泛化能力。
尽管各家都有不同的发展路径,但可靠性仍然是大模型在金融领域落地最大的鸿沟。为了将大模型更好地“缝合”到业务场景中,提升可靠性、安全性和流畅度,各大厂商的主流方案有三种:一是将大模型与专业领域的小模型结合,大模型负责认知、理解、沟通、创作,小模型负责把握风险、承载严谨的逻辑;二是将大模型的参数知识与结构化、显性化、可靠的金融知识图谱相结合,此举能很好地为大模型注入可靠性;三是将开放QA(问答)和封闭QA的结合,让大模型得到请求指令后,在专业知识领域内进行检索,大幅提高准确性。
对于金融大模型竞争中的核心问题,毕马威中国金融科技主管合伙人黄艾舟认为,这取决于最关键的是两个能力:第一个是算法,因为好的算法能够使得需要的参数减少,同时产生更好的效果,但这需要顶尖的AI科学家。第二个是数据的质量和数据的规模,如果已经有了经过标注的数据,那一定会提升模型的性能和模型产生的结果,同时通过大规模数据的不断学习和训练,才能有智能涌现的能力。
工信部赛迪研究院日前发布的数据显示,2023年我国语言大模型市场规模实现较快提升,将达到132.3亿元,增长率将达到110%,而且应用场景不断丰富。而随着AI技术产品化、产业化以及商业化,2024年将是大模型发展的重中之重,在应用层面有望实现新的突破。
对金融大模型来说,现阶段最容易实现的包括AI投资顾问、自动化客服、风险评估、报告自动化生成、代码生成应用等较为外围的工作,但如果要将AI进一步渗透到风控等金融核心业务,还需要在垂直领域进行磨合,经过长时间的考验,才能进入到更为核心的金融业务中。
而在未来发展方面,金融大模型也面临着一些挑战。这首先来自于数据安全合规的采集、管理和使用。因为金融行业本身对数据安全和隐私合规有着严格的要求,注定了金融大模型在采集、传输、加工及处理信息的各个环节,都要比通用大模型乃至其他行业大模型更为谨慎。而且数据又是不同金融机构的核心生产力,关系着自身的护城河问题。大模型发展需要高质量数据集,同时又受限于自身远远不及通用语料的数据规模,就必然需要不同业态完成数据共享,如何构建一个合理且安全的机制,考验的是整个金融行业的智慧。
其次是大模型的迭代和训练,成本高、成本大,模型需及时调整,也有一些金融机构选择利用大数据的整合,在垂直领域精调模型,以小规模算力打造轻量级精调模型。金融的本质是风控,大模型优化金融业务流程和用户体验的同时,要将风险降到最低。
也因此,目前大模型在金融垂直领域仍未挖掘出涌现效应,一方面是由于金融数据及知识的私密性导致难以共享,无法构建一个庞大的数据集,对此可以增强产学研的联动性,共同构建更强的金融垂直领域基座模型。另一方面由于金融数据模态更多,难以进行统一的处理建模,而如今的大模型对此种多模态的表达能力仍有待加强。
最后,金融大模型的发展,还要处理好金融业务数据如何融入到大模型中,以及如何控制幻觉问题等模型缺陷问题。所谓“幻觉”,指的是人工智能模型生成的内容,不是基于任何现实世界的数据,而是大模型自己想象的产物,即给出事实错误或者是一些看上去权威正确的虚假信息。可以说,生成式大模型非常擅长创造,往往创造有余,但准确性不足。且金融领域的本质是复杂决策、低容错率,这远远比对话聊天困难得多,通用模型里面的专业知识远远不够,如果无法有效发现“幻觉”中的漏洞,那么将很可能导致金融大模型出现理解或判断上的偏差,直接影响风控效果。
就当前而言,成本较高、金融数据不充分,落地场景和大模型之间实际预期业务价值之间存在差异。企业对模型精度和效率要求更高,尤其是一些专业性强、知识密度高的领域,大模型的表现存在输出结果不受控、可解释性较差、可信程度较低等情况,从而限制了其应用场景。此外,在新技术的应用过程中面临伦理道德、价值观上带来的挑战时,人工智能带来的伦理问题需要法律法规约束,这些在未来都需要进一步厘清和给出明确的规定指引。