9月5日下午,由北京市科学技术协会、中国通信学会、“科创中国”金融科技产业服务团、“科创中国”京津冀挂点工作组共同主办的“2023中国智能金融论坛”在国家会议中心成功举办。中国工商银行首席技术官吕仲涛出席会议,并作《金融行业AI大模型落地探索与实践》的主题分享。敬请阅读。
文/吕仲涛(中国工商银行首席技术官)
来源/微信公众号“CIC金融科技与数字经济专家委”
尊敬的各位嘉宾:
大家好!很荣幸受邀参加2023服贸会中国智能金融论坛。随着ChatGPT的发布,人工智能大模型技术成为社会各界关注的热点。ChatGPT的诞生,成为了AI界的"iPhone时刻",其出色的对话能力让其成为历史上用户增长速度最快的应用。ChatGPT在语言理解、知识储备和回答问题等方面,都展现出了很强的能力和潜力。同时让业界看到大模型广泛的应用前景,通过大模型可以助力行业提质增效,推动数据与实体的融合,改变行业发展格局。结合论坛主题,我主要和大家分享一下AI大模型在金融行业的落地探索与实践。
国际人工智能权威杂志《自然-机器智能》将大模型定义为网络参数规模达到亿级以上的“预训练深度学习算法”。大模型通过海量数据的训练学习,具备了强大的语言理解和表达、思维链推理等能力,在文本图像理解、内容生成等AI任务表现出显著优势和巨大潜力。相较于传统人工智能算法一事一议的建模方式,大模型具备更强的通用能力,可处理多种任务,可较好解决传统模型的碎片化问题。其特点可以总结为“三大一快”。三大,指的是大模型基于“大算力+大数据+大算法参数网络结构”进行训练,实现通用海量知识预置。一快,指的是大模型通用能力强,各行业可在大模型基础上,直接使用或“站在巨人肩膀上”通过再次训练快速学会新知识,快速赋能业务应用。
人工智能在1956年达特茅斯会议上被首次提出后,历经三次发展浪潮,其中人工智能第一、二次浪潮是“小数据、单任务”范式的分析式AI,分别是“专家系统+机器学习”浪潮以及深度学习浪潮,这两个阶段,人工智能技术均不能创造新内容。大模型催生了人工智能第三次浪潮,开始向“大数据、多任务”范式的生成式AI迈进,具备更强的通用性、理解和生成能力,让通用人工智能发展迎来起点,加速通用人工智能走进现实,改变人类的生产生活。
从ChatGPT诞生以来,国内外大模型发展浪潮持续高涨,形成了算法研发、产品应用的产业链生态。但相较国际领先水平,国内大模型仍存在代际差距。从算法生态来说,目前最优秀的大模型是OpenAI的GPT-4,这是一个多模态大模型,在很多领域专业和学术基准上表现出人类水平。国内各类AI公司也纷纷入局,已推出如百度文心一言、阿里通义千问、讯飞星火等产品,各有千秋。从应用层面来说,微软依托投资GPT4红利,已在搜索、办公、安全等传统领域推出智能化产品。国内在应用层面仍处于起步阶段,有待进一步探索。
大模型作为一种新型的人工智能技术,与传统模型相比,具备强大的通用能力和智能创作能力,可以通过聊天交互模式,协助用户完成文案撰写、文档总结、代码生成等各类智力性和创造性工作,引领行业新变革。商业银行可以聚焦远程银行、基层网点等大基数员工群体共性需求,持续加大新技术面向全业务流程的综合化运用,形成端到端的业务智能化解决方案,全方位提升银行服务的工作质效。
在远程银行客服领域,工商银行围绕远程银行中心数千人的客服团队,贯穿坐席事前、事中、事后全流程,聚焦对客服务中枢的运营团队、群体基数较大的人工坐席、工作量较为繁重的质检人员,重新定义该群体的作业和生产模式,基于大模型能力赋能全流程业务场景。在事前智能客服知识运营阶段,利用大模型自动完成数据标注与知识维护,助力提升传统智能客服分流质效。在事中服务客户阶段,利用大模型打造前情摘要功能、知识随行功能、工单智能填写功能,极大提升坐席运营效率,压降通话时间。在事后质量检查阶段,生成传统质检AI模型数据,即模拟坐席及客户问答,提升传统质检模型准确率。
在行内智慧办公领域,工商银行全面升级办公模式,利用大模型的文本生成、问答能力,围绕邮件、文档、会议、员工日常事务等方面,优化行内办公工具的交互体验,助力全行40万员工的办公效率提升。比如会议纪要生成,根据会议对话内容,大模型快速生成会议纪要初稿,降低人工记录会议纪要的成本,助力全行办公领域智能化。
在智能研发领域,工商银行利用大模型代码生成、代码识别与检测、代码转自然语言等领域的全方位能力,构建基于大模型的智能研发体系。截至目前人工智能编码助手共收集到超2100万个字符编码数据,录入代码超80万行,编码助手生成代码量占总代码量的比值从20%提升至40%,有效提升一线开发人员编码效率和质量。
大模型本质是一个海量参数的深度学习算法,受制于当前模型黑盒、计算复杂度高、推理结果不可预知等因素,存在答非所问、应用成本高、科技伦理风险等方面问题。比如,大模型生成的内容中可能存在明显的宗教偏见、性别歧视等现象,有违社会伦理。有时候内容看起来合乎逻辑,但可能并非真实甚至是捏造的事实,存在非法利用、造谣等安全隐患。数据隐私保护也存在隐患,大模型训练数据来源于互联网、业务数据,这些数据可能涉及大量用户隐私,需要通过隐私计算、联邦学习等方式进行保护。
国家高度重视大模型应用安全,国家网信办于7月13日联合国家发改委、教育部、科技部、工信部、公安部、广电总局发布《生成式人工智能服务管理暂行办法》,从适用范围、管控要求、鼓励导向等方面明确生成式大模型管理要求,旨在促进基于大模型的生成式人工智能健康发展和规范应用,维护国家安全和社会公共利益,保护公民、法人和其他组织的合法权益。
虽然大模型有各类安全风险,但同样给银行业数字化转型带来新机遇。在这过程中,我们需要解决数据、算力、算法、应用等诸多挑战。
一是大模型需要大数据。通过数据驱动,释放数据要素价值,加速金融行业和企业大模型建设,加速推进银行业数字化转型。
二是大模型需要大算力。当前国内外算力市场面临着算力供给短缺、多厂商异构算力融合、国产AI生态不足、机房和网络建设等复杂情况,金融机构需要深化与产界各方的合作,来共同推动解决大规模算力部署和应用挑战。
三是大模型需要大合作。银行业要加快探索引入业界通用的大模型技术的策略和实践,通过推进大模型算法在银行业的应用实践,加快大模型能力增强,从而提升大模型服务金融行业能力。
四是大模型需要大创新。大模型要能在银行深化应用,就需要探索形成一套面向银行业的高标准、低门槛的银行业金融大模型应用模式,来快速推进人工智能在金融领域的深化应用。
关于大模型应用落地,目前业界尚无标准方法论,企业可按照场景通用化、专业化程度,分别使用基础大模型、行业大模型、企业大模型、任务大模型。四层模型训练数据规模和投入算力逐层递减,专业属性逐层增强。其中,基础大模型由于投入数据量大、算力成本高、算法难度大,由头部AI公司进行建设,虽然通识能力较强,但其缺少金融专业知识,对金融场景应用有限。
对于大型金融机构而言,因金融数据海量,应用场景丰富,可引入业界领先的基础大模型,自建金融行业、企业大模型,考虑到建设周期较长,可采用微调形成专业领域的任务大模型,快速赋能业务,比如工行前期和鹏城实验室联创,通过微调,率先实现了人工智能大模型在行业内的应用。对于中小金融机构而言,综合考虑应用产出和投入成本的性价比,可按需引入各类大模型的公有云API或私有化部署服务,直接满足赋能诉求。
工商银行经过5年多的建设,目前已经沉淀人工智能模型3000余个,包括传统机器学习模型、传统深度学习模型和大模型三类。一是传统机器学习模型因可解释性强,广泛用于欺诈交易预测、理财产品营销推荐等智能决策分析应用,二是传统深度学习模型广泛用于OCR识别、人脸识别、语音识别等感知识别类任务,有效提升劳动密集型工作;三是大模型,其计算复杂度最高,可解释性最低,具备的能力最强,经过探索实践,大模型可用于文本、图像等AIGC任务,提升智力密集型工作质效。从趋势来看,大模型随通用能力增强,将逐步超越传统模型的能力,但受制于计算复杂度高、可解释性差等问题,短期内,大模型和传统模型会共存,同时,大模型强大的语义理解能力使其可作为中控,将传统模型作为技能进行调用。
通过前期实践,我们认为大模型在文本、图像等领域的AIGC能力优势明显,但当前阶段并不成熟,仍存在科技伦理风险等问题。因此,短期内不建议直接对客使用,应优先面向金融文本和金融图像分析理解创作的智力密集型场景,以助手形式,人机协同提升业务人员工作质效。后续建议在如下四个方面加强建设。
一是场景方面,金融行业需持续加快千亿级大模型场景建设。大模型参数规模越大,可容纳的知识越多,能力越强。千亿大模型具备更强的逻辑推理和生成能力,可更好支撑存在大量逻辑推理、分析复杂的场景,如财务报告智能分析、金融人才智能招聘等。同时千亿级模型资源消耗是百亿级的2-4倍,因此在未来一段时间内是百亿和千亿搭配应用。
二是数据方面,需持续完善大模型数据工程建设。大模型的突破得益于高质量数据的发展,数据的高效处理方式是大模型成功的关键要素。随着数据集规模的增大,数据管理难度也在攀升,需持续提升大模型数据清洗的工程化能力,高效去除有害、非事实数据,助力大模型训练数据质量提升,并从单一的结构化数据转向多模态的全领域数据。
三是工程化应用方面,需持续提升大模型工程化流水线能力,随着大模型参数规模的提升,训练过程所需的计算资源也呈现指数级增长,需要强大的计算能力来支持高效的分布式训练和推理。现有计算集群在进行大规模并行训练过程中,由于硬件故障等原因,稳定性仍存在较大问题,需提升训练任务失败时快速定位问题能力,保障训练效率。
四是评测标准方面,需建立金融行业大模型评测标准体系。为保证大模型在各场景能力方面展现出优异效果,需建立一套全面、客观、高效的测评体系,并结合业界各方智慧与行内真实应用,制定一套符合自身的测评标准,保证对大模型的效果及安全状况进行全面测评。
【结语】
我们相信在大模型的助力下,金融机构将不断提升人机协同智能化、经营决策智能化、业务流程智能化,赋能数字化转型。工商银行将与“产学研用”各方开展深度合作,把握生成式人工智能重大发展机遇,加快推进AI大模型在业务方面的广泛应用,全面提升金融服务质效,助力高质量发展。
完
文章来源:微信公众号“CIC金融科技与数字经济专家委”,2023年9月7日(本文仅代表作者观点)
本篇编辑:热万·托合达尔
温馨提示:目前微信推送文章不再按照发布时间排序,而是会优先显示“设为星标”或者点击过“在看”文章的订阅号推送。广大读者朋友们可以点击上方蓝字“金融观察家”,然后再点击右上角“...”点选“设为星标”;或对喜欢的文章点击“在看”,方便查阅。感谢您的关注。
扫
码
关
注
微信公众号
金融观察家
“聚焦金融政策研究
促进金融专业交流”