华夏银行量子基础大模型构建与应用

http://www.chaguwang.cn 2026-06-10 华夏银行内幕信息

来源 :金融电子化2026-06-10

　　6月3日， 2026?数智金融论坛在合肥顺利举办，该论坛由中国科学技术大学国际金融研究院与神州信息联合主办，以“AI 驭领?价值重塑”为主题。华夏银行科技开发与运行中心副总经理王彦博出席论坛并发表主题演讲，分享了华夏银行量子基础大模型构建与应用。

　　“十五五”规划纲要指出要“加快突破人工智能基础理论和核心技术，推进人工智能模型架构改进、算法优化”，并强调前瞻布局未来产业，推动量子科技等成为新的经济增长点。纵观全球，近年来诺贝尔物理学奖、诺贝尔化学奖、图灵奖颁发给了量子科技和人工智能领域，量子科技与人工智能相融合已逐步成为全球科技发展趋势。

　　当前，根据所使用的不同算力和算法类型，人工智能发展主要分为三种计算方式。一是经典计算，即使用经典算力和经典算法进行计算，这是当前人工智能的主流实现方式。二是量子计算，即使用量子算力和量子算法进行计算，该方式代表的是人工智能与量子计算深度融合的未来长期发展方向。三是模拟量子计算，即使用经典算力和量子算法进行计算，该方式实质是以量子计算赋能人工智能，它不仅是连接传统人工智能与未来量子计算应用之间的重要混合形态，也是以经典算力承载量子算法研究的独立发展路径，在量子算法创新、量子计算场景应用等方面具有长期研究价值和工程意义。

　　基于模拟量子计算，华夏银行创新运用量子傅里叶变换（Quantum Fourier Transform, QFT）替换Transformer结构中的自注意力子层，从而构建了量子基础大模型。在此基础上，进一步结合MLA多头潜在注意力机制，将高维输入映射到低维的潜在空间，而后在低维空间中执行多头注意力计算，从而减少计算量和内存占用；同时采用MSG模型增长机制，先从小规模参数量的模型开始训练，然后逐渐增大模型参数量规模，并设计适当的模型增长算子和调度策略，实现高效且稳定的量子基础大模型训练过程。综合运用如上技术方法，华夏银行构建了多款不同参数规模的量子基础大模型（龙智·康熙，QuantumSeek），有效提升了模型训练速度、节省了算力资源，并面向金融场景开展应用。

　　一是基于量子基础大模型开展面向业务场景的LoRA微调。以合规问答、客户情感分析和投资风险事件抽取场景为例，基于QuantumSeek-14B-A2.4B开展LoRA微调，并与多款主流开源基础大模型LoRA微调结果进行对比。在合规问答场景，基于QuantumSeek-14B-A2.4B微调后的ROUGE-1、ROUGE-2和ROUGE-L微调结果指标均优于其他开源大模型；在客户情感分析场景，QuantumSeek-14B-A2.4B在参数量小于 DeepSeek-R1-Distill-Qwen-32B、Qwen3-32B的情况下，准确率排名居首；在投资风险事件抽取场景，基于QuantumSeek-14B-A2.4B微调后的事件抽取精确率表现仅比DeepSeek-R1-Distill-Qwen-32B和Qwen3-32B略低，排在第三位。按照评估指标得分排序，综合三个场景的结果，QuantumSeek-14B-A2.4B 在平均排名中与DeepSeek-R1-Distill-Qwen-32B并列第一，且QuantumSeek-14B-A2.4B排名第一的指标数量最多。

　　二是基于量子基础大模型开展多场景联合微调。在上述场景的基础上进一步增加投研投顾摘要生成和远程银行相似问匹配场景，基于QuantumSeek-14B-A2.4B针对五个场景开展联合微调。由于人工智能大模型存在“负迁移”问题，即当多任务共享模型时，学习信号会互相冲突，反而会拖累所有任务的表现。因此，传统方案往往采取“一个场景对应一个微调模型”的模式，从而可能导致垂类模型数量多、算力消耗大、训练维护成本高等一系列问题。相较于经典大模型，量子基础大模型在多场景联合微调中整体表现出更强的稳定性。与Qwen3-32B和DeepSeek-R1-Distill-Qwen-32B相比，QuantumSeek-14B-A2.4B在多场景联合微调评估指标排名中，整体表现与Qwen3-32B并列第一，且QuantumSeek-14B-A2.4B排名第一的指标数量最多。总体来看，量子基础大模型在多任务联合微调条件下能够较好地平衡不同任务之间的性能表现，展现出更强的任务协同能力与稳定性。这也带来算力成本的有效降低，实现了可观的算力资源节省。

　　三是基于量子基础大模型开展互联网贷款语音催收话术质检应用。在解决海量催收录音全量自动化质检问题的过程中，角色识别是明确质检主体、聚焦催收行为的关键环节，其核心是基于大模型的语义理解与特征提取能力，完成零样本学习推理任务，对经语音分割和语音识别输出的两段文本进行说话人角色（“催收人”与“被催收人”）标注与内容筛选。基于DeepSeek-R1-Distill-Qwen-32B模型识别准确率为95%；将QuantumSeek-14B-A2.4B引入互联网贷款语音催收话术质检的角色识别环节，在保持识别准确率的同时，平均识别响应时间更短。

　　四是基于量子基础大模型开展授信调查报告生成应用。基于QuantumSeek-14B-A2.4B量子基础大模型实现对抵质押物评估报告、房产及权证类核心业务信息的高效提取和分析，从而快速生成尽调报告，将原本人工需要3—10天完成的报告生成时间压缩至分钟级，效率提升200倍以上。QuantumSeek-14B-A2.4B量子基础大模型授信调查报告生成效果可对标Qwen3-32B大模型，且平均响应时间更短。

　　五是基于量子基础大模型支持NL2DSL2SQL意图识别。NL2DSL2SQL是一种分层递进的自然语言到SQL转换技术，核心理念是将传统端到端直接转换的复杂任务，拆解为“自然语言（NL）→领域特定语言（DSL）→结构化查询语言（SQL）”两步独立且衔接紧密的转换流程，通过引入DSL中间语义层，实现业务语义与底层数据库语法的解耦，兼顾语义理解的灵活性与SQL生成的规范性。通过将QuantumSeek-14B-A2.4B嵌入至NL2DSL2SQL意图识别关键环节，实现自然语言查询的意图解析与判定。面向小样本学习NL2DSL2SQL意图识别场景，在微调参数一致的前提下，与DeepSeek-R1-Distill-Qwen-32B和Qwen3-32B相比，QuantumSeek-14B-A2.4B的准确率与F1值均排名第一。

　　展望未来，“量智融合”在金融领域的应用发展已成趋势。面对快速演进的技术革命，华夏银行将继续秉持前瞻视野，积极把握新一轮科技革命带来的发展机遇，持续加强金融科技与数字金融能力建设，不断推进前沿技术应用探索，以“量智融合”为银行业务高质量发展注入新动能。