自美国人工智能公司OpenAI推出ChatGPT以来,通用人工智能大模型在全球掀起新一轮人工智能产业发展浪潮,全球人工智能大模型市场呈现“百模争鸣”的快速发展态势。2025年1月,我国人工智能公司深度求索(DeepSeek)发布推理模型DeepSeek-R1,不仅在性能上逼近甚至超越了OpenAI的o1系列产品,并且凭借组相对策略优化(GroupRelative Policy Optimization,GRPO)算法模式、知识蒸馏(Knowledge Distillation)和思维链(Long-CoT)技术,实现推理成本仅需o1的3%左右。这一里程碑式进展被硅谷科技媒体、德意志银行等誉为中国人工智能领域的“斯普特尼克时刻”(Sputnik Moment)。
长期以来,以银行为代表的金融部门以其大规模、高质量的数据资源和多维度、多元化的应用场景,被视为最适合大模型应用的行业之一。据中国移动上海产业研究院数据,AI大模型在金融领域渗透率已突破50%,位居各行业首位。据《2024年度中国银行业发展报告》,银行业具有适用AI大模型技术的丰富场景,AI大模型技术能够充分挖掘银行业的海量数据。作为“五篇大文章”之一,数字金融对银行业高质量发展的战略意义持续凸显,也为大模型的落地创造了广阔空间。2025年《政府工作报告》指出,“支持大模型广泛应用”;2025年3月,国务院办公厅发布《关于做好金融“五篇大文章”的指导意见》,强调“加快推进金融机构数字化转型,增强数字化经营服务能力”。当前,以DeepSeek为代表的人工智能大模型持续赋能银行等金融相关领域,有望为金融行业数字化转型提供关键助力。
生成式AI大模型在银行业的应用场景可以贯穿前、中、后台各个环节,规模化应用有望带来可观的降本增效收益。据波士顿咨询(BCG)数据,以一家拥有约两万名员工的区域性国际银行为例,梳理该银行前中后台相关部门应用生成式AI的潜力和效益,预计首年可节省约1.5亿美元的成本,占整体薪酬总包的7%左右(表1)。
DeepSeek通过应用于精准营销、理财顾问、贷前风控、信用评估等核心领域,带动银行各类业务效率明显提升。例如,在精准营销环节,DeepSeek构建的对话式AI引擎,采用意图识别(NLU)与对话状态跟踪(DST)双引擎架构,多轮对话管理系统支持上下文感知的个性化服务,结合情感计算模块实现客户体验的量化评估。基于DeepSeek的智能客服系统,能够实现全天候不间断服务,快速响应客户的咨询和问题。通过自然语言处理技术,智能客服可以理解客户的意图,根据客户的历史记录和偏好,为客户提供个性化的服务推荐,提升客户满意度。此外,DeepSeek基于客户消费习惯和金融资源应用状态、所处行业特征、产品特性等生成的各类营销方案,也将为客户经理提供多维度的参考(图1)。在投资决策环节,DeepSeek可以通过对客户的资产状况、风险偏好、投资目标等信息的分析,为客户制定个性化的投资组合方案。同时,DeepSeek也可以实时监测全球金融市场动态,包括股票、债券、外汇等各类金融市场的价格波动、交易量变化等,通过对历史数据和实时数据的分析,捕捉到市场趋势的细微变化,提前发出风险预警。在智能风控环节,DeepSeek基于实时风险决策引擎和整合流式计算框架与复杂事件处理(CEP)技术,能够实现毫秒级风险决策响应。从目前已完成或计划完成DeepSeek本地化部署的商业银行来看,其多元化业务为DeepSeek赋能提供了丰富场景(表2)。
二、银行业高质量发展过程中,DeepSeek低成本、高性能、开源化的特点为其带来新机遇
传统大模型计算资源消耗较大,DeepSeek基于专家混合架构(MoE)、模型训练优化、高效强化学习和数据蒸馏技术,显著提高了计算效率和推理速度,同时也大幅降低了对计算资源的需求。据DeepSeek数据,预训练大模型Deepseek-v3的训练成本约为558万美元,远低于同类头部模型;DeepSeek在API服务定价也远低于OpenAI同类产品(图2、3)。同时,在较低成本的基础上,DeepSeek也能够兼顾模型效率。在AIME2024美国数学邀请赛中,DeepSeek-R1得分达到79.8%,优于OpenAI-o1(图4)。在英文、代码、数学、中文等不同测试集下,DeepSeek-R1较一些知名模型在部分指标上竞争力突出。此外,DeepSeek采取了完全开放的开源策略,允许开发者基于DeepSeek的基础模型进行自定义开发。
近年来,数字化能力成为商业银行核心竞争力之一,银行业持续加大金融科技投入。据安永数九游娱乐据,2023年我国已披露数据上市银行金融科技投入达到1959亿元;大型银行和股份制银行持续加大数字化应用规模,大型银行(6家)、股份制银行(9家)、城商/农商行(10家)合计金融科技投入分别为1228.2亿元、652.4亿元和89.6亿元(图5)。随着科技投入达到一定规模、数字技术和数据底座能力差距逐渐拉大,不同规模商业银行间数字化转型的“马太效应”逐渐显现。据测算,2014-2020年,在综合数字化战略、数字化组织、数字化客户、数字化产品和数字化技术等维度的数字化转型水平方面,大型银行明显高于中小银行(图6)。
DeepSeek大幅降低AI大模型的应用门槛,中小银行可以选择与金融科技服务商合作,通过接入DeepSeek开源大模型,运用混合专家系统等降低算力消耗,从而减少研发成本、突破技术门槛,同时借助二次开发对接业务场景需求,缩小与大行数字服务能力的差距。更为重要的是,DeepSeek的开源模式允许金融部门根据业务需求灵活调用和部署不同参数、功能的模型。据卓普云测算,企业本地化部署DeepSeek的硬件成本取决于模型规模与算力载体选择,不同需求形成的硬件成本在5-200万元,由此为各类商业银行接入DeepSeek提供了不同选择(表3)。大型金融机构可以在前期数据积累、自研大模型等基础上,结合业务场景特性调用DeepSeek模型,推动业务价值链向高端延伸;中小金融机构可以在部分业务节点进行本地化部署加快入局。
商业银行服务实体经济的本质,决定了数字金融发展的根本目的在于促进产业生态共同发展。纵观历史,历次工业革命总是伴随着金融技术变革以及新的金融业态形成,并进一步为产业革命提供资本动能。DeepSeek开源架构与模块化设计,本质上构建了一个去中心化的技术生态,促进了商业银行与各行各业的科技生态协同发展。一方面,通过开放的API接口,DeepSeek朋友圈迅速“扩容”,商业银行可以探索与其他金融机构、科技企业等进行数据共享和业务合作,提升金融服务的整体效率和质量。截至2025年3月13日,Wind中DeepSeek指数共有43家A股上市公司,行业涵盖计算机、传媒、金融、商贸零售、通信、医疗等(图7);据不完全统计,截至2025年2月末,已有超过200家企业接入DeepSeek,覆盖科技互联网、云服务、电信、金融、能源、汽车、手机等领域。未来,银行业能够以DeepSeek为纽带,跨越制造、能源、政务等边界,构建产业生态共同体。例如,商业银行可以与制造业联合创新供应链金融2.0,基于制造业订单、物流、资金流数据实时授信,盘活产业链资金。
另一方面,DeepSeek全开源战略将带动银行业等行业开发者创新热情,助力产品和服务创新。截至2025年2月28日,DeepSeek开发者社区已汇聚85万注册用户,开源模型下载量突破2100万次。全球各行各业的开发者都可以发现并实时修正错误与漏洞,从而形成广泛的社区贡献,为其开源模型的迭代提供重要的技术支撑。据工信部2023年调研数据,采用国产大模型轻量化方案的企业,智能化改造成本仅为传统方案的12%-18%。这种“微创新”模式有望充分激发银行从业者创新热情,从业者可以基于专业能力持续训练、强化自己专属大模型,真正意义上实现“千人千模”。此外,以DeepSeek为代表的“人工智能+”广泛赋能各个行业,也将提升各行业对可信数据空间等其他基础设施的需求,从而进一步强化行业间互联互通。广泛的数据联通需求牵引下,不同的行业数据空间建设模式趋于成熟,从而实现各行业数据空间融合互通,以及行业数据空间与通用型、区域性数据交易市场的衔接。伴随数字金融、科技金融、产业金融生态化发展与融合持续推进,多方互利共赢的全新商业生态模式逐渐形成,从而实现整个生态圈健康发展。
人工智能技术快速发展的同时,也引起社会对其就业替代的广泛担忧,银行业被认为是将被颠覆的主要领域之一。据波士顿咨询公司(BCG)测算,人工智能将从削减岗位、提升效率及创造就业三个方面对金融就业市场产生影响,预计到2027年中国金融业将有230万岗位因人工智能的应用而被削减,占全行业就业人口的23%;银行业将削减104万工作岗位,降幅达22%(以2017年的就业人口为基数)。同时,银行业本身具有特殊性,单纯依赖AI从事某环节工作可能引发风险,亟需探索使用人工和AI间的平衡。据全球研究与咨询公司Gartner调研数据,尽管AI技术在提高客服效率、降低成本方面具有显著优势,但受访者普遍担忧AI可能带来的问题,有高达64%的人表示不希望客服系统部署AI技术。
以DeepSeek为代表通用大模型快速崛起,使AI成为提升银行业务效率工具的同时也兼具专用性,形成“人人可用”“百花齐放”的人机协同模式。DeepSeek能够有效缓解人类认知和AI认知的难点问题,在人机协同过程中使从业者从简单的信息处理分析中解放出来,更加专注于深度思考和战略决策(表4)。
据摩根大通数据,截至2024年11月,该行采用生成式人工智能以来已创造了更多的就业机会。银行相关业务人员减少重复性简单工作过程中,也有更多余力推动个人价值的充分释放。在宏观经济环境突发变动时,业务人员能识别和解释政策调整、地缘政治等一些难以量化的复杂因素,迅速改变策略;在企业经营发展变化时,业务人员能够能基于管理层的理想追求、能力作风等软信息进行判断,更精准评估企业价值,快速作出反应;在面对客户情绪化、个性化需求时,业务人员可凭借人际互动中积累的信任和了解,提供量身定制的营销方案。
传统生成式AI大模型带来的能耗污染问题已构成严峻的环境挑战,以OpenAI、谷歌、Meta等企业为代表的生成式人工智能技术体系,依托强大算力支撑,形成“算力军备竞赛”模式,能源消耗呈指数级增长。据斯坦福人工智能研究所数据,GPT-3一次训练的耗电量为1287兆瓦时、排放552吨二氧化碳,相当于3000辆特斯拉电动汽车共同开跑、每辆车跑20万英里所耗电量的总和;训练期间耗水近700吨,每回答20-50个问题就要消耗500毫升水。银行业应用传统大模型过程中,需要配备大量高性能的GPU计算节点、高速硬盘以及高速网络带宽,对算力要求和消耗持续提升。另据《金融行业先进AI存力报告》,大模型训练等场景对于存力也提出一系列新挑战,存力易成为短板从而制约算力效能发挥,成为金融大模型落地过程中潜藏的风险。
DeepSeek通过对模型架构的极致优化和算力需求的精简,实现了在性能一般的中低端显卡上媲美甚至超越ChatGPT的效果。过去依靠顶级算力才能承载的大模型,现在可以“降维”到成本更低的硬件上运行,将大幅降低模型推理过程中的能耗,实现“绿色计算”。DeepSeek产生的“鲇鱼效应”也将带动国产推理芯片厂商持续突破,缓解银行业等大型企业AI模型高度依赖英伟达GPU的问题。DeepSeek推动训练端算力需求相对减少的同时,也加速推理端芯片需求持续增长。其开源策略为国产GPU兼容CUDA生态提供了参考模板,有利于促进打造“国产模型+国产算力+国产系统+国产应用”的全国产化AI产业链,进一步缓解大型银行机构面临的潜在芯片卡脖子问题。据相关机构预测,DeepSeek-R1模型训练若采用国产芯片(性能为H100的30%-60%),需10万至15万颗国产芯片替代5万颗H100,有望拉动国产芯片快速发展。
(一)DeepSeek引起的颠覆式创新,对行业监管体系跟进完善提出较高要求
在技术应用过程中,金融行业对生成内容专业性、严谨性、可解释性、合规性、数据保护等有严格要求。受成本、技术成熟度等限制,传统大模型赋能银行发展过程中已经处于较为完善的监管框架体系之下(表5),整体风险较为可控。但是,受限于底层技术模型特性,生成式大模型可能存在算法决策不透明、生成错误信息、存在偏见、内容违规、侵犯版权、用户个人信息泄露等风险,与金融领域法规、准则要求相悖。此外,大模型技术的复杂性和不确定性也给监管机构的管理带来新的挑战。2024年,银行机构信息科技业务罚没金额达到1946万元,同比增长136%。近期,DeepSeek的ClickHouse数据库因配置错误而暴露,导致超过100万条记录敏感信息泄露,涵盖聊天记录、API密钥、操作日志等高度敏感的信息。
随着DeepSeek加速赋能银行业,大模型在金融机构的应用有望加速落地,由此也为银行业监管体系跟进完善提出较高要求。《欧盟人工智能法案》中将金融行业人工智能归类为高风险类别。据中金公司研究部研究,大模型技术对包括金融消费者权益保护、“大而不能倒”、顺周期性在内的各种潜在金融风险可能带来更大的挑战。从现实来看,监管框架和法律法规的补充和更新难以跟上当前模型持续迭代的技术变化,可能降低金融监管在风险识别、风险预测上的敏感性和准确性,导致依靠事前预警规避金融科技创新引发系统性风险的难度较高,而通过事后整治维持金融市场正常运行秩序成本较高。特别是在大量中小银行加速部署DeepSeek的格局下,监管部门亟需强化对银行业AI大模型应用领域治理和管控力度,避免造成系统性金融风险。
华为大模型团队在2023年发表论文对大模型幻觉(Hallucination)进行总结,指出大模型广泛存在的“一本正经胡说八道”情况,即输出内容与现实事实不一致或与用户输入不对应,分别对应“事实性幻觉”与“忠实性幻觉”。大模型幻觉对其实际部署带来了重大挑战,并引发了银行业等现实场景对大模型应用可靠性的担忧。DeepSeek-R1的幻觉率在主要模型中尤为严重,在Vectara HHEM人工智能幻觉测试中达到14.3%,是DeepSeek-V3的近4倍,也远超行业平均水平(图8)。
银行的业务特点决定了其在应用DeepSeek过程中无法根治幻觉问题。一是数据来源导致幻觉。金融市场本身具有较高的随机性,金融数据多为含有噪声、非线性、非结构化数据,大模型往往依赖于海量的历史数据进行训练,这些数据可能缺乏实时更新或确切来源,可能导致大模型在处理金融数据时遇到过拟合现象。据中国银行业协会数据,有45%的机构应用非结构化数据进行大数据分析。二是训练过程导致幻觉。大模型复杂程度较高,在内容生成方面可能存在更为严重的“黑箱”问题,内容生成的结果和过程难以被清晰地解释,导致银行部门难以在事前、事中、事后对其进行有效的风险溯源和管理。在此过程中,如果大模型难以保证准确率为100%,始终需要人员对训练过程进行验线°画像,整合了纳税、电商、社交等多达18类数据。但在模型训练过程中,将“凌晨转账”与“欺诈风险”强行关联,导致夜市摊主贷款通过率骤降40%。三是推断结果导致幻觉。大模型在输出结果时固有的抽样随机性导致输出结果的随机性,对于同一问题在多次输出中给出的答案存在差异。考虑到客户可能同时使用多个银行平台,在同一问题得到不同答案的情况下,可能进一步抬高客户的沟通成本。
(三)商业银行部署过程中对算力、数据、IT基础设施要求不断提升,转型压力依然较大
DeepSeek推动人工智能技术的门槛降低,过去由于成本限制而无法应用人工智能的领域,例如中小银行、边缘计算场景等,将涌现出大量新的应用需求,从而导致算力调用密度指数级上升,由此可能引发AI领域的“杰文斯悖论”。据《中国人工智能计算力发展评估报告》,DeepSeek带来的算法效率的提升并未抑制算力需求,更多用户和场景的加入推动大模型普及与应用落地,带动数据中心、边缘及端侧算力需求进一步爆发。2025年,中国通用算力规模预计达85.8EFLOPS(每秒百亿亿次浮点运算次数),同比增长20%;智能算力规模将达1037.3EFLOPS,同比增长43%。同时,短期内DeepSeek仍未绕开英伟达的CUDA生态,据英伟达数据,DeepSeek-R1在Blackwell架构芯片的推理吞吐量提升了25倍,训练成本也大幅降低。考虑到美国对于中国半导体产业等领域的限制,正从单纯的产品/技术断供升级为生态绞杀,DeepSeek崛起浪潮下美国对于中国芯片领域的产品和技术封锁仍将持续加码。对于银行业而言,如果再次陷入算力瓶颈,可能会影响大模型赋能业务发展。
同时,银行业大模型持续优化需要依托高质量的专用数据集,对于银行推动专业数据标准化也提出了新的要求。据微软研究院模拟显示,要保持大模型性能的指数增长,2026年需要430艾字节(EB)的高质量训练数据(相当于把人类现存所有文字资料复制2300遍)。此外,我国商业银行的技术架构主要以传统集中式数据库和事务处理模式为主,而DeepSeek需要依赖云计算、分布式计算和高性能GPU等先进算力资源。技术架构上的差异性,意味着商业银行如果要使用DeepSeek技术,就有可能要对原有的IT基础设施进行全面升级改造,这不仅面临成本高昂的风险,还可能引发现有的业务系统和DeepSeek模型之间产生协同性冲突。
DeepSeek以其强劲的创新能力,掀起了新一轮人工智能赋能各行业的浪潮。商业银行既要明确自身的发展定位和目标,结合自身业务特点确定AI应用重点和方向,也应在AI热潮中保持冷静,避免“一哄而上”式地盲目对接。
第一,推动完善银行业AI大模型监管体系。任何技术创新在金融行业的应用都必须处于监管框架之下。商业银行应积极参与监管政策的研讨与制定,与监管机构保持密切沟通,及时了解监管动态。同时,建立内部合规审查机制,对DeepSeek模型的开发、训练和应用进行全流程合规审查。在模型数据采集阶段确保数据来源的合法性;模型训练与调整阶段采用必要的技术和组织措施保障数据安全,并在投放市场前进行数据安全测试;模型应用阶段对模型数据来源的合规性开展形式审查,对用户数据采取必要的保密和安全保障措施。商业银行需设置专门的AI监测和管理机制,定期审查DeepSeek的模型表现与运行效果,对其进行实时和定期的后评价。通过引入独立第三方测试机构或行业标准框架,不断提升模型应用的稳定性与公平性,严防因为模型偏差或技术故障产生的业务风险。优化数据治理框架,引入联邦学习和隐私计算等先进的数据治理技术,实现数据在敏感性分析中的脱敏处理与本地化运行。进一步健全数据访问权限,建立风险预警制度,控制和减少数据滥用与合规风险。
第二,加强系统性优化,缓解大模型幻觉问题。数据方面,商业银行应加强数据治理,整合内部数据资源,建立统一的数据平台。通过数据清洗、标注、建模等工作,提高数据质量和可用性。加强外部数据的获取和整合,通过推进可信数据空间建设,打通公共数据空间、城市数据空间与金融数据空间互联互通,激发公共数据在金融可信数据空间中的带动效应。训练过程中,提高DeepSeek模型的可解释性,银行内部信息科技、金融科技等技术部门应加强模型可解释性研究,开发可视化工具,将模型的决策过程和依据以直观的方式呈现出来。例如,通过可视化工具展示模型如何综合各项数据得出风险评分,让商业银行管理层和监管机构能够在理解的基础上进行审查。探索开发智能解释算法,实现模型决策解释说明的自动生成,以提高模型的可解释性。推断结果方面,积极构建监管部门对AI生成结果验真的常态机制,确保模型产出的结果符合相关法规要求。结合规则引擎,建立用户参与和反馈机制,确保模型产出的结果符合业务逻辑要求。
第三,多维度制定优化策略,为AI持续赋能筑牢基础。在人才方面,银行内各部门可组建模型应用团队,加强培养从业人员数据分析、应用模型的能力,采用以干代训、边干边学的方式,在机构内部构建“AI+业务”的思维体系,鼓励职工以数据沟通业务和技术,加快形成人机协同工作新模式。在算力方面,商业银行可适度加大对云计算、大数据等基础设施的投入,提高算力水平。通过建立私有云、混合云等云计算平台,实现算力的弹性扩展和高效利用。中小银行可探索私有化模型开发,结合特有业务场景微调模型,提升垂直领域的适用性,同时降低对硬件资源的需求。在IT架构对接方面,强化技术融合能力,提升银行系统与DeepSeek运行系统的适配性。逐步将现有IT架构调整为支持分布式计算和云计算的混合型技术平台,为AI模型提供强大算力支持的同时,便于实现多系统间的数据接口统一,提高银行整体系统运维效率。(中国银行研究院 刘晨)
记者从延安市教育局了解到,延安市2025全市中小学、幼儿园暑假放假时间安排已经公布:各县教体局、市直各学校:现就全市中小学、幼儿园2025年暑假放假时间安排如下,请遵照执行。
据海南省纪委监委6月3日消息,海口市纪委原副书记、市监委原副主任柯伟涉嫌严重违纪违法,目前正接受海南省纪委监委纪律审查和监察调查。
珠海市紫荆中学党总支原书记、紫荆中学教育集团原总校长朱国旺严重违纪违法被开除党籍和公职
日前,经珠海市香洲区委批准,珠海市香洲区纪委监委对珠海市紫荆中学党总支原书记、紫荆中学教育集团原总校长朱国旺严重违纪违法问题进行了立案审查调查。
皮实耐造又保值,燃油车里面你们首选谁?#汉兰达开三年直接省出一辆车 #汉兰达
家属称女子在三亚被毒蛇咬伤就医后身亡 卫健委:已组织多方协商处理(百姓关注、新京报)
茂名市政协机关一级调研员黄永涉嫌严重违纪违法,目前正接受茂名市纪委监委纪律审查和监察调查。如需内容合作,请拨打政企服务专席。
对一些党员干部来说,下班后打牌、打麻将等活动可以说是相当常见了。那么,问题来了,这些活动真的是违法违纪吗?
5月27日,有网民在网络发布信息称重庆“永川一环卫工人在河沟打捞起80万元现金”,引发网民关注。当天9时20分许,重庆永川警方接到河道清理人员报警,称在清理河道垃圾时发现一个疑是现金的快递。
6月1日,江苏靖江市一网友发布视频反映,当天本是其亲友举行婚礼的日子,但在婚礼前一天,这对新人开车坠河后双双遇难。
1600元包下阿姨家小鱼塘!捞鱼现场惊现万元鱼群,网友:血赚翻