Note

“反哺”或是洗礼:DeepSeek如何撬动金融业

· Views 14

作者:郑嘉意、郑敏芳

缘起于量化投资领域的DeepSeek,如今正在“回身”对传统金融行业积聚前所未有的改变。

2月26日,人气一路飙升的DeepSeek抛出“第三板斧”:宣布开源DeepGEMM(通用矩阵乘法)计算库,为V3/R1模型训练、推理提供支持。

这或许只是年初以来,DeepSeek所掀动的“算法效率革命”的再进一步,其目前正在势无可挡地席卷各行各业,而以大量数据、大量客户、大量风险为特征的传统金融业正在与之发生愈来愈深的关联。

由于金融行业存在大量敏感数据不适合通过外网传输,以DeepSeek为代表的开源模型相较相较于传统闭源模型,带给金融行业更多的部署便利,而这种优势正在悄然扩散。

信风(ID:TradeWind01)不完全统计发现,目前已有不少于20家银行、15家险企、16家券商“官宣”进行DeepSeek本地化部署。“反哺”或是洗礼:DeepSeek如何撬动金融业

发端于金融领域的DeepSeek,如今对传统金融业带来的种种变化,究竟属于反哺还是一场洗礼,正在等待时间的校验。

银行的渗透

凭借低成本、高性能与开源优势,DeepSeek在短短2个月内已快速渗透银行业。

据信风(ID:TradeWind01)不完全统计,目前已有接近20家银行“官宣”接入DeepSeek。

其中既有工行、建行、邮储、招行、兴业等国股行,亦不乏北京银行、江苏银行、渝农商行、新网银行等城农商行和民营银行。

实际应用中,这一数字或许只多不少。

一家股份行IT部门人士透露,“公司没宣传,但实际已接入DeepSeek。我们部门有做对应讲座,预计在测试阶段。”

在这场竞相接入的金融AI风暴中,有人将DeepSeek视为金融科技跃迁的序幕,有人将之视为工作效能提升的关键。

综合来看,银行接入DeepSeek后的应用,涉及包括智能客服、代码补全、投研投顾、智能风控等多个领域。

例如邮储银行接入DeepSeek的使用场景,就包括复杂的业务推理流程、产品推荐、产品组合推荐、股权分析及财务分析等功能;

建行、北京银行、苏商银行等机构均将本地部署后的DeepSeek投入风控领域。

苏农商行曾公开表示“应用DeepSeek-VL2多模态模型,信贷材料综合识别准确率提升至超97%,信贷审核全流程效率提升了20%。”

从公开材料看,DeepSeek接入后的应用已涉及方方面面,但对于使用感受,非IT部门的员工仍旧呈现出一定的“钝感”。

多位国有大行业务部门受访者表示,对DeepSeek的使用停留在报告,“感觉不到对整个银行系统的加持。”

对于前沿技术更敏感的IT部门,则提前感知到了变化。

一名国有大行IT部门人士表示,“接入有一段时间了,体验很好,政策解读、方案规划、代码编写都非常有用。”

“我们早有布局AI的计划。”另一大行IT人士称,“苦于沟通上存在阻力。”

据该人士透露,IT部门对接入大模型普遍持积极态度,只是基于数据安全等考量,方案在决策层往往遭遇阻力。

“做决策的人不一定了解AI,信息差会导致保守、负面的倾向。”该人士称,“DeepSeek走红后在性能和开源上的优势深入人心,未知带来的猜疑消失,方案进展顺利。”

上述态度,也在多家银行布局的时间线上得到了印证。

信风(ID:TradeWind01)注意到,DeepSeek全面走红更早前的2024年,仅有工行、苏商银行、新网银行等个别机构开启了DeepSeek本地化部署;

蛇年新春前后,接入机构开始呈现井喷式增长。

接入只是第一步。

以银行为代表的特殊行业大模型的训练与使用,一般分为预训练、微调、推理三个步骤:

预训练需要“投喂”海量数据,得到通用大模型;微调则是通过提供特定领域标注数据集,得到行业大模型乃至专业大模型。

模型运用则是推理,可对未知数据进行预测、推断,生成文本、进行图像与语音识别,配备外挂知识库,便可进行“开卷考”。

业内人士介绍,银行机构接入DeepSeek后,普遍不进行预训练与微调,而是外挂知识库后直接运用(推理)。

“对于智能客服、财报分析、投研助手一类功能,推理已经够用。”该人士表示,“训练非常‘烧钱’、微调花费也不小,推理是成本最低的方式。”

成本与抉择

来自成本维度的考量,直接导致了不同银行在引入模式上的分歧。

例如建行总行引入DeepSeek后,已进行定制化训练;江苏银行选择微调DeepSeek-VL2多模态模型和轻量DeepSeek-R1推理模型。

相较之下,以中信百信银行为代表的大多数,只是“完成了轻量DeepSeek-R1推理模型的本地部署”。

与上述公司形成鲜明对比的是,银行业中作为主体的大部分中小城农商行,仍未有接入DeepSeek动态传出。

这或意味着,以DeepSeek的接入与使用为分界点,不同银行可能呈现出科技能力的进一步分化:

实力雄厚的大行既可在接入后,由IT部门完成微调,亦可购买由外部AI公司进行进一步训练后,专项表现更突出的模型;

但哪怕DeepSeek成本已显著低于传统模型,预算有限的中小银行缺乏动力采购。

信风(ID:TradeWind01)了解到,目前接入“满血版”DeepSeek的硬件成本在300-400万元上下;接入普通版本的成本则在200-300万元上下;聘请外部机构进行模型微调的花费,则在80-300万元不等。

从经济角度看,市场中有关中小银行可借DeepSeek“弯道超车”的论调,仍为时尚早。

“不能不谈成本,小银行甚至200万预算都是很难的。”有国股行IT部人士指出,“何况DeepSeek目前只是辅助作用,像核心清算系统还需要是银行自己的。”

硬件成本只是起步。

有AI服务商对信风表示“后续agent工程能力对大模型响应速度、并发量、回答质量也有很大影响,这要求工程师有业务理解、也有agent框架理解,对工程研发要求很高。”

这意味着,资金充沛、技术过硬的大行,在大模型应用上依旧有着更好的实力与容错率;

而满足了接入DeepSeek的最低成本后,中小银行仍旧可能陷入从众陷阱,解决了“有没有”,却难以应对下一步的“好不好”疑问。

即便DeepSeek可能帮助中小银行通过更低的成本、更先进的能力实现与之前闭源模型相似的性能,但距离大行的完全版拥抱仍然存在差距。

这也意味着,由于当下AI投入成本维度带来的筹码差异,有可能会进一步导致头部银行与中小银行之间的发展分化,进而加剧行业的马太效应。

新希望科技金融相关负责人指出,中小银行更需寻找兼具技术与经济可行性的方案,通过模块化等改造方式,构筑算力弹性调度能力、实现渐进式升级。

例如,DeepSeek-R1 Lite等剪裁后的边缘计算版本,可直接部署于银行本地服务器;GPU资源池化等技术,可通过虚拟化技术将GPU算力封装为API服务,供多个业务系统共享。

不过相较大行,中小银行亦有其制度灵活性上的独特优势。

该负责人表示,中小银行管理层级少、决策流程短,如果意愿条件满足,有望快速将DeepSeek的知识输出转化为业务动作,再根据动作实施效果辅以DeepSeek支持,不断迭代。

其表示“这种支持细分客群、场景、部门、片区等细腻颗粒度的灵活‘正循环’是大型机构很难实现的。”

炼化“AI代理人”

相比于银行的有轻有重,保险公司在大模型上的投入热情只增不减。

信风(ID:TradeWind01)不完全统计发现,已有平安、人保、新华、太平、中华保险与慧择保险等10余家机构宣布接入Deepseek。

平安人寿提及,已推进DeepSeek本地化训练;人保财险则表示,“进一步针对重点领域、重点场景进行精调”。

另有国有大型险企透露,今年技术部门的重点工作,即是推动大模型在公司业务层面的落地应用,“目前该公司已成立工作专班,其中亦有业务部门加入。”“反哺”或是洗礼:DeepSeek如何撬动金融业

 险企热衷DeepSeek的原因在于,在投入了大量人力成本的销售端,大模型不仅可以辅助代理人实现精准的产品推荐,更有望实现与用户的直接沟通。

个险与银保的拥挤竞争中,一条“AI代理人”的崭新赛道或许正在浮水。

此前已有多家险企试水大模型,如阳光于2023年推出保险垂直大模型“阳光正言GPT”,人保于同年推出自研“数智灵犀—人保大模型”。

规模较小机构中,信美相互人寿(下称“信美”)亦基于通用基础大模型,强化非结构化数据管理及处理能力,运用检索增强、模型“微调”,深耕保险垂直应用。

过去的难点,一是成本高昂,二是对语义理解要求度高、准确性难有保障。

例如,向大模型询问“XX产品何时回本?”“哪个保险收益更好?”,就需要其理解“回本”一词在保险语境中对应的具体名目,同时根据保费测算出具体产品的IRR。

面对此类问题,险企更普遍的做法是在大模型中加入插件等外部工具。

DeepSeek的出现,很快打破了过往“军备竞赛”的陈规。

华泰证券指出,DeepSeek V3训练成本相当于Llama3系列的7%,可降低现有模型的训练和推理成本。

一位AI产品经理对信风(ID:TradeWind01)透露,仅以微调为例,2024年上半年,聘请乙方机构进行大模型微调的价格在500-1000万元;如今,已降至80-300万元。

性能上,信美相关负责人对信风(ID:TradeWind01)表示“DeepSeek-R1实际使用下来,已经能深入理解用户意图,甚至拓展对话描述中尚未覆盖的方面。”

该负责人表示,引入超强思维链(CoT)的推理模式后,对于复杂问题,可通过逐步推理和回顾反思的方式增强回答的准确性,一定程度上补充回答完整性。

有业内人士指出,DeepSeek-R1加入后,计算IRR一类问题或可解决,“缺陷是速度比较慢。”

但信美方面则透露,插件仍是最优解,“从输出结果精准和可解释性角度考虑,大量数据查询和计算的场景,我们仍会调用外部工具,不依赖大模型自身。”

在触达客户信息的过程中,隐私安全则通常会采用加密方式解决。

例如信美上述负责人针对数据安全问题表示,公司采用检索增强生成技术,在知识入库时已经对隐私信息进行技术脱敏,“例如去除姓名、手机号、身份证件号等。”

“未来若进一步ToC,首先需要满足销售合规性,保证生成内容全面准确;其次要满足信息使用最小化收集、授权同意等原则。”该负责人指出。

DeepSeek在保险领域的参与,已不止于营销。

信美相关负责人称,大模型在运营、客服等领域,同样有广阔的发挥空间。

例如健康险核保,大语言模型既可快速解析记录,提取关键信息,节省大量材料翻阅时间;也能分析问卷,判断客户风险,甚至给出初步核保建议。

平安健康方面则表示,旗下已接入DeepSeek的“医博通”多模态大模型,可辅助平台提供更加精准的健康咨询和疾病诊断,有望在医疗数据分析和患者管理方面实现质的提升。

券商全面入局

业务线更加复杂的证券行业,同样开启了大模型竞赛。

据不完全统计,目前已有不少于16家券商宣布主动接入DeepSeek。

而从信风(ID:TradeWind01)调研的情况来看,实际接入DeepSeek的券商数量或许更多。

南方一家中小型券商人士对信风(ID:TradeWind01)表示,其已经接入DeepSeek,但还未对外官宣。

来自金融业更多观点认为,财富管理与投顾业务是链接DeepSeek等AI能力的最佳入口。

但从已经官宣的券商情况来看,DeepSeek主要应用在智能问答、风控、业务流程的优化等场景,以提升办公效率;还有部分券商尝试向机构客户推出DeepSeek服务的板块。

广发证券在2025年春节前就接入了DeepSeek大模型,目前主要应用于投顾知识问答、研报审核、代码辅助撰写等场景。

一名接近广发证券人士介绍,在研报审核场景中,DeepSeek对于错别字、逻辑错误以及表述不当等问题,展现出了更高的错误识别率。

与此同时,广发证券在机构客户综合服务平台“广发智汇”推出DeepSeek服务模块,让机构客户可以调用DeepSeek服务,并根据自身需求进行应用定制和包装,从而大幅降低独立部署大模型所需的硬件和人力成本。

国金证券(600109.SH)完成了DeepSeek大模型本地化部署测试,同样计划将其用于信息检索、文档处理、行业研究等场景,并计划未来进一步拓展至智能服务、风险管理、投资分析等核心业务领域。

东海证券则在今年1月份就开始DeepSeek进行内部的部署试用。

接近东海证券人士向信风(ID:TradeWind01)介绍,内部进行模型部署测试和验证的情况来看,性价比确实极高。

行业普遍认为,部署DeepSeek后,最具挑战环节在于后续的数据训练。

“现在很多金融机构都在接入DeepSeek的大模型,其实进行本地化部署并不难,主要是后续的数据训练。”一家北京的信息科技公司人士向信风(ID:TradeWind01)表示。

据该人士介绍,目前主要有两种路径:

一是知识库的接入,这是比较低成本且短时间内都可以完成的方式,但是这种方式下能够实际落地的场景相对有限。

例如上海一家券商目前所接入的DeepSeek模型主要进行了10次金融数据相关的训练,主要来源是金融行业从业资格考试的题目50万条公开数据。

该模型能够在一定程度上完成客户基础性问题,但后续能否实现更为高阶的投顾产品推荐等功能,仍待验证。

二是金融机构需要接入核心的业务数据进行训练,成本高且历时较长,但能够实现的场景将会变得更加多元化。

例如针对投顾业务下的理财产品推荐,真正做到“千人千面”,匹配客户风险等级与风险偏好。

对于后一种路径,有业内人士认为实现的可能性较小。

“部署完DeepSeek之后,大部分的公司只是用来做推理,而不是做训练。只有很少的公司才会喂数据训练,或者甚至只有AI模型的厂商会做这个。”北京一位券商内部IT人士向信风(ID:TradeWind01)表示。“大部分券商都是本地化部署,连接一个本地的知识库就来实现智能助理、信息检索的这些功能。”

但也有券商人士认为并非不可能。

“现在可能还不太能接入业务数据来训练,但未来并非不可实现。”上海一家头部券商的科技研发部负责人向信风(ID:TradeWind01)表示。“一方面这需要具体的业务方来提需求,但目前还在学习阶段;另一方面还需要保证合理合规、脱敏的基础上,经过合规风控部门审核后,才会进行大模型的训练。”

“我们目前是知识库接入的方式,但同时也在探索微调/蒸馏的方案进行接入。”华南一家头部券商的IT内部人士对信风(ID:TradeWind01)表示。

接近东海证券人士则向信风(ID:TradeWind01)提出了未来行业共建AI大模型的可能性。

“行业可能AI共建,组建高级别算力的大模型实验室,借此在全业务领域拥抱AI,部分头部机构也会自建AI算力池和AI中台等。”该人士指出。

无论如何,证券业全面拥抱AI的节奏确实在提速。“反哺”或是洗礼:DeepSeek如何撬动金融业

边界如何勾勒

作为充满外部性的金融行业所迎来一种新现象,DeepSeek全面涌入所可能引发的各种问题,目前还缺乏统一的规则指引来明确边界。

针对算法的使用,央行曾在2023年发布《人工智能算法金融应用信息披露指南》,提出“相关机构需要依法依规对人工智能算法金融应用进行合规性审计,并及时将算法审计活动所依据的政策、法规等信息以及审计结果进行说明”。

但随着大模型的不断“进化”,实操过程中所隐含的潜在风险,似乎又是难以忽视的。

首先是DeepSeek的幻觉问题,是否有可能会对投资者产生误导,而纠纷发生时相关权责又当如何界定。

在Vectara HHEM人工智能幻觉测试中,DeepSeek-R1显示出14.3%的幻觉率,这是 DeepSeek-V3近4倍。

其次,真实的投资世界具有复杂博弈的混沌特征。

当AI在投顾领域普及后,未来可能的“算法荐股”不排除招致“策略拥挤”的隐患,进而滋生潜在的金融风险。

“用户集中使用趋同算法可能造成策略拥挤,进而放大市场波动,或许是不得不考虑的问题。”深圳一家私募机构人士指出。

类似的量化事故已有出现,例如2024年春节前,微盘股因量化策略过载而发生剧烈波动,一度引发业内关注。

例如多家券商推出了针对个人投资者基于AI的T0量化策略,可以实现在日内捕捉波动的收益,但相似策略下投资者选股持仓过于集中,同样可能存在局部性的拥挤踩踏风险。

再次,证券行业拥有大量投资者的财产、理财情况等各方面隐私数据,在未获得客户充分授权的情况下,能否以何种脱敏形态用于模型训练方可满足基本的行业伦理,目前仍然存在一定制度空白。

此外在持牌机构的正规军以外,若未来第三方AI平台通过部署DeepSeek进行AI荐股,其合规性问题如何解决。

信风(ID:TradeWind01)目前测试部分第三方接入DeepSeek的AI平台尝试寻求荐股建议时,模型都会给出“精确答案”。

接近广发证券人士向信风(ID:TradeWind01)表示,该类平台若提供典型的证券投资咨询建议行为,也应该被纳入牌照监管。

该人士指出,一方面,算法偏见或错误可能引发投资损失,而第三方平台在适当性管理、风险提示等方面缺乏规范,可能会对投资者造成误导及欺诈等违法违规行为而不易被发现;另一方面,持牌券商需承担合规成本。但若第三方平台游离于监管外,将形成不公平竞争。

“像‘924行情’前后,抖音等短视频平台的部分网红博主凭借饱含情感的话术也曾经吸引了一波流量,误导很多的投资者。新兴事物兴起后怎么去解决这些问题,还是需要各方持续的探索。”北京一家券商营业部人士指出。“反哺”或是洗礼:DeepSeek如何撬动金融业

风险提示及免责条款
市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。

Disclaimer: The content above represents only the views of the author or guest. It does not represent any views or positions of FOLLOWME and does not mean that FOLLOWME agrees with its statement or description, nor does it constitute any investment advice. For all actions taken by visitors based on information provided by the FOLLOWME community, the community does not assume any form of liability unless otherwise expressly promised in writing.

FOLLOWME Trading Community Website: https://www.followme.com

If you like, reward to support.
avatar

Hot

No comment on record. Start new comment.