大模型在银行业务场景中的『落地路径』_

近期简单探讨了“银行大模型”的应用现状及重点领域，原本打算畅想下大模型在银行业务场景中的落地路径，然后就看到了下面这篇极度打脸但又人间清醒的“攻略”——如何打造一个拖垮公司的大模型？

第1步：先砸十个亿买卡。做大模型，要有大格局，舍不得孩子套不着狼。什么X100、Y100……专挑算力强的买。正规渠道没货了？不能怂！加价也要整起来。

第2步：从顶流公司挖大牛来坐镇首席科学家。必须是业界扛把子级别的大牛，就职于顶流AI公司比如“CloseAI”，经常在各种会议上高光出镜的那种。能把整个团队都带过来最好，成建制、好管理、出活儿快。

第3步：定战略，当卷王。模型参数至少要万亿级别，当不成卷王，就只能被卷死。再来个“智算中心”，算力至少达要1000PFLOPS，自己训练完大模型，还能把算力开放出来给同行。

第4步：万事开头难，从数据准备开始全员鸡血加班。数据不够怎么整？公开一部分，自有一部分，交易一部分。拿到数据后，得清洗处理，全体动员做标注，老板亲自下场，主打一个陪伴。

第5步：开始玩命训练，不出意外的话快出意外了。服务器挂了、存储速度跟不上了、跨卡性能不行、梯度消失、梯度爆炸……什么？！Checkpoints没保存？反复回退，反复调参，反复排雷。

第6步：内部开始自我修正。问题一多，团队就乱了，人都变得很浮躁。公司原有的主营业务停滞不前，业绩下滑。

第7步：不管产品行不行，市场宣传要先行一步。“我们来了！”广告要全渠道、全媒体覆盖。必须要业界感知到我们来势汹汹的霸气。

第8步：生态伙伴少不了，气氛必须搞起来。先结盟5000家合作伙伴，达成意向合作。第二天，大家联合发发新闻稿，必须让吃瓜群众充满期待。

第9步：大模型终于“练”出来了。练是练出来了，看上去有点不对劲，莫不是个“大傻子”吧？落地实施，那叫一个难，不知道给谁用，不知道往哪儿用。

第10步：及时止损，人间清醒。然后开始复盘，多么痛的领悟……

据不完全统计，2023年单单中国企业就累计发布了将近300个大模型，这来势汹汹的“百模大战”颇有一番“大炼AI”的架势。尽管上述“攻略”有夸张的成分在，但也从侧面暴露出被誉为“下一个科技风口”的AI在资本的裹挟下已经开始出现一些浮躁或扭曲的乱象，简单来说有如下几类问题：

大模型的应用场景尚未清楚就匆匆上马，盲目跟风；
热衷请专家、立概念、讲故事，饼能画多大就画多大；
为了能把故事讲圆，刻意追求所谓的“自建”和“闭环”；
本末倒置，过于关注热点创新业务而耽误主业；
重推广轻产品，以吸引投资为导向，而忽略了业务价值创造。

如此看来，在跟集万千宠爱于一身的大模型套近乎时，最好还是掂量一下，务必以创造业务价值为导向，在明确业务需求的前提下规划相应的落地路径，避免出现虎头蛇尾竹篮打水一场空的情况。

下面我们结合一个虚拟案例，简单聊聊大模型在银行业务场景中的落地路径。

案例背景：某银行希望引入大模型来提升其信贷审批流程的效率和准确性。当前，信贷审批过程大量依赖人工审核，效率低下且容易出错，银行希望通过大模型自动化地处理和分析客户的信贷申请，以快速准确地做出审批决策。

第1步：业务理解和需求分析

与信贷业务部门沟通，深入了解信贷审批流程的具体细节和业务需求。
确定大模型在信贷审批中的应用场景，如客户信用评分、欺诈检测、还款能力预测等。

第2步：数据收集和处理

收集历史信贷申请数据，包括客户个人信息、财务状况、信贷历史等。
对数据进行清洗和预处理，去除无效数据和异常值，确保数据质量和一致性。
根据业务需求对数据进行特征工程和标签化处理，提取出对模型训练有用的特征。

第3步：模型选择和训练

选择适合信贷审批场景的大模型架构，如深度学习模型、决策树模型等（此处可以考虑与成熟供应商进行合作）。
使用处理后的数据对模型进行训练，通过调整模型参数和超参数来优化模型性能。
在独立的验证集上评估模型的准确性、召回率等指标，确保模型满足业务需求。

第4步：模型集成和部署

将训练好的模型集成到银行的信贷审批系统中，确保模型能够与现有系统无缝对接。
开发相应的API接口，使信贷审批系统能够调用模型进行实时推理。
对模型进行部署和测试，确保模型在实际环境中能够稳定运行并输出结果。

第5步：业务验证和调优

在实际业务场景中对模型进行验证，观察模型的审批决策是否符合预期。
收集反馈数据并进行模型调优，改进模型的性能和准确性。
建立模型性能的监控机制，定期评估模型的性能并进行必要的调整和优化。

第6步：上线和监控

经过充分验证和调优后，将模型正式上线并投入生产环境使用。
对模型进行持续的监控和维护，确保模型在实际运行中的稳定性和可靠性。
定期评估模型的效果和业务价值，为后续的模型优化和迭代提供依据。

或许有朋友会问，上述案例中所描述的信贷审批业务需求，通过小模型同样能够实现，为何还要劳神费力上大模型呢？

简单来说，选择大模型还是小模型，主要取决于具体的业务场景应用需求，以银行业务为例，大模型更适合处理需要深度分析和复杂决策的场景（如企业贷款审批、投资策略制定或全面的客户关系管理等），而小模型则更适合处理快速、简单的决策任务（如ATM交易欺诈检测、基本客户查询响应或个性化推荐等）。

当然除此之外，银行还需要综合考虑自身的资源禀赋、性能要求以及隐私和安全等方面的因素，或者也可以采用混合方法，结合大模型和小模型的优势来处理不同复杂度的任务。

最后，尽管银行业对大模型的关注日益升温，并且在营销推广、渠道运营、开发运维等领域取得一定成效和收益，但对于天然厌恶风险的银行而言，仍处于发展初期的大模型在其业务侧的全面落地还面临诸多挑战，不过“挑战”即“机会”，也希望广大同业能够抓住这个难得的机会，共同推进AI技术在银行数智化转型中的应用落地及价值创造。

头条号入驻

华道视界金融创新和服务领域的最新资讯

财经自媒体联盟更多自媒体作者

今日推荐优秀作者看点月榜

新浪财经头条意见反馈留言板

4000520066 欢迎批评指正

大模型在银行业务场景中的『落地路径』

头条号入驻

年报｜浦发信用卡2023年聚焦民生消费需求精细化布局， APP月活较上年末增长 8.29%

年报｜广发信用卡2023年挖存量、提新质、控风险，累计发卡1.18亿张

上海银行2023年净利225.45亿同比增长1.19%，尚诚消金净利同比激增81.75%

财经自媒体联盟更多自媒体作者

热文排行榜