大模型在银行业务场景中的『落地路径』

大模型在银行业务场景中的『落地路径』
2024年03月05日 11:08 华道视界

近期简单探讨了“银行大模型”的应用现状及重点领域,原本打算畅想下大模型在银行业务场景中的落地路径,然后就看到了下面这篇极度打脸但又人间清醒的“攻略”——如何打造一个拖垮公司的大模型?

第1步:先砸十个亿买卡。做大模型,要有大格局,舍不得孩子套不着狼。什么X100、Y100……专挑算力强的买。正规渠道没货了?不能怂!加价也要整起来。

第2步:从顶流公司挖大牛来坐镇首席科学家。必须是业界扛把子级别的大牛,就职于顶流AI公司比如“CloseAI”,经常在各种会议上高光出镜的那种。能把整个团队都带过来最好,成建制、好管理、出活儿快。

第3步:定战略,当卷王。模型参数至少要万亿级别,当不成卷王,就只能被卷死。再来个“智算中心”,算力至少达要1000PFLOPS,自己训练完大模型,还能把算力开放出来给同行。

第4步:万事开头难,从数据准备开始全员鸡血加班。数据不够怎么整?公开一部分,自有一部分,交易一部分。拿到数据后,得清洗处理,全体动员做标注,老板亲自下场,主打一个陪伴。

第5步:开始玩命训练,不出意外的话快出意外了。服务器挂了、存储速度跟不上了、跨卡性能不行、梯度消失、梯度爆炸……什么?!Checkpoints没保存?反复回退,反复调参,反复排雷。

第6步:内部开始自我修正。问题一多,团队就乱了,人都变得很浮躁。公司原有的主营业务停滞不前,业绩下滑。

第7步:不管产品行不行,市场宣传要先行一步。“我们来了!”广告要全渠道、全媒体覆盖。必须要业界感知到我们来势汹汹的霸气。

第8步:生态伙伴少不了,气氛必须搞起来。先结盟5000家合作伙伴,达成意向合作。第二天,大家联合发发新闻稿,必须让吃瓜群众充满期待。

第9步:大模型终于“练”出来了。练是练出来了,看上去有点不对劲,莫不是个“大傻子”吧?落地实施,那叫一个难,不知道给谁用,不知道往哪儿用。

第10步:及时止损,人间清醒。然后开始复盘,多么痛的领悟……

据不完全统计,2023年单单中国企业就累计发布了将近300个大模型,这来势汹汹的“百模大战”颇有一番“大炼AI”的架势。尽管上述“攻略”有夸张的成分在,但也从侧面暴露出被誉为“下一个科技风口”的AI在资本的裹挟下已经开始出现一些浮躁或扭曲的乱象,简单来说有如下几类问题:

  • 大模型的应用场景尚未清楚就匆匆上马,盲目跟风;

  • 热衷请专家、立概念、讲故事,饼能画多大就画多大;

  • 为了能把故事讲圆,刻意追求所谓的“自建”和“闭环”;

  • 本末倒置,过于关注热点创新业务而耽误主业;

  • 重推广轻产品,以吸引投资为导向,而忽略了业务价值创造。

如此看来,在跟集万千宠爱于一身的大模型套近乎时,最好还是掂量一下,务必以创造业务价值为导向,在明确业务需求的前提下规划相应的落地路径,避免出现虎头蛇尾竹篮打水一场空的情况。

下面我们结合一个虚拟案例,简单聊聊大模型在银行业务场景中的落地路径。

案例背景:某银行希望引入大模型来提升其信贷审批流程的效率和准确性。当前,信贷审批过程大量依赖人工审核,效率低下且容易出错,银行希望通过大模型自动化地处理和分析客户的信贷申请,以快速准确地做出审批决策。

第1步:业务理解和需求分析

  • 与信贷业务部门沟通,深入了解信贷审批流程的具体细节和业务需求。

  • 确定大模型在信贷审批中的应用场景,如客户信用评分、欺诈检测、还款能力预测等。

第2步:数据收集和处理

  • 收集历史信贷申请数据,包括客户个人信息、财务状况、信贷历史等。

  • 对数据进行清洗和预处理,去除无效数据和异常值,确保数据质量和一致性。

  • 根据业务需求对数据进行特征工程和标签化处理,提取出对模型训练有用的特征。

第3步:模型选择和训练

  • 选择适合信贷审批场景的大模型架构,如深度学习模型、决策树模型等(此处可以考虑与成熟供应商进行合作)。

  • 使用处理后的数据对模型进行训练,通过调整模型参数和超参数来优化模型性能。

  • 在独立的验证集上评估模型的准确性、召回率等指标,确保模型满足业务需求。

第4步:模型集成和部署

  • 将训练好的模型集成到银行的信贷审批系统中,确保模型能够与现有系统无缝对接。

  • 开发相应的API接口,使信贷审批系统能够调用模型进行实时推理。

  • 对模型进行部署和测试,确保模型在实际环境中能够稳定运行并输出结果。

第5步:业务验证和调优

  • 在实际业务场景中对模型进行验证,观察模型的审批决策是否符合预期。

  • 收集反馈数据并进行模型调优,改进模型的性能和准确性。

  • 建立模型性能的监控机制,定期评估模型的性能并进行必要的调整和优化。

第6步:上线和监控

  • 经过充分验证和调优后,将模型正式上线并投入生产环境使用。

  • 对模型进行持续的监控和维护,确保模型在实际运行中的稳定性和可靠性。

  • 定期评估模型的效果和业务价值,为后续的模型优化和迭代提供依据。

或许有朋友会问,上述案例中所描述的信贷审批业务需求,通过小模型同样能够实现,为何还要劳神费力上大模型呢?

简单来说,选择大模型还是小模型,主要取决于具体的业务场景应用需求,以银行业务为例,大模型更适合处理需要深度分析和复杂决策的场景(如企业贷款审批、投资策略制定或全面的客户关系管理等),而小模型则更适合处理快速、简单的决策任务(如ATM交易欺诈检测、基本客户查询响应或个性化推荐等)。

当然除此之外,银行还需要综合考虑自身的资源禀赋、性能要求以及隐私和安全等方面的因素,或者也可以采用混合方法,结合大模型和小模型的优势来处理不同复杂度的任务。

最后,尽管银行业对大模型的关注日益升温,并且在营销推广、渠道运营、开发运维等领域取得一定成效和收益,但对于天然厌恶风险的银行而言,仍处于发展初期的大模型在其业务侧的全面落地还面临诸多挑战不过“挑战”即“机会”,也希望广大同业能够抓住这个难得的机会,共同推进AI技术在银行数智化转型中的应用落地及价值创造。

财经自媒体联盟更多自媒体作者

新浪首页 语音播报 相关新闻 返回顶部