近期簡單探討了“銀行大模型”的應用現狀及重點領域,原本打算暢想下大模型在銀行業務場景中的落地路徑,然后就看到了下面這篇極度打臉但又人間清醒的“攻略”——如何打造一個拖垮公司的大模型?
第1步:先砸十個億買卡。做大模型,要有大格局,舍不得孩子套不著狼。什么X100、Y100……專挑算力強的買。正規渠道沒貨了?不能慫!加價也要整起來。
第2步:從頂流公司挖大牛來坐鎮首席科學家。必須是業界扛把子級別的大牛,就職于頂流AI公司比如“CloseAI”,經常在各種會議上高光出鏡的那種。能把整個團隊都帶過來最好,成建制、好管理、出活兒快。
第3步:定戰略,當卷王。模型參數至少要萬億級別,當不成卷王,就只能被卷死。再來個“智算中心”,算力至少達要1000PFLOPS,自己訓練完大模型,還能把算力開放出來給同行。
第4步:萬事開頭難,從數據準備開始全員雞血加班。數據不夠怎么整?公開一部分,自有一部分,交易一部分。拿到數據后,得清洗處理,全體動員做標注,老板親自下場,主打一個陪伴。
第5步:開始玩命訓練,不出意外的話快出意外了。服務器掛了、存儲速度跟不上了、跨卡性能不行、梯度消失、梯度爆炸……什么?!Checkpoints沒保存?反復回退,反復調參,反復排雷。
第6步:內部開始自我修正。問題一多,團隊就亂了,人都變得很浮躁。公司原有的主營業務停滯不前,業績下滑。
第7步:不管產品行不行,市場宣傳要先行一步。“我們來了!”廣告要全渠道、全媒體覆蓋。必須要業界感知到我們來勢洶洶的霸氣。
第8步:生態伙伴少不了,氣氛必須搞起來。先結盟5000家合作伙伴,達成意向合作。第二天,大家聯合發發新聞稿,必須讓吃瓜群眾充滿期待。
第9步:大模型終于“練”出來了。練是練出來了,看上去有點不對勁,莫不是個“大傻子”吧?落地實施,那叫一個難,不知道給誰用,不知道往哪兒用。
第10步:及時止損,人間清醒。然后開始復盤,多么痛的領悟……
據不完全統計,2023年單單中國企業就累計發布了將近300個大模型,這來勢洶洶的“百模大戰”頗有一番“大煉AI”的架勢。盡管上述“攻略”有夸張的成分在,但也從側面暴露出被譽為“下一個科技風口”的AI在資本的裹挾下已經開始出現一些浮躁或扭曲的亂象,簡單來說有如下幾類問題:
大模型的應用場景尚未清楚就匆匆上馬,盲目跟風;
熱衷請專家、立概念、講故事,餅能畫多大就畫多大;
為了能把故事講圓,刻意追求所謂的“自建”和“閉環”;
本末倒置,過于關注熱點創新業務而耽誤主業;
重推廣輕產品,以吸引投資為導向,而忽略了業務價值創造。
如此看來,在跟集萬千寵愛于一身的大模型套近乎時,最好還是掂量一下,務必以創造業務價值為導向,在明確業務需求的前提下規劃相應的落地路徑,避免出現虎頭蛇尾竹籃打水一場空的情況。
下面我們結合一個虛擬案例,簡單聊聊大模型在銀行業務場景中的落地路徑。
案例背景:某銀行希望引入大模型來提升其信貸審批流程的效率和準確性。當前,信貸審批過程大量依賴人工審核,效率低下且容易出錯,銀行希望通過大模型自動化地處理和分析客戶的信貸申請,以快速準確地做出審批決策。
第1步:業務理解和需求分析
與信貸業務部門溝通,深入了解信貸審批流程的具體細節和業務需求。
確定大模型在信貸審批中的應用場景,如客戶信用評分、欺詐檢測、還款能力預測等。
第2步:數據收集和處理
收集歷史信貸申請數據,包括客戶個人信息、財務狀況、信貸歷史等。
對數據進行清洗和預處理,去除無效數據和異常值,確保數據質量和一致性。
根據業務需求對數據進行特征工程和標簽化處理,提取出對模型訓練有用的特征。
第3步:模型選擇和訓練
選擇適合信貸審批場景的大模型架構,如深度學習模型、決策樹模型等(此處可以考慮與成熟供應商進行合作)。
使用處理后的數據對模型進行訓練,通過調整模型參數和超參數來優化模型性能。
在獨立的驗證集上評估模型的準確性、召回率等指標,確保模型滿足業務需求。
第4步:模型集成和部署
將訓練好的模型集成到銀行的信貸審批系統中,確保模型能夠與現有系統無縫對接。
開發相應的API接口,使信貸審批系統能夠調用模型進行實時推理。
對模型進行部署和測試,確保模型在實際環境中能夠穩定運行并輸出結果。
第5步:業務驗證和調優
在實際業務場景中對模型進行驗證,觀察模型的審批決策是否符合預期。
收集反饋數據并進行模型調優,改進模型的性能和準確性。
建立模型性能的監控機制,定期評估模型的性能并進行必要的調整和優化。
第6步:上線和監控
經過充分驗證和調優后,將模型正式上線并投入生產環境使用。
對模型進行持續的監控和維護,確保模型在實際運行中的穩定性和可靠性。
定期評估模型的效果和業務價值,為后續的模型優化和迭代提供依據。
或許有朋友會問,上述案例中所描述的信貸審批業務需求,通過小模型同樣能夠實現,為何還要勞神費力上大模型呢?
簡單來說,選擇大模型還是小模型,主要取決于具體的業務場景應用需求,以銀行業務為例,大模型更適合處理需要深度分析和復雜決策的場景(如企業貸款審批、投資策略制定或全面的客戶關系管理等),而小模型則更適合處理快速、簡單的決策任務(如ATM交易欺詐檢測、基本客戶查詢響應或個性化推薦等)。
當然除此之外,銀行還需要綜合考慮自身的資源稟賦、性能要求以及隱私和安全等方面的因素,或者也可以采用混合方法,結合大模型和小模型的優勢來處理不同復雜度的任務。
最后,盡管銀行業對大模型的關注日益升溫,并且在營銷推廣、渠道運營、開發運維等領域取得一定成效和收益,但對于天然厭惡風險的銀行而言,仍處于發展初期的大模型在其業務側的全面落地還面臨諸多挑戰,不過“挑戰”即“機會”,也希望廣大同業能夠抓住這個難得的機會,共同推進AI技術在銀行數智化轉型中的應用落地及價值創造。
免責聲明:本文、圖片均轉載網絡,版權歸原作者所有,如有侵權請聯系刪除。
0512-36606275
17768080505
CDG-Marketing@chinadatagroup.com