張大偉 制圖
◎記者 溫婷
DeepSeek風(fēng)頭正盛,金融機(jī)構(gòu)爭(zhēng)相接入。
截至2月11日,有北京銀行、江蘇銀行、蘇商銀行、重慶農(nóng)村商業(yè)銀行等多家銀行及國泰君安等頭部券商“嘗鮮”DeepSeek。恒生電子、金證股份、星環(huán)科技等金融科技服務(wù)公司的大模型服務(wù)也接入了DeepSeek。
通過部署DeepSeek,一些金融機(jī)構(gòu)看到了AI支出“降本增效”的可能性。專家表示,DeepSeek的出現(xiàn)在通用大模型領(lǐng)域產(chǎn)生了很強(qiáng)的“鲇魚效應(yīng)”,但從“好用”到“用好”,仍面臨數(shù)據(jù)安全、惡意訓(xùn)練、模型幻覺等挑戰(zhàn)。
爭(zhēng)相接入DeepSeek
日前,北京銀行宣布全面啟動(dòng)“all in AI”戰(zhàn)略,攜手華為率先實(shí)現(xiàn)DeepSeek全棧國產(chǎn)化金融應(yīng)用。江蘇銀行依托“智慧小蘇”大語言模型服務(wù)平臺(tái),本地化部署微調(diào)DeepSeek-VL2多模態(tài)模型、輕量DeepSeek-R1推理模型,分別運(yùn)用于智能合同質(zhì)檢和自動(dòng)化估值對(duì)賬場(chǎng)景。重慶農(nóng)村商業(yè)銀行借助騰訊云大模型知識(shí)引擎的能力,在企業(yè)微信上線基于DeepSeek模型的智能助手應(yīng)用“AI小渝”。
據(jù)公開信息,接入DeepSeek的金融機(jī)構(gòu)類型涵蓋銀行、證券、基金、非銀行支付機(jī)構(gòu)等。目前,多家銀行已實(shí)現(xiàn)DeepSeek系列大模型本地化部署,應(yīng)用場(chǎng)景包括智能合同管理、客服助手等。
作為最早一批本地化部署DeepSeek的非銀行支付機(jī)構(gòu)之一,移卡最初選擇DeepSeek的原因就是“好用”,這也成為DeepSeek擁躉眾多的主要原因。
移卡執(zhí)行董事、CTO羅小輝表示,移卡在2024年初就本地化部署了DeepSeek coder,在此基礎(chǔ)上,移卡開發(fā)了編碼助手,其功能包括代碼撰寫、代碼糾錯(cuò)等?!癉eepSeek是目前開源最徹底的大模型廠商,性能和效率俱佳?!绷_小輝坦言,移卡準(zhǔn)備長期使用以DeepSeek為代表的開源大模型,逐步替換海外AI產(chǎn)品的大模型服務(wù),這將在保證質(zhì)量的前提下大大降低應(yīng)用成本。
奇安信銀行行業(yè)負(fù)責(zé)人徐懿巍認(rèn)為,訓(xùn)練成本更低,性能更強(qiáng),完全開源、支持免費(fèi)商用等優(yōu)勢(shì),使DeepSeek在垂直行業(yè)更容易落地。
對(duì)此,優(yōu)智科技創(chuàng)始人兼CEO詹毅頗有感觸。目前優(yōu)智科技與中信建投等頭部券商在大模型應(yīng)用領(lǐng)域完成項(xiàng)目上線,正與數(shù)十家金融機(jī)構(gòu)推進(jìn)應(yīng)用落地。其核心AI平臺(tái)(智遇文檔、智友Agent)已全面接入DeepSeek,為金融機(jī)構(gòu)提供包括DeepSeek私有化部署在內(nèi)的完整解決方案。與此同時(shí),優(yōu)智科技正在DeepSeek上持續(xù)訓(xùn)練面向金融場(chǎng)景的模型版本。
“如果用造車來類比的話,金融機(jī)構(gòu)青睞更好用的大模型‘整車’,而DeepSeek提供了更好的引擎?!闭惨惴Q,對(duì)大模型應(yīng)用而言,2024年更多是頭部機(jī)構(gòu)積極推動(dòng)大模型落地,2025年在DeepSeek的認(rèn)知普及和更多金融標(biāo)桿案例的推動(dòng)下,中小機(jī)構(gòu)大模型應(yīng)用將提速,市場(chǎng)將大幅擴(kuò)容。
“以往談到大模型,金融機(jī)構(gòu)的目標(biāo)往往是‘爭(zhēng)先’;如今更多是‘恐后’,思維方式發(fā)生了質(zhì)變?!闭惨阏f。
“鲇魚效應(yīng)”持續(xù)強(qiáng)化
重金投入,產(chǎn)出未知,一直是影響金融機(jī)構(gòu)大模型規(guī)模化投入的重要原因,而通過部署DeepSeek,不少金融機(jī)構(gòu)看到了AI支出“降本增效”的可能性。
據(jù)悉,恒生電子、星環(huán)科技、金證股份等金融科技服務(wù)商的大模型服務(wù)正加速接入DeepSeek。例如,恒生大模型系列應(yīng)用全面接入DeepSeek主流模型(DeepSeek-V3/DeepSeek-R1),覆蓋金融投研、投顧、合規(guī)、運(yùn)營、投行等核心業(yè)務(wù)場(chǎng)景;星環(huán)科技大模型運(yùn)營管理平臺(tái)Sophon LLMOps全面支持DeepSeek-R1全參版本及蒸餾版本,可用于智能投研與策略支持、智能運(yùn)營與流程再造等智能金融場(chǎng)景。其測(cè)試數(shù)據(jù)也印證了這一趨勢(shì)。
以恒生電子為例,實(shí)測(cè)數(shù)據(jù)顯示,在金融高密度數(shù)據(jù)處理場(chǎng)景中,依托DeepSeek-R1的千億級(jí)參數(shù)壓縮和蒸餾技術(shù),本地部署算力資源消耗降低50%;基于DeepSeek獨(dú)創(chuàng)的MoE(混合專家)架構(gòu),客戶需求解析速度加快3倍。
“在一些強(qiáng)推理的業(yè)務(wù)場(chǎng)景,DeepSeek提升了訓(xùn)練實(shí)效?!毙黔h(huán)科技金融行業(yè)助理副總裁張曉明近期在與客戶的對(duì)接測(cè)試中發(fā)現(xiàn),一些有大模型應(yīng)用基礎(chǔ)、算力和人才資源儲(chǔ)備的銀行和頭部券商正積極接入DeepSeek,DeepSeek在通用大模型領(lǐng)域產(chǎn)生了很強(qiáng)的“鲇魚效應(yīng)”。
當(dāng)然,DeepSeek優(yōu)勢(shì)突出并不意味著其他大模型被放棄。張曉明坦言,整個(gè)大模型市場(chǎng)還是一個(gè)多元需求的市場(chǎng),目前已有金融客戶用星環(huán)科技大模型運(yùn)營管理平臺(tái)Sophon LLMOps適配了70多個(gè)主流模型,可適應(yīng)不同業(yè)務(wù)場(chǎng)景的需求,“DeepSeek熱浪下,應(yīng)該思考如何將大模型轉(zhuǎn)化為生產(chǎn)力”。
恒生電子首席科學(xué)家、恒生研究院院長白碩稱,DeepSeek擅長慢思考,在需要快慢思考結(jié)合的具體應(yīng)用場(chǎng)景中,通義千問和DeepSeek可以相得益彰,發(fā)揮更大的效果。
對(duì)于未來DeepSeek的應(yīng)用場(chǎng)景,羅小輝提出了兩方面設(shè)想:“一是面向企業(yè)內(nèi)部員工的效率工具;二是面向用戶或客戶的產(chǎn)品開發(fā)?!痹趹?yīng)用模式上,除當(dāng)作問答助手外,將大模型植入具體的應(yīng)用場(chǎng)景能讓其發(fā)揮更大的作用。
不容忽視的挑戰(zhàn)
新生事物都是機(jī)遇和挑戰(zhàn)并存,DeepSeek應(yīng)用也不例外。專家表示,金融機(jī)構(gòu)由于其業(yè)務(wù)性質(zhì),對(duì)數(shù)據(jù)的安全性、隱私保護(hù)及合規(guī)性有著極高要求,因此在部署大模型時(shí)也面臨更大挑戰(zhàn)。
徐懿巍表示,金融領(lǐng)域大模型往往包含復(fù)雜的算法和市場(chǎng)分析能力,開發(fā)成本較高,并承載重要業(yè)務(wù)和數(shù)據(jù),自身安全性的重要性不言而喻。在OWASP發(fā)布的大模型應(yīng)用十大安全風(fēng)險(xiǎn)中,“提示注入”位居首位。攻擊者可通過設(shè)計(jì)特定的提示詞來誤導(dǎo)大模型產(chǎn)生錯(cuò)誤的結(jié)果,特別是涉及投資決策、風(fēng)險(xiǎn)管理等關(guān)鍵領(lǐng)域時(shí),這種攻擊可能導(dǎo)致重大經(jīng)濟(jì)損失。
金融行業(yè)大模型的幻覺問題也是一大安全隱患。大模型生成的內(nèi)容有時(shí)可能與現(xiàn)實(shí)不符,這對(duì)于高度依賴準(zhǔn)確信息的金融行業(yè)來說,是一個(gè)潛在的風(fēng)險(xiǎn),尤其在提供市場(chǎng)預(yù)測(cè)、風(fēng)險(xiǎn)評(píng)估或投資建議時(shí),其危害不容忽視。
徐懿巍表示,金融機(jī)構(gòu)在部署大模型時(shí),安全風(fēng)險(xiǎn)不僅來自單個(gè)大模型服務(wù),更來自整家公司。因此,金融企業(yè)要做好整個(gè)公司風(fēng)險(xiǎn)暴露面管理,實(shí)施嚴(yán)格的訪問控制措施,如身份驗(yàn)證和授權(quán)機(jī)制,限制對(duì)API、數(shù)據(jù)庫的訪問。同時(shí),做好網(wǎng)絡(luò)、終端、云、服務(wù)器、數(shù)據(jù)庫等基礎(chǔ)網(wǎng)絡(luò)安全防護(hù)措施,最大程度減少外部威脅。在具體保障措施方面,應(yīng)圍繞數(shù)據(jù)來源合規(guī)、內(nèi)容安全合規(guī)、敏感數(shù)據(jù)識(shí)別過濾、訓(xùn)練數(shù)據(jù)標(biāo)注安全、數(shù)據(jù)分類分級(jí)與安全保護(hù)、數(shù)據(jù)訪問控制等,打造體系化的防護(hù)方案。
除安全外,基礎(chǔ)設(shè)施特別是GPU資源也成為大模型部署的一大“掣肘”?!翱紤]到模型對(duì)于資源的需求較多,我們大多采用混合部署的方式,即部分本地化、部分外部接口的方式。我們正在密切關(guān)注大模型的小型化方案,期待通過這種方式來緩解資源壓力,同時(shí)希望涌現(xiàn)更多GPU資源,本土大模型與計(jì)算設(shè)備的結(jié)合是接下來重點(diǎn)研究的事項(xiàng)?!绷_小輝說。
張曉明建議,金融機(jī)構(gòu)部署DeepSeek要綜合考慮算力、預(yù)算和基礎(chǔ)設(shè)施的投入情況,因“材”施策?!袄纾写笮蜋C(jī)構(gòu)可通過部署R1全參版本,發(fā)揮算力、人才等綜合優(yōu)勢(shì),加速大模型的平臺(tái)能力部署;中小機(jī)構(gòu)可以立足業(yè)務(wù)導(dǎo)入蒸餾版,開發(fā)更適合DeepSeek落地的應(yīng)用和工具,循序漸進(jìn),真正通過大模型實(shí)現(xiàn)降本增效?!睆垥悦髡f。