夯實(shí)數(shù)據(jù)安全基礎(chǔ) 券商與AI大模型縱深融合未來可期
AI大模型在券商業(yè)務(wù)中的場(chǎng)景應(yīng)用大有可為,但券商大規(guī)模使用AI大模型仍面臨數(shù)據(jù)安全性、合規(guī)性及穩(wěn)定性等多個(gè)方面的痛點(diǎn)。在業(yè)內(nèi)人士看來,未來隨著相關(guān)技術(shù)的不斷成熟和應(yīng)用場(chǎng)景拓展,相關(guān)痛點(diǎn)將逐步解決,券商與AI大模型將縱深融合。
面臨多個(gè)痛點(diǎn)
作為金融機(jī)構(gòu),券商擁有高價(jià)值的領(lǐng)域數(shù)據(jù)資產(chǎn),在布局AI大模型過程中,面臨合規(guī)性、安全性等多重挑戰(zhàn)。
國(guó)金證券研究所計(jì)算機(jī)行業(yè)首席分析師孟燦表示,AI大模型的應(yīng)用可能需要將數(shù)據(jù)傳輸至外部服務(wù)器進(jìn)行處理,而券商所涉及處理的是高度敏感和機(jī)密的數(shù)據(jù),數(shù)據(jù)安全成為一個(gè)關(guān)注的焦點(diǎn)。此外,許多證券公司的數(shù)據(jù)治理體系尚未完全建立或優(yōu)化,這意味著數(shù)據(jù)可能存在分散、不一致或質(zhì)量不高的問題。由于大型語言模型高度依賴數(shù)據(jù)的質(zhì)量和結(jié)構(gòu),這些問題可能導(dǎo)致模型性能不佳或產(chǎn)生誤導(dǎo)性的輸出。
“證券行業(yè)涉及大量敏感數(shù)據(jù),包括客戶信息、交易數(shù)據(jù)等,在處理數(shù)據(jù)時(shí)可能會(huì)泄露敏感信息?!眹?guó)泰君安表示,同時(shí),金融行業(yè)數(shù)據(jù)具有復(fù)雜性和多樣性,AI大模型在訓(xùn)練過程中可能出現(xiàn)過擬合現(xiàn)象,同時(shí)存在AI大模型幻覺問題,難以滿足金融行業(yè)對(duì)數(shù)據(jù)、內(nèi)容準(zhǔn)確性的高要求。
此外,證券公司IT穩(wěn)定性要求與新技術(shù)日新月異變化之間存在矛盾。孟燦表示,證券公司信息系統(tǒng)的穩(wěn)定性要求很高,將AI大模型集成到證券公司現(xiàn)有的IT架構(gòu)和工作流程中可能遇到技術(shù)挑戰(zhàn),包括系統(tǒng)兼容性問題、成本問題和合規(guī)性問題,而且新技術(shù)的引入也會(huì)干擾現(xiàn)有工作流程的穩(wěn)定性和效率。
國(guó)泰君安還強(qiáng)調(diào),AI大模型的訓(xùn)練和推理過程需要強(qiáng)大的計(jì)算資源作為支持。如果算力供應(yīng)不足或不穩(wěn)定,可能導(dǎo)致模型訓(xùn)練時(shí)間過長(zhǎng)、推理速度過慢等問題,影響模型在實(shí)際應(yīng)用中的效果。
加強(qiáng)數(shù)據(jù)治理
針對(duì)數(shù)據(jù)安全風(fēng)險(xiǎn),國(guó)泰君安認(rèn)為,需要加強(qiáng)數(shù)據(jù)治理,明確數(shù)據(jù)源的范圍、目的和用途,確保數(shù)據(jù)來源合法合規(guī),在數(shù)據(jù)全流程中確保數(shù)據(jù)的安全性和隱私性,防止數(shù)據(jù)泄露和濫用。準(zhǔn)確性方面,可結(jié)合訓(xùn)練微調(diào),并通過加強(qiáng)合規(guī)監(jiān)測(cè)等方式規(guī)避AI大模型幻覺所帶來的相關(guān)問題。
孟燦認(rèn)為,券商需不斷夯實(shí)數(shù)字技術(shù)應(yīng)用的安全基礎(chǔ):制定應(yīng)急處置預(yù)案,常態(tài)化開展應(yīng)急演練,及時(shí)有效處置突發(fā)事件;深入研究開源軟件治理,建立健全開源軟件評(píng)估體系,妥善應(yīng)對(duì)開源風(fēng)險(xiǎn);建設(shè)行業(yè)網(wǎng)絡(luò)和信息安全態(tài)勢(shì)感知平臺(tái),防范化解數(shù)據(jù)隱私和安全風(fēng)險(xiǎn)。
為解決AI大模型的合規(guī)性、安全性等問題,國(guó)金證券原創(chuàng)性地提出“AI友好”型組織以及“AI友好”業(yè)務(wù)流、數(shù)據(jù)流的設(shè)計(jì)理念,如可重復(fù)驗(yàn)證的場(chǎng)景,包括合同是否符合某些合規(guī)性要求、身份證和人臉識(shí)別、軟件運(yùn)行是否符合預(yù)期,這類場(chǎng)景的追求目標(biāo)是將暫且只能由人工執(zhí)行的流程,通過“AI友好”設(shè)計(jì)為“AI可重復(fù)驗(yàn)證”,通過自動(dòng)化執(zhí)行不斷提升AI的應(yīng)用力度。
國(guó)泰君安也多措并舉建立輸出內(nèi)容的可控技術(shù)架構(gòu),實(shí)現(xiàn)內(nèi)容的可信、可控輸出。包括建立可信的輸出內(nèi)容倉庫,賦能AI大模型可信數(shù)據(jù)源;AI大模型與小模型結(jié)合,并輔以Agent平臺(tái)和實(shí)時(shí)API接口,控制AI大模型結(jié)構(gòu)化輸出;建設(shè)AI大模型對(duì)結(jié)構(gòu)化、非結(jié)構(gòu)化、半結(jié)構(gòu)化數(shù)據(jù)的統(tǒng)一支持,將異構(gòu)數(shù)據(jù)一體化一站式處理變成現(xiàn)實(shí),實(shí)現(xiàn)數(shù)據(jù)能力的全面提升。