“大模型在金融行業(yè)的應用與展望”研討會舉行
中證網(wǎng)訊(記者 王可)近日,恒生聚源主辦的“大模型在金融行業(yè)的應用與展望”研討會在上海舉行。會上,恒生電子高級副總裁、恒生聚源董事長王鋒表示,“當技術(shù)、模型、數(shù)據(jù)、應用快速形成閉環(huán),將產(chǎn)生真正的業(yè)務價值,AI進入了從能力涌現(xiàn)走向價值涌現(xiàn)的新階段。”
2022年11月以來,隨著OpenAI發(fā)布ChatGPT,全球迎來AI大模型熱潮。到今年3月BloombergGPT的推出,引起對金融垂直領(lǐng)域大模型應用的關(guān)注。
恒生研究院院長、首席科學家白碩介紹稱,基于Transformer架構(gòu),大模型目前分為兩條技術(shù)路線,其中GPT的單向預測模型可以理解為“接龍”,而另一條路線類似于“填空”,前者通過一條示意可以容納包括知識、推理、引導、詳細說明,甚至代碼的預測,后者需要兩邊文本的信息指示。
“GPT對AI行業(yè)的沖擊非常大!卑状T告訴記者,在此之前機構(gòu)部署的AI系統(tǒng)都是“煙囪式”的單個系統(tǒng),“諸多小模型的訓練使分析師淪為數(shù)據(jù)標注員,而模型的可用性也難以得到保障。”
富國基金信息技術(shù)部總經(jīng)理李強提到,在基金行業(yè)的AI應用中,自然語言處理、文檔解析、智能客服、發(fā)票識別、表單提取等小模型應用都已相對成熟,但“煙囪式”發(fā)展問題非常嚴重。
“小模型和大模型也存在經(jīng)濟學中的‘不可能三角’!鄙耆f宏源證券研究所所長助理劉洋提到,小模型強調(diào)了精準度、利潤率,但弱化了智能化程度,大模型恰恰相反,通過成本的堆疊,實現(xiàn)了模型的智能化與高效能。
“當高質(zhì)量語料庫訓練到百億級參數(shù)時,大模型的語言能力就會涌現(xiàn),在意圖理解、文本語言生成等方面的能力將隨著參數(shù)的增加達到頂峰。”白碩指出,盡管大模型的語言能力已經(jīng)很強,但是在垂直專業(yè)能力方面還有所欠缺,當前普遍適用的解法是,以大模型中控為核心,結(jié)合應用、插件等共同構(gòu)建成AI能力中心,將大模型中控成為鏈接大模型與應用的“橋梁”。
“大模型的涌現(xiàn)能力,讓基于大量計算的‘暴力求解’成為現(xiàn)實!眲⒀蟊硎,在算力、算法、數(shù)據(jù)“三駕馬車”的推動下,工程化能力變得尤為重要,特別是在券商、基金這樣的垂類大模型應用場景下,率先為客戶提供服務的廠商將搶占先機。從應用端,李強同樣提到,目前各類大模型“百花齊放”,但應用落地還需要真正的工程化能力。
“我們要解決的一個核心問題是,讓大模型有效應用于投資業(yè)務服務之中,對于機構(gòu)客戶能帶來投資收益,對于我們內(nèi)部的中臺與后臺,可以帶來有效工作效率提升。”中信證券首席數(shù)據(jù)科技分析師張若海指出,在投研領(lǐng)域,大模型可以助力人均價值的提升,例如在量化領(lǐng)域,對政策文本數(shù)據(jù)的情緒提煉、中觀景氣研究的指標投資有效性識別,在投資覆蓋寬度與數(shù)據(jù)處理精度大幅提升同時,人力規(guī)模并沒有顯著等比例增加。在高頻場景下,可以實現(xiàn)大規(guī)模的定量數(shù)據(jù)跟蹤與觀點提煉,解構(gòu)成交易信號,從而幫助到機構(gòu)投資者更加便利地獲得大模型的賦能。
李強認為,未來三年內(nèi)代碼生成的效率提升將在30%-50%之間。白碩則提到,從技術(shù)發(fā)展的角度,三年內(nèi)大模型的語言能力將全部上一個臺階,而在金融領(lǐng)域的提質(zhì)增效目前主要集中于IT研發(fā)與數(shù)據(jù)分析方面。通過AI可以實現(xiàn)低代碼甚至“零代碼”,工作效率可以提升2-3倍,滿足七成以上的數(shù)據(jù)偶發(fā)性即時需求,提升8-10倍的建模效率。
“在ChatGPT3.5橫空出世時,很多金融從業(yè)者不對其進行訓練與微調(diào),可以達到很好的效果,但是隨著在業(yè)務場景的落地,會發(fā)現(xiàn)這一模型難以滿足各業(yè)務的精度要求!焙闵墼锤笨偨(jīng)理白雪表示,為了實現(xiàn)“語控萬數(shù)”,恒生電子與恒生聚源共同推出的智能投研平臺WarrenQ-Chat利用大模型疊加搜索和聚源金融數(shù)據(jù)庫,通過對話指令,輕松獲得金融行情、資訊和數(shù)據(jù),且每一句生成的對話均支持原文溯源,確保消息出處可追溯。