合合信息大模型“加速器”亮相2024世界人工智能大會
中證網(wǎng)訊(記者 黃一靈)7月4日至7月7日,2024世界人工智能大會在上海舉辦。本屆大會上,大模型仍是關(guān)注焦點之一,“百模大戰(zhàn)”仍在繼續(xù)。
大模型技術(shù)的發(fā)展和應(yīng)用,預(yù)示著更加智能化、個性化未來的到來。如果將大模型比喻為正在疾馳的科技列車,語料便是珍貴的“燃料”。對于中國的大模型企業(yè)而言,語料短缺問題更為嚴(yán)峻。當(dāng)前大模型數(shù)據(jù)集主要為英文,中文語料占比較低;無線表、跨頁表格、復(fù)雜公式等元素的處理仍是大模型語料處理中的另一個“攔路虎”。在此背景下,如何幫助大模型在信息的海洋中快速找準(zhǔn)航向,在數(shù)據(jù)的荒漠中找到高質(zhì)量的“水源”?大會上,合合信息展示了大模型“加速器”解決方案。
據(jù)了解,在大模型訓(xùn)練的上游階段,“加速器”中的文檔解析引擎將助力大模型突破在書籍、論文、研報等文檔中的版面解析障礙,從源頭為模型訓(xùn)練與應(yīng)用輸送純凈的“燃料”,助力大模型跑得更快;“加速器”還加載了acge文本向量化模型,助力大模型解決“已讀亂回”的“幻覺”問題,讓大模型在正確的航線上行駛得更遠。
合合信息智能創(chuàng)新事業(yè)部總經(jīng)理唐琪表示,目前,大模型“加速器”已被多家大模型廠商應(yīng)用于金融、醫(yī)學(xué)、財經(jīng)、媒體等多領(lǐng)域的文檔的解析中,助力大模型更順利地接軌“專業(yè)課”,它不僅僅是一套技術(shù)工具,更是推動行業(yè)專業(yè)知識管理革新、提升業(yè)務(wù)效率的重要基石。未來,大模型加速器將陪伴更多行業(yè)級知識庫的建立,讓大模型的服務(wù)潤澤社會各個角落,實現(xiàn)“智能觸手可及”。