中證網(wǎng)
中證網(wǎng)
返回首頁

全國政協(xié)委員、中國科學院自動化研究所研究員王亮:以高質(zhì)量數(shù)據(jù)驅(qū)動人工智能發(fā)展

鄭萃穎 楊潔 中國證券報

  “大模型技術(shù)的進步使得通用人工智能成為可能,但要實現(xiàn)通用人工智能還有很長的路要走。”全國政協(xié)委員、中國科學院自動化研究所研究員王亮近日接受中國證券報記者采訪時說。王亮從2000年開始研究計算機視覺,他研究并推動了步態(tài)識別算法進入產(chǎn)業(yè)應(yīng)用,是國內(nèi)人工智能產(chǎn)業(yè)的早期開拓者,目前在多模態(tài)人工智能系統(tǒng)全國重點實驗室從事研究工作。

  王亮表示,DeepSeek在大模型技術(shù)上取得的顯著進展,極大地提振了人們對邁向通用人工智能的信心。他認為,人工智能的未來應(yīng)用需要多模態(tài)數(shù)據(jù)的融合。此外,若要推動“人工智能+”廣泛落地,應(yīng)加強學術(shù)研究與產(chǎn)業(yè)應(yīng)用的深度融合,同時要加快實現(xiàn)高質(zhì)量數(shù)據(jù)的共享。

  大模型技術(shù)讓人工智能更通用

  在過去的幾年間,大模型成為了人工智能飛速發(fā)展的強勁引擎。尤其是今年,DeepSeek的突破性進展備受矚目。王亮分析稱,DeepSeek在大模型的軟件與硬件層面均進行了優(yōu)化創(chuàng)新,大幅提升了大模型的運行效率與通用性。

  “大模型如今已具備學習、推理、規(guī)劃、認知以及決策等關(guān)鍵能力,并且能夠接納多模態(tài)數(shù)據(jù)輸入。這賦予了大模型在復雜環(huán)境與不同應(yīng)用領(lǐng)域完成任務(wù)的通用能力,使通用人工智能從設(shè)想逐步走向可能。”王亮說道。此外,眾多大模型紛紛采取開源策略,這一舉措極大地降低了學術(shù)界與產(chǎn)業(yè)界開發(fā)、應(yīng)用大模型技術(shù)的門檻,有力地推動了人工智能技術(shù)的快速迭代更新,進一步加速了技術(shù)的廣泛推廣。

  不過,王亮同時表示,真正實現(xiàn)通用人工智能依舊任重道遠。要讓人工智能具備如同人類般感知外部世界、理解并處理信息的能力,諸多技術(shù)難題有待攻克。以自動駕駛技術(shù)為例,當前采用該技術(shù)的公司僅依靠計算機視覺,難以應(yīng)對復雜多變的環(huán)境,通常需要結(jié)合雷達系統(tǒng)或其他多模態(tài)解決方案,彌補視覺技術(shù)的短板。

  王亮認為,為推動人工智能在產(chǎn)業(yè)端實現(xiàn)更廣泛的應(yīng)用,多模態(tài)感知解決方案不可或缺。比如人形機器人的發(fā)展,需要具備感知視覺、聽覺、觸覺等多模態(tài)數(shù)據(jù)的能力;在網(wǎng)絡(luò)安全領(lǐng)域,相關(guān)應(yīng)用也需能夠理解分析文字、圖片、視頻、語音等多模態(tài)數(shù)據(jù),并據(jù)此做出精準判斷。

  提高數(shù)據(jù)質(zhì)量

  王亮表示,要進一步提升大模型性能,需要更大規(guī)模的高質(zhì)量數(shù)據(jù),這也是人工智能下一步發(fā)展需要突破的難點之一。

  “真正能夠用于大模型訓練的數(shù)據(jù),需要經(jīng)過人工細致的過濾、清洗與標注,這一過程耗時、耗力且耗費大量資金。”王亮解釋道,數(shù)據(jù)標注通常需要經(jīng)過專業(yè)訓練的團隊來完成,高質(zhì)量的數(shù)據(jù)標注能夠使數(shù)據(jù)更加規(guī)范化。他形象地將大模型的發(fā)展比作火箭,而數(shù)據(jù)則是推動火箭升空的燃料。

  近日,為推進國家數(shù)據(jù)基礎(chǔ)設(shè)施體系化、集約化、一體化建設(shè),國家數(shù)據(jù)局指導全國數(shù)據(jù)標準化技術(shù)委員會研究形成了《數(shù)據(jù)基礎(chǔ)設(shè)施 參考架構(gòu)(試行)》《數(shù)據(jù)基礎(chǔ)設(shè)施 互聯(lián)互通基本要求(試行)》《數(shù)據(jù)基礎(chǔ)設(shè)施 標識管理規(guī)范(試行)》等6項技術(shù)文件,引導地方、行業(yè)、領(lǐng)域、企業(yè)按照“統(tǒng)一目錄標識、統(tǒng)一身份登記、統(tǒng)一接口要求”推進國家數(shù)據(jù)基礎(chǔ)設(shè)施建設(shè)。

  作為全國數(shù)據(jù)標準化技術(shù)委員會的成員,王亮表示:“針對人工智能的發(fā)展,我們期望推動不同領(lǐng)域的數(shù)據(jù)實現(xiàn)共享。而共享的前提是對數(shù)據(jù)的采集、標注、交易、使用等各個環(huán)節(jié)進行規(guī)范化。若能在數(shù)據(jù)層面切實做好規(guī)范工作,將加速大模型技術(shù)在不同垂直領(lǐng)域的應(yīng)用,推動技術(shù)的快速迭代?!?/p>

  促進科技創(chuàng)新與產(chǎn)業(yè)創(chuàng)新融合

  王亮強調(diào),推動人工智能加速應(yīng)用,必須促進學術(shù)研究與產(chǎn)業(yè)應(yīng)用的深度融合。

  “過去幾年,產(chǎn)學研融合取得了一定成果,但仍存在一些不足之處,這與學術(shù)界和產(chǎn)業(yè)界的不同定位、目標密切相關(guān)?!蓖趿练治龇Q,“學術(shù)界關(guān)注前沿技術(shù)探索,注重長期技術(shù)積累;而產(chǎn)業(yè)界更側(cè)重于短期應(yīng)用與商業(yè)回報,這導致學術(shù)界的研究成果與產(chǎn)業(yè)界的實際應(yīng)用容易脫節(jié)。”

  這種脫節(jié)使得實驗室的技術(shù)成果在向產(chǎn)業(yè)推廣時,難以完全契合產(chǎn)業(yè)應(yīng)用需求,往往需要經(jīng)歷一個適配過程。王亮指出,為縮短這一適配周期,應(yīng)將學術(shù)界與產(chǎn)業(yè)界的合作前置。

  “在研發(fā)階段,就應(yīng)該加強學術(shù)界與產(chǎn)業(yè)界的協(xié)同合作,而不是等到學術(shù)研究完成后才考慮產(chǎn)業(yè)化。”王亮建議,要讓學術(shù)界深入了解產(chǎn)業(yè)界的真實應(yīng)用場景與需求,同時產(chǎn)業(yè)界為學術(shù)界提供應(yīng)用場景數(shù)據(jù),用于算法開發(fā)?!叭绱艘粊恚_發(fā)出的算法能夠直接應(yīng)用于實際生產(chǎn),形成完整的產(chǎn)業(yè)閉環(huán)。”

中證網(wǎng)聲明:凡本網(wǎng)注明“來源:中國證券報·中證網(wǎng)”的所有作品,版權(quán)均屬于中國證券報、中證網(wǎng)。中國證券報·中證網(wǎng)與作品作者聯(lián)合聲明,任何組織未經(jīng)中國證券報、中證網(wǎng)以及作者書面授權(quán)不得轉(zhuǎn)載、摘編或利用其它方式使用上述作品。