全國政協(xié)委員、中國科學(xué)院自動(dòng)化研究所研究員王亮:以高質(zhì)量數(shù)據(jù)驅(qū)動(dòng)人工智能發(fā)展
“大模型技術(shù)的進(jìn)步使得通用人工智能成為可能,但要實(shí)現(xiàn)通用人工智能還有很長的路要走?!比珖f(xié)委員、中國科學(xué)院自動(dòng)化研究所研究員王亮近日接受中國證券報(bào)記者采訪時(shí)說。王亮從2000年開始研究計(jì)算機(jī)視覺,他研究并推動(dòng)了步態(tài)識(shí)別算法進(jìn)入產(chǎn)業(yè)應(yīng)用,是國內(nèi)人工智能產(chǎn)業(yè)的早期開拓者,目前在多模態(tài)人工智能系統(tǒng)全國重點(diǎn)實(shí)驗(yàn)室從事研究工作。
王亮表示,DeepSeek在大模型技術(shù)上取得的顯著進(jìn)展,極大地提振了人們對(duì)邁向通用人工智能的信心。他認(rèn)為,人工智能的未來應(yīng)用需要多模態(tài)數(shù)據(jù)的融合。此外,若要推動(dòng)“人工智能+”廣泛落地,應(yīng)加強(qiáng)學(xué)術(shù)研究與產(chǎn)業(yè)應(yīng)用的深度融合,同時(shí)要加快實(shí)現(xiàn)高質(zhì)量數(shù)據(jù)的共享。
大模型技術(shù)讓人工智能更通用
在過去的幾年間,大模型成為了人工智能飛速發(fā)展的強(qiáng)勁引擎。尤其是今年,DeepSeek的突破性進(jìn)展備受矚目。王亮分析稱,DeepSeek在大模型的軟件與硬件層面均進(jìn)行了優(yōu)化創(chuàng)新,大幅提升了大模型的運(yùn)行效率與通用性。
“大模型如今已具備學(xué)習(xí)、推理、規(guī)劃、認(rèn)知以及決策等關(guān)鍵能力,并且能夠接納多模態(tài)數(shù)據(jù)輸入。這賦予了大模型在復(fù)雜環(huán)境與不同應(yīng)用領(lǐng)域完成任務(wù)的通用能力,使通用人工智能從設(shè)想逐步走向可能?!蓖趿琳f道。此外,眾多大模型紛紛采取開源策略,這一舉措極大地降低了學(xué)術(shù)界與產(chǎn)業(yè)界開發(fā)、應(yīng)用大模型技術(shù)的門檻,有力地推動(dòng)了人工智能技術(shù)的快速迭代更新,進(jìn)一步加速了技術(shù)的廣泛推廣。
不過,王亮同時(shí)表示,真正實(shí)現(xiàn)通用人工智能依舊任重道遠(yuǎn)。要讓人工智能具備如同人類般感知外部世界、理解并處理信息的能力,諸多技術(shù)難題有待攻克。以自動(dòng)駕駛技術(shù)為例,當(dāng)前采用該技術(shù)的公司僅依靠計(jì)算機(jī)視覺,難以應(yīng)對(duì)復(fù)雜多變的環(huán)境,通常需要結(jié)合雷達(dá)系統(tǒng)或其他多模態(tài)解決方案,彌補(bǔ)視覺技術(shù)的短板。
王亮認(rèn)為,為推動(dòng)人工智能在產(chǎn)業(yè)端實(shí)現(xiàn)更廣泛的應(yīng)用,多模態(tài)感知解決方案不可或缺。比如人形機(jī)器人的發(fā)展,需要具備感知視覺、聽覺、觸覺等多模態(tài)數(shù)據(jù)的能力;在網(wǎng)絡(luò)安全領(lǐng)域,相關(guān)應(yīng)用也需能夠理解分析文字、圖片、視頻、語音等多模態(tài)數(shù)據(jù),并據(jù)此做出精準(zhǔn)判斷。
提高數(shù)據(jù)質(zhì)量
王亮表示,要進(jìn)一步提升大模型性能,需要更大規(guī)模的高質(zhì)量數(shù)據(jù),這也是人工智能下一步發(fā)展需要突破的難點(diǎn)之一。
“真正能夠用于大模型訓(xùn)練的數(shù)據(jù),需要經(jīng)過人工細(xì)致的過濾、清洗與標(biāo)注,這一過程耗時(shí)、耗力且耗費(fèi)大量資金?!蓖趿两忉尩?,數(shù)據(jù)標(biāo)注通常需要經(jīng)過專業(yè)訓(xùn)練的團(tuán)隊(duì)來完成,高質(zhì)量的數(shù)據(jù)標(biāo)注能夠使數(shù)據(jù)更加規(guī)范化。他形象地將大模型的發(fā)展比作火箭,而數(shù)據(jù)則是推動(dòng)火箭升空的燃料。
近日,為推進(jìn)國家數(shù)據(jù)基礎(chǔ)設(shè)施體系化、集約化、一體化建設(shè),國家數(shù)據(jù)局指導(dǎo)全國數(shù)據(jù)標(biāo)準(zhǔn)化技術(shù)委員會(huì)研究形成了《數(shù)據(jù)基礎(chǔ)設(shè)施 參考架構(gòu)(試行)》《數(shù)據(jù)基礎(chǔ)設(shè)施 互聯(lián)互通基本要求(試行)》《數(shù)據(jù)基礎(chǔ)設(shè)施 標(biāo)識(shí)管理規(guī)范(試行)》等6項(xiàng)技術(shù)文件,引導(dǎo)地方、行業(yè)、領(lǐng)域、企業(yè)按照“統(tǒng)一目錄標(biāo)識(shí)、統(tǒng)一身份登記、統(tǒng)一接口要求”推進(jìn)國家數(shù)據(jù)基礎(chǔ)設(shè)施建設(shè)。
作為全國數(shù)據(jù)標(biāo)準(zhǔn)化技術(shù)委員會(huì)的成員,王亮表示:“針對(duì)人工智能的發(fā)展,我們期望推動(dòng)不同領(lǐng)域的數(shù)據(jù)實(shí)現(xiàn)共享。而共享的前提是對(duì)數(shù)據(jù)的采集、標(biāo)注、交易、使用等各個(gè)環(huán)節(jié)進(jìn)行規(guī)范化。若能在數(shù)據(jù)層面切實(shí)做好規(guī)范工作,將加速大模型技術(shù)在不同垂直領(lǐng)域的應(yīng)用,推動(dòng)技術(shù)的快速迭代?!?/p>
促進(jìn)科技創(chuàng)新與產(chǎn)業(yè)創(chuàng)新融合
王亮強(qiáng)調(diào),推動(dòng)人工智能加速應(yīng)用,必須促進(jìn)學(xué)術(shù)研究與產(chǎn)業(yè)應(yīng)用的深度融合。
“過去幾年,產(chǎn)學(xué)研融合取得了一定成果,但仍存在一些不足之處,這與學(xué)術(shù)界和產(chǎn)業(yè)界的不同定位、目標(biāo)密切相關(guān)?!蓖趿练治龇Q,“學(xué)術(shù)界關(guān)注前沿技術(shù)探索,注重長期技術(shù)積累;而產(chǎn)業(yè)界更側(cè)重于短期應(yīng)用與商業(yè)回報(bào),這導(dǎo)致學(xué)術(shù)界的研究成果與產(chǎn)業(yè)界的實(shí)際應(yīng)用容易脫節(jié)?!?/p>
這種脫節(jié)使得實(shí)驗(yàn)室的技術(shù)成果在向產(chǎn)業(yè)推廣時(shí),難以完全契合產(chǎn)業(yè)應(yīng)用需求,往往需要經(jīng)歷一個(gè)適配過程。王亮指出,為縮短這一適配周期,應(yīng)將學(xué)術(shù)界與產(chǎn)業(yè)界的合作前置。
“在研發(fā)階段,就應(yīng)該加強(qiáng)學(xué)術(shù)界與產(chǎn)業(yè)界的協(xié)同合作,而不是等到學(xué)術(shù)研究完成后才考慮產(chǎn)業(yè)化?!蓖趿两ㄗh,要讓學(xué)術(shù)界深入了解產(chǎn)業(yè)界的真實(shí)應(yīng)用場景與需求,同時(shí)產(chǎn)業(yè)界為學(xué)術(shù)界提供應(yīng)用場景數(shù)據(jù),用于算法開發(fā)?!叭绱艘粊恚_發(fā)出的算法能夠直接應(yīng)用于實(shí)際生產(chǎn),形成完整的產(chǎn)業(yè)閉環(huán)?!?/p>