首頁 > 綜合專題>DeepSeek大放異彩掘金這些投資機(jī)會(huì)>機(jī)構(gòu)解讀

DeepSeek有望激發(fā)新一波人工智能創(chuàng)新浪潮

新華社 2025-02-07 17:27

　　新華社舊金山1月27日電 硅谷手記｜DeepSeek有望激發(fā)新一波人工智能創(chuàng)新浪潮

　　新華社記者吳曉凌

　　中國(guó)人工智能（AI）企業(yè)深度求索（DeepSeek）日前發(fā)布其最新開源模型DeepSeek-R1，用較低的成本達(dá)到了接近于美國(guó)開放人工智能研究中心（OpenAI）開發(fā)的GPT-o1的性能。這一進(jìn)展破解了全球人工智能產(chǎn)業(yè)長(zhǎng)期以來“堆算力”的路徑依賴，其影響波及資本市場(chǎng)。業(yè)界人士認(rèn)為，DeepSeek模型有望激發(fā)一波創(chuàng)新浪潮，推動(dòng)全球AI繼續(xù)進(jìn)步。

　　“更大不再等于更聰明”

　　據(jù)深度求索公司官網(wǎng)介紹，DeepSeek-R1在后訓(xùn)練階段大規(guī)模使用了強(qiáng)化學(xué)習(xí)技術(shù)，在僅有很少標(biāo)注數(shù)據(jù)的情況下極大提升了模型的推理能力，在數(shù)學(xué)、代碼、自然語言推理等任務(wù)上，測(cè)評(píng)性能與GPT-o1模型正式版接近。

　　國(guó)際投行摩根士丹利表示，“更大（的模型）不再等于更聰明”，DeepSeek通過顯著提高數(shù)據(jù)質(zhì)量和改進(jìn)模型架構(gòu)，展示了一條與之前大模型不同的高效訓(xùn)練途徑。摩根士丹利說，DeepSeek的模型現(xiàn)在低成本優(yōu)勢(shì)突出，與國(guó)際知名大模型相比，其成本大約低了一個(gè)數(shù)量級(jí)。

　　高盛集團(tuán)也認(rèn)為，DeepSeek新模型的成本遠(yuǎn)低于現(xiàn)有模型，這意味著開發(fā)利用大模型的門檻降低，互聯(lián)網(wǎng)巨頭將面臨初創(chuàng)公司的潛在競(jìng)爭(zhēng)。

　　英國(guó)《金融時(shí)報(bào)》發(fā)表的一篇評(píng)論文章指出，DeepSeek挑戰(zhàn)了人工智能產(chǎn)業(yè)在過去一段時(shí)間的核心信念，即認(rèn)為更強(qiáng)大的硬件才是推動(dòng)人工智能發(fā)展的關(guān)鍵。

　　有望激發(fā)創(chuàng)新浪潮

　　摩根士丹利認(rèn)為，DeepSeek的模型表明，前沿AI能力可能不需要大量計(jì)算資源就能實(shí)現(xiàn)。通過巧妙的工程設(shè)計(jì)和高效的訓(xùn)練方法，高效利用資源可能比純粹的計(jì)算能力更重要。這可能會(huì)激發(fā)一波創(chuàng)新浪潮，各家企業(yè)會(huì)探索具有成本效益的AI開發(fā)和部署方法。

　　DeepSeek的模型是開源共享的。近日，全球知名開源平臺(tái)抱抱臉公司等多個(gè)團(tuán)隊(duì)已宣布復(fù)現(xiàn)了DeepSeek-R1的訓(xùn)練過程。美國(guó)“元”公司首席AI科學(xué)家楊立昆在社交媒體上發(fā)文說，DeepSeek-R1的面世，意味著開源模型正在超越閉源模型。

　　英國(guó)《金融時(shí)報(bào)》的評(píng)論文章說，開源模型DeepSeek-R1對(duì)全球用戶產(chǎn)生極大吸引力，有利于推動(dòng)人工智能技術(shù)的開發(fā)和應(yīng)用。文章說，對(duì)于大多數(shù)商業(yè)用戶來說，擁有一款足夠可靠并且好用的模型比擁有絕對(duì)領(lǐng)先的模型更重要?！安⒉皇敲總€(gè)司機(jī)都需要一輛法拉利。像R1這樣模型的推理能力進(jìn)步，可能會(huì)為與客戶互動(dòng)或處理工作任務(wù)的‘智能體’帶來突破性變化?！比绻芤愿偷某杀緭碛羞@些模型，企業(yè)的盈利能力將提升。

　　瑞士瑞銀集團(tuán)指出，如果AI訓(xùn)練和推理成本顯著降低，預(yù)計(jì)更多終端用戶將利用AI來改善他們的業(yè)務(wù)或開發(fā)新的用途。