返回首頁

迎接大數(shù)據(jù)思維新模式--《智能時(shí)代》讀書筆記

姜 洋中國證券報(bào)·中證網(wǎng)

  天有不測風(fēng)云。今年6月6日北京把新冠肺炎防控等級由二級下調(diào)到三級沒幾天,病毒突然從新發(fā)地農(nóng)產(chǎn)品批發(fā)市場竄出,把北京的防控級別又拽回二級。8日我們從北京飛回老家鄉(xiāng)下山里想涼快幾天,哪知11日深夜當(dāng)?shù)鼐旌歪t(yī)務(wù)人員根據(jù)機(jī)票信息追蹤到家里,把我們拉去50公里外的縣醫(yī)院做核酸檢測,然后天天兩次上門測體溫,自我隔離14天。借此機(jī)會(huì),看了幾本書,中信出版社的《智能時(shí)代》是其中之一。作者是大數(shù)據(jù)科普作家吳軍博士,他已經(jīng)出版過好幾本有關(guān)大數(shù)據(jù)的科普著作。作者在書中,用通俗易懂的語言,對大數(shù)據(jù)和機(jī)器智能對未來的影響進(jìn)行了比較充分的揭示,文字振聾發(fā)聵,諸如“數(shù)據(jù)密集型科學(xué)”“機(jī)械思維”“大數(shù)據(jù)思維”等等新觀點(diǎn),讓人來了次頭腦風(fēng)暴。作者是大數(shù)據(jù)科學(xué)家,又曾經(jīng)是數(shù)據(jù)服務(wù)商高管,在書中,夾敘夾議中既有科學(xué)理論,又有實(shí)踐經(jīng)驗(yàn)。讀起來無晦澀之困,有通俗之感。作者闡述了大數(shù)據(jù)科學(xué)發(fā)展的前因后果,概述了科學(xué)研究發(fā)展經(jīng)歷的四個(gè)范式:一是描述自然現(xiàn)象的實(shí)驗(yàn)科學(xué);二是以牛頓定律等為代表的理論科學(xué);三是模擬復(fù)雜現(xiàn)象的計(jì)算科學(xué);四是目前的數(shù)據(jù)密集型科學(xué)。第四個(gè)范式是大數(shù)據(jù)時(shí)代的決定性因素,會(huì)與以前的每一階段工業(yè)革命一樣,給經(jīng)濟(jì)社會(huì)帶來巨大變遷。作者認(rèn)為,雖然數(shù)據(jù)在上面四個(gè)科學(xué)階段都存在,但只有今天,隨著互聯(lián)網(wǎng)的寬帶化和移動(dòng)電子設(shè)備技術(shù)的應(yīng)用,數(shù)據(jù)量的爆炸性增長和科學(xué)家們對數(shù)據(jù)的深度挖掘分析,才形成以大數(shù)據(jù)為特征的數(shù)據(jù)密集型科學(xué)。

  “數(shù)據(jù)密集型科學(xué)”推動(dòng)思維革命

  書里提出了“數(shù)據(jù)密集型科學(xué)”概念,說它將推動(dòng)人類的思維革命。為了說明這點(diǎn),作者讓我們重溫了科學(xué)技術(shù)引導(dǎo)人類經(jīng)濟(jì)社會(huì)進(jìn)步的歷史。世界經(jīng)濟(jì)發(fā)展史上的每一次技術(shù)革命,都是圍繞著一個(gè)核心技術(shù)展開的。第一次工業(yè)革命是蒸汽機(jī),第二次工業(yè)革命是電氣化,第三次工業(yè)革命是計(jì)算機(jī)和半導(dǎo)體芯片為主的信息化,第四次是大數(shù)據(jù)和機(jī)器智能引領(lǐng)的智能革命。作者預(yù)言,這第四次革命將會(huì)徹底改變我們當(dāng)下所有人的生活。其標(biāo)志是人類思維方式的革命性變革。傳統(tǒng)上人類決策是靠邏輯推理,而大數(shù)據(jù)和機(jī)器智能不是靠邏輯推理,而是靠大數(shù)據(jù)和智能算法幫助我們決策。這不可避免地會(huì)對未來經(jīng)濟(jì)產(chǎn)生巨大影響。書里對過去商業(yè)模式的歷史變遷總結(jié)了三條:一是技術(shù)革命導(dǎo)致新的商業(yè)模式誕生;二是生產(chǎn)過剩,需求拉動(dòng)經(jīng)濟(jì)增長的模式不可逆轉(zhuǎn);三是商業(yè)模式既有繼承性又有創(chuàng)新性。第一次工業(yè)革命導(dǎo)致了產(chǎn)品需要靠展示推銷才能賣出去;第二次工業(yè)革命導(dǎo)致廣告業(yè)興起,展示的推銷方式變成了廣告,并導(dǎo)致了商業(yè)鏈的出現(xiàn);第三次工業(yè)革命是信息革命使商業(yè)鏈得到發(fā)展,服務(wù)業(yè)的重要性凸顯。以“數(shù)據(jù)密集型科學(xué)”為指導(dǎo)思想的大數(shù)據(jù)時(shí)代,毫無疑問會(huì)推動(dòng)現(xiàn)存商業(yè)模式的改變,大數(shù)據(jù)和機(jī)器智能將是第四次工業(yè)革命。蒸汽機(jī)、電氣化、信息化是這樣,大數(shù)據(jù)時(shí)代將仍然會(huì)是這樣,這是經(jīng)濟(jì)發(fā)展的規(guī)律。這種變化是革命性的震撼人心的。為了讓讀者更直觀感性地認(rèn)識這一點(diǎn),作者在書中與我們一起回顧了2017年5月23-27日那場智能機(jī)器人戰(zhàn)勝世界段位高手的圍棋比賽。智能機(jī)器人以三比零戰(zhàn)勝人類頂尖棋手靠的就是大數(shù)據(jù)和計(jì)算機(jī)算法。從經(jīng)濟(jì)角度思考這場圍棋比賽。那就是大數(shù)據(jù)和智能機(jī)器人將會(huì)對現(xiàn)存經(jīng)濟(jì)模式產(chǎn)生深刻而廣泛的影響。作者分析了機(jī)器人取勝的原因:其一,它的采用的是機(jī)器學(xué)習(xí)與神經(jīng)系統(tǒng)科學(xué)結(jié)合的學(xué)習(xí)算法;其二,它在強(qiáng)大的云計(jì)算系統(tǒng)中,通過統(tǒng)計(jì)模型在極短時(shí)間內(nèi)學(xué)習(xí)分析了幾千萬盤圍棋棋譜和比賽巨量數(shù)據(jù)后,獲得了不同局勢下該如何行棋有一個(gè)比人類更為準(zhǔn)確的估計(jì),尋找出了比基礎(chǔ)棋譜更好的大數(shù)據(jù)棋路。這一點(diǎn)是人類大腦無論如何也無法完成的。機(jī)器智能里面有兩個(gè)關(guān)鍵的技術(shù)是人腦無法獲得的。第一個(gè)關(guān)鍵技術(shù)是把棋盤上當(dāng)前的狀態(tài)變成一個(gè)獲勝概率的數(shù)學(xué)模型,是完全靠數(shù)據(jù)訓(xùn)練出來的。第二個(gè)關(guān)鍵技術(shù)是啟發(fā)式搜索算法。作者認(rèn)為下圍棋這個(gè)看似智能型的問題,從本質(zhì)上講,是一個(gè)大數(shù)據(jù)和算法的問題。在機(jī)器人的背后,是數(shù)據(jù)中心強(qiáng)大的服務(wù)器集群,它們獲得智能的方法不是和我們?nèi)艘粯涌窟壿嬐评恚嗟氖抢么髷?shù)據(jù)。因此,思維方式上的邏輯推理一霸天下的歷史或?qū)⒏膶憽?/p>

  “機(jī)械思維”將靠后站

  “機(jī)械思維”是一種靠邏輯推理的思維方式。如果機(jī)器人利用邏輯推理和圍棋手對弈,是戰(zhàn)勝不了人類的,但它另辟蹊徑,用大數(shù)據(jù)把人類頂級棋手干下去了。智能機(jī)器人在下棋時(shí)沒有用機(jī)械思維思考。作者認(rèn)為,機(jī)械思維是前三個(gè)工業(yè)革命的科學(xué)方法論。它們和因果關(guān)系息息相關(guān)。由因根據(jù)三段論推出果的邏輯推理方式。作者認(rèn)為,機(jī)械思維是過去三個(gè)多世紀(jì)里人類總結(jié)出的最重要的思維方式是現(xiàn)代文明的基礎(chǔ)。西方把機(jī)械思維歸功于牛頓的科學(xué)方法論。內(nèi)容包括:第一,世界變化的規(guī)律是確定的;第二,世界變化的規(guī)律不僅可以被認(rèn)識,而且可用簡單的公式或語言描述清楚;第三,這些規(guī)律放之四海而皆準(zhǔn)。機(jī)械思維方式導(dǎo)致了工業(yè)革命。從牛頓時(shí)代開始接下來的三個(gè)多世紀(jì)里,人類越來越習(xí)慣于用機(jī)械思維描述一切、抽象一切:即抽象個(gè)體然后進(jìn)行標(biāo)準(zhǔn)化,形成了用一個(gè)通用的方案來解決所有問題的方法論。作者認(rèn)為,工業(yè)革命是牛頓提供了方法論即機(jī)械思維,而瓦特則是利用機(jī)械思維方法論發(fā)明了蒸汽機(jī),開啟西方工業(yè)革命大門。因此,瓦特蒸汽機(jī)的成功不僅是技術(shù),更重要的是機(jī)械思維方法論的成功。從牛頓開始,人類社會(huì)進(jìn)步在很大程度上得益于機(jī)械思維,但是到了計(jì)算機(jī)信息時(shí)代,機(jī)械思維的局限性也越來越明顯。人們發(fā)現(xiàn)世界本身存在著很大的不確定性。作者認(rèn)為,機(jī)械思維的核心思想可以概括成確定性、或者可預(yù)測性和因果關(guān)系。它導(dǎo)致了人類歷史上很多重大的發(fā)明和發(fā)現(xiàn)。尋找因果關(guān)系是機(jī)械思維的一個(gè)特征,但事實(shí)上,人類找到真正的因果關(guān)系是一件很難的事,里面運(yùn)氣的成分很大。機(jī)械思維具有兩面性——善于把握確定性而難以解決不確定性問題。由于數(shù)據(jù)之間的相關(guān)性在某種程度上可以取代原來的因果關(guān)系,可以幫助我們得到我們想知道的答案。由于近30年來互聯(lián)網(wǎng)寬帶和移動(dòng)通信設(shè)備的迅速發(fā)展,由此而產(chǎn)生的海量數(shù)據(jù)和計(jì)算機(jī)算法,改變了機(jī)械思維300多年的習(xí)慣思維。大數(shù)據(jù)和計(jì)算機(jī)算法的結(jié)合不可避免地產(chǎn)生出“大數(shù)據(jù)思維”。因此“人機(jī)大戰(zhàn)”中,機(jī)器人才能戰(zhàn)勝人類頂尖棋手。

  “大數(shù)據(jù)思維”引領(lǐng)新時(shí)代

  “大數(shù)據(jù)思維”,可以幫助人們解決機(jī)械思維狀態(tài)下不能解決的一些問題。人機(jī)大戰(zhàn)中機(jī)器人的取勝說明,未來是可預(yù)測的,不確定是可以轉(zhuǎn)化為確定。因此,大數(shù)據(jù)思維在新的工業(yè)革命中將引領(lǐng)新時(shí)代。作者認(rèn)為,大數(shù)據(jù)的基礎(chǔ)是數(shù)據(jù)和信息的收集和匯聚,它們?nèi)呒扔新?lián)系又有區(qū)別。

  談數(shù)據(jù)前,作者講了數(shù)字和數(shù)據(jù)的聯(lián)系和區(qū)別。他認(rèn)為,數(shù)字僅是數(shù)據(jù)非常小的一部分,數(shù)據(jù)的范疇比數(shù)字要大得多,但它們是有聯(lián)系的。互聯(lián)網(wǎng)上的文字、圖片和視頻等都是數(shù)據(jù);醫(yī)院里包括醫(yī)學(xué)影像在內(nèi)的所有檔案也是數(shù)據(jù);公司的各種設(shè)計(jì)圖紙也是數(shù)據(jù);出土文物上的文字、圖示也都是數(shù)據(jù)。人類發(fā)明了文字,并記錄了人類活動(dòng)并留傳后世,形成文明的傳承。以語言和文字形式存在的內(nèi)容是全世界各種信息處理中最重要的數(shù)據(jù),在20世紀(jì)90年代互聯(lián)網(wǎng)興起之后,數(shù)據(jù)的獲取變得非常容易。

  接著作者區(qū)別了數(shù)據(jù)和信息。作者認(rèn)為,數(shù)據(jù)和信息還是稍有不同。信息是關(guān)于世界、人和事的描述,它比數(shù)據(jù)來得抽象。人的大腦是一個(gè)信息源,從思考到找到合適的語句,再通過發(fā)音說出來,是一個(gè)編碼的過程,經(jīng)過媒介如聲道、空氣、電話線和揚(yáng)聲器等傳播到聽眾耳朵里,是經(jīng)過了一個(gè)長長的信道的信息傳播問題,最后聽話人把它聽懂,是一個(gè)解碼的過程。隨著人類的進(jìn)步以及處理數(shù)據(jù)和信息的能力不斷增強(qiáng),人類從數(shù)據(jù)中獲取有用信息的本事就越來越大,對數(shù)據(jù)和信息進(jìn)行處理后,人類就可以獲得知識。知識比信息更高一個(gè)層次,也更加抽象,它具有系統(tǒng)性的特征。而數(shù)據(jù)是知識的基礎(chǔ)。只有善用數(shù)據(jù),我們才能得到數(shù)據(jù)背后的信息。數(shù)據(jù)中隱藏的信息和知識是客觀存在的,但是只有具有相關(guān)領(lǐng)域?qū)I(yè)知識的人才能將它們挖掘出來。人類文明的進(jìn)程是伴隨著獲取數(shù)據(jù)——分析數(shù)據(jù)——建立模型——預(yù)測未知。雖然數(shù)據(jù)在文明進(jìn)程中具有重大作用,但過去數(shù)據(jù)的作用常常被人們忽視。這里面有兩個(gè)原因,首先是由于過去數(shù)據(jù)量不足,積累大量的數(shù)據(jù)所需要的時(shí)間太長。其次,數(shù)據(jù)和所想獲得的信息之間的聯(lián)系通常是間接的,它要通過不同數(shù)據(jù)之間的相關(guān)性才能體現(xiàn)出來。

  最后作者區(qū)別了數(shù)據(jù)和大數(shù)據(jù)。前面已經(jīng)說到數(shù)據(jù)的概念是指所有輸入到計(jì)算機(jī)并被計(jì)算機(jī)程序處理的符號的介質(zhì)的總稱。大數(shù)據(jù)則不僅僅是數(shù)據(jù)體量大并能及時(shí)獲得,同時(shí)還具有多維度、多樣性;全面性、完備性等特征。從現(xiàn)象中、觀察中總結(jié)出數(shù)據(jù),匯總數(shù)據(jù)并運(yùn)用數(shù)據(jù),是衡量人類文明發(fā)展水平之一。隨人類進(jìn)步以及處理數(shù)據(jù)和信息的能力不斷增強(qiáng),人類從數(shù)據(jù)中獲取有用信息的本事就越來越大,這就是大數(shù)據(jù)應(yīng)用的基礎(chǔ)。數(shù)據(jù)在計(jì)算機(jī)時(shí)代記錄了人類的行為,靠計(jì)算機(jī)去發(fā)掘、分析而得出人類沒有寫明的,存在于多次重復(fù)的行為中的數(shù)據(jù)。這樣的行為,光有數(shù)據(jù)做不到,只有計(jì)算機(jī)也難成,只有兩者結(jié)合才能事成。這個(gè)加入計(jì)算機(jī)算法的數(shù)據(jù)稱之為大數(shù)據(jù)。計(jì)算機(jī)信息技術(shù)和電子移動(dòng)設(shè)備使得我們可以從足夠多的數(shù)據(jù)中發(fā)現(xiàn)各種事物的相關(guān)性并把握事物發(fā)展的軌跡,并依靠大數(shù)據(jù)來提高對未來不確定性把控能力。采用大數(shù)據(jù)的方法能夠使計(jì)算機(jī)的智能水平大大提高,替代人類智能解決不了的許多問題。決定今后20年經(jīng)濟(jì)發(fā)展的是大數(shù)據(jù)和由之而來的智能革命。因此,從方法論的層面上看,大數(shù)據(jù)與三百年前產(chǎn)生的機(jī)械思維一樣,在大數(shù)據(jù)和機(jī)器智能大規(guī)模運(yùn)用的情況下,會(huì)形成一種全新的思維模式即大數(shù)據(jù)思維,從而完成思維模式的一次革命。

  大數(shù)據(jù)思維會(huì)帶來什么?

  按照大數(shù)據(jù)思維模式,我們做事情的方式方法需要從根本上改變。回顧歷史,展望未來,大數(shù)據(jù)引發(fā)的智能革命將是以一種全新的方式展開。蒸汽機(jī)、電氣化等技術(shù)革命都是生產(chǎn)力單點(diǎn)突破,從而帶動(dòng)社會(huì)全面變革,今天的大數(shù)據(jù)正面臨這樣一個(gè)突破,大數(shù)據(jù)和機(jī)器智能的普及會(huì)帶來新一輪經(jīng)濟(jì)社會(huì)生活的全面變革。大數(shù)據(jù)思維所具有的解決不確定性的能力可以為經(jīng)濟(jì)社會(huì)發(fā)展有所作為。在大數(shù)據(jù)思維指導(dǎo)下,數(shù)據(jù)科學(xué)家可以把過去解決不了的問題,變成大數(shù)據(jù)問題來處理。溫故而知新。作者說,在歷史上,一項(xiàng)技術(shù)帶動(dòng)整個(gè)社會(huì)的變革通常遵循一個(gè)公式,即現(xiàn)有產(chǎn)業(yè)+新技術(shù)=新產(chǎn)業(yè)。第一次工業(yè)革命是:現(xiàn)有產(chǎn)業(yè)+蒸汽機(jī)=新產(chǎn)業(yè);第二次工業(yè)革命是:現(xiàn)有產(chǎn)業(yè)+電氣化=新產(chǎn)業(yè);第三次工業(yè)革命是:現(xiàn)有產(chǎn)業(yè)+摩爾定律=新產(chǎn)業(yè);第四次工業(yè)革命將是:用兩個(gè)公式簡單概括,現(xiàn)有產(chǎn)業(yè)+大數(shù)據(jù)=新產(chǎn)業(yè),現(xiàn)有產(chǎn)業(yè)+機(jī)器智能=新產(chǎn)業(yè)。大數(shù)據(jù)思維將帶來一場新技術(shù)革命。大數(shù)據(jù)思維的核心是通過數(shù)據(jù)之間相關(guān)性的演算分析,取代機(jī)械思維下的因果推理,但大數(shù)據(jù)思維和原有的機(jī)械思維并非完全對立,它更多的是對后者的補(bǔ)充。是對邏輯思維辦不到的事情提供有益的補(bǔ)充,消除事物的不確定性,從而解決問題。大數(shù)據(jù)和機(jī)器智能將從供給側(cè)推動(dòng)許多新產(chǎn)業(yè)的誕生,帶動(dòng)產(chǎn)業(yè)升級換代,滿足人類社會(huì)多樣化、個(gè)性化需求,導(dǎo)致我們整個(gè)社會(huì)的升級和變遷。

  這本書給我們提了個(gè)醒,即將到來的大數(shù)據(jù)時(shí)代,無論國家還是個(gè)人都應(yīng)該建立大數(shù)據(jù)思維方式。跟上去則適者生存,掉下來則淘汰沒落。凡事預(yù)則立,不預(yù)則廢。據(jù)普華永道預(yù)測,到2030年,大數(shù)據(jù)和人工智能將為全世界國內(nèi)生產(chǎn)總值貢獻(xiàn)15.7萬億美元。數(shù)據(jù)是開發(fā)高級神經(jīng)系統(tǒng)的必要條件,有數(shù)據(jù)才有可能更好地理解語言、識別物體并提出有用的見解。中國是世界第一制造大國,同時(shí)還擁有8-9億網(wǎng)民、10億以上的智能手機(jī)使用者,它們產(chǎn)生的海量數(shù)據(jù)是世界獨(dú)一無二的,這樣的數(shù)據(jù)背景為大數(shù)據(jù)和機(jī)器智能在中國發(fā)展提供了巨大的優(yōu)勢條件。基于這種數(shù)據(jù)優(yōu)勢,我們在第四次工業(yè)革命中存在非常大的彎道超車機(jī)會(huì)。目前,在大數(shù)據(jù)和機(jī)器智能領(lǐng)域,中國與世界先進(jìn)水平距離已縮短,有些方面還略微領(lǐng)先,比如金融移動(dòng)支付等。因勢利導(dǎo)地用大數(shù)據(jù)思維完成中國新經(jīng)濟(jì)模式的變革是有完全可能的。在這種背景下讀讀《智能時(shí)代》一書,可以幫助我們更好理解即將到來的大數(shù)據(jù)思維新時(shí)代。

  姜 洋

  2020年6月22日

中證網(wǎng)聲明:凡本網(wǎng)注明“來源:中國證券報(bào)·中證網(wǎng)”的所有作品,版權(quán)均屬于中國證券報(bào)、中證網(wǎng)。中國證券報(bào)·中證網(wǎng)與作品作者聯(lián)合聲明,任何組織未經(jīng)中國證券報(bào)、中證網(wǎng)以及作者書面授權(quán)不得轉(zhuǎn)載、摘編或利用其它方式使用上述作品。凡本網(wǎng)注明來源非中國證券報(bào)·中證網(wǎng)的作品,均轉(zhuǎn)載自其它媒體,轉(zhuǎn)載目的在于更好服務(wù)讀者、傳遞信息之需,并不代表本網(wǎng)贊同其觀點(diǎn),本網(wǎng)亦不對其真實(shí)性負(fù)責(zé),持異議者應(yīng)與原出處單位主張權(quán)利。