如何借助區(qū)塊鏈、大數(shù)據(jù)等技術(shù)嚴控病毒的回流
疫情的防控需要結(jié)合科學(xué)有效的手段,其中大數(shù)據(jù)作為科學(xué)判斷的主要依據(jù),扮演著相當重要的作用,隨著抗疫的逐漸深入,究竟何時才能到達拐點,何時才能見到曙光?算力大學(xué)邀請中科院大學(xué)金融科技中心首席科學(xué)家劉世平從大數(shù)據(jù),用數(shù)學(xué)模型給出了他的預(yù)測。
劉世平表示,通過Logistic增長模型和Vintage分析,全國確診人數(shù)的峰值可能在8萬左右,預(yù)計在3月14日以后每日新增確診小于10人,疫情進入緩解階段。
新一代進行信息技術(shù)包括很多方面,像4G、5G各方面的信息流通、大數(shù)據(jù)、云計算、區(qū)塊鏈、人工智能等都非常熱應(yīng)用面也非常廣。
這些技術(shù)往往有很多復(fù)雜的交叉和應(yīng)用,比如大數(shù)據(jù)跟云計算是一個緊密的結(jié)合,如何把大數(shù)據(jù)跟區(qū)塊鏈技術(shù)進行有效的結(jié)合,也很重要。
人工智能也非常依賴大數(shù)據(jù)的數(shù)據(jù)和數(shù)據(jù)整理。
那么大數(shù)據(jù)是怎么一回事?
一是大數(shù)據(jù)是一個更加廣泛和深入的數(shù)字化。
二是全社會的互聯(lián)互通。
數(shù)字化是不是一個簡單的電子化的問題,它是用數(shù)字來指導(dǎo)我們業(yè)務(wù)的一個習(xí)慣、策略和決策的概念。
麥肯錫在2011年對大數(shù)據(jù)提過一個定義,“big data:The next fronTIer for innovaTIon,compeTITIon and productivity。”這里提出了三個關(guān)鍵詞,創(chuàng)新、競爭、生產(chǎn)效率。
這些年我們做了幾十年的工作以后,總結(jié)了5個關(guān)鍵點。
1.建立大數(shù)據(jù)標準體系;
2.不斷強化基于大數(shù)據(jù)的數(shù)據(jù)質(zhì)量管控;
3. 持續(xù)完善基于大數(shù)據(jù)的基礎(chǔ)設(shè)施;
4.初步實現(xiàn)基于大數(shù)據(jù)的數(shù)據(jù)集中與共享;
5.逐步開展基于大數(shù)據(jù)的數(shù)據(jù)挖掘和應(yīng)用。
那么用大數(shù)據(jù)主要能干什么?
一個是總結(jié)過去,另一個是掌握現(xiàn)在,還有預(yù)測未來。
在這次疫情過程中,我們要不斷發(fā)現(xiàn)每天和過去發(fā)生的事情,積極歸納總結(jié)。我們是希望知道我們當下的狀態(tài),并對未來做一些預(yù)估,我們可能關(guān)心很多的題,比如大家都關(guān)心什么時候會出現(xiàn)拐點?
這就是數(shù)據(jù)挖掘的概念。數(shù)據(jù)挖掘是從大量的數(shù)據(jù)中挖掘有應(yīng)用價值的信息,關(guān)鍵問題是怎么樣把這些信息運用到我們的決策過程中,這里有一系列算法要做。在這次疫情的分析過程中,我們也用到了各種不同的算法去對疫情和未來的反彈的問題進行預(yù)估。
要用數(shù)據(jù)挖掘的方法去建模,首先對業(yè)務(wù)的理解非常重要,第2是要對數(shù)據(jù)進行探索,知道我需要什么樣的數(shù)據(jù)。
在這個基礎(chǔ)上對數(shù)據(jù)進行準備,包括數(shù)據(jù)的收集和整理,甚至有時候還要去購買一些數(shù)據(jù),對數(shù)據(jù)的質(zhì)量要進行檢查,另外要對中間的變量轉(zhuǎn)化等等做一系列工作。建模完成后還有個很重要的工作,對模型進行有效評估,評估模型是否準確,然后部署到系統(tǒng)中,讓他真正發(fā)揮作用。
中央指導(dǎo)組的副組長,中央政法委秘書長陳一新強調(diào)說,疫情防控指揮系統(tǒng)的決策力、執(zhí)行力,是武漢保衛(wèi)戰(zhàn)能否打贏的前提條件和關(guān)鍵的環(huán)節(jié)。決策力、執(zhí)行力就要用到數(shù)據(jù),所以他也提到了一句,要加大數(shù)據(jù)的分析,時刻要心中有數(shù)。
在我們的決策過程中,這是一種思維方式,建立健全有力有序有效的指揮機制,實現(xiàn)疫情防控的科學(xué)化、精準化、高效化,尤其是科學(xué)化和精準化以及高效化,這些東西,都離不開大數(shù)據(jù)的有力支持。
在這個基礎(chǔ)上,總書記也提出了他的指示,鼓勵運用大數(shù)據(jù)、人工智能、云計算等數(shù)字技術(shù),在疫情監(jiān)測分析、病毒溯源、防控救治、資源調(diào)配等方面發(fā)揮更好的支撐作用。所以在從各個方面對大數(shù)據(jù)的重要性的強調(diào)都很多。
舉個例子,如果一個人平均傳播2.6個人的話,傳播到第5代,可以快速擴展到368個人。所以這次武漢爆發(fā)我們究竟關(guān)心什么東西呢?
從整個事件的本身去理解,有病患發(fā)展的一個周期。我們把它分成潛伏期、待確診、治療以及出院,包括密切接觸留院的觀察者、疑似患者、確診患者、重癥患者等等。
這里很重要是治愈和死亡,現(xiàn)在提到的很多死亡率和治愈率的數(shù)據(jù)講法是不準確的。
因為很多專家都說了,疫情傳播隱藏期大概14天左右,比如湖北是我國第1個大型爆發(fā)的。第2個是在溫州,然后還有北京、深圳等等城市,那么這些城市發(fā)現(xiàn)第1例的時候,究竟在什么時間點會出現(xiàn)大的一個爆發(fā),也會出現(xiàn)一個波峰?
我們分析了這些很多城市之后,一般大概是在7~9天左右的時間,那么湖北省的第1個波峰是在9天,在其他的省一般在9天左右,也就是說當發(fā)現(xiàn)第1例患者,可以通過患者者來簡單預(yù)測未來在什么時間點,可能預(yù)估到會出現(xiàn)的一個小高峰。
另外很重要的一點,從現(xiàn)有的疫情來確認人數(shù),看疫情發(fā)展的一個趨勢。
在早期的時候,我們都在找拐點,但究竟什么是拐點?
我們一開始做分析的時候,我們找第1個拐點就是說讓增速能不能先降下來。第2個拐點是讓絕對值能下來。
數(shù)學(xué)上我們就在講的第1個是增速,其后我們希望找的是絕對值的減少。
另外還有一個很重要的點,要預(yù)估這次疫情的發(fā)展,潛在可能有多少人被感染、大概在什么時間點會達到高峰期?我們用了邏輯回歸的理念。邏輯回歸這條曲線有開始期,有加速期、有減速期以及飽和期。
我們做了這么一個預(yù)估,應(yīng)該是在79,000多將近8萬的這樣的一個數(shù)字。然后具體的時間大概應(yīng)該是在3月14號左右,全國這個增量大概會在10人以下。
在收集了大量的數(shù)據(jù)之后,還有一個很重要的一點是利用模型預(yù)測病毒繁衍。
我要講的第三部分是大數(shù)據(jù)在抗疫中的作用。
一、大數(shù)據(jù)支撐人員返程
我們每天對全國的疫情,都有一個很明確的分析,利用大數(shù)據(jù)追蹤行程追溯,這個人病源是從什么地方來,看從他流動的趨勢,利用交通信息數(shù)據(jù)精密追蹤這個人的動向。
二、大數(shù)據(jù)防控預(yù)警平臺
三、大數(shù)據(jù)可以追溯傳染病源頭
四、大數(shù)據(jù)分析人員流動軌跡
五、大數(shù)據(jù)助力物資調(diào)運
大數(shù)據(jù)可以幫助我們進行物資的調(diào)運,什么地方缺什么東西,缺的量是多少,什么地方可以快速的把這些物資可以快速的運用到這個地方去。這些技術(shù)早在20年前,沃爾瑪用來解決了他倉儲的問題,區(qū)塊鏈在打假這方面也很重要,尤其在利用區(qū)塊鏈的物資調(diào)配來辨別醫(yī)療物資的真假方面。
首先是要進行分類的審批,對于醫(yī)療防護用品的企業(yè)鼓勵迅速復(fù)工,這很重要,廣東的佛山市開發(fā)了一個叫疫情數(shù)據(jù)報送平臺,動態(tài)的掌握了企業(yè)生產(chǎn)的和員工的數(shù)據(jù)。
還有一個很重要的問題,如果當?shù)氐囊咔楸容^嚴重,務(wù)工的人員不愿意去也是很重要的問題。對政府來說,在不同的地方復(fù)工,首先批準的是基本上沒有疫情的地方,務(wù)工人員也會愿意到這個地方來。
每個人得病,這都是其實是一個很隱私的事情。那么在抗議過程,在隱私保護方面,哪些可以對隱私的保護能夠起到比較好的作用?
目前,為做好新冠肺炎疫情聯(lián)防聯(lián)控中的個人信息保護,積極利用包括個人信息在
內(nèi)的大數(shù)據(jù)支撐聯(lián)防聯(lián)控工作。中央網(wǎng)信辦日前公開發(fā)布《關(guān)于做好個人信息保護利用大數(shù)據(jù)支撐聯(lián)防聯(lián)控工作的通知》,明確為疫情防控、疾病防治收集的個人信息,不得用于其他用途。任何單位和個人未經(jīng)被收集者同意,不得公開姓名。
在大數(shù)據(jù)使用里邊非常重要的一個理念,也是隱私的保護的問題。在這個時間點我們首先要解決的是疫情防控問題,但是同時我們一定要注意隱私的一個保護。
區(qū)塊鏈的優(yōu)勢在于,它的一個加密哈希算法里包括了數(shù)據(jù)的收集、數(shù)據(jù)的存儲、數(shù)據(jù)的共享、數(shù)據(jù)的使用,以及數(shù)據(jù)在什么時間內(nèi)銷毀的問題。這里包括安全的采集、存儲的安全,以及一系列加密手段和加密算法。
所以我們希望隨著疫情逐漸趨于平坦,可以把更多時間用在隱私保護工作上,其實對這些人的隱私的保護,一樣的是很重要。
比如利用數(shù)字簽名保障數(shù)據(jù)收集的真實可靠。
隨著疫情逐漸向平穩(wěn)過渡,希望政府在今后的過程中,能夠把已經(jīng)收集到的一些數(shù)據(jù)的使用能夠提出一些更加完整、更加系統(tǒng)的些方法,每一個人私密和隱私進行一定的保護。
對此我們也提出了一個概念,叫密管中心。利用大數(shù)據(jù)平臺,通過一個嚴格的流程程,使得數(shù)據(jù)和使用者嚴格遵守隱私保護的體系和理念,對我們每一個人來講,都希望有這樣的隱私權(quán)的。
另外區(qū)塊鏈在這個過程中,然后可以使社區(qū)的防疫更加精準。其不可篡改性,和精確追蹤的去穿透式能力,可以更加準確的掌握每一個人的行動和軌跡。
另一點是助力解決中小微企業(yè)的融資的問題,區(qū)塊鏈在企業(yè)的信用方面能夠發(fā)揮很多的作用,讓信用更加真實可靠。
大家也知道前一段時間,關(guān)于捐贈物品使用的是不是合理,是不是規(guī)范的問題,其實區(qū)塊鏈技術(shù)可以在這方面發(fā)揮一定的作用,利用他的防篡改、可追溯性,接受公眾的監(jiān)督。
總體來說,這些新一代技術(shù),像區(qū)塊鏈、大數(shù)據(jù)、互聯(lián)網(wǎng)、人工智能,在很多方面都是相互有關(guān)聯(lián)作用的。每一種技術(shù)都會有自己的缺陷,不同技術(shù)之間也會有一定的相互補充。所以好多技術(shù)在很多時候都可以綜合應(yīng)用。
我覺得大數(shù)據(jù)跟人工智能更加密切一點,大數(shù)據(jù)跟區(qū)塊鏈也有一定的兼容性,所以我們在利用大數(shù)據(jù)各種各樣的優(yōu)勢的同時,也可以考慮利用區(qū)塊鏈去保護隱私,讓其他的東西更的透明。比如中小企業(yè)的信用,更加真實可靠,讓捐贈更加透明,這些東西都是區(qū)塊鏈的優(yōu)勢。