用大數(shù)據(jù)技術整合數(shù)據(jù)生產(chǎn)要素、賦能工業(yè)轉型
早在2015年,武漢東湖大數(shù)據(jù)交易中心股份有限公司就已成立,成為國內最早成立的數(shù)據(jù)流通和交易市場之一。從脫敏合規(guī)政務數(shù)據(jù),再到企業(yè)和產(chǎn)業(yè)數(shù)據(jù),這家公司一步步摸索,從價值數(shù)據(jù)資源流通、到技術驅動數(shù)據(jù)形成資產(chǎn),不斷賦能企業(yè)和產(chǎn)業(yè)場景化應用,通過基于公司多源多模態(tài)數(shù)據(jù)融合認知計算技術賦能行業(yè)場景的智能決策平臺的技術能力,面向人工智能、保險、能源、招商等多個行業(yè)提供技術服務。
“如果說建設數(shù)據(jù)交易的第三方市場是數(shù)據(jù)要素流通和交易產(chǎn)業(yè)1.0的話,我們已經(jīng)走到了2.0。基于多源多模態(tài)數(shù)據(jù)融合認知計算技術賦能行業(yè)場景的智能決策平臺,在具體的應用場景中也可以融合其它數(shù)據(jù)智能技術解決企業(yè)、產(chǎn)業(yè)的應用痛點問題,有了這些價值應用,數(shù)據(jù)要素流通和交易才能打通了‘任督二脈’,疏通這些數(shù)字經(jīng)濟場景中的‘毛細血管’才是這個產(chǎn)業(yè)的機會點?!蔽錆h東湖大數(shù)據(jù)交易中心股份有限公司負責人杜小軍說。
當前,由于疫情原因,地方政府在招商及企業(yè)在擴產(chǎn)、選址上都徒增難度,“云招商”成為國家到地方出臺穩(wěn)增長政策的高頻詞匯,成為各地園區(qū)招商部門開拓發(fā)展的新方式。
就全國市場而言,面對數(shù)億條的企業(yè)資質明細、數(shù)千萬招投標信息、數(shù)百萬條基金及土地數(shù)據(jù)……如何整合這些數(shù)據(jù)要素,從產(chǎn)業(yè)賦能的角度做好精準招商服務?杜小軍表示,根本上是要利用好大數(shù)據(jù)、人工智能等技術工具,為地方園區(qū)招商、為產(chǎn)業(yè)發(fā)展賦能;就好比大海撈針,從海量的數(shù)據(jù)中打撈出一根針來,形成以“招、管、服”為區(qū)域經(jīng)濟發(fā)展的三駕馬車。
為此,公司近年來陸續(xù)推出了產(chǎn)業(yè)鏈招商圖譜,全面梳理區(qū)域產(chǎn)業(yè)結構,以產(chǎn)業(yè)鏈全景式圖譜為視角,精準繪制招商行動路線圖。
近日,記者走進能科數(shù)智,公司正組織員工對省第十三次黨代會精神展開學習,作為一家“年輕”的數(shù)字化企業(yè),執(zhí)行力和創(chuàng)新力是企業(yè)賦予這群年輕人的新標簽。
能科數(shù)智科技有限公司咨詢部顧問楊飛霞說:“本次我們學習了省第十三次黨代會精神,感觸非常深刻,因為里面提到數(shù)字化轉型這塊,對于我們這種科技型的公司,目標就是提質、增效、降本、綠色、節(jié)能,接下來,我們也會把省第十三次黨代會精神貫徹到實際工作中?!?
據(jù)了解,平臺可實現(xiàn)現(xiàn)實工廠與虛擬工廠虛實結合與數(shù)據(jù)打通,為推動貴陽開磷化肥有限公司由傳統(tǒng)的磷化工企業(yè)不斷向生產(chǎn)綠色化、裝備智能化、過程可視化、管理信息化方向發(fā)展賦予了新動能。
能科數(shù)智科技有限公司總經(jīng)理助理付思思說:“我們依托于先進的工業(yè)軟件以及電力電子信息技術,助力區(qū)域優(yōu)化升級和產(chǎn)業(yè)鏈的完善,這一塊也為客戶提供了以工業(yè)互聯(lián)網(wǎng)為核心的數(shù)字化、網(wǎng)絡化、智能化的解決方案?!?
數(shù)據(jù)湖的分析和機器學習
在此之前討論了使用Presto和ApacheSpark在數(shù)據(jù)湖上進行更快的SQL查詢。SQL只是分析數(shù)據(jù)的一種方法,盡管它非常重要并且通常是第一步。此外,考慮采用Power BI、Tableau或Qlik等商業(yè)智能工具;Jupyter、Zeppelin或Spark notebooks;, scikit-learn、SparkML或KNIME等機器學習技術;TensorFlow或PyTorch等深度學習技術。
超大規(guī)模云計算供應商擁有自己的分析和機器學習工具,用戶可以連接到他們的數(shù)據(jù)湖。
Amazon Athena使用Presto和Hive對AmazonS3中的數(shù)據(jù)執(zhí)行SQL查詢。Amazon EMR是一個基于云計算的大數(shù)據(jù)平臺,用于使用Apache Spark、Apache Hive和Presto等開源分析框架運行大規(guī)模分布式數(shù)據(jù)處理作業(yè)、交互式SQL查詢和機器學習應用程序。Amazon SageMaker是一項完全托管的服務,用于構建、訓練和部署機器學習模型。
Azure Data Lake Analytics (ADLA)是一種傳統(tǒng)的按需分析作業(yè)服務,可以簡化大數(shù)據(jù),并使用U-SQL,也就是SQL+C#。ADLA正被Azure Synapse Analytics所取代,這是一種將數(shù)據(jù)集成、企業(yè)數(shù)據(jù)倉庫和大數(shù)據(jù)分析結合在一起的無限分析服務。它讓用戶可以自由地根據(jù)自己的條件查詢數(shù)據(jù),可以使用無服務器選項,也可以大規(guī)模使用專用選項。Synapse結合了數(shù)據(jù)湖、企業(yè)數(shù)據(jù)倉庫和操作數(shù)據(jù)查詢功能,可以自動從ADLA和數(shù)據(jù)倉庫遷移數(shù)據(jù)和代碼。Synapse與Azure機器學習、Azure認知服務和Power BI進行了深度集成。