當前位置：首頁 > 物聯(lián)網(wǎng) > 智能應(yīng)用

新聞大數(shù)據(jù)的增值應(yīng)用

時間：2019-06-21 18:11:11

關(guān)鍵字：大數(shù)據(jù) 智能

手機看文章

掃描二維碼
隨時隨地手機看文章

[導(dǎo)讀] 新聞大數(shù)據(jù)借助于領(lǐng)域詞表、大數(shù)據(jù)和人工智能技術(shù)，將雜亂無章的新聞條目數(shù)據(jù)按照領(lǐng)域詞表自動重新聚類，并在聚類的基礎(chǔ)上，進行數(shù)據(jù)重組和集成，形成具有較大價值的專題數(shù)據(jù)，提供給機構(gòu)和讀者。

新聞大數(shù)據(jù)借助于領(lǐng)域詞表、大數(shù)據(jù)和人工智能技術(shù)，將雜亂無章的新聞條目數(shù)據(jù)按照領(lǐng)域詞表自動重新聚類，并在聚類的基礎(chǔ)上，進行數(shù)據(jù)重組和集成，形成具有較大價值的專題數(shù)據(jù)，提供給機構(gòu)和讀者。

新聞大數(shù)據(jù)是報社的制勝法寶

互聯(lián)網(wǎng)媒體對傳統(tǒng)報社構(gòu)成了較大沖擊，經(jīng)濟效益顯著下滑，讀者數(shù)量也急劇減少。報社賴以生存的新聞報道已經(jīng)被今日頭條、手百等互聯(lián)網(wǎng)媒體所取代，讀者通過手機百度等媒體就可以全面了解當前熱點、新聞、時政等新聞內(nèi)容，導(dǎo)致報社讀者大量流失，讀者的流失又直接導(dǎo)致了廣告商投入和報紙銷量的減少。

針對互聯(lián)網(wǎng)媒體的沖擊，報社也投入了大量資金以應(yīng)對日趨惡化的經(jīng)營環(huán)境，例如，建立新聞網(wǎng)站、移動新聞客戶端、融媒體建設(shè)等。但大多收效甚微，主要原因是——雖然新聞的生產(chǎn)方式、經(jīng)營方式已經(jīng)數(shù)字和互聯(lián)網(wǎng)化，提高了新聞的生產(chǎn)和傳播效率，但是其經(jīng)營的內(nèi)容沒有改變，依然是售賣新聞模式，該模式同手機百度等媒體相比，缺乏內(nèi)容競爭力，讀者自然就不買賬了。

不過，報社也有其自身的競爭力。以參考消息為例，參考消息完成了自1953年至今所有參考消息版面的數(shù)字化加工工作，加工后的數(shù)字內(nèi)容以PDF、數(shù)據(jù)庫、XML等多種方式存儲，為大數(shù)據(jù)增值服務(wù)提供了數(shù)據(jù)支撐。參考消息大數(shù)據(jù)集中體現(xiàn)了中國自建國以來，國外媒體對中國外交、經(jīng)濟、政治、民生等方面的報道及觀點，其承載的文化內(nèi)容和歷史內(nèi)涵都是不言而喻的，對研究中國國情及發(fā)展歷程具有很大的文獻情報價值，對圖書館、機構(gòu)、社會組織、企業(yè)、讀者都有較強的內(nèi)容吸引力，也是今日頭條、手百等媒體不能給予讀者的內(nèi)容。

大數(shù)據(jù)增值應(yīng)用有哪些技術(shù)內(nèi)容?

大數(shù)據(jù)增值服務(wù)涉及到數(shù)據(jù)的感知與采集、數(shù)據(jù)的存儲、數(shù)據(jù)的挖掘分析與重組、數(shù)據(jù)的展現(xiàn)與交互技術(shù)。

數(shù)據(jù)的感知與采集是獲取并對數(shù)據(jù)進行預(yù)處理的技術(shù)。例如，新聞機構(gòu)一般都以數(shù)據(jù)庫方式存儲新聞條目，這就需要系統(tǒng)能夠識別數(shù)據(jù)庫存儲的新聞條目，并按照預(yù)定規(guī)則對新聞條目預(yù)處理后，進入到大數(shù)據(jù)存儲系統(tǒng)。再如，利用爬蟲技術(shù)從新聞網(wǎng)站采集新聞條目，并按照預(yù)定規(guī)則對采集的新聞條目預(yù)處理后，進入到大數(shù)據(jù)存儲系統(tǒng)。

大數(shù)據(jù)的存儲技術(shù)非常重要，直接關(guān)系到大數(shù)據(jù)增值服務(wù)系統(tǒng)的響應(yīng)和運算能力，從系統(tǒng)的響應(yīng)和運算能力考慮，傳統(tǒng)的關(guān)系型數(shù)據(jù)庫存儲、數(shù)據(jù)集中式存儲技術(shù)已不能滿足大數(shù)據(jù)的存儲與數(shù)據(jù)運算需求。需要運用新的數(shù)據(jù)存儲和運算技術(shù)，以滿足不斷增長的數(shù)據(jù)存儲需求和高并發(fā)數(shù)據(jù)的運算能力。

新聞大數(shù)據(jù)的增值服務(wù)主要是對新聞數(shù)據(jù)進行挖掘和重組，對機構(gòu)和讀者提供數(shù)據(jù)檢索和專題數(shù)據(jù)服務(wù)。例如，某機構(gòu)要組織“記錄濰坊，見證歷史”活動，可以通過新聞大數(shù)據(jù)系統(tǒng)挖掘濰坊發(fā)展過程中涉及的熱點、大事件、政策、民生變化等新聞條目，并按照時間線和熱點、大事件、政策、民生進行排序和歸類，生成專題數(shù)據(jù)，活動參與者可以通過瀏覽器、手機瀏覽專題數(shù)據(jù)。再如，對濰坊文化、歷史感興趣的讀者都可以通過檢索和專題數(shù)據(jù)來感知濰坊。

數(shù)據(jù)的展現(xiàn)和交互技術(shù)直接影響用戶使用大數(shù)據(jù)服務(wù)的體驗，也影響到大數(shù)據(jù)服務(wù)的傳播和推廣。面向機構(gòu)提供大數(shù)據(jù)服務(wù)時，系統(tǒng)可以部署到機構(gòu)內(nèi)部(大數(shù)據(jù)鏡像服務(wù))，也可以部署在云端，并提供標準或者個性化的檢索與閱讀頁面，機構(gòu)讀者可以在機構(gòu)內(nèi)部和外部通過移動終端(微信小程序)、PC瀏覽器訪問大數(shù)據(jù)服務(wù);面向讀者提供服務(wù)時，充分考慮到新聞機構(gòu)已有的系統(tǒng)建設(shè)，提供數(shù)據(jù)服務(wù)接口，為新聞機構(gòu)已有系統(tǒng)提供數(shù)據(jù)獲取服務(wù)。

大數(shù)據(jù)增值應(yīng)用實現(xiàn)需要的核心技術(shù)

大數(shù)據(jù)服務(wù)首先要解決大數(shù)據(jù)的存儲與高并發(fā)運算需求。大數(shù)據(jù)的特征是高價值的海量數(shù)據(jù)、數(shù)據(jù)來源渠道眾多、適合于數(shù)據(jù)的挖掘和重組、支持高并發(fā)運算?；诖髷?shù)據(jù)的上述特征，采用傳統(tǒng)的數(shù)據(jù)集中式存儲和關(guān)系型數(shù)據(jù)庫技術(shù)已經(jīng)不能滿足大數(shù)據(jù)服務(wù)需求，需要采用新的存儲和數(shù)據(jù)庫技術(shù)。

大數(shù)據(jù)服務(wù)宜采用分布式存儲以提高大數(shù)據(jù)的存儲擴展能力。考慮到大數(shù)據(jù)硬件建設(shè)成本和便捷的擴展性，服務(wù)器應(yīng)采用價格低廉的普通PC服務(wù)器，每臺PC服務(wù)器通過網(wǎng)絡(luò)連接，工作互相不受干擾，數(shù)據(jù)存儲到自身的硬盤上，當需要擴展數(shù)據(jù)存儲時，直接在網(wǎng)絡(luò)中加入PC服務(wù)器即可。所有接入存儲網(wǎng)絡(luò)的PC服務(wù)器在分布式操作系統(tǒng)的控制下，自動保存數(shù)據(jù)的多個副本到不同的PC服務(wù)器，以提高數(shù)據(jù)的容錯性，可以在不同服務(wù)器之間直接拷貝和復(fù)制數(shù)據(jù)，保持各服務(wù)器的負載平衡。

系統(tǒng)應(yīng)用分布式基礎(chǔ)架構(gòu)Hadoop技術(shù)，硬件可以基于普通PC 服務(wù)器，存儲基于服務(wù)器自帶的本地硬盤，操作系統(tǒng)采用Linux。上述基礎(chǔ)架構(gòu)擁有較高的存儲擴展能力和內(nèi)在的故障容錯能力以及數(shù)據(jù)保障機制，可以降低每TB數(shù)據(jù)的處理成本，為大數(shù)據(jù)處理提供技術(shù)和性價比支撐。數(shù)據(jù)庫采用Hbase，HBase是一個分布式的、面向列的開源數(shù)據(jù)庫。利用HBase和Hadoop技術(shù)，可在廉價PC 服務(wù)器上搭建大規(guī)模結(jié)構(gòu)化存儲集群。

大數(shù)據(jù)服務(wù)宜采用云計算以提高大數(shù)據(jù)的運算能力，運算能力包括檢索、數(shù)據(jù)挖掘、重組能力。由不同PC服務(wù)器組成的分布式存儲系統(tǒng)可以構(gòu)建云計算，利用PC服務(wù)器自身的運算能力，對自身存儲的數(shù)據(jù)進行運算，每臺PC服務(wù)器的運算結(jié)果匯總后，返回給數(shù)據(jù)請求者。

利用Hadoop的MapReduce技術(shù)，可以控制多臺PC服務(wù)器完成數(shù)據(jù)的并發(fā)運算。例如，讀者在前端的一個檢索請求，會觸發(fā)MapReduce發(fā)起云計算，MapReduce將調(diào)用多臺PC服務(wù)器參與運算，然后將每臺服務(wù)器的運算結(jié)果匯總并返回給檢索系統(tǒng)。

本站聲明：本文章由作者或相關(guān)機構(gòu)授權(quán)發(fā)布，目的在于傳遞更多信息，并不代表本站贊同其觀點，本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者，如若文章內(nèi)容侵犯您的權(quán)益，請及時聯(lián)系本站刪除。

換一批

與傳統(tǒng)的驅(qū)動方式相比，共陰恒流驅(qū)動在能效有哪些優(yōu)勢

LED驅(qū)動電源的輸入包括高壓工頻交流(即市電)、低壓直流、高壓直流、低壓高頻交流(如電子變壓器的輸出)等。

關(guān)鍵字：驅(qū)動電源

[電源]

工業(yè)電機驅(qū)動電源設(shè)計：反電動勢抑制與過流保護的集成方案

在工業(yè)自動化蓬勃發(fā)展的當下，工業(yè)電機作為核心動力設(shè)備，其驅(qū)動電源的性能直接關(guān)系到整個系統(tǒng)的穩(wěn)定性和可靠性。其中，反電動勢抑制與過流保護是驅(qū)動電源設(shè)計中至關(guān)重要的兩個環(huán)節(jié)，集成化方案的設(shè)計成為提升電機驅(qū)動性能的關(guān)鍵。

關(guān)鍵字：工業(yè)電機驅(qū)動電源

[電源]

如何解決 LED 驅(qū)動電源的易損壞問題

LED 驅(qū)動電源作為 LED 照明系統(tǒng)的 “心臟”，其穩(wěn)定性直接決定了整個照明設(shè)備的使用壽命。然而，在實際應(yīng)用中，LED 驅(qū)動電源易損壞的問題卻十分常見，不僅增加了維護成本，還影響了用戶體驗。要解決這一問題，需從設(shè)計、生...

關(guān)鍵字：驅(qū)動電源照明系統(tǒng) 散熱

[電力電工電路]

LED設(shè)計中LED驅(qū)動電源的公式

根據(jù)LED驅(qū)動電源的公式，電感內(nèi)電流波動大小和電感值成反比，輸出紋波和輸出電容值成反比。所以加大電感值和輸出電容值可以減小紋波。

關(guān)鍵字： LED 設(shè)計驅(qū)動電源

[汽車電子]

EV主驅(qū)IGBT隔離驅(qū)動電源方案選擇問題探討

電動汽車(EV)作為新能源汽車的重要代表，正逐漸成為全球汽車產(chǎn)業(yè)的重要發(fā)展方向。電動汽車的核心技術(shù)之一是電機驅(qū)動控制系統(tǒng)，而絕緣柵雙極型晶體管(IGBT)作為電機驅(qū)動系統(tǒng)中的關(guān)鍵元件，其性能直接影響到電動汽車的動力性能和...

關(guān)鍵字：電動汽車新能源驅(qū)動電源

[電源]

合理的驅(qū)動電源方案成為大功率區(qū)域照明的主流選擇

在現(xiàn)代城市建設(shè)中，街道及停車場照明作為基礎(chǔ)設(shè)施的重要組成部分，其質(zhì)量和效率直接關(guān)系到城市的公共安全、居民生活質(zhì)量和能源利用效率。隨著科技的進步，高亮度白光發(fā)光二極管(LED)因其獨特的優(yōu)勢逐漸取代傳統(tǒng)光源，成為大功率區(qū)域...

關(guān)鍵字：發(fā)光二極管驅(qū)動電源 LED

[消費電子]