www.久久久久|狼友网站av天堂|精品国产无码a片|一级av色欲av|91在线播放视频|亚洲无码主播在线|国产精品草久在线|明星AV网站在线|污污内射久久一区|婷婷综合视频网站

當前位置:首頁 > 物聯(lián)網(wǎng) > 智能應用
[導讀] 在了解一件自己完全沒有涉足過的事情之前,筆者喜歡使用“一縱兩橫”的思維去學習了解,這樣能夠快速的幫助自己構建知識體系。學習一個新學科時,可以看其一縱,其整個歷史至今的發(fā)展過程。然后看其兩橫,一橫是不同人對于其的評價即定義,還有一橫是不同學科或領域與其的聯(lián)系和區(qū)別。抓住這一縱兩橫的思維,可以幫助我們快速了解一個新的學科或者一個新的領域。

 在了解一件自己完全沒有涉足過的事情之前,筆者喜歡使用“一縱兩橫”的思維去學習了解,這樣能夠快速的幫助自己構建知識體系。學習一個新學科時,可以看其一縱,其整個歷史至今的發(fā)展過程。然后看其兩橫,一橫是不同人對于其的評價即定義,還有一橫是不同學科或領域與其的聯(lián)系和區(qū)別。抓住這一縱兩橫的思維,可以幫助我們快速了解一個新的學科或者一個新的領域。

所謂的“一縱”,就是事物本身的歷史發(fā)展,從最開始的誕生到當今的發(fā)展情況,可能有的人會覺得無聊或者沒有必要,但筆者想告訴讀者的是,這是進入一個事物領域的最基本素質,能夠很好地體現(xiàn)著專業(yè)素養(yǎng)。而所謂的“兩橫”,就是一方面比較該領域里不同的專家學者或者提出者(創(chuàng)造者),以及其他領域的人對于該事物的闡述理解或者評價態(tài)度;另一方面就是比較已有領域學科或者相近領域學科和該事物的異同點或者聯(lián)系與區(qū)別。但完成了這“一縱兩橫”后,不僅是從本質上了解事物,同時也和自己已有的知識架構聯(lián)系在一起,有了自己的一些理解感悟。

 

大數(shù)據(jù)起源背景

筆者第一次正式接觸大數(shù)據(jù),是閱讀維克托的《大數(shù)據(jù)時代》,當然是翻譯的中文版,是浙江人民出版社的,在《大數(shù)據(jù)時代》書中提到,大數(shù)據(jù)的發(fā)展來源,大數(shù)據(jù)的特征,著者維克托傳遞出大數(shù)據(jù)時代來臨了的信號,同時我們數(shù)據(jù)的思考和應用都應該有巨大的思想變革,這樣才能適應大數(shù)據(jù)時代的發(fā)展。

書中對大數(shù)據(jù)的三個核心思想:數(shù)據(jù)不是隨機樣本,而是全部數(shù)據(jù);數(shù)據(jù)不是精確性,而是混雜性;數(shù)據(jù)間不是因果關系,而是相關關系;

維克托圍繞著三個核心思想,闡述了我們思維、生活以及商業(yè)的變革,同時筆者有點小感悟,那就是我們的學習或者教育是不是也需要變革,針對這三個核心思想對我們學習或者教育進行改革,當然這不是我們重點,這就當做是筆者在拋磚引玉 。

既然大數(shù)據(jù)這個概念能夠催生,那么在實際的生活必然有著對應的實際應用。那么這又是這樣的情況了?這就聊到了 hadoop 框架的產生背景了,進入 21 世紀以來,隨著信息技術和信息社會的高速發(fā)展,信息或者數(shù)據(jù)在不斷地增長,而且是超幾何的瘋狂增長。特別是在 Web2.0 時代,人們對于信息的產生和索取需求在瘋狂增長,這樣在瀏覽器端產生的數(shù)據(jù)在 TB 級別或者 PB 級別在增長,億萬網(wǎng)民用戶的瀏覽數(shù)據(jù)記錄以及日夜增長的網(wǎng)站,這些海量數(shù)據(jù)如何進行存儲和分析計算,就成為擺在我們的面前,同時也是 Google 這樣的搜索引擎公司天然就需要面對的現(xiàn)實和需要解決的問題。

Google-Alphabet 的新老三篇文章,被稱之為大數(shù)據(jù)領域的三駕馬車:

Google 老三架馬車: GFS、 MapReduce、 BigTable

Google 新三架馬車: Dremel、 Pregel、 Caffeine

大數(shù)據(jù)的應用開發(fā)框架,你一定聽過 Hadoop,對就是它!Hadoop 是 Apache(這樣說應該不準確,就先這樣理解) 基于 Google 的前三篇文章實現(xiàn)的開源框架,現(xiàn)在是 Apache 下一個頂級項目。大家可以訪問Apache的Hadoop官網(wǎng)看一看。

 

Hadoop 的起源背景之 GFS

大數(shù)據(jù)解決本質問題之一,就是對海量的數(shù)據(jù)如何進行存儲。海量的數(shù)據(jù)并不是傳統(tǒng)的 MB 或者 GB 級數(shù)據(jù),而是 TB、 PB 級的數(shù)據(jù)概念?;蛟S你沒有啥直觀的感覺,我們用信息數(shù)據(jù)的量級來進行表明一下,你就會明白了。

簡單來說, 1.2ZB 字節(jié)數(shù)據(jù),如果儲存在只讀光盤上,那么這些光盤可以堆成五堆,每一堆都可以伸到月球。公元前 3 世紀,埃及的托勒密二世竭力收集了當時所有的書寫作品,全部儲存在亞歷山大圖書館,代表著當時世界上所有的知識量,但是在數(shù)字數(shù)據(jù)洪流涌向世界后,每一個人都可以獲取大量的數(shù)據(jù)信心,相當與當時壓力山大圖書館儲存的數(shù)據(jù)總量的 320 倍。從上面的小故事就可以知道,現(xiàn)在數(shù)字信息的龐大,如此海量的數(shù)據(jù)需要儲存,傳統(tǒng)的磁盤陣列儲存已經無法滿足這樣的需求了,畢竟磁盤陣列價格是昂貴的。這就需要低成本、高效率、高可靠的儲存設計。

2003 年, Google 發(fā)表了 文章,解決了這個問題。在文章中闡述了解決海量數(shù)據(jù)儲存的設計思想。同時在 Apache 下Lucene 的子項目研究下,實現(xiàn)了海量數(shù)據(jù)的存儲設計:分布式文件系統(tǒng),也就是 HDFS(Hadoop Distributed File System)。

Hadoop 的起源背景之 MapReduce大數(shù)據(jù)解決本質問題之二,就是海量數(shù)據(jù)如何進行計算。在編程計算里,有并行編程計算框架,有過了解的人就知道,這并不是什么新興的技術。同樣 Google 在 2004 年發(fā)表了 文章,文章闡述了基于分布式儲存的海量數(shù)據(jù)并行計算解決方案思想。開源社區(qū) Apache 的 Hadoop 項目研究實現(xiàn)了MapReduce 并行計算框架,將計算與數(shù)據(jù)在本地進行,將數(shù)據(jù)分為 Map 和Reduce 階段。簡單闡述就是 MapReduce 編程模型:把一個大任務拆分成小任務,再進行匯總。

Hadoop 的起源背景之 BigTable

大數(shù)據(jù)解決本質問題之三,就是對于海量的數(shù)據(jù)進行分析處理。數(shù)據(jù)在儲存后,其作用就是提供檢索和查閱,這才是搜索引擎的功效,也是Google 的強大技術支持。那么提高查詢和利用數(shù)據(jù)的效率就是需要解決的重點。到這里就需要有一定的數(shù)據(jù)庫相關知識 (建議可以查閱一下關于數(shù)據(jù)庫的起源以及歷史發(fā)展),數(shù)據(jù)庫的產生就是為了查詢和利用數(shù)據(jù)的效率提高,然而現(xiàn)有的數(shù)據(jù)庫并不能滿足基于分布式儲存的需求。結構化的數(shù)據(jù)庫 (SQL) 和非結構化的數(shù)據(jù) (NoSQL)。

Google 工程師在 2006 年發(fā)表了 文章,文中闡述了基于分布式儲存的數(shù)據(jù)庫設計思想。就這樣數(shù)據(jù)庫時代從關系型數(shù)據(jù)庫進入了非關系型數(shù)據(jù)庫時代,一張大表 BigTable 設計思想, BigTable 就是把所有的數(shù)據(jù)保存到一張表中,同時采用冗余方式 (提高效率和可靠性,這種冗余的方式是最常用的手段,無論是在通信領域,或者自然語言處理領域、語音處理等等), 基于其設計思想就開源實現(xiàn)了基于 HDFS 的非關系型數(shù)據(jù)庫(NoSQL 數(shù)據(jù)庫) HBase。

其實在我們常用的云盤或者網(wǎng)盤,其主要的設計思想就是這樣的,筆者常用的百度網(wǎng)盤也就類似于這樣分布式的儲存。筆者建議感興趣的讀者,可以閱讀 Google 的三篇文章,最好是原文 (雖然筆者的英文很爛),這樣我們就更能理解其設計思想的精髓。

搭建 Hadoop 環(huán)境準備

安裝虛擬機 VMWare、 Linux 操作系統(tǒng)。配置主機名和 I 靜態(tài) IP 地址、免密碼登錄設置。約定安裝目錄: /liwei/hadoop。配置好 JDK 的環(huán)境變量、準備好 Hadoop 安裝包。了解 Hadoop 的目錄結構以及對應的作用。

在學習大數(shù)據(jù)之前,我們應該知道對于 Hadoop 的環(huán)境搭建,有著三種方式:

本地模式,就是單機版的 Hadoop,筆者覺得完全沒有必要,因為 Hadoop的儲存原理本就是分布式的概念,同時不具備 HDFS,只能測試 MapReduce程序。全分布式集群,就是對每一個必須的節(jié)點都采用一個獨立的主機,擁有獨立的 IP 地址,真正意義的分布式集群概念,完全達到 Hadoop 的實際應用要求。偽分布式集群,我們學習最常用的一個環(huán)境搭建。就是采用一個主機,但是配置多個擁有獨立的虛擬節(jié)點,滿足 Hadoop 分布式的邏輯概念。具備 Hadoop 的所有功能,在單機上模擬一個分布式的環(huán)境。這也是我們在學習中建議采用的方式,因為筆者使用的是 Windows7 系統(tǒng),故而需要借助虛擬機。

 

Hadoop 環(huán)境搭建

Hadoop 分布式集群簡介!引言:學習大數(shù)據(jù),就需要自己搭建 Hadoop 的運行環(huán)境,這對于新手而言是一項困難的工作,特別是對于 Liunx 操作不熟悉的讀者而言,更是一大難題。但是學習部署自己的 Hadoop 環(huán)境是學習大數(shù)據(jù)的必經之路,也是必會技能之一。接下來跟筆者一起來搭建 Hadoop 集群環(huán)境吧!當然在 Windows 下也是支持部署 hadoop 的,不過這并不適合實際生產的需求,同時 Windows 不如 Liunx 性能穩(wěn)定等等因素,一次是來自 Apache 官網(wǎng)對于開發(fā)平臺的簡介。

GNU/Linux is supported as a development and production platform. Hadoop has been demonstrated on GNU/Linux clusters with 2000 nodes.Windows is also a supported platform but the followings steps are for Linux only. To set up Hadoop on Windows, see wiki page.

支持 GNU / Linux 作為開發(fā)和生產平臺。已經在具有 2000 個節(jié)點的GNU / Linux 集群上演示了 Hadoop。 Windows 也是受支持的平臺,但以下步驟僅適用于 Linux。要在 Windows 上設置 Hadoop,請參閱 Wiki 頁面。

本站聲明: 本文章由作者或相關機構授權發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內容真實性等。需要轉載請聯(lián)系該專欄作者,如若文章內容侵犯您的權益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

LED驅動電源的輸入包括高壓工頻交流(即市電)、低壓直流、高壓直流、低壓高頻交流(如電子變壓器的輸出)等。

關鍵字: 驅動電源

在工業(yè)自動化蓬勃發(fā)展的當下,工業(yè)電機作為核心動力設備,其驅動電源的性能直接關系到整個系統(tǒng)的穩(wěn)定性和可靠性。其中,反電動勢抑制與過流保護是驅動電源設計中至關重要的兩個環(huán)節(jié),集成化方案的設計成為提升電機驅動性能的關鍵。

關鍵字: 工業(yè)電機 驅動電源

LED 驅動電源作為 LED 照明系統(tǒng)的 “心臟”,其穩(wěn)定性直接決定了整個照明設備的使用壽命。然而,在實際應用中,LED 驅動電源易損壞的問題卻十分常見,不僅增加了維護成本,還影響了用戶體驗。要解決這一問題,需從設計、生...

關鍵字: 驅動電源 照明系統(tǒng) 散熱

根據(jù)LED驅動電源的公式,電感內電流波動大小和電感值成反比,輸出紋波和輸出電容值成反比。所以加大電感值和輸出電容值可以減小紋波。

關鍵字: LED 設計 驅動電源

電動汽車(EV)作為新能源汽車的重要代表,正逐漸成為全球汽車產業(yè)的重要發(fā)展方向。電動汽車的核心技術之一是電機驅動控制系統(tǒng),而絕緣柵雙極型晶體管(IGBT)作為電機驅動系統(tǒng)中的關鍵元件,其性能直接影響到電動汽車的動力性能和...

關鍵字: 電動汽車 新能源 驅動電源

在現(xiàn)代城市建設中,街道及停車場照明作為基礎設施的重要組成部分,其質量和效率直接關系到城市的公共安全、居民生活質量和能源利用效率。隨著科技的進步,高亮度白光發(fā)光二極管(LED)因其獨特的優(yōu)勢逐漸取代傳統(tǒng)光源,成為大功率區(qū)域...

關鍵字: 發(fā)光二極管 驅動電源 LED

LED通用照明設計工程師會遇到許多挑戰(zhàn),如功率密度、功率因數(shù)校正(PFC)、空間受限和可靠性等。

關鍵字: LED 驅動電源 功率因數(shù)校正

在LED照明技術日益普及的今天,LED驅動電源的電磁干擾(EMI)問題成為了一個不可忽視的挑戰(zhàn)。電磁干擾不僅會影響LED燈具的正常工作,還可能對周圍電子設備造成不利影響,甚至引發(fā)系統(tǒng)故障。因此,采取有效的硬件措施來解決L...

關鍵字: LED照明技術 電磁干擾 驅動電源

開關電源具有效率高的特性,而且開關電源的變壓器體積比串聯(lián)穩(wěn)壓型電源的要小得多,電源電路比較整潔,整機重量也有所下降,所以,現(xiàn)在的LED驅動電源

關鍵字: LED 驅動電源 開關電源

LED驅動電源是把電源供應轉換為特定的電壓電流以驅動LED發(fā)光的電壓轉換器,通常情況下:LED驅動電源的輸入包括高壓工頻交流(即市電)、低壓直流、高壓直流、低壓高頻交流(如電子變壓器的輸出)等。

關鍵字: LED 隧道燈 驅動電源
關閉