www.久久久久|狼友网站av天堂|精品国产无码a片|一级av色欲av|91在线播放视频|亚洲无码主播在线|国产精品草久在线|明星AV网站在线|污污内射久久一区|婷婷综合视频网站

當前位置:首頁 > 智能硬件 > 軍用/航空電子
[導讀] 摘要:優(yōu)步是全球領先的移動互聯(lián)網(wǎng)創(chuàng)業(yè)公司,通過創(chuàng)新科技為乘客和合作司機高效即時匹配,提供安全、高效、可靠、便利的出行選擇,他的使命是“使出行如自來水一樣可靠,每個人在任何地方都能享用

摘要:優(yōu)步是全球領先的移動互聯(lián)網(wǎng)創(chuàng)業(yè)公司,通過創(chuàng)新科技為乘客和合作司機高效即時匹配,提供安全、高效、可靠、便利的出行選擇,他的使命是“使出行如自來水一樣可靠,每個人在任何地方都能享用”。...

優(yōu)步是全球領先的移動互聯(lián)網(wǎng)創(chuàng)業(yè)公司,通過創(chuàng)新科技為乘客和合作司機高效即時匹配,提供安全、高效、可靠、便利的出行選擇,他的使命是“使出行如自來水一樣可靠,每個人在任何地方都能享用”。為了履行這一承諾,優(yōu)步依賴于在每個層面做出數(shù)據(jù)驅動的決策。

優(yōu)步目前的業(yè)務廣泛分布于75個國家或地區(qū),超過500個城市,基于分析可以充分了解一個城市人們出行的特點(熱點區(qū)域、主要交通流向等)。大部分的決策都得益于更快的數(shù)據(jù)處理能力,其底層核心在于構建了強大的Hadoop大規(guī)模數(shù)據(jù)處理平臺。下面對Hadoop在優(yōu)步的發(fā)展過程做一個初步介紹。

2014年以前數(shù)據(jù)架構比較簡單,數(shù)據(jù)主要有日志和DB數(shù)據(jù)組成,采集到數(shù)據(jù)倉庫后再做進一步加工,然后直接服務商業(yè)應用或即席查詢分析等,架構如下:

此架構的中心是一個數(shù)據(jù)倉庫,用于將各種數(shù)據(jù)源收歸一處,經(jīng)統(tǒng)一建模處理后再提供服務給上層業(yè)務或數(shù)據(jù)分析人員使用。傳統(tǒng)的數(shù)據(jù)倉庫建設可初略分為3個環(huán)節(jié),數(shù)據(jù)采集、維度建模、數(shù)據(jù)服務。

首先簡要介紹數(shù)據(jù)采集過程中的技術,分為兩類:
日志采集與處理方案較多,下面對常見的做一個對比:

由此可見,優(yōu)步選擇kafka的原因也就一目了然。

DB數(shù)據(jù)采集
在數(shù)據(jù)加載到數(shù)據(jù)庫的過程中,分為全量加載(更新)和增量加載(更新)。全量加載是首先全表刪除后再從源表進行數(shù)據(jù)加載的方式;增量加載是目標表僅更新源表變化的數(shù)據(jù)。常用的方式有:

系統(tǒng)日志分析方式

觸發(fā)器方式

時間戳方式

全表比對方式

源系統(tǒng)增量(delta)數(shù)據(jù)直接或者轉換后加載。

優(yōu)步在數(shù)據(jù)處理方面選用了部分amazon的云計算解決方案,采用AmazonS3,它具有簡單的Web 服務接口,可用于在 Web 上的任何位置存儲和檢索任意數(shù)量的數(shù)據(jù)。它能夠提供99.999999999% 的持久性,并且可以在全球大規(guī)模傳遞數(shù)萬億對象。可作為分析的批量存儲庫或“數(shù)據(jù)湖”。

另外數(shù)據(jù)在存儲到 S3 中后,會自動采用成本更低、存儲期限更長的云存儲類進行存檔。計算方面采用了Amazon EMR,它是可用于運行 AWS上托管的 Hadoop 群集,各完成多種類型的數(shù)據(jù)加工處理任務。

數(shù)據(jù)建模是專門用于分析型數(shù)據(jù)庫、數(shù)據(jù)倉庫、數(shù)據(jù)集市建模的方法,除了在數(shù)據(jù)庫中常見的ER建模和關系建模,還包括專門針對數(shù)據(jù)倉庫的維度建模技術,包括幾種模型:星形模型、雪花模型、混合模型。

2015年前的優(yōu)步從服務器數(shù)量、計算任務量、數(shù)據(jù)量等幾個方面來看Hadoop規(guī)模仍然較小。由于其業(yè)務高速發(fā)展,到如今已經(jīng)有非常大的變化,由上千臺服務器組建的Hadoop集群,每天處理10W+計算任務,PB級的數(shù)據(jù)存儲,數(shù)據(jù)處理框架不僅采用spark,同時hive和Presto也廣泛應用。新架構與2014年相比,最大的變化在于計算和存儲引擎的統(tǒng)一,規(guī)?,F(xiàn)實大幅度增漲。

Hadoop集群規(guī)模從2014年初期的幾個節(jié)點,到2015年增長到百余節(jié)點和PB級數(shù)據(jù)容量,2016年發(fā)展到千余節(jié)點,預計2017年可發(fā)展到5000節(jié)點、100PB存儲的規(guī)模。

在集群規(guī)模和業(yè)務高速發(fā)展的過程中,優(yōu)步解決了一些自身面臨的個性化需求,包括:
1. Strict Schema Management:由于大量使用數(shù)據(jù)的人員主要通過SQL來加工數(shù)據(jù),而SQL允許用戶在高層的數(shù)據(jù)結構上工作,所有SQL語句都接受集合作為輸入,返回集合作為輸出,因此需要嚴格、統(tǒng)一管理數(shù)據(jù)的結構信息或數(shù)據(jù)模型。
2. 多種大數(shù)據(jù)處理工具協(xié)同:面向不同類型的數(shù)據(jù)用戶提供多種數(shù)據(jù)處理工具,如Hive、Presto、Spark等,普通用戶可直接使用hive/presto完成常規(guī)的數(shù)據(jù)處理與分析,利用spark可完成更深入的數(shù)據(jù)挖掘與圖計算等。

隨著優(yōu)步業(yè)務的全球化拓展,對應的服務與底層的計算與存儲引擎也需要有全球化的能力,資源的全球化管理也將成為重中之重,下面簡要介紹幾個資源管理框架的特點與應用。

Mesos和YARN之間的主要區(qū)別圍繞著優(yōu)先級的設計以及調度任務的方式。Mesos的設計初衷是作為整個數(shù)據(jù)中心的一個可拓展的全局資源管理器。YARN出于管理Hadoop規(guī)模的需求。在YARN出現(xiàn)之前,資源管理(功能)集成在Hadoop MapReduce V1架構中,為了有助于MapReduce的擴展而將其移除(轉移到YARN中實現(xiàn))。MapReduce的Job Tracker并不能在超過上千臺的機器中有效調度MapReduce任務。YARN在下一代Hadoop生命周期中被創(chuàng)造,主要圍繞著資源拓展。

Mesos的調度策略,Mesos決定了哪些資源可用,它把分配請求返回給一個應用調度器(應用調度器和執(zhí)行器被稱作“框架”)。這些分配請求被框架接受或者拒絕。這個模型被認為是非單體模型,因為它是一個“兩級”調度器,調度算法是可拔插的。
Mesos允許任何實現(xiàn)任何調度算法,每個算法都能根據(jù)自己的策略進行接收或是拒絕分配請求,并且可以容納成千上萬種調度程序以多租戶的方式運行在同一個集群。
Mesos的兩級調度模型允許每個框架(自己)決定使用哪種算法來調度運行的工作。Mesos扮演仲裁者,在多個調度器上來調度資源,解決沖突,并且確保資源基于業(yè)務策略被公平地分發(fā)。分配請求到來時,框架會執(zhí)行任務來消費那些提供的資源?;蛘呖蚣芸梢赃x擇拒絕請求并且等待下一個分配請求。多年的操作系統(tǒng)和分布式系統(tǒng)的實踐發(fā)展證明,這種模型的好處在于它具有良好的擴展性。它已被Google和Twitter證明。

YARN的調度策略,當job請求到達YARN資源管理器,YARN評估所有可用的資源然后調度job。YARN以一種整體的方式,直接決定job運行的位置。在MapReduce架構演變的過程中,重申強調YARN的出現(xiàn)十分重要。
在Hadoop任務的資源規(guī)模伸縮需求的驅動下,YARN把資源管理的模型從MR的Job Tracker中獨立出來,在Resources Manager組件中實現(xiàn)。YARN既不是為長時間運行的服務而設計,也不是為滿足短期交互/快速響應式請求(像簡短而快速的Spark任務),盡管它可能調度其他種類的工作任務,但這并不是一個理想的模型。
MapReduce的資源需求、執(zhí)行模型和架構需求不同于長時間運行的服務,如Web服務器、SOA應用程序或是像Spark和Storm那樣的實時任務。同時,YARN為了易于無狀態(tài)的腳本任務重啟而設計。它并不能處理像分布式文件系統(tǒng)或數(shù)據(jù)庫那樣的有狀態(tài)的服務。然而YARN的整體的調度器理論上可以處理不同類型的工作負載(通過把新的算法合并到調度代碼),對于支持日益復雜的調度算法,這并不是一個輕量級的模型。

當你把如何管理數(shù)據(jù)中心作為整體來評估時,一方面使用Mesos來管理數(shù)據(jù)中心的所有資源,另一方面使用YARN來安全的管理Hadoop任務,但它并不具有管理整個數(shù)據(jù)中心的能力。數(shù)據(jù)中心運營商傾向于把集群劃分為的不同區(qū)域(Hadoop集群和非Hadoop集群)來應對這兩個場景。在同一個數(shù)據(jù)中心使用Mesos和YARN,為了受益于資源管理器,目前需要創(chuàng)建兩個靜態(tài)分區(qū)。此時意味著當指定資源被Hadoop的YARN管理時,Mesos就無法起作用。這也許過于簡化了,盡管這么做確實有效。但本質上,我們是想避免這種情況。

能否讓企業(yè)和數(shù)據(jù)中心受益于YARN和Mesos的協(xié)調工作?答案是肯定的。一些著名的公司——eBay、MapR和Mesosphere共同合作了一個項目叫做Myriad。這個開源軟件項目既是一個Mesos框架,又是一個YARN調度器,這就使得Mesos能夠管理YARN的資源請求。當一個任務到達YARN時,它會通過Myriad調度器調度它,使請求與Mesos提供的資源匹配。

相應的,Mesos也會將它傳遞給Mesos工作節(jié)點。之后,這個Mesos節(jié)點會把這個請求與一個正在執(zhí)行YARN節(jié)點的管理器的Myriad執(zhí)行器關聯(lián)。Myriad在Mesos資源啟動YARN節(jié)點管理器,啟動之后,Mesos資源會告訴YARN資源管理器哪些資源可用。這時YARN就可以隨意地使用這些資源。Myriad為Mesos的可用資源池和YARN的任務(需要用到Mesos中資源)之間架起了一座無縫連接的橋梁。

優(yōu)步在 Mesos 上設計了全新統(tǒng)一資源調度系統(tǒng)Peloton,用來更有效和彈性地管理計算資源,并且為不同團隊提供了分層的的最大最小公平算法,不久的將來可能開源。


 

本站聲明: 本文章由作者或相關機構授權發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內容真實性等。需要轉載請聯(lián)系該專欄作者,如若文章內容侵犯您的權益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或將催生出更大的獨角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉型技術解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關鍵字: 汽車 人工智能 智能驅動 BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務能7×24不間斷運行,同時企業(yè)卻面臨越來越多業(yè)務中斷的風險,如企業(yè)系統(tǒng)復雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務連續(xù)性,提升韌性,成...

關鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報道,騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會開幕式在貴陽舉行,華為董事、質量流程IT總裁陶景文發(fā)表了演講。

關鍵字: 華為 12nm EDA 半導體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會上,華為常務董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權最終是由生態(tài)的繁榮決定的。

關鍵字: 華為 12nm 手機 衛(wèi)星通信

要點: 有效應對環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實提質增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務引領增長 以科技創(chuàng)新為引領,提升企業(yè)核心競爭力 堅持高質量發(fā)展策略,塑強核心競爭優(yōu)勢...

關鍵字: 通信 BSP 電信運營商 數(shù)字經(jīng)濟

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術學會聯(lián)合牽頭組建的NVI技術創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會上宣布正式成立。 活動現(xiàn)場 NVI技術創(chuàng)新聯(lián)...

關鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會上,軟通動力信息技術(集團)股份有限公司(以下簡稱"軟通動力")與長三角投資(上海)有限...

關鍵字: BSP 信息技術
關閉
關閉