京東物流基于Doris的億級數(shù)據(jù)自助探索應(yīng)用
時(shí)間:2021-08-19 16:29:55
手機(jī)看文章
掃描二維碼
隨時(shí)隨地手機(jī)看文章
[導(dǎo)讀]導(dǎo)讀:京東智慧物流在數(shù)據(jù)應(yīng)用方面,主要是基于大數(shù)據(jù)預(yù)測分析技術(shù)實(shí)現(xiàn)智能化的調(diào)度、決策,提升物流效率,最終提升客戶的體驗(yàn)。但面對億級數(shù)據(jù)的業(yè)務(wù)場景,將會面臨著不同的問題和不同的處理方案。今天討論了京東物流在億級數(shù)據(jù)管理和應(yīng)用方面,利用ApacheDoris進(jìn)行的探索和實(shí)踐。01業(yè)務(wù)...


- 早:海量數(shù)據(jù)的多維查詢已經(jīng)成為常態(tài),高時(shí)效保障是業(yè)務(wù)的最新追求,甚至要求實(shí)時(shí);
- 散:數(shù)據(jù)存儲在不同的業(yè)務(wù)系統(tǒng),各個(gè)系統(tǒng)沒有標(biāo)準(zhǔn)的數(shù)據(jù)規(guī)范, 數(shù)據(jù)重復(fù)建設(shè);
- 重:日報(bào)、周報(bào)、半月報(bào)、月報(bào)等工作效率低,部分重復(fù)工作多,數(shù)據(jù)統(tǒng)計(jì)費(fèi)時(shí)費(fèi)力;
- 慢:全國區(qū)域、戰(zhàn)區(qū)以及各產(chǎn)品群數(shù)據(jù)場景多樣,無法快速響應(yīng)數(shù)據(jù)變化;
- 缺:缺少統(tǒng)一的數(shù)據(jù)資產(chǎn)管理,運(yùn)營人員無法方便、快捷地進(jìn)行統(tǒng)一的數(shù)據(jù)分析;
- 難:領(lǐng)導(dǎo)獲取數(shù)據(jù)難, 營銷投入產(chǎn)出比衡量難,數(shù)據(jù)驅(qū)動業(yè)務(wù)難,數(shù)據(jù)價(jià)值挖掘難。



- 長遠(yuǎn)解決方案:用戶需求反哺,沉淀方法論,線下分析報(bào)表化,支持自助探索。
- 短期解決方案:導(dǎo)出時(shí),彈窗提醒法律風(fēng)險(xiǎn);導(dǎo)出形成賬單,并每月發(fā)送給區(qū)總了解。
- 分析權(quán)限:因歷史積累,訪問大數(shù)據(jù)開發(fā)分析平臺的權(quán)限不匹配當(dāng)前安全要求。例如,有些業(yè)務(wù)分析師可以訪問庫內(nèi)全量表,未區(qū)分區(qū)域;
- 指標(biāo)權(quán)限:指標(biāo)的訪問權(quán)限控制散落在各系統(tǒng)管理,無法做到統(tǒng)一控制,容易混亂和遺漏。
- 分析權(quán)限:梳理BDP訪問權(quán)限,按照業(yè)務(wù)特性縮小訪問范圍,并制定崗位權(quán)限白皮書;
- 指標(biāo)權(quán)限:指標(biāo)出口由統(tǒng)一數(shù)據(jù)API進(jìn)行控制,指標(biāo)查看權(quán)限設(shè)置由指標(biāo)收口人在資產(chǎn)管理平臺統(tǒng)一設(shè)置。

- 內(nèi)部工具調(diào)研,京東動力目前處于快速迭代階段,調(diào)研現(xiàn)階段支持功能,定制化開發(fā)的相應(yīng)速度;
- 外部工具調(diào)研,從成本,市場成熟度,產(chǎn)品易用性,擴(kuò)展性,性能等多維度交叉比對市場主流BI工具的優(yōu)缺點(diǎn);
- 內(nèi)外部工具對比,業(yè)務(wù)方、產(chǎn)品經(jīng)理以及研發(fā)三方組成專家評分組,對內(nèi)外部工具進(jìn)行評分;
- 工具對比結(jié)論,最終確定BI工具實(shí)施方案。

- 京東動力作為分析工具
- 動力從商城數(shù)據(jù)中臺引入
- 性能慢:分鐘級,高峰期出不來
- 上卷、下鉆等功能缺失
- 體驗(yàn)不友好,拖拽繁瑣
- 提數(shù),本地分析
- 隱患:數(shù)據(jù)導(dǎo)出后無法跟蹤
- 引入更適合的工具
- 調(diào)研:動力的計(jì)劃,Tableau、永洪BI等
- 提供便捷自助服務(wù):一站式分析平臺,集數(shù)據(jù)準(zhǔn)備、報(bào)告制作、數(shù)據(jù)分析為一體,業(yè)務(wù)人員也能輕松、快速地制作并分析數(shù)據(jù)報(bào)告,帶來業(yè)務(wù)驅(qū)動的數(shù)據(jù)分析工作模式。多維度下鉆和上卷。
- 內(nèi)嵌豐富組件,上線周期短,組件豐富,可以對所有數(shù)據(jù)源進(jìn)行合并、搜索、交互和分析。
- 移動跨屏,無縫支持PC、iPhone、iPad和Android,并在這些終端設(shè)備上保持一致、易用的用戶體驗(yàn)。
- 高性能,秒級計(jì)算,利用列存儲和內(nèi)存計(jì)算,實(shí)現(xiàn)千萬級數(shù)據(jù)分析的秒級響應(yīng);提升性能,支撐更多的分析維度和更大的數(shù)據(jù)范圍。
- 自主分析不便捷,加工鏈條過長,需要前端,UI,產(chǎn)品以及UI多方配合,資源協(xié)調(diào)困難,溝通成本較高;
- 定制化研發(fā)投入多,定制化開發(fā),不同維度的分析需要開發(fā)不同的匯總以及前段展示界面,底表模型變更影響范圍廣;
- 圖表組件不豐富,對于每種新的應(yīng)用場景均需要不同的額開發(fā)集成,各功能模塊之前需要聯(lián)調(diào)測試,開發(fā)周期長,暫不支持移動端;
- 無法跨屏展示