日日夜夜免费精品视频,久久99伊人,亚洲aⅴ网站
首頁 > 企業(yè)

中國郵政郵科院 X DorisDB:統(tǒng)一OLAP平臺,大幅降低運維成本

2021/08/19 13:17      IT產(chǎn)業(yè)網(wǎng)


  郵政科學研究規(guī)劃院有限公司(以下簡稱“郵科院”),作為中國郵政集團有限公司的科研智庫單位,專注于戰(zhàn)略規(guī)劃、企業(yè)管理、工程設計、物流裝備、智能終端、質(zhì)量檢測、標準化研究等領域,在助力中國郵政戰(zhàn)略轉型和經(jīng)營發(fā)展中發(fā)揮著重要支撐作用。

  郵科院數(shù)據(jù)組負責全院大數(shù)據(jù)體系架構的建設,支撐日常BI運營分析、科研數(shù)據(jù)產(chǎn)品、物流數(shù)據(jù)、網(wǎng)點畫像等業(yè)務場景。郵科院數(shù)據(jù)組通過使用DorisDB,統(tǒng)一了實時和離線的分析場景,替換了ClickHouse、Presto、MySQL等系統(tǒng),解決了原有多套系統(tǒng)帶來的運維和使用復雜性,簡化了數(shù)據(jù)ETL流程,同時大幅提升OLAP、Adhoc等場景的查詢效率。本文主要介紹郵科院數(shù)據(jù)組基于新一代極速全場景MPP數(shù)據(jù)庫DorisDB,在數(shù)據(jù)服務體系和數(shù)據(jù)應用場景中的實踐和探索。

  “作者:謝翔 郵政科學研究規(guī)劃院有限公司寄遞研究所數(shù)據(jù)組負責人,專注于數(shù)倉建設、數(shù)據(jù)分析等領域研究。”

  一、業(yè)務背景

  隨著科研數(shù)據(jù)積累越來越大,數(shù)據(jù)規(guī)模和體量也急劇膨脹。科研的原始數(shù)據(jù)通常來源于研報抽取、日志埋點文件、業(yè)務數(shù)據(jù)庫、三方接口等。過去通常基于CDH/Hadoop等大數(shù)據(jù)分布式計算框架和數(shù)據(jù)集成工具,構建離線的數(shù)據(jù)倉庫,并對數(shù)據(jù)進行適當?shù)姆謱印⒔!⒓庸ず凸芾恚瑯嫿ǜ黝惙治鲋黝}。郵科院數(shù)據(jù)體系中沉淀了諸多研報主題數(shù)據(jù),例如:電商流量數(shù)據(jù),物流企業(yè)財務數(shù)據(jù),行業(yè)報告相關的數(shù)據(jù)等。

  上層數(shù)據(jù)應用對查詢的響應延遲和時效性要求高,會將數(shù)據(jù)通過數(shù)據(jù)同步工具同步到MySQL、ElasticSearch、Presto、HBase、ClickHouse等數(shù)據(jù)庫系統(tǒng)中,來支撐上層數(shù)據(jù)應用的查詢要求。

  郵科院的大數(shù)據(jù)總體架構如下圖所示,從下到上可以分為數(shù)據(jù)接入層、數(shù)據(jù)計算層、數(shù)據(jù)服務層和數(shù)據(jù)應用層。

  數(shù)據(jù)計算層使用科研工作各分析場景下產(chǎn)生的模型/方案/業(yè)務的明細數(shù)據(jù),進行離線數(shù)據(jù)計算,對TB級別的明細數(shù)據(jù)進行調(diào)度、聚合、計算,在數(shù)倉里沉淀出大量明細表、聚合表和最終的數(shù)據(jù)報表。

  數(shù)據(jù)計算層生成的各類數(shù)據(jù)表,會同步到數(shù)據(jù)服務層,由數(shù)據(jù)服務層提供接口給數(shù)據(jù)應用層使用,滿足不同的數(shù)據(jù)業(yè)務需求。

  二、業(yè)務痛點

  數(shù)據(jù)服務層的愿景是開放數(shù)倉能力,建立統(tǒng)一的數(shù)據(jù)服務出口,針對不同的數(shù)據(jù)業(yè)務分析場景(數(shù)據(jù)規(guī)模、QPS、UDF支持、運維成本等),原有架構在底層使用了不同的查詢引擎:

  ·大數(shù)據(jù)量、低QPS:使用Hive、Presto、ClickHouse等基于Hadoop生態(tài)的離線批任務計算框架和MPP數(shù)據(jù)庫來解決。

  ·小數(shù)據(jù)量、高QPS:使用MySQL、ElasticSearch、HBase、MongoDB等關系型/非關系型數(shù)據(jù)庫來解決。

  使用多套查詢引擎,我們遇到如下問題和挑戰(zhàn):

  ·離線/實時ETL任務過多,處理邏輯大部分為簡單聚合/去重,聚合表數(shù)量龐大,導致運營和運維上的成本增加;

  ·針對中等數(shù)據(jù)量、中等QPS的查詢場景,如何能兼顧數(shù)據(jù)規(guī)模的同時,有較友好的查詢響應延遲;

  ·大數(shù)據(jù)量下插入、更新的實時數(shù)據(jù)場景無法得到支持,例如:網(wǎng)點畫像、實時數(shù)據(jù)導入、郵路路徑、研報數(shù)據(jù)匯總等。

  三、OLAP引擎選型

  針對如上的問題和挑戰(zhàn),我們的目標是尋求盡可能少的OLAP引擎,利用在明細表上現(xiàn)場計算來解決ETL任務、數(shù)倉表過多問題,同時需要兼顧在數(shù)據(jù)規(guī)模、查詢QPS、響應耗時、查詢場景方面的權衡。

  目前市面上OLAP引擎百花齊放,諸如Impala、Druid、ClickHouse、DorisDB。經(jīng)過一番調(diào)研,我們最終選擇了DorisDB。DorisDB是基于MPP架構的分析型數(shù)據(jù)庫,自帶數(shù)據(jù)存儲,整合了大數(shù)據(jù)框架的優(yōu)勢,支持主鍵更新、支持現(xiàn)代化物化視圖、支持高并發(fā)和高吞吐的即席查詢等諸多優(yōu)點,天然能解決我們上述的問題。

  四、DorisDB應用實踐

  DorisDB已經(jīng)投入生產(chǎn)環(huán)境,主要作為離線/實時數(shù)據(jù)的OLAP數(shù)據(jù)庫使用。離線數(shù)據(jù)主要存儲于HDFS中,通過DataX任務批量同步數(shù)據(jù)到DorisDB;另一部分實時數(shù)據(jù)主要存儲于Kafka中,使用DorisDB的routine load功能實時將數(shù)據(jù)從kafka寫入到DorisDB。

  在沒有引入DorisDB之前,我們使用的底層引擎是MySQL、Presto on HDFS和ClickHouse等系統(tǒng),對明細表/聚合表進行查詢。這幾種方式都存在著不少問題:

  ·MySQL處理上億規(guī)模的數(shù)據(jù),無論使用分庫分表、分區(qū)表、集群化部署的PolarDB方案,都會存在慢查詢、數(shù)據(jù)庫扛不住、運維困難的窘境;

  ·Presto on HDFS的方案更偏向于分析型數(shù)據(jù)業(yè)務,雖然能存儲海量的數(shù)據(jù),計算能力不錯,唯一致命的在于無法滿足在線業(yè)務的高吞吐QPS,查詢比較難做到毫秒級。

  ·ClickHouse對Join支持較弱,通常使用大寬表建模,不夠靈活,另外運維也比較復雜。

  ·在引入DorisDB替換MySQL、Presto和ClickHouse后,DorisDB帶來的業(yè)務效果如下:

  ·支撐了在線報表查詢+數(shù)據(jù)分析業(yè)務,服務于對內(nèi)運營+對外行業(yè)分析的數(shù)據(jù)產(chǎn)品,報表業(yè)務查詢大部分耗時在毫秒級別,分析型業(yè)務查詢大部分耗時在秒級別;

  ·支持10億規(guī)模的明細表查詢,月、季、年等維度統(tǒng)計數(shù)據(jù)現(xiàn)場算聚合統(tǒng)計、精準去重等,查詢耗時都能控制在500ms以內(nèi);

  ·千萬級別的多表的Join和union查詢,經(jīng)過Colocate Join特性優(yōu)化,查詢響應在秒級。

  另外,我們還將DorisDB應用到實時數(shù)據(jù)分析場景,DorisDB在實時數(shù)據(jù)分析主要有如下優(yōu)勢:

  ·實時寫入性能:目前DorisDB支持HTTP方式的Stream Load,可以自定義的分鐘級別微批寫入,以及Routine Load功能,可以將Kafka的數(shù)據(jù)實時同步到DorisDB中,滿足當前實時數(shù)據(jù)分析業(yè)務;

  ·統(tǒng)一離線和實時分析:實時數(shù)據(jù)和離線數(shù)據(jù)更好的在DorisDB中進行融合,靈活支撐應用,數(shù)據(jù)存儲策略通過DorisDB動態(tài)分區(qū)的功能進行自動管理;

  ·SQL Online Serving:高效的SQL即席查詢能力,能夠兼容業(yè)界標準的SQL規(guī)范,支撐業(yè)務靈活復雜的訪問,提高取數(shù)開發(fā)的效率。

  五、總結和規(guī)劃

  郵科院數(shù)據(jù)組引入DorisDB生產(chǎn)集群,解決了數(shù)據(jù)服務層單表億級別規(guī)模、高QPS數(shù)據(jù)場景下引擎的空白,直接開放明細表準實時查詢的能力,給各項目組上層數(shù)據(jù)業(yè)務和BI系統(tǒng)提供了更多的選擇和自由度,同時將大大減少數(shù)倉中大量ETL任務、聚合表、報表,降低了數(shù)倉ETL的運維壓力和維護成本,DorisDB綜合性價比較原有的MySQL、Presto、ClickHouse等同類產(chǎn)品提升數(shù)倍以上。

  未來,郵科院在DorisDB的應用和實踐上還有不少規(guī)劃:

  ·除了unique和duplicate數(shù)據(jù)模型,未來會將符合的數(shù)據(jù)場景遷移至aggregation模型,并使用物化視圖,進一步降低數(shù)倉開發(fā)維護成本,降低查詢延遲;

  ·DorisDB on ES的功能也值得我們深挖和探索,解決原生ES集群無法支持跨索引Join的能力;

  ·更多數(shù)據(jù)應用層的場景接入DorisDB,例如網(wǎng)點畫像服務、郵路路徑分析等,將進一步拓展DorisDB在實時數(shù)據(jù)寫入、批量數(shù)據(jù)更新場景中的應用;

  ·與科研數(shù)據(jù)分析平臺、數(shù)倉平臺深度打通,完善數(shù)據(jù)整體架構,作為數(shù)據(jù)團隊的基礎設施去保障穩(wěn)定性和服務;

  ·考慮使用多云架構,自主可控的數(shù)倉架構可以靈活的在多云間切換遷移,降低單一云廠商的依賴,控制成本提高可用性。

  ·......

  最后的最后,感謝DorisDB技術團隊給予的熱情、靠譜的答疑解惑和技術支持!!!

IT產(chǎn)業(yè)網(wǎng)微信二維碼logo

  行業(yè)資訊、企業(yè)動態(tài)、業(yè)界觀點、峰會活動可發(fā)送郵件至news#citmt.cn(把#換成@)。

海報生成中...

分享到微博

掃描二維碼分享到微信

分享到微信
一鍵復制
標題鏈接已成功復制

最新新聞

熱門新聞

99热手机在线_五月天在线免费视频_波多野结衣之无限发射_美女一区二区三区视频_日韩在线观看a_天天天干夜夜夜操_日韩黄色片在线_97在线免费视频观看_天堂а√在线中文在线_88av.com_国产乱女淫av麻豆国产_日本a在线免费观看
日韩国产高清在线| 亚洲欧美日本日韩| 国产国产精品| 91精品韩国| 91日韩在线| 91综合网人人| 国产日韩欧美三区| 久久精品天堂| 98精品视频| 蜜臀av国产精品久久久久| 电影亚洲精品噜噜在线观看| 成人一二三区| 欧美sss在线视频| 欧美粗暴jizz性欧美20| 国产精品一级在线观看| 国产精品久av福利在线观看| 日本精品一区二区三区在线观看视频 | 国产乱人伦精品一区| 福利欧美精品在线| 精品久久99| 亚洲欧美日本国产| 日韩亚洲精品在线观看| 日韩精品dvd| 国产欧美另类| 日韩国产一区二区| 国产网站在线| 精品在线99| 最近国产精品视频| 欧美一区二区三区高清视频| 国产精品日本一区二区不卡视频 | 国产麻豆一区二区三区| 老司机免费视频一区二区| 日韩深夜视频| 99国产精品久久久久久久 | 国产尤物精品| 国产精品国产三级国产在线观看| 中文无码日韩欧| 美女在线视频一区| 四虎884aa成人精品最新| 国产日产一区| 99久精品视频在线观看视频| 美女精品一区| 精品久久久亚洲| 国产精品一区二区三区美女| 国产66精品| 亚洲欧美一级| 天堂av在线| 日韩av一级| 国产精品麻豆成人av电影艾秋| 蜜桃久久久久久| 黄毛片在线观看| 亚洲综合专区| 日本91福利区| 在线日韩中文| 国产一区二区三区四区大秀| 一本综合精品| 久久人人97超碰国产公开结果| 不卡福利视频| 欧美日韩国产免费观看视频| 美女性感视频久久| 中文日韩欧美| 欧美不卡高清一区二区三区| 日本不卡一区二区三区| 久久亚洲专区| 国产精品久久久久久久久久白浆| 尤物网精品视频| 色爱综合网欧美| 欧美午夜三级| 蜜臀久久99精品久久久久久9| 亚洲伦乱视频| 久久精品一区| 久久狠狠久久| 亚洲青青久久| 久久久亚洲欧洲日产| 日韩.com| 免费精品国产的网站免费观看| 国产精品xx| 精品国产网站| 国产欧美日韩免费观看| 亚洲日本久久| 高清av一区| 成人国产精选| 精品日韩毛片| 欧美久久一区二区三区| 日本v片在线高清不卡在线观看| 婷婷成人综合| 日韩欧美1区| 中文字幕一区日韩精品| 欧美午夜不卡| 久久av中文| 国产在线不卡| 亚洲尤物av| 亚洲欧美日韩专区| 国产在线欧美| 亚洲综合专区| 日韩电影免费在线观看| 你懂的亚洲视频| 精品一区视频| 91亚洲自偷观看高清| 一区二区91| 中文视频一区| 激情久久一区二区| 日韩中文字幕av电影| 欧美极品中文字幕| 免费视频一区二区三区在线观看| 日本视频一区二区| 国产精品免费精品自在线观看| 青草综合视频| 精品久久美女| 婷婷激情综合| 亚洲精品成人图区| 亚洲网站视频| 色综合视频一区二区三区日韩| 日韩精品欧美| 免费在线观看一区二区三区| 日韩欧美中文字幕电影| 99国产一区| 久久久五月天| 丝袜a∨在线一区二区三区不卡| 亚洲va久久| 欧美国产美女| 国产劲爆久久| 日韩精品一页| 给我免费播放日韩视频| 国产欧美日韩视频在线| 午夜欧美巨大性欧美巨大| 美女视频黄 久久| 日韩免费小视频| 国产一区二区久久久久| 日韩国产欧美一区二区三区| 制服诱惑一区二区| 蜜臀91精品国产高清在线观看 | 亚洲一区日韩| 91精品麻豆| 日本中文字幕一区二区视频| 国产精品白丝久久av网站| 日韩欧美字幕| 日韩不卡一二三区| 欧美日韩精品免费观看视欧美高清免费大片| 日韩av福利| 日韩精品一级中文字幕精品视频免费观看| 久久亚洲国产精品一区二区| 免费在线观看不卡| 日韩视频一区| 麻豆久久久久久久| 亚洲少妇在线| 福利一区在线| 亚洲成人av观看| 国产精品欧美三级在线观看| 在线一区免费| 国产精品chinese| 视频一区中文字幕国产| av资源中文在线| 久久久久蜜桃| 国产专区精品| 久久九九国产| 99re国产精品| 韩国三级一区| 亚洲激情欧美| www成人在线视频| 在线亚洲国产精品网站| 在线天堂中文资源最新版| 不卡一二三区| 精品久久亚洲| 精品视频网站| 国产欧美大片| 国产一二在线播放| 久久中文在线| 久久尤物视频| 国产精品毛片aⅴ一区二区三区| 久久免费影院| 久久国内精品视频| 欧美韩日一区| 欧美日韩国产免费观看| 日韩国产专区| 久久福利毛片| 国产精品久久乐| 欧美日韩中文| 999国产精品| 久久久精品五月天| 日韩中文字幕高清在线观看| 高清不卡亚洲| 蜜臀久久精品| 亚洲成人一区在线观看| www.九色在线| 在线观看精品| 91亚洲精品视频在线观看| 日韩精品1区2区3区| 亚洲精品大片| 色综合www| 国产精品尤物| 正在播放日韩精品| 91精品丝袜国产高跟在线| 日韩精选在线| 欧美日韩视频免费看| 国产极品一区| 欧美精品高清| 日韩亚洲精品在线| 亚洲啊v在线| 欧美中文字幕|