
“不斷降低使用數(shù)據(jù)的門檻,封裝復雜性,讓‘用數(shù)據(jù)’更簡單。”
—— StartDT CEO、奇點云創(chuàng)始人 行在
5月28日,以“用數(shù)據(jù) 簡單點”為主題,由StartDT(奇點云、GrowingIO)主辦的2024 StartDT Day數(shù)智科技大會暨產品發(fā)布會召開。
奇點云正式發(fā)布數(shù)據(jù)云平臺DataSimba敏捷版,資源更省,上手更快,建平臺更簡單;3款工具一齊亮相,為數(shù)據(jù)集成、數(shù)據(jù)資產管理、算法生產工程化等環(huán)節(jié)提效。
GrowingIO則帶來了明星產品“增長分析”的重磅更新,以XEI多主體模型為核心,從“用戶分析”升級為“全場景業(yè)務分析”,人人都可用,數(shù)據(jù)驅動業(yè)務增長更簡單。
2024年版《OLAP數(shù)據(jù)庫引擎選型白皮書》同期發(fā)布,為業(yè)界伙伴提供最新的選型參考。
01
更省更輕,兼容演進
DataSimba敏捷版發(fā)布,數(shù)據(jù)平臺簡單點
近年來,數(shù)字化帶來的業(yè)務效果不斷得到驗證,越來越多的最佳實踐涌現(xiàn),也吸引到了越來越多的企業(yè)客戶入局,開始建設數(shù)據(jù)平臺,來支撐數(shù)據(jù)資產價值化。
但不同于數(shù)據(jù)規(guī)模PB級、數(shù)字化預算百萬級的超大型企業(yè),對于初建數(shù)據(jù)平臺或希望從傳統(tǒng)數(shù)倉升級的企業(yè)客戶而言,經典的多引擎Lambda架構存在一定的“性價比”弊端,例如技術較為復雜,需要資深的數(shù)據(jù)團隊,集群規(guī)模大。相比現(xiàn)有數(shù)據(jù)能夠產生的價值,運維和數(shù)據(jù)治理性價比不高。
StartDT合伙人、CTO地雷介紹,結合中小型數(shù)據(jù)規(guī)模企業(yè)的情況,經典的主流方案(3引擎Lambda架構)可以簡化為1.5個引擎:將離線引擎和即席查詢引擎合并,同時存算分離,讓實時引擎落盤到即席查詢引擎。近年來國產MPP*數(shù)據(jù)庫引擎也對此類需求做出積極回應。
奇點云數(shù)據(jù)云平臺DataSimba的敏捷版,就為上述場景而生。


DataSimba敏捷版依然基于成熟的StartDT SimbaOS技術體系研發(fā),并重點加強了對各類新MPP引擎的支撐,包括ClickHouse、Apache Doris、StarRocks等等。
· 從成本角度看,DataSimba敏捷版部署簡單,在達到生產RAS(可靠性、可用性、可服務性)的標準下,最小僅需3個節(jié)點;技術棧簡單,易上手;配備集成、研發(fā)、運維、服務等全鏈路功能,滿足GB~TB級數(shù)據(jù)場景所需。
· 從架構角度看,DataSimba敏捷版并不是簡單的“技術棧裁剪”,而為未來的擴展預留了兼容方案。敏捷版的核心SimbaOS Kernel支持各類新MPP引擎,同樣也支持Hive、Spark、Flink等經典的大數(shù)據(jù)引擎。“在中型數(shù)據(jù)規(guī)模的階段,先利用MPP引擎支撐數(shù)據(jù)平臺;當數(shù)據(jù)量暴增時,再逐步按需打開其他引擎,例如圖、時序等。我們曾經陪伴上百家企業(yè)客戶,沿著演化路徑不斷前進。”地雷介紹。同時,DataSimba敏捷版支持Hudi、Iceberg等數(shù)據(jù)湖存儲工業(yè)標準,企業(yè)可以提前統(tǒng)一存儲格式,在后期引擎更換/升級時無需數(shù)據(jù)拷貝,從而減少相關成本。當然,敏捷版也繼承了SimbaOS的諸多特性,例如支持集成50+種數(shù)據(jù)源、有完善的安全機制等等。
在地雷看來,“簡單點”的本質邏輯是抽象標準能力、封裝復雜性,為不斷變化的數(shù)據(jù)業(yè)務需求提供簡單的選擇。可增可減,可切換可迭代,面向未來構建數(shù)據(jù)云,而不需要推倒重建。
此外,數(shù)據(jù)云體系中的幾款工具產品也逐一亮相,讓數(shù)據(jù)集成、數(shù)據(jù)資產管理、算法生產工程化簡單點:
SimbaX(集成工廠),增強型全域數(shù)據(jù)集成產品,支持數(shù)據(jù)湖和字段行列處理等相關能力;SimbaFabric(資產工廠),全域數(shù)據(jù)資產管理平臺,具備全鏈路血緣管理、自動化資產盤點等能力,為數(shù)據(jù)資產入表提供技術支持;SimbaML(算法工廠),幫助企業(yè)建立MLOps體系,一份數(shù)據(jù)同時支持數(shù)倉和算法開發(fā),數(shù)據(jù)更安全,資源更節(jié)約。

集成工廠 SimbaX

資產工廠 SimbaFabric

算法工廠 SimbaML
02
從用戶分析到業(yè)務分析
GrowingIO多主體模型發(fā)布,數(shù)據(jù)分析簡單點
發(fā)布會上,分析云GrowingIO同樣帶來重磅產品升級:從專注支撐用戶分析、用戶增長的UBA(用戶行為分析平臺),升級為全場景覆蓋、人人都可用的XBA(業(yè)務增長分析平臺)。X代表企業(yè)希望分析的任何主體,“人/貨/場”都可以被視為“X”。
“UBA以穩(wěn)定統(tǒng)一的UEI模型(User用戶-Event事件-Item實體)為核心,在過去數(shù)千家實踐中,幫助企業(yè)用戶大幅提升了數(shù)據(jù)建模、應用和價值化的效率,降低了維護成本和操作門檻。XBA在此基礎上迭代,為企業(yè)全業(yè)務場景提供便捷易用的數(shù)據(jù)驅動能力。”StartDT副總裁、GrowingIO聯(lián)合創(chuàng)始人葉玎玎介紹,“包括商品、門店、經銷商、汽車在內,企業(yè)可以自定義分析多種業(yè)務主體的行為事件數(shù)據(jù),也支持進一步對這些‘X’進行低代碼標簽開發(fā)、群組圈選、畫像分析等等。”

從專注用戶分析升級為全業(yè)務分析,分析云還帶來了全新的“B24”場景,為企業(yè)不同業(yè)務需求、不同部門角色提供數(shù)據(jù)洞察,客戶可以按需選擇。

不設限的XEI對于業(yè)務團隊來說,能告別原本定制開發(fā)的長時間等待,簡單易上手,可以靈活完成自助分析;對于分析團隊,則通過統(tǒng)一模型,讓數(shù)據(jù)處理、理解和分析產出更簡單高效。
“分析云的使命是幫助企業(yè)提升數(shù)據(jù)驅動能力,實現(xiàn)更好的增長。”葉玎玎表示,“作為新一代的智能‘業(yè)務分析平臺’,期待能陪伴更多客戶實現(xiàn)業(yè)務增長簡單點。”
03
看—用—智能
不斷降低數(shù)據(jù)價值化的門檻
數(shù)據(jù)云、分析云產品持續(xù)迭代升級的同時,StartDT也發(fā)現(xiàn),數(shù)據(jù)系統(tǒng)正從邊緣系統(tǒng)變?yōu)楹诵纳a系統(tǒng),有越來越多企業(yè)逐漸從“看數(shù)據(jù)”走向“用數(shù)據(jù)”,乃至發(fā)揮了“數(shù)據(jù)智能”的力量。
“看—用—智能,是數(shù)據(jù)價值深入的過程。”StartDT CEO、奇點云創(chuàng)始人行在表示,“奇點云自創(chuàng)立第一天起,就以‘讓商業(yè)更智能’為使命,和客戶站在一起,不斷降低客戶使用數(shù)據(jù)的門檻,支撐客戶建立自主可控的數(shù)據(jù)能力。數(shù)據(jù)智能將成為企業(yè)和社會的新質生產力,也是我們全心投入的方向。”

發(fā)布會尾聲,StartDT合伙人、資深戰(zhàn)略咨詢專家何夕帶來了數(shù)據(jù)驅動商業(yè)的最新實踐:
# 看數(shù)據(jù):一家水果零售企業(yè)使用數(shù)據(jù)可視化工具,將每日銷售數(shù)據(jù)轉化為直觀的圖表和報告,供店鋪經理查看。某區(qū)域門店曾發(fā)現(xiàn)毛利突降了15%,借助數(shù)據(jù)分析得出了原因——折扣率同比下降11%,促銷不合理,就立即重新定價、調整策略,從而避免了更多損失。
# 用數(shù)據(jù):一家3C電子企業(yè),基于StartDT產品建立了自己的可視化溯源平臺,改變了原本需數(shù)十人手工投入才能完成的分段追溯方式,通過數(shù)據(jù)和自動化讓訂單、質量、供應鏈的管理科學有效。
# 數(shù)據(jù)智能:一家消費零售企業(yè)在營銷活動時,依托個性化推薦和預測算法,不僅達成了整體更好的轉化效果,還“意外”成功喚醒了活動通常不敢觸達的沉睡用戶,激活了購買,并更新了客戶洞察。
從大廠的獨家實踐,到更多公司的最佳實踐;從少數(shù)派的大數(shù)據(jù),到大多數(shù)企業(yè)擁有自己的數(shù)據(jù)能力…每個和第五要素打交道的人,都在通向未來的路上。
DT時代,StartDT期待成為更多企業(yè)伙伴的Must-have Partner,用數(shù)據(jù),簡單點!

*MPP:Massively Parallel Processing,大規(guī)模并行處理。傳統(tǒng)的MPP數(shù)據(jù)庫以Teradata為代表;近年國產數(shù)據(jù)庫廠商發(fā)力,涌現(xiàn)新一代MPP引擎,包括TiDB、StarRocks、OceanBase等,在部分場景加強能力。業(yè)內主流觀點認為,基于Hadoop體系的分布式大數(shù)據(jù)平臺因其開放性、擴展性、吞吐量、容錯性等優(yōu)勢,將徹底取代基于MPP數(shù)據(jù)庫的傳統(tǒng)數(shù)倉。而在小集群、低并發(fā)的場景,MPP仍有性價比優(yōu)勢。
移步奇點云官網、公眾號,即可下載《OLAP數(shù)據(jù)庫引擎選型白皮書(2024)》。
行業(yè)資訊、企業(yè)動態(tài)、業(yè)界觀點、峰會活動可發(fā)送郵件至news#citmt.cn(把#換成@)。
海報生成中...