企業(yè)智能化轉(zhuǎn)型不但要有愿景目標規(guī)劃,也需要有推進協(xié)調(diào)和監(jiān)督機制,并且要有完備工具,確保實施。AI平臺就是其中的生產(chǎn)力工具。
文|徐鑫
編|任曉漁
產(chǎn)業(yè)智能化轉(zhuǎn)型走進深水區(qū),企業(yè)對AI能力的需求點在起變化。
越來越多大型企業(yè)的視野已不局限在單一智能應用上。在電力、金融等行業(yè),大型企業(yè)正圍繞著AI能力的生產(chǎn)、運用和管理全流程,對廠商的AI學習平臺及平臺性生產(chǎn)力工具提出需求,從而解決人才稀缺、數(shù)據(jù)稀缺、管理困難、資源復用率低等一系列痛點。
大模型熱潮到來后,平臺的比拼重點轉(zhuǎn)移到了大模型開發(fā)和應用之上,廠商們積極將此前的AI平臺解決方案和大模型結合。 在平臺大比拼中,一些企業(yè)的優(yōu)勢已經(jīng)凸顯出來。國際分析機構Forrester近日發(fā)布報告顯示,中國人工智能/機器學習平臺競爭中,百度智能云表現(xiàn)亮眼,參與評選的AI平臺在數(shù)據(jù)、推理、應用等6個大類,15個細項獲得了最高分,位居領導者象限。
AI平臺,正幫助企業(yè)快速構建符合業(yè)務需求的人工智能模型及應用,有效監(jiān)控和優(yōu)化模型效果。
一百個場景要建一百個模型的境況已經(jīng)成為歷史。
01
深度用AI,老炮們的困擾
產(chǎn)業(yè)正在進入深度用AI應用階段,AI已不再遙不可及。不過也有越來越多企業(yè)發(fā)現(xiàn),隨著應用深入,這些企業(yè)智能化領域里的資深用戶們正在遭遇新的困擾。
以能源行業(yè)為例,大型電力企業(yè)已經(jīng)將AI模型用于電路巡檢等多個場景。通常情況下,這類企業(yè)的相關需求,多由不同部門或分公司獨立采購。隨著AI應用變多,模型數(shù)量也在積累。管理大量模型,并讓大量的零散模型能穩(wěn)定、高效運行,正成為一項挑戰(zhàn)。
許多大型企業(yè)都存在類似問題。一位資深人士告訴數(shù)智前線,他親眼見過企業(yè)里A部門放5個人做A算法,B部門搞B小分隊也放幾個人做算法,這導致很難從公司層級進行統(tǒng)一的監(jiān)控優(yōu)化更新維護,同時企業(yè)內(nèi)整體的AI資源復用率很低。
金融行業(yè)應用AI也走在前列,一些企業(yè)或機構早已將AI技術應用于信用卡發(fā)放資格審批和欺詐識別等多個環(huán)節(jié),實現(xiàn)AI風控和精準營銷。但金融行業(yè)對安全和合規(guī)的強調(diào)也在延伸到AI的應用過程。比如,銀行內(nèi)的技術團隊非常重視合規(guī)因素,新建一個模型時,建設的委托和批準角色是誰,數(shù)據(jù)讀取的審批由誰經(jīng)手,數(shù)據(jù)撰寫、模型生產(chǎn)、訓練、落地和上線也都有層層流程保障。這類需求明顯不是傳統(tǒng)的智能應用建設。
一位云廠商資深行業(yè)解決方案人士告訴數(shù)智前線,一些大型央國企明確提出希望構建企業(yè)的智能中樞,培育自身的AI能力,這樣企業(yè)里的數(shù)字化部門就能針對新場景,自己研發(fā)算法做全新應用。
業(yè)界也觀察到這一趨勢。百度智能云AI平臺高級架構師靳偉告訴數(shù)智前線,這反映出,AI應用邁向深水區(qū),企業(yè)的智能化轉(zhuǎn)型的系統(tǒng)性日益凸顯。企業(yè)不但要有愿景目標規(guī)劃,也需要有很強的推進協(xié)調(diào)和監(jiān)督機制,并且要有完備的工具,確保順利推進實施。AI平臺就是企業(yè)智能化轉(zhuǎn)型的生產(chǎn)力工具。
行業(yè)上下已經(jīng)意識到這一平臺產(chǎn)品的重要性。日前,國際分析機構Forrester發(fā)布《The Forrester WaveTM:中國市場人工智能/機器學習平臺廠商評測,Q42023》報告指出,中國的企業(yè)決策者們正進一步優(yōu)先考慮采用AI技術,推動生產(chǎn)率提升和業(yè)務創(chuàng)新。過程中,企業(yè)需要人工智能平臺產(chǎn)品,從而在各自的業(yè)務環(huán)境中支持復雜用例。
新的趨勢對機器學習平臺廠商的能力也提出了要求。Forrester認為,領先的平臺既要能提供跨數(shù)據(jù)管理、模型培訓和人工智能應用程序構建的綜合工具;也要貼合產(chǎn)業(yè)場景,幫助一些缺乏AI人才和數(shù)據(jù)科學家的企業(yè)基于自身業(yè)務需求來獲得AI能力;另外,還能通過工具、技術和實踐幫助企業(yè)可以規(guī)模化開發(fā)部署模型。
Forrester對中國14家主流機器學習平臺廠商從產(chǎn)品能力、戰(zhàn)略布局、市場表現(xiàn)3大維度,進行了25項細分標準的評估。數(shù)據(jù)顯示,目前百度智能云獲評該報告的領導者陣營,在數(shù)據(jù)、訓練、預測推理、應用等9項細分評分均獲第一。
靳偉介紹,百度在AI平臺的產(chǎn)品能力領先經(jīng)歷了長期的積累和打磨。AI平臺的初衷是希望打造一款生產(chǎn)力軟件,讓不同類型的企業(yè)用戶能夠多快好省地建設AI應用,同時做到平臺上算法多、工具多、運行快、效果好,幫助客戶節(jié)省服務器和人力。
目前能源、金融行業(yè)的一些大型企業(yè)里已經(jīng)在深度使用。基于AI平臺,企業(yè)不僅可以快速構建符合業(yè)務需求的人工智能模型及應用,還能有效監(jiān)控和優(yōu)化模型效果。此外,管理和協(xié)調(diào)數(shù)據(jù)、算力、人員、流程等資源時也更便捷、高效。
例如,電力行業(yè),百度智能云AI平臺正幫助大型集團解決業(yè)務痛點。一方面,模型和數(shù)據(jù)能在不同子公司分享,避免重復造輪子。同時一些已有的安全生產(chǎn)相關模型使用這款產(chǎn)品,可由國網(wǎng)直接統(tǒng)一分發(fā)到省網(wǎng)或市網(wǎng),能高效利用AI資源,質(zhì)量一致。另外,AI平臺還能助力企業(yè)創(chuàng)新,比如研發(fā)出的電力調(diào)度新算法,用上了百度的強化學習框架,可實現(xiàn)不用大量專家的人工經(jīng)驗調(diào)參數(shù),AI自動完成調(diào)度參數(shù)校準。
金融行業(yè)里,百度智能云的AI平臺解決方案也幫助許多金融機構構建了大的模型風險管理模塊,保障AI應用到金融場景里流程合規(guī)和可信安全。
02
大模型時代,如何量體裁衣
今年以來,大模型和生成式AI浪潮推動了產(chǎn)業(yè)界進一步深度應用AI,機器學習平臺也在迎來新的發(fā)展機會。
資深人士介紹,大語言模型到來后,機器學習平臺的變化體現(xiàn)在三個層面。最典型的一個變化在操作界面上,NLP之前復雜的操作界面變簡單了,企業(yè)應用語言類AI的門檻在降低。同時,模型的自動化能力提升,數(shù)據(jù)處理、模型選擇、自動報告生成等任務都可以自動化完成。另外,AI原生的創(chuàng)新應用空間也隨之打開。
在這一背景下,許多企業(yè)已經(jīng)把大模型當作了一道必答題,各平臺廠商也摩拳擦掌,加足馬力,推出各類產(chǎn)品和平臺來加速大模型技術的應用落地。以百度為例,今年3月推出了百度智能云千帆大模型平臺,將大模型開發(fā)和應用的關鍵能力與AI平臺深度整合,打造大模型服務的“超級工廠”。
為方便企業(yè)輕松使用和開發(fā)大模型應用,目前百度千帆上既提供包括百度自研的文心大模型和第三方大模型,還提供了各種AI開發(fā)工具和整套開發(fā)環(huán)境,助力各行業(yè)的生成式AI產(chǎn)業(yè)落地。
具體而言,百度將產(chǎn)業(yè)界對大模型的需求總結為五種類型,無論是只有算力需求的客戶,還是希望直接調(diào)用大模型API或基于現(xiàn)有大模型做二次開發(fā)的企業(yè),以及想要基于大模型去開發(fā)AI原生應用或者直接使用已開發(fā)好應用的公司,百度千帆平臺都能提供有針對性的服務。
對只有算力需求的企業(yè),百度千帆平臺可提供極具高效和性價比的異構算力服務。靳偉透露,要做到這一點,百度智能云AI平臺的技術團隊花幾年時間做了大量Dirty Work。例如兼容國內(nèi)外主流AI芯片,需要從框架層、核心算法及網(wǎng)絡、芯片型號、操作系統(tǒng)四個層級做適配。“PyTorch寫的和TensorFlow寫的不一樣,操作系統(tǒng)用Windows、Linux或者單片機,要做的工作也有差別。四層組合做了四萬種適配,才能保證各種模型順利運轉(zhuǎn)。”靳偉說。
想直接調(diào)用大模型API的用戶關心模型能力的豐富性,目前千帆大模型平臺既接入了文心大模型4.0,還納管了44個第三方的國內(nèi)外主流大模型,數(shù)量上是國內(nèi)平臺里最多。
有些企業(yè)希望對現(xiàn)有大模型進行二次開發(fā),這需要豐富的工具鏈和大量的數(shù)據(jù)集支持。千帆平臺目前有覆蓋大模型再訓練、微調(diào)、評估和部署等全生命周期的完善工具鏈和大量高質(zhì)量數(shù)據(jù)集,能針對場景快速優(yōu)化模型效果,進一步提升企業(yè)的大模型用戶體驗。
大模型對數(shù)據(jù)標注環(huán)節(jié)帶來新變化,許多標注任務可通過模型完成。目前千帆平臺支持業(yè)務數(shù)據(jù)回流和高度自動化的數(shù)據(jù)標注。比如目標檢測場景里,千帆直接提供預訓練能力,通過點按紐標注少部分,剩下的讓模型學習人類標注風格自動標注,可為企業(yè)節(jié)省70%~90%的人力。
也有許多企業(yè)想基于大模型來開發(fā)AI原生應用。本月中旬,百度智能云發(fā)布“千帆AI原生應用開發(fā)工作臺”,其中包含大模型應用開發(fā)的常見應用組件、應用框架兩層服務,正是針對開發(fā)AI原生應用需求。
以應用組件為例,千帆平臺包含了多種類型的能力,如問答、思維鏈等大語言模型組件和文生圖、語音識別等多模態(tài)組件以及向量數(shù)據(jù)庫、對象存儲等傳統(tǒng)云服務能力等。
而應用框架能將組件有機串聯(lián)起來,完成特定場景的完整任務。千帆平臺已經(jīng)提供市面上常用的檢索增強生成(RAG)、智能體(Agent)等框架服務,先鋒企業(yè)如三一重工已經(jīng)應用這些框架,快速開發(fā)自己的知識問答應用。
Prompt工程是大模型出現(xiàn)之后誕生的新領域。這與大模型的特性有關,稍微改變一下指令,它的輸出或行為會發(fā)生巨大變化。目前,各家廠商都在強調(diào)Prompt工程工具。百度千帆平臺也提供了覆蓋對話、編程、電商、醫(yī)療、游戲、翻譯、演講等十余個場景,共226個模版。據(jù)介紹,這是國內(nèi)主流平臺里數(shù)量最多的Prompt模板庫。開發(fā)者和企業(yè)還能使用平臺提供的各類自動化及批量工具,高效完成prompt環(huán)節(jié)。
靳偉認為,過去幾個月里百度智能云千帆大模型平臺夯實了基礎,為百模大戰(zhàn),助力企業(yè)規(guī)模化應用AI做好了準備。
03
AI平臺,下一站拼什么?
AI并不只是大企業(yè)專屬。目前機器學習平臺廠商們都重視對大型企業(yè)、中小型客戶和開發(fā)者市場的全面覆蓋,百度智能云的AI平臺解決方案也有針對性地服務不同群體。
靳偉告訴數(shù)智前線,百度AI平臺解決方案是多個產(chǎn)品的總稱,包含了全功能AI開發(fā)平臺BML、零門檻AI開發(fā)平臺EasyDL及百度智能云千帆大模型平臺等產(chǎn)品。針對不同領域或不同客戶偏好,AI平臺都有對應的產(chǎn)品適配。例如,數(shù)據(jù)處理能力被打包成EasyData產(chǎn)品,零代碼建模能力也被抽出來做了EasyDL產(chǎn)品,能幫助用戶實現(xiàn)用高性能預訓練模型完成零代碼建模,而大模型的能力則由百度智能云千帆平臺承載。
在公有云上,客戶類型以偏中小的企業(yè)居多,AI平臺的模塊被重新打散組合,以全功能AI開發(fā)平臺BML和EasyDL產(chǎn)品為主要代表來適應需求。針對大型客戶的私有化部署需求,各類產(chǎn)品又會被打包成超大產(chǎn)品去完成交付。
此次Forrester報告顯示,百度智能云AI平臺的產(chǎn)品能力在數(shù)據(jù)處理、模型訓練、預測推理、應用、架構等五大領域都表現(xiàn)優(yōu)異。
靳偉介紹了不同領域里的獨特能力優(yōu)勢。以數(shù)據(jù)領域的特征工程為例,靳偉介紹,百度AI平臺集成了非常優(yōu)異的特征庫管理能力,能力上達到了專業(yè)級水平。可以提供特征的增刪改查,特征生產(chǎn)、共享、版本管理、數(shù)據(jù)驗證等功能,支持批示流式不同形式的數(shù)據(jù)用于預測服務,還能保證模型訓練時用的特征和最終預測時候的特征一致。“如果訓練的時候特征分布上,比如男人占50%,女人50%,而預測的時候男人占60%、女人40%,那你不可能指望這個模型特別準”,靳偉說,這對模型的準確性非常關鍵。
又比如模型訓練領域,百度AI平臺可支持包含圖像、視頻、文本、語音以及結構化數(shù)據(jù)等多種數(shù)據(jù)類型的建模和訓練。在建模方式上,為愿意寫代碼的人提供了NoteBook工具支持,不喜歡寫代碼的人能拖拉拽甚至點一下集成式一站式按紐就能建模。針對大量的場景比如圖像分類,單標簽多標簽,物體檢測等CV場景,都由飛槳算法團隊基于Paddle算子進行了深度優(yōu)化,性能和效果表現(xiàn)會更優(yōu)異。
產(chǎn)品性能上的獨特優(yōu)勢點,離不開長期的技術投入和對新技術趨勢的關注。百度AI平臺研發(fā)團隊介紹,他們非常關注新的技術趨勢,比如三年前業(yè)界就在探討模型可解釋性問題,不知道模型怎么做決策的,就會影響模型在安全合規(guī)要求比較高的場景里使用。一般而言,深度學習模型參數(shù)量上比傳統(tǒng)的機器學習模型大很多,黑盒問題會更加嚴重。
經(jīng)過長期的準備,百度AI平臺團隊最終攻克了常規(guī)機器學習領域下的模型可解釋性算法,集成了五個常見的機器學習的原理白盒化,同時還攻克了部分深度學習可解釋性問題。“弄清模型在什么場合下做出決策,是數(shù)據(jù)引發(fā)還是算法引發(fā),都可以歸因,這些成果推動了AI平臺相關產(chǎn)品在金融決策等特殊行業(yè)場景里的應用。”靳偉介紹。
當下業(yè)界把大模型的發(fā)展范式分五層,大模型本身、prompt工程、Chain工具鏈和行動鏈、Agency與Multiagency。百度智能云千帆平臺此前主要的工作重心在第一、二層走得非常扎實,后面三層包括工具鏈、Agent和Multiagency能力也處于重點建設階段。靳偉介紹,千帆大模型平臺將持續(xù)完善升級,讓大模型自主發(fā)揮主觀能動性,具備解決復雜問題的能力。同時,未來不排除有出海計劃。
總體而言,企業(yè)智能化建設下,企業(yè)應用AI深度升級,AI平臺領域的競爭也日趨激烈。要在這一領域持續(xù)保持領先,迎接合規(guī)性和技術復雜度變化等帶來的長期挑戰(zhàn),廠商們還需要技術投入。靳偉認為,廠商需要堅持技術創(chuàng)新、在客戶滿意度、安全性、合規(guī)性上提升來適應這個不斷變化的市場。
行業(yè)資訊、企業(yè)動態(tài)、業(yè)界觀點、峰會活動可發(fā)送郵件至news#citmt.cn(把#換成@)。
海報生成中...