如果說2023年是通用大模型的元年,2024年將是行業大模型落地元年。
文|趙艷秋
從去年底到今年初,各行各業正迎來大模型落地潮。“大家都馬不停蹄的。”
就在這樣的熱潮之中,政企市場的資深玩家浪潮云,在青島發布海若大模型業務戰略,定位行業大模型市場,首批面向政府、交通、應急、制造、醫療、農業六大行業,通過培育“三位一體”的數字生態創新共同體,加速行業大模型在百城落地。
01
大模型落地熱開始了
“大模型的行業落地需求來的又快又猛。”一位趕到青島參加浪潮云數字創新生態大會的大模型落地服務商說。“從去年底到今年初,這樣的氛圍特別濃,大家都馬不停蹄的,這個潮流來的太快了。”另一位現場人士說。
一位正在與醫院合作大模型落地的浪潮云人士說,原來每家醫院都有自己的一個小生態,其他人想進入都有壁壘。“但我們現在用大模型去聊,醫院都很開放。雙方在一起碰撞的思路特別多,大家都愿意做出一些創新的東西。”
在醫院,一位科室主任告訴浪潮云人士,自己手下那么多博士,80%的時間都花在文書上了。“一點都不夸張。”另一位參觀的服務商說,現在實習生就是在辦公室寫病歷,根本接觸不到患者。“所以他們就想解決這個問題。”目前,浪潮云與一家三甲醫院合作,采用大模型的即時病例生成,準確率已達90%。
在經歷了近一年的市場培育和摸索后,各行各業正迎來大模型落地潮。背后根本的原因是,傳統技術已不能解決企業當下面臨的問題,而大模型在降本增效上確實效果明顯。正是在這樣的形勢下,浪潮云正式發布海若大模型業務戰略。
“現在是很寶貴的時間窗口。”一位浪潮云人士說,“我們在一些行業中不是走在最前面的廠家,但大模型我們是比較快的。我們一旦用大模型形成方案,占領市場,就可能建立自己的護城河。”
浪潮集團執行總裁、總工程師,浪潮云董事長肖雪在大會上表示,政府工作報告首項任務即是加快新質生產力。“新質生產力起點是‘新’,關鍵在‘質’,落腳于‘生產力’。大模型的問世,讓我們有新的抓手,去培育新質生產力。”
浪潮云總經理顏亮介紹,浪潮海若大模型定位在行業大模型,首批面向政府、交通、應急、制造、醫療、農業六大行業。浪潮云將投入50億元資金,通過培育“三位一體”的數字生態創新共同體,推動海若大模型在100個城市快速落地。
“如果說2023年是通用大模型的元年,2024年從浪潮云的角度來看,是行業大模型落地的元年。”浪潮云首席技術官孫思清說,浪潮云正在與生態伙伴,跑通行業大模型商業閉環。
02
行業大模型必須下場
去年,全國掀起了百模大戰。“前期的同質化比較嚴重,大家尤其關注通用大模型的基礎能力。”顏亮說,“但在后續的裂變中,我們意識到,大模型要能快速展現場景價值、快速落地,行業大模型必須下場。”
現在各個城市已意識到這個趨勢,都在加大行業大模型投入力度。
那么,一個行業大模型是怎么煉成的?孫思清告訴數智前線,在每個行業,浪潮云都有“燈塔客戶”,合作去訓練行業模型。
在數據方面,大模型的訓練使用了公開數據、授權數據和私有數據。其中,公開數據集完全能對外,是浪潮云經過治理形成的;如果用到了行業授權數據,要保障不出域;而針對私有數據則是本地化的。“每個行業的數據安全分級不同,要根據不同的法規解決這件事。”孫思清說。
“有些數據不容易確權怎么辦?就在域內做模型訓練,訓練后模型能不能出域,就涉及到安全審查或安全評估。”顏亮進一步分析,“因為模型可以加噪,如果技術能證明原始數據是不可復原的,模型就可以出域,這是下一個課題,業內還在探討。”
在訓練行業大模型時,浪潮云會沉淀每個行業的通用智能體,這是一些共性應用,發布在智能體商店。每個行業智能體商店將覆蓋200多個典型應用場景,加快復制推廣。行業大模型在進入企業或政府內部,可以再結合專有數據、專有場景調優。
以醫療行業為例,浪潮云收集了1800多本醫學書籍、1200多萬個醫療問答等100萬條以上的公開數據,訓練醫療行業大模型。這個行業大模型應用到一家三甲醫院的病歷生成上,準確率為50%。浪潮云進一步采用該醫院1.2萬份脫敏住院病歷、300小時入院問診對話等更高質量的數據,進行監督訓練和強化學習,生成的準確率逐步達到90%。
“行業大模型落地的一個特點,是必須有一個對專有數據的精調過程。”顏亮說。
“從浪潮云來講,我們必須跟別人不一樣,會考慮標準化、規模化,同時一定會考慮定制化。”孫思清說。
有趣的是,通用大模型參數已經從上千億走到萬億級,但在浪潮云在行業落地中發現,參數不是越多越好。“在行業中,我們認為7B-70B性價比最佳。”孫思清說,因為國民經濟共有97個行業,每個行業采用的數據集通常是2T、3T,不會很大。這一實踐得到不少服務商的認同。
對于大模型落地路徑,業界有不同觀點。“大家現在有一個很大的概念,叫做大模型的原生,但我不這么認為。”顏亮告訴數智前線,“我們的想法是針對原有的生產系統或管理系統,植入大模型能力,這既能快速體現行業價值,也能對原有架構挑戰最小。”
現場一位資深服務商表示贊同。他們從去年開始與一些地市合作,將行業大模型植入到原有的投訴舉報系統,實現了效果提升,目前已在幾個地市推廣復制。
當下大模型處于場景點的挖掘,顏亮認為,要真正讓行業產生質變,大模型需要全流程植入。這可能需要1-2年,其中關鍵是大模型要經過周期性迭代,才能達到可用。“最多兩年時間。競爭會促成大家的互相學習和投入,我們感知到,2024年用戶在大模型上的投入,是2023年水平的3-4倍以上。”
03
行業落地關卡和三個解法
在這一年的實踐中,浪潮云觀察,政企用戶在接納、落地行業大模型上,要過四大關卡:
首先是數據隱私的保護和合規,這是客戶的底線,這個問題不解決,很多行業客戶就不會進場;其次是復雜的定制化需求,這是政企行業的基本要求;再次是人工與智能的協作,這是當下每個人都面臨的新變化;最后是持續的學習和優化,大模型落地不是一個項目,而是服務與運營。
浪潮云也摸索出三個解法,將其提煉為可信賴、易落地和可持續。
首先是可信賴,核心要解決的問題是本地化部署。政府有明確的“數據不出域”的邊界,行業和企業也有“模糊的”數據不出域的邊界。本地部署是行業大模型的必備條件,滿足用戶的底線要求。
其次是易落地。大模型企業要提供完整的產品矩陣。“算力一定是大模型廠商帶著入場的。”顏亮說。數據治理能力是必不可少的。而大模型引擎是最基本的要求。要在行業里實現價值,要靠智能體工廠,這是一個面向行業的人工智能低代碼開發平臺。最終,做出的智能體要發布到商店里。
最后是可持續。“如果不可持續,得不償失,因為我們去做一個大模型驗證的試驗環境,投入量級都是幾百萬元。”顏亮在大會上介紹說,我們建議“平臺+服務”模式,購買MaaS服務。從持續性上看,核心問題是數據的持續供給,現在95%的政企客戶,數據質量不高,要做數據治理。
浪潮云在這三方面已有明確布局。浪潮云已在120個城市部署了云中心。預計今年6月,基于浪潮政務云,會在90個城市部署大模型引擎和智能體平臺,提供從底層分布式算力,到上層治理好的數據集,再到上面的海若大模型、智能體工廠和智能體商店,以及安全衛士的整個體系。
在這樣的體系下,云上的政務客戶,在一天內可以接入大模型,開箱即用。在云中心覆蓋的城市,不能直接用政務云的非政務客戶,浪潮云一周可以在云中心內為企業和行業做部署;如果是基于客戶自有云中心或第三方云中心,部署周期為一個月。
04
大模型的“三位一體”創新生態
大模型帶來了新的生態結構。顏亮告訴數智前線,這是一個“三位一體”的創新共同體,分別是算力層生態伙伴、行業數據層生態伙伴,以及智能體運用生態伙伴。
從算力角度講,浪潮云自身有一定算力,但因為大模型下場會帶來很大的算力消耗,所以各地建設的算力中心,包括政府平臺公司建設的算力平臺,都在浪潮云的生態伙伴范疇。
在智能體開發商伙伴方面,大模型也改變了傳統的開發形態。軟硬件廠商、端廠商會融合起來一同創新。比如在醫院病歷生成應用中,醫生會掛采集端。“我們甚至有個想法,是把模型小型化之后,植入到采集端,突破效率、環境的局限性。這在發展之中。”顏亮說。
一位從華中地區趕來的制造行業服務商告訴數智前線,他感到,經過一年多的實踐,浪潮云在政企市場的落地思路和實踐打法已非常清晰,他期望加入到浪潮海若大模型的生態中,參與到當下行業大模型的落地熱潮中。
行業資訊、企業動態、業界觀點、峰會活動可發送郵件至news#citmt.cn(把#換成@)。
海報生成中...