首頁 > 資訊 > 數字化

建議阿里們，不要著急搶行業大模型的「飯碗」

2023/09/27 10:15 微信公眾號：數據猿一蓑煙雨

　　近幾個月，國內大模型領域一個很明顯的發展態勢，就是大家扎堆行業大模型。不僅各個垂直領域的企業發布多個行業大模型，而且百度、阿里巴巴、華為、騰訊、京東等頭部巨頭，也把行業大模型作為一個關鍵的發力點。

　　具體來看，根據大模型在其戰略中的比重，這些廠商又可以分為兩類：

　　百度、阿里巴巴、騰訊、科大訊飛這幾家，通用大模型與行業大模型并重。

　　一方面，他們比較注重通用大模型，并將通用大模型開放給C端用戶使用。百度文心一言、科大訊飛的訊飛星火甚至做了手機端APP，來推進通用大模型的應用。

　　另一方面，他們也非常注重行業大模型。一般通過行業解決方案的形式，對外輸出。甚至，在9月19日，百度直接推出了一個醫療行業大模型——靈醫大模型，直接服務醫院、患者、醫藥器械企業。

　　另外一類，則以華為、京東為代表，他們從一開始就主打產業大模型，直接面向行業應用。

　　華為盤古大模型一開始打出的口號就是“不作詩，只做事”，其并不熱心C端應用，幾乎把所有戰略重心都放在行業上。

　　京東的言犀大模型也類似，秉承京東云“更懂產業的云”這一理念，京東在大模型領域也將重心放在行業應用上。此外，京東健康還發布了京醫千詢大模型，作為進軍行業領域的排頭兵。

　　可以發現，無論是“兩線并重”的百度、阿里巴巴、騰訊、科大訊飛，還是幾乎“單線作戰”的華為、京東，都將行業大模型作為一個兵家必爭之地。

　　筆者認為，這是有問題的。這些科技巨頭，應該把重心放在通用大模型上，行業應用應該交給各個行業領域的合作伙伴去做，自己只做大模型的“基礎設施”，不碰上層應用。

　　為什么這樣說，接下來我們來詳細分析其中的利弊關系。

　　巨頭應該著眼于通用大模型的研發

　　通用大模型就像整個大模型產業的地基，地基是否牢固，將決定了這座大廈能夠建多高。那么，現在的地基牢固么?

　　很遺憾，雖然目前大模型初步實現了智能“涌現”，在自然語言理解、內容生成、邏輯推理方面都有長足的進步，但是還不夠好。尤其是想讓大模型在各個行業領域進行商業落地，目前的模型能力是不夠的。

　　這里說的能力不夠強，不是特指某一個大模型。

　　即使是GPT-4，要想在商業領域落地，能力都還存在顯著的不足。我們來看幾個例子。

　　搜索引擎是大模型一個重要的應用場景，微軟的必應因為接入ChatGPT，改變了原來關鍵詞的搜索方式，打了一個漂亮的翻身仗。那么，有ChatGPT助攻的必應的真實表現如何呢?

　　我們試用了一下，說實話讓人很失望。

　　以下是一個例子，讓必應查找一下今天(9月26日)關于大模型的新聞，結果給出的四條新聞，點進去之后，第1、3條內容其實來自于一篇新聞文章，而且這條新聞是2月21日發布的;第2、4條內容也來自同一篇新聞，這個新聞是7月27日發布的。

　　也就是說，給出來的新聞是錯的，我們要找今天的新聞，結果卻返回幾個月前的內容。而且，我們是要找大模型領域發生的重要事件，給出來的四條答案中，有兩個報告、一篇新聞分析文章、一個論壇活動。嚴格的說，報告、分析文章并不算是重要的新聞事件，從這個角度來說，必應給出來的結果也完全不符合要求。

　　筆者接著往下問，讓它用表格梳理一下給出的新聞內容。結果在其給出的表格中，新聞時間都變成了9月26日，而且具體到時間點，這明顯就是在胡說八道嘛。

　　筆者曾經對必應這類新的搜索引擎懷有很高的期待，也嘗試過很多次。但整體的感覺就是——基本不能用。這就是ChatGPT在搜索領域應用的實際表現，某種程度上，這已經代表了大模型所能達到了最高水平。

　　百度也推出了類似的功能，除了通常的網頁搜索外，也可以通過對話形式來進行查詢，我們迫不及待的試了一下。

　　相對于必應，百度對于新聞事件的理解要好一些，必應給出了幾個報告，百度給出的結果是大模型發布，這些事件的新聞價值明顯更高。

　　但是，百度給出的這些結果靠譜么?同樣的，我們讓其以表格形式進行統計，并給出新聞時間和鏈接�？梢园l現，時間都是5月11日的，這明顯是有問題的，我們要的是9月26日的新聞，而不是5月11日的。

　　而且，表格里給出的新聞鏈接也有問題，打開對應的網頁直接是“404”。當然，微軟的必應也有這個問題，其給出的新聞鏈接要么打不開、要么不存在。

　　回到ChatGPT上來，其一個重要的局限就是不能聯網，而且其數據沒能實時更新，GPT-3的訓練數據集是截止到2021年9月，GPT-4的訓練數據集是截止到2022年1月。

　　而且，ChatGPT在復雜的數據計算處理方面，經常會出錯。其宣稱的文本上傳、理解能力，也并不理想。

　　讓我們來試一下GPT-4的文檔理解能力。我們上傳了龍芯中科的2023年半年報，試圖讓其來做一個簡單的SWOT分析。上傳文檔之后，ChatGPT就開始寫代碼，來解析文檔，好像很厲害的樣子。

　　結果如何呢?

　　最終，ChatGPT沒解析出來這個PDF文檔，我們又試了好幾次，結果都是解析不出來。

　　試想一下，依托這些大模型，想要在復雜的行業場景落地，效果必然不會很理想，而他們已經是現在市場上*的通用大模型了。

　　誠然，大模型的確出現了一些“智能涌現”，能力得到質的提升，但目前處于“小荷才露尖尖角”的初級階段。既然發現大模型這條道路是一個有希望的方向，那現在最應該做的是快馬加鞭，好好培養這個有潛力的“孩子”，而不是過早的就讓其來養家糊口。

　　以歷史經驗來看，每次人工智能狂熱之后都會經歷一段漫長的沉寂，主要原因就是前期人們的期望值被拉得太高了，一旦發現達不到期望就會很失望。

　　同樣的，如果現在就匆匆將大模型在各個行業領域強行落地，很快就會迎來一個問題爆發期，人們會從巨大的期待迅速轉變成瘋狂吐槽，這樣的大起大落是不利于行業健康發展的。

　　所以，阿里巴巴、華為、百度、騰訊這樣的科技巨頭，目前最核心的任務，就是把通用大模型這個“孩子”培養好。只要能力真正提上來了，那規模化落地其實是很快的，不著急在這一時半會。

　　大模型領域有一條著名的智能涌現的曲線，也就是模型的表現跟參數規模并不是線性相關的，不是200億參數的模型就比100億參數的模型好兩倍。

　　在這個智能涌現曲線上，有一個閾值，目前看這個閾值就是1000億參數左右。在這個閾值之前，模型表現出的智力水平并不隨著參數規模的擴大而顯著變化，200億參數的模型跟20億參數的模型表現差不多。但是，當參數規模邁過千億的門檻之后，模型的表現得到指數級提升。

　　雖然，模型規模不能代表一切，但從近十年的人工智能發展經驗來看，“數量暴力”往往是一個關鍵的方向，更大的模型、更深的神經網絡、更多的數據，會帶來更好的表現。

　　從目前的智能涌現曲線來看，千億級參數規模之后，又會進入一個智能瓶頸期，可能5000億參數的模型，跟1000億參數模型在“智力”上沒有顯著的差異。但是，如果我們要追求下一個“涌現閾值”，目前來看*的辦法就是繼續擴大參數規模。也許，等參數規模擴大到幾十萬億之后，又會迎來下一個涌現閾值，大模型的能力將再上一個臺階。

　　當然，擴大模型規模，成本也會顯著提高，所以這只能是巨頭們的游戲。而且，單純擴大模型規模，還會帶來過擬合的問題。因此，模型規模的擴大還需要配合模型架構的優化調整，這才是真正考驗技術能力的地方。

　　退一步說，現在的大模型都是基于Transformer架構，而這個架構是5年前谷歌的幾個研究人員的一篇論文提出來的。那么Transformer架構真的是*的么，是否有更好的模型架構呢?這些問題，都是需要華為、百度、阿里巴巴、騰訊等科技巨頭來回答的。

　　除了參數規模、模型架構外，大模型還需要解決“幻覺”問題、可解釋性問題、多模態問題。這些問題現在都沒能得到很好的解決，這是整個行業所面臨的共同難題。而要解決這些問題，關鍵還是在于通用大模型上的底層技術突破，而不在于行業大模型。

　　當然，誰能真正解決這些關鍵問題，那市場必定會給出對應的獎勵。

　　不要既做裁判又做運動員

　　之所以建議科技巨頭先不要碰行業大模型，除了通用大模型的問題還沒解決外，另一個很重要的原因，就是避免與合作伙伴發生利益沖突。

　　對于科技巨頭而言，玩的是生態的游戲，分享的是基礎設施的收益。

　　在大模型領域，其價值傳導路線應該是通用大模型-行業大模型-行業客戶。在行業大模型階段，華為、百度、阿里等通用大模型廠商既可以自研行業大模型，也可以讓第三方合作伙伴在自己通用大模型基礎上進行研發。

　　通用大模型考驗的是技術能力，而行業大模型的技術門檻并不是很高，其核心要素是數據和行業經驗，而這兩點是科技巨頭們的短板。要匯聚金融、醫療、制造、零售等各個行業的優質數據集，理解各行各業的業務場景，*不是某一家企業能夠做到的，必須依托生態的力量，用整個生態體系成千上萬的合作伙伴去做。

　　當然，百度、華為、騰訊這樣的通用大模型廠商，也可以兩條價值傳導路線都占。比如，在醫療領域，百度既可以用自有的靈醫大模型去直接服務醫院、患者、醫藥器械企業，同時也可以推進垂直醫療大模型合作伙伴體系建設。

　　但是，這種情況就會面臨“與民爭利”的問題，這犯了商業的大忌。

　　試想一下，某個醫療大模型企業A，建立在B企業的通用大模型基礎上，把自己的核心醫療數據向B開放，訓練醫療大模型。在幾個月之后，A發現B企業也推出了一個醫療大模型，而且功能跟自己的差不多。在行業客戶打單時，發現B企業也在競標，自己的合作伙伴突然變成了競爭對手。如果是這種情況，A企業還愿意與B企業合作么?

　　在一個生態體系中，合作伙伴對于生態主的信任是黃金一般寶貴的東西。只有上層應用合作伙伴堅信生態主不會跟他發生利益沖突，不會搶他生意，他才會放心把自己的業務放在生態主構建的平臺上。

　　這有點類似于云計算領域IaaS廠商與SaaS廠商的關系。中國很多SaaS企業之所以對阿里云、騰訊云、百度云、華為云等云廠商不放心，最關鍵的就是怕利益沖突。目前，IaaS云廠商的業務邊界不夠清晰，不僅提供IaaS、PaaS產品，還進入了不少SaaS領域，這是其SaaS合作伙伴最忌諱的。

　　在中國互聯網的早期階段，投資人對創業公司有一個著名的靈魂拷問——騰訊做一個同樣的產品，你怎么辦?

　　同樣的道理，通用大模型廠商想構建一個應用生態，那醫療、金融、政務、制造等領域的行業大模型廠商也會問——你將來做一個跟我一樣的東西，那我怎么辦?

　　那怎樣的大模型生態體系才更合理呢?可以借鑒云計算生態體系，通用大模型相當于IaaS，行業大模型相當于SaaS。

　　百度、華為、阿里巴巴、騰訊、京東、字節跳動、科大訊飛等幾家頭部通用大模型廠商，專心做好通用大模型(IaaS+PaaS)，盡量不碰行業大模型(SaaS)，劃分好業務邊界。

　　需要指出的是，即使不做行業大模型，底層通用大模型廠商依然可以分享到大模型的行業應用紅利。就像SaaS應用會消耗IaaS資源，為IaaS付費一樣，上層的行業大模型會調用下層通用大模型的能力，可以基于調用的次數和使用量，來構建合理的商業模式。

　　比如，百度不做醫療大模型，但在文心一言基礎上有10個醫療大模型合作伙伴，每個合作伙伴服務1000家醫院。假定每家醫院每年付費100萬元，這100萬中百度分享20%。那每個醫療大模型企業每年可收入10億元，百度的收入為10億*20%*10=20億元。這樣一來，百度只需要服務好10家合作伙伴即可，而不是去服務1萬家醫院。

　　以此類推，如果能夠構建一個繁榮的行業大模型生態體系，大模型的行業應用也可以為底層通用大模型廠商帶來上百億的收入規模。

　　對于百度、華為、騰訊、阿里巴巴這種通用大模型廠商而言，根本無需擔心錯過行業大模型應用的紅利。就像云計算領域，有哪個SaaS廠商的收入能夠媲美做IaaS的阿里云、騰訊云、華為云?

　　只要專心把通用大模型的地基打好，那以后就可以躺著賣“地皮”，而不用苦哈哈的搬磚建房子。我們回想一下房地產領域，*錢的是萬科、恒大這種房地產開放商么?顯然是賣地更賺錢，也更輕松。

　　對于垂直行業大模型廠商而言，他們最理想的狀態，是借鑒SaaS跨云部署策略，實現行業大模型的跨通用模型部署，并可將業務從一個通用模型平臺平滑遷移到另一個平臺，這樣就避免了被單個平臺綁定。當然，目前行業大模型才處于非常初級的階段，談跨通用模型部署還為時尚早。

　　行業大模型的跨模型部署模式數據猿制圖

　　綜上，建議百度、華為、阿里巴巴、騰訊這類科技巨頭，把注意力放在通用大模型的研發方面，而不是放在行業大模型的應用上。

　　一方面，通用大模型現在還不足夠好，模型的智能水平不夠高、幻覺問題、可解釋性差、多模態融合能力差、模型訓練推理成本高等問題還很突出，科技巨頭應該去解決這些更底層、更具挑戰性的難題。只有這些問題得到解決，大模型行業應用的根基才穩固。

　　在大模型行業應用層面，完全可以交給上層的垂直領域企業去完成�？梢灶A見，每個領域都將會有成百上千家行業大模型企業競爭，最后優勝劣汰留下來幾十家，這些生存下來的企業就是合格的合作伙伴。底層通用大模型廠商應該與合作伙伴一起構建一個生態體系，來共同服務行業客戶。

IT產業網微信二維碼logo

　　行業資訊、企業動態、業界觀點、峰會活動可發送郵件至news#citmt.cn（把#換成@）。

海報生成中...

分享到微博分享到微信一鍵復制

標題鏈接已成功復制

建議阿里們，不要著急搶行業大模型的「飯碗」

最新新聞

熱門新聞

新動態

關注度

最話題

建議阿里們，不要著急搶行業大模型的「飯碗」

相關閱讀

最新新聞

熱門新聞

新動態

關注度

最話題

建議阿里們，不要著急搶行業大模型的「飯碗」