日韩精品第一区,国产探花在线精品一区二区,高清一区二区
首頁 > 資訊 > 評論

MoE大模型大火,AI廠商們在新架構上看到了什么樣的未來?

2024/06/12 16:20      智能相對論


  文 | 智能相對論

  作者 | 陳泊丞

  很久以前,在一個遙遠的國度里,國王決定建造一座宏偉的宮殿,以展示國家的繁榮和權力。他邀請了全國最著名的建筑師來設計這座宮殿,這個人以其卓越的才能和智慧聞名。

  然而,這位建筑師設計的宮殿雖然精美絕倫,卻因為過于復雜和精細,以至于在實際施工過程中遇到了重重困難,許多技藝高超的工匠也感到力不從心。

  這時,國王手下有三位普通的石匠,他們雖然沒有顯赫的名聲,技藝也稱不上頂尖,但三人經常一起工作,彼此間有著極好的默契和互補的技能。面對宮殿建設的難題,他們沒有退縮,而是聚在一起討論和思考解決方案。通過無數次的嘗試和調整,他們發明了幾種新的工具和施工方法,簡化了復雜的建筑過程,使原本難以實施的設計變得可行。

  最終,這三位平平無奇的石匠通過配合,不僅幫助解決了工程上的難題,還加快了宮殿的建設進度,確保了工程質量,讓國王和所有人大為驚訝。他們的故事很快傳遍了整個國度,并成了一段佳話——“眾人智慧勝過一人天才”。

  而這句佳話所反映出來的道理,恰恰正是目前AI行業大火的MoE混合專家模型的設計思路。目前,隨著MoE模型大火,AI大模型的發展不再是追求“一人天才”,而是走向了“眾人智慧”。

  主流廠商越來越看重MoE模型,在新架構上他們又看到了什么樣的未來?“眾人智慧勝過一人天才”的佳話是否能在MoE模型上得以實現?

  有多少大模型廠商在押注“眾人智慧”?

  目前,在海外,OpenAI的GPT-4、谷歌的Gemini、Mistral AI的Mistral、xAI的Grok-1等主流大模型都采用了MoE架構。

  而在國內,昆侖萬維推出的天工3.0、浪潮信息發布的源2.0-M32、通義千問團隊發布的Qwen1.5-MoE-A2.7B、MiniMax全量發布的abab6、幻方量化旗下的DeepSeek發布的DeepSeek-MoE 16B等等也都屬于MoE模型。

  越來越多的廠商開始涉足MoE模型的開發和應用。比起“眾人智慧”,MoE模型的具體工作原理更接近中國的一句古語“術業有專攻”,通過把任務分門別類,然后分給多個特定的“專家”進行解決。

  它的工作流程大致如此,首先數據會被分割為多個區塊(token),然后通過門控網絡技術(Gating Network)再把每組數據分配到特定的專家模型(Experts)進行處理,也就是讓專業的人處理專業的事,最終匯總所有專家的處理結果,根據關聯性加權輸出答案。

  當然,這只是一個大致的思路,關于門控網絡的位置、模型、專家數量、以及MoE與Transformer架構的具體結合方案,各家方案都不盡相同,也逐漸成為各家競爭的方向——誰的算法更優,便能在這個流程上拉開MoE模型之間的差距。

  像浪潮信息就提出了基于注意力機制的門控網絡(Attention Router),這種算法結構的亮點在于可以通過局部過濾增強的注意力機制(LFA, Localized Filtering-based Attention),率先學習相鄰詞之間的關聯性,然后再計算全局關聯性的方法,能夠更好地學習到自然語言的局部和全局的語言特征,對于自然語言的關聯語義理解更準確,從而更好地匹配專家模型,保證了專家之間協同處理數據的水平,促使模型精度得以提升。

  拋開目前各家廠商在算法結構上的創新與優化不談,MoE模型這種工作思路本身所帶來的性能提升就非常顯著——通過細粒度的數據分割和專家匹配,從而實現了更高的專家專業化和知識覆蓋。

  這使得MoE模型在處理處理復雜任務時能夠更準確地捕捉和利用相關知識,提高了模型的性能和適用范圍。因此,「智能相對論」嘗試了去體驗天工3.0加持的AI搜索,就發現對于用戶較為籠統的問題,AI居然可以快速的完成拆解,并給出多個項目參數的詳細對比,屬實是強大。

  由此我們可以看到,AI在對比兩款車型的過程中,巧妙地將這一問題拆解成了續航里程、動力性能、外觀設計、內飾設計、智能化與自動駕駛、市場表現與用戶口碑、價格等多個項目,分別處理得出較為完整且專業的答案。

  這種“眾人智慧”的結果,更是“術業有專攻”的優勢——MoE模型之所以受到越來越多廠商的關注,首要的關鍵就在于其所帶來的全新解決問題的思路促使模型的性能得到了較為顯著的提高。特別是伴隨著行業復雜問題的涌現,這一優勢將使得MoE模型得到更廣泛的應用。

  各大廠商爭先開源MoE模型的背后

  在MoE模型被廣泛應用的同時,也有部分廠商爭先開源了自家的MoE模型。前不久,昆侖萬維宣布開源2千億參數的Skywork-MoE。而在此之前,浪潮信息的源2.0-M32、DeepSeek的DeepSeek-MoE 16B等,也都紛紛開源。

  開源的意義在于讓MoE模型更好的普及。那么,對于市場而言,為什么要選擇MoE模型?

  拋開性能來說,MoE模型更突出的一點優勢則在于算力效率的提升。

  DeepSeek-MoE 16B在保持與7B參數規模模型相當的性能的同時,只需要大約40%的計算量。而37億參數的源2.0-M32在取得與700億參數LLaMA3相當性能水平的同時,所消耗的算力也僅為LLaMA3的1/19。

  也就意味著,同樣的智能水平,MoE模型可以用更少的計算量和內存需求來實現。這得益于MoE模型在應用中并非要完全激活所有專家網絡,而只需要激活部分專家網絡就可以解決相關問題,很好避免了過去“殺雞用牛刀”的尷尬局面。

  舉個例子,盡管DeepSeek-MoE 16B的總參數量為16.4B,但每次推理只激活約2.8B的參數。與此同時,它的部署成本較低,可以在單卡40G GPU上進行部署,這使得它在實際應用中更加輕量化、靈活且經濟。

  在當前算力資源越來越緊張的局面下,MoE模型的出現和應用可以說為行業提供了一個較為現實且理想的解決方案。

  更值得一提的是,MoE模型還可以輕松擴展到成百上千個專家,使得模型容量極大增加,同時也允許在大型分布式系統上進行并行計算。由于各個專家只負責一部分數據處理,因此在保持模型性能的同時,又能顯著降低了單個節點的內存和計算需求。

  如此一來,AI能力的普惠便有了非常可行的路徑。這樣的特性再加上廠商開源,將促使更多中小企業不需要重復投入大模型研發以及花費過多算力資源的情況下便能接入AI大模型,獲取相關的AI能力,促進技術普及和行業創新。

  當然,在這個過程中,MoE模型廠商們在為市場提供開源技術的同時,也有機會吸引更多企業轉化成為付費用戶,進而走通商業化路徑。畢竟,MoE模型的優勢擺在眼前,接下來或許將有更多的企業斗都會嘗試新的架構來拓展AI能力,越早開源越能吸引更多市場主體接觸并參與其中。

  開源本身是對行業趨勢的一種認知判斷和提前布局,由此來說MoE模型具有成為未來AI能力普惠的關鍵。

  寫在最后

  MoE大模型作為當前人工智能領域的技術熱點,其獨特的架構和卓越的性能為人工智能的發展帶來了新的機遇。不管是應用還是開源,隨著技術的不斷進步和應用場景的不斷拓展,MoE大模型有望在更多領域發揮巨大的潛力。

  如同開篇的寓言故事,人們或許會在開始追求驚才艷艷的“一人天才”,但是在實踐過程中也會逐漸發現懂得配合和互補的“眾人智慧”才是建造落地的關鍵,就如同現在AI領域的MoE大模型大火。

IT產業網微信二維碼logo

  榜單收錄、高管收錄、融資收錄、活動收錄可發送郵件至news#citmt.cn(把#換成@)。

海報生成中...

分享到微博

掃描二維碼分享到微信

分享到微信
一鍵復制
標題鏈接已成功復制

最新新聞

熱門新聞

99热手机在线_五月天在线免费视频_波多野结衣之无限发射_美女一区二区三区视频_日韩在线观看a_天天天干夜夜夜操_日韩黄色片在线_97在线免费视频观看_天堂а√在线中文在线_88av.com_国产乱女淫av麻豆国产_日本a在线免费观看
日韩精品一区二区三区免费视频 | 欧美中文字幕| 在线视频观看日韩| 国产精品蜜月aⅴ在线| 视频在线观看一区二区三区| 亚洲激情中文| 91精品在线免费视频| 国产乱码精品一区二区三区亚洲人| 亚洲久久视频| 国产精品成人国产| 蜜桃成人精品| 香蕉久久久久久| 国产精品久久久久久模特| 久久aⅴ国产紧身牛仔裤| 亚洲欧美日本日韩| 成人自拍av| 欧美日韩视频网站| 久久狠狠婷婷| 视频一区日韩| 视频二区不卡| 亚洲欧美日韩国产| 精品亚洲自拍| 樱桃视频成人在线观看| 国产一区二区三区不卡视频网站| 久久久精品网| 亚洲一区二区三区四区五区午夜| 在线视频亚洲| 成人日韩在线观看| 欧美一区精品| 好吊一区二区三区| 国产网站在线| 亚洲精品1区2区| 亚洲国产日韩欧美在线| 欧美日韩免费观看一区=区三区| 美女视频黄 久久| 久久视频精品| 成人日韩精品| 97国产精品| 九九99久久精品在免费线bt| 国产免费av一区二区三区| 欧美日韩国产一区二区三区不卡 | 亚洲免费专区| 欧美日韩国产免费观看视频| 亚洲精品韩国| 国产一区二区三区成人欧美日韩在线观看| 久久男人av| 成人亚洲一区| 国产精品中文字幕亚洲欧美| 日韩在线麻豆| 日韩精品亚洲专区在线观看| 国产麻豆精品久久| 久久这里只有| 五月激情久久| 六月丁香综合在线视频| 免费日韩成人| 久久伊人久久| 模特精品在线| 精品视频高潮| 亚洲激情久久| 最新中文字幕在线播放 | 麻豆国产欧美日韩综合精品二区| 美女亚洲一区| 久久精品影视| 涩涩av在线| 国产日韩三级| 精品国产一区二| 不卡福利视频| 久久久777| 国产欧美日韩一级| 欧美激情综合| 午夜宅男久久久| 日韩精品电影| 国产日韩欧美在线播放不卡| 国产亚洲在线| 精品国产18久久久久久二百| 午夜精品久久久久久久久久蜜桃| 久久精品三级| 久久亚洲风情| 美女网站一区| 综合亚洲色图| 日韩视频中文| 国产欧美成人| 精品国产一区二区三区噜噜噜| 伊人国产精品| 成人日韩在线| 国产精品毛片aⅴ一区二区三区| 亚洲精品午夜av福利久久蜜桃| 国产精品中文字幕制服诱惑| 综合国产视频| 亚洲精品一区二区妖精| 嫩草伊人久久精品少妇av杨幂| 免费污视频在线一区| 欧美激情福利| 免费在线播放第一区高清av| 精品高清久久| 日韩久久一区| 99成人在线| 国产精品嫩模av在线| 久久三级中文| 日本中文字幕一区二区| 日韩精品欧美| 久久裸体视频| 久久精品影视| 日韩av三区| 日韩专区精品| 久久99精品久久久久久园产越南| 日韩综合一区二区| 中文在线免费视频| 亚洲精品电影| 国产一精品一av一免费爽爽| 色婷婷综合网| 久久精品99国产国产精| 亚洲香蕉网站| 精品伊人久久久| 狂野欧美性猛交xxxx| 丁香六月综合| 精品成人免费一区二区在线播放| 欧美极品中文字幕| 久久都是精品| 日韩中文字幕麻豆| 99视频精品全国免费| 精品视频97| 国产精品久久久久久久久妇女| 亚洲伊人精品酒店| 亚洲欧美一区在线| 日韩精品诱惑一区?区三区| 欧美精品三级在线| 日本aⅴ免费视频一区二区三区| 欧美日韩一区二区三区视频播放| 日韩深夜视频| 国产精品观看| 日本午夜精品| 欧美激情99| 国产欧美久久一区二区三区| 久久中文欧美| 美女视频黄久久| 国产精品久久久久久模特| 国产欧美日韩一区二区三区四区| 人人爽香蕉精品| 日韩精品欧美大片| 亚洲一区日韩在线| 国模精品一区| 精品欧美一区二区三区在线观看| 里番精品3d一二三区| 久久在线视频免费观看| 日韩不卡视频在线观看| 国产精品17p| 亚洲91久久| 欧美日韩中文字幕一区二区三区| 日韩天堂av| 亚洲欧洲日韩精品在线| 伊人影院久久| 亚洲人成在线影院| 日韩精品亚洲一区二区三区免费| 久久精品国产网站| 精品午夜久久| 亚洲综合五月| 国产精品久久久久77777丨| 日韩av在线免费观看不卡| 国产精品成人国产| 水蜜桃精品av一区二区| 亚洲欧美一区在线| 免费不卡在线观看| av资源新版天堂在线| 亚洲视频综合| 日日夜夜免费精品视频| 欧美久久天堂| 国产综合精品| 国产精品黄色| 久久精品电影| 国产精品国产三级国产在线观看| 六月婷婷综合| 国产午夜精品一区二区三区欧美 | 激情综合在线| 99pao成人国产永久免费视频 | 蜜臀精品久久久久久蜜臀| 婷婷久久免费视频| 欧美日韩激情在线一区二区三区| 国产精品av一区二区| 免费精品国产的网站免费观看| 久久精品97| 亚洲一级少妇| 欧美日韩一区二区三区在线电影| 欧美国产极品| 91免费精品| 亚洲伊人精品酒店| av中文字幕在线观看第一页 | 久久精品av麻豆的观看方式| 99久久99视频只有精品| 欧美日韩国产探花| 日韩欧美二区| 日韩中文字幕视频网| 久久精品伊人| 欧美精品中文字幕亚洲专区| 成人精品中文字幕| 国产h片在线观看| 日本久久一区| 久久精品欧洲| 久久伊人国产| 亚洲三级毛片|