国产一区二区三区不卡视频网站,日本成人在线不卡视频,97精品在线
首頁 > 資訊 > 數(shù)字化

OPPO大模型,主打非自研

2023/11/01 16:39      解碼


   今年5月9日,發(fā)布僅3天的訊飛星火大模型就在一個評測榜單上拿了個國服第一,力壓清華智譜、復(fù)旦MOSS以及百度文心一言等國產(chǎn)大模型,僅次于GPT-4和GPT-3.5。

  本來外界對訊飛稱王并無異議,但這份榜單將文心一言列在最后一名,熱心網(wǎng)友就不樂意了。

  隨后發(fā)布榜單的評測機構(gòu)SuperCLUE被曝光,一個仿照GLUE的國內(nèi)民間組織,權(quán)威度和影響力與GLUE相去甚遠,其微信賬號主體屬性為個人,被網(wǎng)友戲稱為AI版李逵和李鬼。

  就連訊飛的稱王都被挖出來貓膩。

  評測榜單發(fā)布當(dāng)天,SuperCLUE官網(wǎng)顯示信息,其測評顧問中排名第一的是崔一鳴,身份為學(xué)術(shù)顧問委員會主任,哈工大訊飛聯(lián)合實驗室(HFL)資深級研究員,而第二天官網(wǎng)就刪除了此條顧問信息。

  至于這個榜單本身,也被業(yè)內(nèi)人士質(zhì)疑其合理性,理由是沒有公布評估數(shù)據(jù)以及具體的評估方式。不過SuperCLUE在8月份進行了一次評測體系、方法及變動說明的解讀,算是變相回應(yīng),只不過3700道的測試題還是較SuperGLUE的2萬道相去甚遠。

  但SuperCLUE卻搖身一變,成為各種大模型PR稿里的救世主,堪稱大模型界的安兔兔和魯大師,個中內(nèi)涵懂得都懂。

  手機廠商也順理成章成為了SuperCLUE的榜單常客。比如OPPO和vivo,前者登上了9月的基礎(chǔ)能力排行榜,后者則拿下了10月的國服第一。

  在搞機圈跑分作弊早已不算秘密,2013年三星Galaxy S4就曾被曝跑分作弊,事后三星不得不向每位Galaxy S4購買者賠償10美元。

  到2018年,跑分作弊儼然已成一種行業(yè)亂象:各大手機廠商費盡心思優(yōu)化跑分項目,有的甚至專門開設(shè)一個白名單,當(dāng)檢測到是跑分軟件時,手機各方面的資源就全速運行,以此開啟芯片的極限性能模式。Anandtech就曾公開點名榮耀Play跑分作弊,跑分監(jiān)測機制開啟和關(guān)閉的情況下,得分相差一倍。

  跑分作弊映射出的一個道理是,這種人為極限性能下的分數(shù),設(shè)備根本不可能長時間保持這樣的水平,因此顯得毫無意義。

  而這種毫無意義的極限性能跑分,隱隱有傳到大模型的跡象。

  比如OPPO這次拿出來的SuperCLUE成績,還不是總榜單,而是十大基礎(chǔ)能力排行榜的“知識與百科”能力。

  在SuperCLUE的評測方案中,“知識與百科”屬于專業(yè)知識技能,包含歷史地理、科學(xué)技術(shù)、文化娛樂、社會人文等眾多任務(wù)。

  相對來說,“知識與百科”傾向于是有標(biāo)準(zhǔn)答案的問答評測,不過即便如此后期有用戶在測試OPPO大模型時,還是出現(xiàn)了魯迅和周樹人不是同一人的錯誤。

  拋開這種低級失誤,對于這種有針對性的評測,小米AI實驗室大模型團隊負責(zé)人欒劍此前在接受媒體采訪時就給過定論,目前這些榜單絕大部分都是學(xué)科問題,而且是選擇題為主,所以用它們對評估大模型的能力是有局限性的。

  “如果把這些學(xué)科的知識、這些學(xué)科搜集到的試題,都拿來對大模型做增強學(xué)習(xí),它的效果一定可以達到很好。”界面新聞就曾曝光過兩種C-Eval“刷榜”方式:

  一種是找數(shù)據(jù)標(biāo)注員把題目做一遍,第二種是用GPT-4把題做一遍,再把答案扣下來訓(xùn)練大模型,這樣都能在相應(yīng)學(xué)科測試中獲得滿分。

  問題的關(guān)鍵還在于,做這樣的訓(xùn)練對大模型其它方面的能力可能會帶來負面影響。

  目前有一些開源的大模型迭代了版本之后,打榜的分數(shù)提高得很明顯,但如果測試它的生成能力,比如寫作水平,發(fā)現(xiàn)其實是有下降的。

  還有一點存疑的是,大模型評測榜單的合理性。

  比如今年5月SuperCLUE的榜單,文心一言在這個測評的評分是明顯偏低的,甚至連一些不知名的國產(chǎn)小型開源模型都比不過,測試結(jié)果與實際使用體驗不符。

  根源在于當(dāng)時SuperCLUE的測試手段是讓大模型做選擇題(據(jù)稱是100道),而這是用來針對BERT時代的判別式AI模型,不適用于現(xiàn)在的這些生成式大模型。

  這倒也不是SuperCLUE一家的問題。華泰證券前資深算法工程師邱震宇此前曾深入探究了市面上大模型的各類評測集,綜合比較了各家榜單結(jié)果,得出的結(jié)論是現(xiàn)在并不存在一個公認有效的評測方式。

  大模型是一個新的范式,其實一個范式除了對底層邏輯的解釋,也需要有一整套的訓(xùn)練方法及評估方法。對大模型來說,這一整套合理的評估方法,大家還在探索中,沒有公認的標(biāo)準(zhǔn)。

  事實上,大模型很難去實現(xiàn)沒有偏頗的測試,所謂的AI模型排名沒有什么值得參考的實際價值,評價大模型的唯一標(biāo)準(zhǔn)就是能不能幫助用戶去解決實際的問題。

  看待打榜,只是從一個側(cè)面驗證一個基座大模型是不是能在某個領(lǐng)域里做到極致,但不代表說它就一定能給用戶帶來最好的應(yīng)用體驗。

  在OPPO之前,已經(jīng)有三家國內(nèi)手機廠商公開了大模型進度,分別是華為、小米和vivo,均以語音助手的形式。而且各家像是打過商量一樣,幾乎是在同一時間對外吹風(fēng),再加上高通、谷歌、聯(lián)發(fā)科的頻頻官宣,上馬大模型儼然成為手機廠商的必選項。

  在這種你追我趕的態(tài)勢下,就很容易發(fā)生“有條件要上,沒有條件也要硬上”的老套情節(jié)。

  2019年OPPO推出小布助手,最初通過調(diào)用搜索引擎完成擴展問答,但整個體驗不暢,促使后來OPPO開始做知識圖譜和海量語料數(shù)據(jù),相當(dāng)于建了一個問答庫。

  這種機械的“檢索式回答”常見于當(dāng)時的語音助手,優(yōu)點是成本低上馬快,缺點則是周期長成本高,而且要面對長尾問題語音助手無法回答的尷尬。舉個例子,長江長還是黃河長這類問題,如果數(shù)據(jù)庫中沒有答案,語音助手就無法回答。

  為了解決問題,2021年OPPO找到了北京智源人工智能研究院,借悟道大模型推出了“生成式問答系統(tǒng)”,一定程度上彌補了自己的技術(shù)短板。

  彼時的OPPO屬于兩條腿走路,一邊從外面引入大模型,一邊在背后埋頭自研。

  2022年6月推出的預(yù)訓(xùn)練模型OBERT,就是OPPO從發(fā)布前兩年開始探索的,共有一億、三億和十億參數(shù)三個版本。同年11月,OPPO語音語義研究部又推出參數(shù)量為30億的中文預(yù)訓(xùn)練大模型CHAOS。

  但這兩個模型在網(wǎng)上能查到的資料很少,除了官宣的新聞稿外幾乎沒有其它消息。倒是今年4月,在阿里云峰會上,阿里云官方發(fā)布的「企業(yè)專屬大模型」合作名單里,OPPO卻位列第一。

  據(jù)阿里云CTO周靖人介紹,以上這一系列模型已經(jīng)和阿里的行業(yè)模型形成了層次化、模塊化結(jié)構(gòu),行業(yè)模型可以在阿里預(yù)訓(xùn)練模型之上進行定制,可以解決當(dāng)下多達200個業(yè)務(wù)場景。

  換言之,這些AI模型本質(zhì)上都是基于阿里云通義大模型完成的能力構(gòu)建。這似乎意味著,OPPO的自研大模型或是火候不到,不得不暫時放棄自研,再轉(zhuǎn)向外部合作。

  坊間也有傳言稱vivo的大模型用的是開源的Llama2,雖不知真假,但也從側(cè)面反映出,手機廠商做大模型的一個被動:無論宣傳上多么高調(diào),總令人懷疑沒這個技術(shù)實力。

  至于是自研好還是外部合作好,就各有論調(diào)了。

  自研的難點在于,從0開始基礎(chǔ)大模型的預(yù)訓(xùn)練,資金投入需要非常大,除此以外,數(shù)據(jù)、算力、know-how、維護等也是一道道門檻,但優(yōu)勢也十分巨大,企業(yè)能夠掌握自己定制模型結(jié)構(gòu)的能力。

  在各種設(shè)備終端上,使用的芯片不同,就會對模型提出各種各樣的要求,這些要求可能細節(jié)到一些算子不支持,或者某種結(jié)構(gòu)運行起來效率不高。手機廠商必須根據(jù)硬件提出的要求,對模型結(jié)構(gòu)做一些調(diào)整。

  如果想修改模型結(jié)構(gòu)的話,就一定需要具備從頭開始訓(xùn)練的能力。因為開源模型的結(jié)構(gòu)是固定的,沒有辦法調(diào)整,就不能滿足需求。

  而外部合作的優(yōu)勢正是自研的難點,百度、阿里等平臺型企業(yè)幾乎提供了一條龍服務(wù),不僅省下了成本,還有性能/中文增強、數(shù)據(jù)集、應(yīng)用范式等系列服務(wù),幾乎一鍵開發(fā)大模型。

  尾聲

  今年2月,高通在一部沒有聯(lián)網(wǎng)的Android手機上使用了Stable Diffusion 來生成AI圖像,整個生成時間不超過15秒,過程全部在手機上進行。剛剛發(fā)布的驍龍8 Gen3,已經(jīng)可以支持運行100億參數(shù)的生成式AI模型。

  今年5月的谷歌I/O大會上,谷歌一口氣發(fā)布了四個新一代大語言模型 PaLM 2。其中最小的“壁虎”大模型,可以適配手機運行。

  到今天,手機大模型已經(jīng)是一個無可爭議的趨勢。但擺在手機廠商面前的問題似乎都被它們忽視了:大模型究竟能為用戶帶來什么?

  至少在當(dāng)前,無論是華為、小米還是vivo、OPPO,其內(nèi)嵌大模型的語音助手還沒有“涌現(xiàn)”的跡象,提供的功能也沒有超出通用大模型的范疇。

  而按照手機廠商的慣用套路,新技術(shù)是否驅(qū)動了新需求尚未可知,但驅(qū)動新價格幾乎是毫無疑問的。

  參考資料

  [1] 國內(nèi)大模型爭霸賽,這是你心目中的大模型排名嗎?機器學(xué)習(xí)

  [2] 跑的高能賣錢?手機廠商為啥要跑分作弊,威鋒網(wǎng)

  [3] 小米的大模型“野心”,始于端側(cè),騰訊科技

  [4] 誰在評價大模型?AI大模型評測榜單亂象調(diào)查,界面新聞

  [5] 手機跑分突破110萬!跑分到底是娛樂還是有可信度?中關(guān)村在線

  [6] 登頂CLUE與MUGE,OPPO語音語義研究部推出中文預(yù)訓(xùn)練大模型CHAOS, 新聞助手

  [7] 登頂KgCLUE,OPPO小布推出預(yù)訓(xùn)練大模型OBERT,OPPO小布團隊

  [8] 全球最大智能模型“悟道”首次落地:數(shù)字人+終端AI助手,支持NVIDIA GTX單卡機運行百億大模型,雷鋒網(wǎng)

IT產(chǎn)業(yè)網(wǎng)微信二維碼logo

  行業(yè)資訊、企業(yè)動態(tài)、業(yè)界觀點、峰會活動可發(fā)送郵件至news#citmt.cn(把#換成@)。

海報生成中...

分享到微博

掃描二維碼分享到微信

分享到微信
一鍵復(fù)制
標(biāo)題鏈接已成功復(fù)制

最新新聞

熱門新聞

99热手机在线_五月天在线免费视频_波多野结衣之无限发射_美女一区二区三区视频_日韩在线观看a_天天天干夜夜夜操_日韩黄色片在线_97在线免费视频观看_天堂а√在线中文在线_88av.com_国产乱女淫av麻豆国产_日本a在线免费观看
欧美视频久久| 国产精品入口久久| 久久高清国产| 中文字幕成在线观看| 国产亚洲一区二区手机在线观看 | 欧美片第1页| 亚洲在线国产日韩欧美| 精品一区二区三区的国产在线观看 | 国产真实久久| 卡一精品卡二卡三网站乱码| 一区在线观看| 欧美福利专区| 久久久久久夜| 国产日韩欧美一区| 亚洲在线成人| 国产在线欧美| 久久九九精品| 免费高潮视频95在线观看网站| 国产精品mv在线观看| 婷婷亚洲成人| 综合国产精品| 久久国产福利| 亚洲女同一区| 美女少妇全过程你懂的久久| 国产精品一级在线观看| 亚洲日韩中文字幕一区| 免费久久精品| 9色国产精品| 亚洲欧美日韩综合国产aⅴ| 日韩成人亚洲| 99久久亚洲精品| 神马日本精品| 亚洲香蕉网站| 韩日一区二区三区| 狠狠操综合网| 日韩中文一区二区| 色婷婷成人网| 你懂的国产精品| 久久精品99国产精品| 日韩av二区在线播放| 中文亚洲欧美| 国产午夜精品一区二区三区欧美| 中文字幕成在线观看| a天堂资源在线| 美腿丝袜亚洲一区| 国产精品成人a在线观看| 国产自产自拍视频在线观看| 久久精品女人| 久久美女性网| 午夜宅男久久久| 日本欧美韩国一区三区| 免费看一区二区三区| 福利一区二区| 婷婷综合激情| 天堂久久av| 免费亚洲婷婷| 免费观看在线综合| 国产毛片一区| 亚洲va久久久噜噜噜久久| 亚洲女同中文字幕| 中文字幕av一区二区三区四区| 亚洲人成网站在线在线观看| 国产香蕉精品| 日韩欧美综合| 一区二区精品| 国产999精品在线观看| 成人精品中文字幕| 免费视频最近日韩| 你懂的国产精品| 亚洲一本视频| 国产欧美三级| 久久激情婷婷| 欧美在线91| 亚洲特级毛片| 欧美偷窥清纯综合图区| 樱桃视频成人在线观看| 国产午夜久久| 国产一区二区三区免费在线| 日韩欧美一区二区三区在线观看| 日韩制服丝袜av| 福利在线免费视频| 精品一区视频| 国产精品亚洲片在线播放| 91亚洲一区| 亚洲精品欧洲| 欧美日韩一区二区三区视频播放| 日韩免费精品| 久久国产直播| aⅴ色国产欧美| 欧美精品国产| 一区二区小说| 精品国产亚洲一区二区三区| 伊人影院久久| 视频二区不卡| 超级白嫩亚洲国产第一| 91亚洲精品视频在线观看| 婷婷成人在线| 国产不卡人人| 国产日本久久| 婷婷精品在线观看| 午夜欧美理论片| 色婷婷精品视频| 91视频一区| 精品视频高潮| 国产欧美日韩精品一区二区三区| 久久香蕉精品| 蜜臀久久99精品久久一区二区| 欧美国产美女| 国内精品伊人| 久久一区国产| 亚洲福利国产| 视频一区日韩精品| 久久久国产亚洲精品| 国产精品白丝一区二区三区| 日韩激情一二三区| 日韩综合一区二区三区| 国产农村妇女精品一区二区| 久久九九电影| 亚洲天堂黄色| 99久久亚洲精品蜜臀| 日韩av首页| 在线日韩中文| 免费视频一区三区| 亚洲在线免费| 日韩一区精品| 国产精品一区三区在线观看| 国产精品久久久久久久久久白浆 | 国产欧美日韩影院| 日韩av三区| 欧美激情 亚洲a∨综合| 麻豆精品久久久| 韩国久久久久久| 中文精品电影| 五月激激激综合网色播| 亚洲美女91| 国产三级精品三级在线观看国产| 人人爱人人干婷婷丁香亚洲| 国产乱码精品| 精品视频在线观看网站| 黄色在线观看www| 国产精品av一区二区| 欧美日韩国产探花| 亚洲精品婷婷| 另类综合日韩欧美亚洲| 91精品久久久久久久久久不卡| 久久中文亚洲字幕| 六月婷婷一区| 美女精品久久| 99精品在线免费在线观看| 欧美va天堂| 日韩精品中文字幕吗一区二区| 精品中文在线| 欧美午夜不卡影院在线观看完整版免费| 日韩一区欧美二区| 精品视频久久| 国产一区成人| 久久久久久亚洲精品美女| 婷婷激情综合| 麻豆成人91精品二区三区| 婷婷成人综合| 久久久久久亚洲精品美女| 日韩午夜在线| 蜜桃视频在线观看一区| 欧洲亚洲一区二区三区| 91欧美日韩| 免费看日韩精品| a国产在线视频| 日本亚洲不卡| 99久久夜色精品国产亚洲1000部| 久久aⅴ国产紧身牛仔裤| 久久精品一区二区国产| 久久精品导航| 久久精品系列| 日本成人中文字幕在线视频| 亚洲成人国产| 麻豆精品av| 日韩精品视频中文字幕| 国产99久久久国产精品成人免费| 国产精品v亚洲精品v日韩精品| 九九久久婷婷| av在线最新| 国产欧美日韩精品高清二区综合区| 色婷婷精品视频| 国产精品日本一区二区三区在线 | 久久精品xxxxx| 美女网站久久| 日本国产精品| 免费一级欧美片在线观看网站| 国产亚洲在线观看| 99视频精品全部免费在线视频| 国产精品va| 日韩免费精品| 在线免费观看亚洲| 先锋影音国产一区| 亚洲高清激情| 视频福利一区| 蜜桃精品在线| 精品资源在线| 电影91久久久| 91视频一区|