日韩二区三区四区,日本一区二区三区视频在线看,麻豆成全视频免费观看在线看
首頁 > 資訊 > 行業

IBM推出高效 LLM 基準測試方法,計算成本降低99%

2024/06/04 14:27      站長之家


  IBM 研究發布了一項突破性的 LLM(大型語言模型)基準測試方法,承諾將計算成本降低高達99%。傳統的基準測試,如斯坦福的 HELM,需要耗費超過一天的時間,并且成本高達1萬美元,這對開發人員和研究人員來說是一個昂貴的過程。隨著 LLMs 能力的增強,基準測試的過程變得更加嚴格,需要大量的計算能力和時間。

  IBM 的創新方法源自以色列的 IBM 研究實驗室,由 Leshem Choshen 領導的團隊開發了一種新方法,大幅降低基準測試的成本。他們并非運行全尺寸基準測試,而是設計了一個使用原始基準測試規模的1% 的 “微型” 版本。令人驚訝的是,這些微型基準測試已被證明幾乎同樣有效,可以在98% 的準確度內估計出全尺寸測試的性能。

  該團隊利用人工智能從完整基準測試中選擇最具代表性的問題,包含在微小版本中。這種選擇性方法確保較小的基準測試仍然高度預測整體模型性能,消除了不貢獻有意義評估的冗余或無關緊要的問題。

  IBM 的高效方法引起了 AI 社區的關注,尤其是在2023年 NeurIPS 的高效 LLM 比賽中。面臨使用有限計算資源評估大量模型的挑戰,組織者與 IBM 合作實施了一個名為 Flash HELM 的簡化基準測試。這種高效方法使他們能夠迅速淘汰表現較差的模型,并將計算資源集中在最有前途的候選模型上,從而進行及時和具有成本效益的評估。

  Flash HELM 的成功展示了 IBM 高效基準測試方法的潛力,促使其在 IBM 的 watsonx 平臺上評估所有 LLMs。成本節約可觀;例如,在像 HELM 這樣的基準測試中評估 Granite13B 模型可能耗費高達1000個 GPU 小時,但使用高效基準測試方法顯著降低了這些成本。

  高效基準測試不僅降低成本,還通過允許更快速地迭代和測試新算法來加速創新。IBM 研究人員,包括 Youssef Mroueh 在內,指出這些方法使得更快速、更經濟的評估成為可能,促進了更加靈活的發展過程。

  這一概念已經超出了 IBM 的范疇。斯坦福實施了 Efficient-HELM,這是其傳統基準測試的簡化版本,為開發人員提供了選擇示例數量和希望分配的計算資源量的靈活性。這一做法強調了一個新興共識,即更大的基準測試不一定意味著更好的評估。

  “大型基準測試不一定通過變得更大而增加價值,”Choshen 說。“這是我們的見解,我們希望它能夠引領更快速、更經濟的 LLM 性能評估方法。”

  IBM 的高效基準測試方法代表了人工智能領域的重大進步,為評估先進語言模型所需的不斷增加的成本和資源需求提供了實際解決方案。

IT產業網微信二維碼logo

  行業資訊、企業動態、業界觀點、峰會活動可發送郵件至news#citmt.cn(把#換成@)。

海報生成中...

分享到微博

掃描二維碼分享到微信

分享到微信
一鍵復制
標題鏈接已成功復制

最新新聞

熱門新聞

99热手机在线_五月天在线免费视频_波多野结衣之无限发射_美女一区二区三区视频_日韩在线观看a_天天天干夜夜夜操_日韩黄色片在线_97在线免费视频观看_天堂а√在线中文在线_88av.com_国产乱女淫av麻豆国产_日本a在线免费观看
日韩大片在线观看| 国产精品tv| 蜜桃视频免费观看一区| 精品色999| 欧美a级一区| 美女久久精品| 欧美日韩一区二区三区四区在线观看| 欧美www视频在线观看| 日韩欧美精品一区| 日韩欧美视频专区| 特黄特色欧美大片| 精品国产欧美日韩| 免费一级欧美在线观看视频| 日韩精品欧美成人高清一区二区| 国产精品7m凸凹视频分类| 久久精品国内一区二区三区| 国产伦精品一区二区三区在线播放| 久久一区精品| 精精国产xxxx视频在线野外| 国产精品黄色| 丝袜美腿诱惑一区二区三区| 日韩精品亚洲专区| 国产欧美88| 久久97视频| 伊人久久亚洲美女图片| 婷婷综合六月| 久久aⅴ国产紧身牛仔裤| 欧美日一区二区在线观看| 日韩精品免费一区二区三区| 国产毛片精品| 日本在线一区二区三区| 日韩精品视频网站| 亚洲精品婷婷| 久久久久九九精品影院| 亚洲男女av一区二区| 亚洲欧美在线专区| 中文字幕色婷婷在线视频| 日韩av一级片| 国产日韩三级| 国产精品普通话对白| 国产不卡精品在线| 国产黄色一区| 国产色噜噜噜91在线精品| 精品99久久| www在线观看黄色| 国产精品午夜av| 日韩中文一区二区| 最新中文字幕在线播放| 狠狠久久伊人中文字幕| 日韩免费高清| 中文在线不卡| 日韩中文字幕区一区有砖一区 | 国产日韩欧美三级| 亚洲在线电影| 欧美国产中文高清| 国内精品伊人| 日韩精品网站| 亚洲欧美久久| 爽好久久久欧美精品| 99国产精品久久久久久久| 人人草在线视频| 午夜精品婷婷| 97精品一区| 国产精品成久久久久| 一区二区国产在线观看| 欧美日韩精品免费观看视欧美高清免费大片 | 久久精品亚洲| 精品91福利视频| 美女精品视频在线| 久久精品国产99久久| 亚洲一区av| 99热精品久久| 国产一区二区三区不卡av| 久久婷婷av| 精品国产欧美| 免费人成在线不卡| 亚洲一区二区日韩| 你懂的亚洲视频| 欧美日韩一区二区三区在线电影| 国产精品久久久亚洲一区| 亚洲精品一级二级| 久久精品99国产精品| 欧美日韩视频一区二区三区| av不卡在线看| 国产精品探花在线观看| 久久国产精品亚洲77777| 麻豆国产91在线播放| 日本亚州欧洲精品不卡| 在线一区免费观看| 日本一区二区三区中文字幕| 777久久精品| 中国女人久久久| 日韩avvvv在线播放| 精品一区二区三区中文字幕| 西西人体一区二区| 亚洲调教视频在线观看| 日韩精品一卡| 九九综合九九| 日韩福利视频网| 综合激情婷婷| 免费看久久久| 嫩呦国产一区二区三区av| 国产一区二区三区精品在线观看| 国产精品视频一区视频二区| 日韩精品欧美精品| 亚洲www啪成人一区二区| 日韩视频一二区| 精品国产欧美| 神马午夜在线视频| 国产99久久| 国产高清视频一区二区| 蜜桃视频在线观看一区二区| 卡一精品卡二卡三网站乱码| 欧美亚洲日本精品| 午夜在线视频一区二区区别| 国产一在线精品一区在线观看| 久久精品亚洲| 欧美日韩少妇| 91欧美国产| 亚洲成人av观看 | 国产乱码精品一区二区三区亚洲人| 日韩中文在线播放| 午夜在线视频一区二区区别| 欧美精品三级在线| 精品色999| 日韩av中文字幕一区二区三区| 久久久久一区| 亚洲中午字幕| 欧美精品影院| 蜜桃tv一区二区三区| 久久国产麻豆精品| 91视频精品| 久久国产精品免费一区二区三区 | 在线亚洲激情| 亚洲精品在线观看91| 国产精品外国| 中文av在线全新| 男女男精品网站| 国产一区二区高清| 日韩不卡一区二区三区| 成人台湾亚洲精品一区二区| 国产精品115| а√天堂8资源在线| 四虎精品永久免费| 日韩免费看片| аⅴ资源天堂资源库在线| 91欧美精品| 日韩在线观看一区二区三区| 黄色欧美日韩| 婷婷成人在线| 国产精品分类| 婷婷综合福利| 日本一区二区三区视频在线看| 久久精品亚洲| 国产一区二区三区成人欧美日韩在线观看| 久久亚洲专区| 99视频精品免费观看| 国产视频亚洲| 在线亚洲成人| 亚洲精品大全| 日韩av不卡在线观看| 国产激情综合| 欧美a在线观看| 国产精品一级在线观看| 久久香蕉精品香蕉| 精品美女久久| 国产91一区| 日韩一区二区三区精品| 欧美资源在线| 日韩精品a在线观看91| 777久久精品| 精品国产一区二| 亚洲视频综合| 国产日本精品| av不卡在线| 国产日韩1区| 精品久久美女| 国产亚洲永久域名| 国产免费久久| 激情综合在线| 高清一区二区三区av| 欧美aa在线观看| 中文字幕一区二区三区日韩精品| 免费久久99精品国产| 精品一区二区三区的国产在线观看 | 欧美日韩伊人| re久久精品视频| 另类小说一区二区三区| 69堂精品视频在线播放| 久久免费高清| 日本视频在线一区| 91精品电影| 日韩欧美1区| 成人自拍av| 国产精品hd| 亚洲一区黄色| 亚洲二区三区不卡| 欧美日韩三区| 99久久久久| 欧美日韩国产精品一区二区亚洲|