6月6日上午,在2025北京智源大會上,北京智源人工智能研究院發布“悟界”系列大模型,展示其在物理AGI領域的最新科研成果與布局。該系列包含全球首個原生多模態世界模型“悟界·Emu3”、腦科學多模態通用基礎模型“悟界·見微Brainμ”、具身大腦RoboBrain 2.0及全原子微觀生命模型OpenComplex2。
其中,“悟界·Emu3”于2024年10月發布,通過研發新型視覺tokenizer,將圖像/視頻編碼為離散符號序列,構建模態無關的統一表征空間,實現文本、圖像和視頻的任意組合理解與生成。
所謂世界模型,指讓AI像人類一樣認知、理解世界并進行推理的工具。基于此,AI可實現更智能的交互,例如智能客服中綜合分析語音、圖像和文本輸入,或智能教育中生成個性化教學內容。
近日,斯坦福大學教授李飛飛在與硅谷投資人對話時指出,世界模型不僅能夠處理文字信息,還能理解3D物理世界的運作規律,是通往AGI的重要路徑。
目前,造車新勢力在應用端積極布局世界模型。在智能駕駛領域,其代表系統對物理世界的數字化理解與預測能力。競爭已從車端算力配置轉向云端構建世界模型的能力。
華泰證券認為,這將提升車載芯片算力與傳感器精度,對算法公司和主機廠提出更高要求。億歐智庫報告稱,盡管世界模型可通過云端訓練和車端蒸餾提升泛化能力,但規模化落地仍受制于算力成本與數據質量。
行業資訊、企業動態、業界觀點、峰會活動可發送郵件至news#citmt.cn(把#換成@)。
海報生成中...