近日,國際計算機視覺頂級會議CVPR 2026放榜。群核科技聯合浙江大學、宇樹科技共同完成的兩篇論文雙雙入選,分別涉及具身智能終身學習框架和視覺語言模型空間推理基準。CVPR每年匯聚全球最前沿的 AI 研究成果。本屆CVPR有效投稿數達16092篇,最終錄用4090篇,錄用率25.42% 。
機器人如何“越用越聰明”?Arcadia框架實現具身智能學習閉環
其中,論文《Arcadia: Toward a Full-Lifecycle Framework for Embodied Lifelong Learning》提出面向具身智能終身學習的全生命周期閉環框架Arcadia,涵蓋數據收集、模型訓練,到實際部署后的自我進化和知識更新的完整過程。它主要探討的是如何讓機器人像人類一樣,在不斷變化的環境中“活到老學到老”。
在該框架中,群核科技發揮了其在空間重建和空間生成上的核心優勢。依托其自研的SpatialLM大模型,系統能夠將機器人采集的多模態傳感器數據高效解析為結構化語義信息;結合SpatialGen的空間生成能力,系統可自動生成豐富的仿真3D場景。隨后,通過空間智能訓練平臺SpatialVerse進行物理特性模擬和和數據擴增,為機器人提供了海量且物理一致的“訓練場”。

實測數據顯示,在宇樹G1人形機器人的真實世界零樣本測試中,Arcadia框架表現卓越:導航任務成功率達到46%,操作任務成功率達到27%。相較于NaVILA、OpenVLA等主流開源方案,其整體性能提升約3倍,尤其在多目導航與多物體協同操作等復雜場景中展現出顯著優勢。
AI真的理解空間嗎?SpatiaLQA構建空間邏輯推理“考卷”
而論文《SpatiaLQA: A Benchmark for Evaluating Spatial Logical Reasoning in Vision-Language Models》關注的,是一個更基礎的問題:AI 是否真的理解空間?
今天的視覺語言模型其實已經很強了。它們擅長“看懂是什么”(物體識別、描述)以及“答對為什么”(抽象問答/常識推理)。但在真實物理空間任務中,面對遮擋關系、相對位置約束、操作順序判斷等問題時,能力短板往往暴露無遺。

例如,當機器人執行書架整理任務時,需要準確判斷哪些書是支撐點、哪些擺件可獨立移動——如果空間邏輯理解出錯,抽出一本書可能導致整排物品傾瀉而下。SpatiaLQA基準測試不僅提供了一套涵蓋多種空間邏輯關系的評測數據集,更系統化定義了評價指標。
值得注意的是,群核科技SpatialLM的空間理解能力,為SpatiaLQA基準的構建提供了重要技術支撐。
行業資訊、企業動態、峰會活動可發送郵件至news#citmt.cn(把#換成@)。
海報生成中...