靈初智能發(fā)布全球首個具身原生人類數(shù)據(jù)采集方案 Psi-SynEngine。該方案由靈初智能全棧自研,包含62+自由度便攜式外骨骼觸覺手套數(shù)采套裝、大規(guī)模 in the wild 數(shù)采數(shù)據(jù)管線、基于世界模型和強(qiáng)化學(xué)習(xí)的跨本體數(shù)據(jù)遷移模型,并已率先將采集到的人類數(shù)據(jù)應(yīng)用于物流等真實場景。同時,靈初智能同步發(fā)布覆蓋視覺、語言、觸覺、動作的大規(guī)模真實世界多模態(tài)數(shù)據(jù)集 Psi-SynNet-v0。這一突破性成果標(biāo)志著靈初智能全自研的真實世界具身數(shù)據(jù)引擎已經(jīng)正式啟動。
相比大模型和自動駕駛,數(shù)據(jù)問題一直是困擾整個具身智能領(lǐng)域的痛點。行業(yè)現(xiàn)有的數(shù)據(jù)采集方案:
1.仿真環(huán)境數(shù)采:Sim-to-Real 差距突出,仿真分布與真實作業(yè)環(huán)境的差異,導(dǎo)致策略遷移退化,調(diào)參成本與場景搭建成本高。例如現(xiàn)有的仿真器難以仿真布料等柔性物體。
2.機(jī)器人遙操數(shù)采:數(shù)據(jù)采集難以規(guī);,行業(yè)呈現(xiàn)碎片化試點狀態(tài),缺乏統(tǒng)一標(biāo)準(zhǔn)與運營機(jī)制。同時數(shù)據(jù)多樣性難以保障,雇傭?qū)H诉M(jìn)行數(shù)采成本過高且效率太低。且無法將世界上所有的場景、所有的物體和所有的操作都在數(shù)采場復(fù)刻,成本過大。
3.UMI設(shè)備數(shù)采:雙夾爪難以實現(xiàn)真實落地場景需要的精細(xì)操作,同時仍需雇傭?qū)H诉M(jìn)行采集,也無法在實際生產(chǎn)作業(yè)中同步完成數(shù)據(jù)采集。Example:美國勞工部數(shù)據(jù)顯示,工廠內(nèi) 98.7% 以上的工序都需要雙手多指協(xié)同完成,雙夾爪存在本質(zhì)局限。
靈初智能 Psi-SynEngine 從根本上突破了上述困境。我們的方案直接采集一線作業(yè)人員在真實工作中的操作數(shù)據(jù),而非在搭建的數(shù)采場中高成本低保真度采集。采集場景覆蓋物流、工廠、商超、酒店和家庭,數(shù)據(jù)源自真實場景,無需二次遷移。
這與靈初智能從創(chuàng)立之初就選擇做通用靈巧操作的戰(zhàn)略不謀而合,相比其他硬件形式,靈巧手與人手的形態(tài)差異最小,數(shù)據(jù)遷移效率最高。
行業(yè)資訊、企業(yè)動態(tài)、峰會活動可發(fā)送郵件至news#citmt.cn(把#換成@)。
海報生成中...