首頁 > 資訊 > 評論

一位院士眼中的AI觀察

2024/01/17 14:15 投資界

　　2024年1月9日-11日，“2024創投大會”在西安舉辦。本屆大會以“向實· 向新 · 向強”為主題，邀請院士專家、投資機構、產業企業從宏觀趨勢、產業投資、企業發展等多個角度呈現一場思想饕餮盛宴。

　　會上，中國工程院外籍院士，德國工程院院士，德國漢堡科學院院士張建偉發表主題演講《通向魯棒自主系統的多模態AI之路》

　　以下為演講實錄，

　　經投資界（ID:pedaily2012）編輯：

　　非常高興從德國漢堡來到古都西安，從絲綢之路的終點回到絲綢之路的起點，在新年伊始之際探討未來，感到非常興奮。

　　我報告的題目是魯棒自主系統，近期我們實現的大的產業就是智能駕駛，未來在中長期的產業，我講是未來的個人服務，機器人是他們的魯棒自主性，他們的可靠性，他們在長期負責的，非結構下環境的自主性，是我們未來用多模態人工智能解決的目標之一。

　　現在，國際上科學家和企業家的融合也越來越深，Nurture發了一篇說科學家正在把科學的成果向工業化轉移，全世界把這種基礎的研究和我們未來的產業進行深度的結合，也是一個國際的趨勢。

　　跟大家分享一下物聯網時代的機器人具身智能的挑戰，剛才克強院士也提到了工業4.0，在十年前德國的國家工程院提出了工業4.0的概念，就是希望用我們未來的人工智能網絡、云的技術，提升傳統的制造業，今天在全世界各個角落和學術界，和工業界，工業4.0已經起到了一定的影響。

　　在今天創新創業是處在一個IOT重要的物聯網時代，在我們經歷了服務和數據物聯網給我們前20年帶來的產業巨大發展之后，未來的基于物聯網的這種硬科技，是我們投資和創業的重點。

　　未來的高新技術可以產生這種融合性的，顛覆性創新，但是它需要我們現在在人工智能、IOT、機器人、材料、能源、VR、AR，甚至通訊、腦科學這一方面的深度的融合。在這一方面，我想西安都具有著非常好的科研和創業的基礎。

　　應用的垂直領域也是我們為技術驅動提供價值重要的實驗場所，從智能制造的工業4.0到未來的出行，未來的健康、農業、家庭服務、教育等，都提供了未來人工智能、物聯網和機器人重要的應用場景。

　　從傳統的現在使用的手機、可穿戴，為視覺和聽覺進行連接人通訊的工具，到未來的智能汽車，加上移動的功能。中長期我們把操作的功能，把智能的功能進行新的提高，我們說從信息通訊到現在的ChatGPT非具身的智能，到未來的智能汽車，智能機器人的具身智能，為我們提供了非常廣泛的應用場景，從信息世界的交互，實現物理世界的交互。

　　在現在的手機之后，我們現在正在討論代替手機的下一個形態是演進，還是一種移動的設備，最終的終極形態是個性化，個人的機器人。在ICT通訊和網絡技術之后，下一個是智能化給我們帶來人口紅利，流量紅利過去之后真正的智能紅利和機器人紅利到來的時刻，在這個時刻我們可以在投資界發現非常多令人興奮的投資標的，包括智能機器人、AIGC、WEB3.0、智能家居和智能存儲等。

　　在疫情期間，我們也在西安組織了世界最大的智能機器人和自動化的旗艦會議，遺憾的是因為疫情，只是在西安進行了小范圍的中國參會者的形式。在機器人界，我們在宴會之前是展現了各種各樣的機器人的場景，從移動的車到未來移動的飛行機器人，水下移動的機器人。20年前我讓德國的博士生畫的幾幅漫畫，讓它展現出20年后機器人的場景，今天我們通過歐盟一些基礎研發項目，我們已經做出了部分的移動操作的漢堡圖書館，進行物理服務的場景。

　　通過現在的這種開源軟件、硬件，我們現在可以達到和歐美科研整個的同步，機器人的操作系統也是我前十年通過一些我們的論文，通過我們對未來的這種開源操作系統的貢獻，也是協調全球的研發能力，來共享未來的機器人落地，智能系統落地機器人這些新的應用。

　　如何實現0到1，1到10，10到100整個全鏈條，技術成熟度從整個智能應用，我用一張圖來部分表達我們在這一方面的一些實踐。從基礎研究的技術成熟度到3，到4的研究，我們通過國家的縱向項目來進行包括跨模態學習，包括深度學習和增強學習的研究，在中間這一層技術成熟度從5到8的階段，我們用一些共享的，包括機器人操作系統的模塊來打造這些關鍵的技術模塊，通過我們的投資，通過我們的孵化，在上層進行傳統行業的提質增效和一些創新創業新的行為，包括我們未來的人才培養等，使得我們和傳統行業的這種垂直的結合，在制造、出行、健康方面，創造新的價值，孵化新的公司。

　　在這一方面，我想我們在大學進行的一些前沿的研究，20年前我做助理教授的時候，我就做了一款雙臂協作的裝配機器人，當時是全世界第一個用智能的形式，多模態交互的形式做玩具飛機的裝配，當時是一個無人區，今天我們在自動化方面，從單臂的裝配到未來的雙臂的這種場景，已經變成了一個重要的領域。

　　我們也把協作機器人現在變成了一種創業的重要基地，機器人也是這一方面的獨角獸，在力控臂方面在全世界已經做出了最好的性能，現在在富士康的蘋果工廠有上千的應用，未來會有更多新的應用。現在中國自動化的工廠程度已經提高了非常多，但是我們現在還能看到很多工廠還雇幾千，幾萬人，甚至在鄭州的工廠有幾十萬人，70%的工作都是用手的精巧在操作，現在還不能自動化操作，我們在從事著用所謂的多模態機器人，加上視覺、聽覺和觸覺，來進行機器人的靈巧裝配，把這一部分的自動化的難點領域，在進行新的替代，用新的AI多模態的技術。

　　也是在20年前，我們就做出了這一款移動操作的實驗室自動化機器人，這一款機器人在拜耳制藥廠的實驗室今天還在使用，我們把視聽、聽覺和觸覺都裝在機器人的身上，在機器人實驗室的場景來進行試管的移動操作。未來在工廠的自動化之后，制藥的自動化和整個生物系統的自動化，現在對機器人的要求也是提得越來越高，越來越深，未來對機器人的系統大有應用之地。

　　服務家庭的機器人，是我們每個人都希望要的產品，我們能不能享用未來家庭服務的機器人，來照顧我們的父母，未來照顧我們自己，使得我們獨立的有尊嚴的生活，我們在歐盟的項目支持下，也做出了這一款室內室外聯合的這種服務的機器人，為助殘的場景做一些基礎實驗。我們在多模態的情況下，在視覺和聽覺的傳感和處理都比較發達的情況下，我們現在研究各種各樣的柔性皮膚的傳感器，包括可伸拉的穿戴傳感器，把具身智能從視覺、聽覺到觸覺的模態整個打通，來進行產業化。

　　在3D的相機方面，我15年前寫的結構按光的這些論文，現在已經被公司們做成公司們做成創業的一個非常好的點，Mind作為另外一家智能機器人的獨角獸，現在是3D點云相機國際上的領軍企業，已經在30多個國家得到銷售，在智能物流和加工方面已經正在起到非常重要的3D感知的作用。

　　未來的制造和全流程的工業4.0這種全生命周期的智能化，也是一個非常重要的方面。未來的智能駕駛現在對能源和電池的處理方面，也有新的需求。可能這兩年已經是我們第一批動力電池開始報廢的時候，現在歐盟和美國都對新能源汽車的本地銷售，提出了要本地化處理動力電池和汽車的要求，這些方面自動化和機器人的需求，我們現在正在布局，把未來電動汽車的拆解和能源電池的拆解，來進行無人化的自動化方案。

　　在自主系統的核心技術方面，克強老師講了從單個車到網聯車，到云和車的服務方面，非常好的一個總攬。在單車的服務方面，我們把人工智能的多傳感的技術進行融合，也是大大提高它們在夜間，在雪地，在極端天氣下整個的魯棒性。包括在夜間的識別、規劃和感知的例子。

　　最近斯坦福大學又放出了一些失敗的視頻，我們物理世界的具身智能實際上面臨著非常高的挑戰，在感知方面，在交互方面，在操作方面，對環境的價值和操作都有著極高的要求，現在個人機器人還沒有達到現在汽車整個的產量，我們看到的只是家庭簡單的吸塵機器人，我們只是看到了小的物流配送，量還非常小。未來包括城市的全自動的駕駛，包括工廠帶有手的多模態自動化，個人助力和家庭服務機器人，建筑機器人等，都給我們未來的20、30年都提出了重大的挑戰。

　　人工智能最近給我們帶來了新的賦能機會，從四個方面再回顧一下，給我們帶來賦能的機會。第一個是算力的增長，這種指數型算力的增長，是一個非常獨特的現象，和我30多年前在清華學計算機相比，計算能力翻了不是30倍，而是上百萬倍，再放眼十年，我們還會獲得上百倍的計算能力。在數據方面，我們也有足夠多的數據和燃料，從單模態到多模態的數據。從算法方面，我們從處理視覺這種深層的CAN網絡，還有去年很火的處理語言的RNN算法，到處理具身智能的算法，現在可以說日新月異，每天都有上百篇非常好的算法來給我們未來的人工智能技術賦能。

　　第四，現在機器人和人工智能學習，到了如何來學習，在虛擬的空間來進行模擬。我們做出了世界第一個能夠正步走的最省電的行走機器人，把下身的形態和上身多年積累的靈巧操作的手，還有仿生的手融合在一起，我們正在打造未來真正的人形機器人。在多模態處理方面，在十年前在深度學習，在大模態和大模型都不火的時候，我們就已經開始布局這一方面的基礎研究。我們申請到了中德之間最大的基礎研究項目，叫跨模態基礎研究項目，去年已經進入到了第八年，我們和腦科學，和心理學共同合作，來研究人的多模態信息的表達、存儲、整合和交互，來轉移到未來的包括自動駕駛，包括人形機器人算法和系統。

　　從這種多模態的低層融合，到中層和晚期的信號級和語義級的融合，我們在打造新的算法，用這種新的算法可以把一些不完全的感覺信息能夠自動補缺。我們在模型和整個數據方面，我想未來也是給我們賦能的一個重要的基礎點。現在不管是汽車的模型，還有人機交互的模型，還有整個世界的模型，我們做出的結果還非常少，所以我們現在需要有大量的數據端到端學習的補充，通過我們未來10、20、30年，甚至上百年這種技術的努力，我們通過具身智能，通過自動駕駛車，通過機器人，通過自動設備，讓這些大數據的模型來更好的支撐，更好的完善現在的物理模型，來進行未來更好的模型進化。

　　一個例子就是我的一個博士后最新做的一款子機器人，傳統需要多個相機，通過我們對人模型的建立，就可以非常方便的用兩個簡單的相機，就做出了這一款個人的對運動的捕捉，我們現在也可以從網上任何人的數據，現在提出人的運動模型，把這些模型來轉移到人機交互上，轉移到未來的人形機器人的編程上。我們也把現在的模型增強學習深入的融合，我們現在做出了這一款拿到了基尼斯記錄的乒乓球機器人，可以個性化來進行訓練，來做運動處方的康復作用。

　　我們把人的多種知識的一小部分，已經融入到服務機器人上，在人機交互的長度方面，可以大大縮短人機交互需要的長度，通過這種交互也是大大的減少機器人對世界理解的模型，和真正模型的誤差。

　　去年ChatGPT橫空出世，我在十年前就讓我的學生做了一幅圖，我說十年后，我們會不會面臨一個機器人把全世界的書都讀進去的一個場景，去年我們就看到了這個場景對圖形和文本方面的影響，當然還不是通過機器人具身的形式，已經通過非具身的形式，已經給我們在這種白領工作的部分替代方面，已經起到了部分的影響。但是在未來這種具身智能，包括機器人的多模態的具身智能方面，未來我想是下一個重要的包括投資和研發，和未來真正的能夠創造個性化機器的一個重要的節點。

　　上個星期在自媒體了起到了一個小小的轟動，通過遙控操作各種各樣的服務機器人，在前十年和二十年都在不斷的進行，現在通過大模型，我們可以通過這種遙控操作來進行機器人未來的編程。這個視頻里面還有很多都是遙控操作的場景，還不是自主的場景，而且魯棒性還非常差。所以大家不要認為看見這個視頻以后，就認為現在的個人化機器人已經達到產品化的程度了。從未來的多模態的具模型，提高可信度和穩定性，擺脫高計算的成本，可解釋，把它落到千行百業，是我們下一個創新創業的重要方向。

　　今天我們也看到了人才是創新創業的一個重要的因素，如何在現在的人工智能時代對工程師的培養，進行新的工科的嘗試，是我們現在關心的一個問題。未來在人工智能的領域，我們要更加注重多模態的整合和以人為本的倫理需求的重視，還有重視真正對垂直領域的需求有影響的這種創新創業，對工程師的培育來講，我們要更加重視他們對多模態的理解能力，他們跨學科的能力，不管是人工智能的從業者，還是非人工智能的從業者，要理解AIGC，人工智能能干什么，不能干什么，包括未來的孩子要學會如何和人工智能共存，要培養對未來自然的解釋能力，我們的想象力，我們的好奇心，和發明更好的問題。

　　我也希望未來德國和中國，和陜西，和西安，有著更多的互補結果，包括在德國的多樣性，小而美，興趣驅動，洪堡大學的這種科研和教學深度融合的原理，和交叉研究的傳統，和中國在這一方面開放、快速、靈活、刻苦的頂層設計，工程師紅利和團隊組織方面，能夠深入的互補和互相學習。

　　未來的人工智能和通信信息技術，和機器人，和未來真正的具身智能的結合，使得產學研能夠深入進行國際合作，來培養有國際視野的跨學科的創新人才，來真正應對全球的重大挑戰，交叉、創新和融合，來共創和諧社會，美好生活。我想今天在一起這個創投大會，一定在新年里面能夠取得新的成果，也希望和各位陜西的同事和朋友們進行深入的合作。謝謝大家!

IT產業網微信二維碼logo

　　榜單收錄、高管收錄、融資收錄、活動收錄可發送郵件至news#citmt.cn（把#換成@）。

海報生成中...

分享到微博分享到微信一鍵復制

標題鏈接已成功復制

一位院士眼中的AI觀察

最新新聞

熱門新聞

新動態

關注度

最話題

一位院士眼中的AI觀察

相關閱讀

最新新聞

熱門新聞

新動態

關注度

最話題