2024-11-25
2024世界機器人大會以“共育新質生產力 共享智能新未來”為主題,為期三天的主論壇和26場專題論壇上,416位國內外頂尖科學家、國際組織代表、院士和企業(yè)家聚焦前沿技術、產業(yè)動向和創(chuàng)新成果,深入研討人工智能與機器人技術深度融合帶來的新趨勢、新機遇,共同打造了一場十分精彩的機器人領域前沿觀點盛宴!
在8月24日下午的主論壇上展開了一場以“探索人形機器人新紀元:創(chuàng)新、挑戰(zhàn)與機遇”為主題的對話,對話由中國工程院外籍院士、德國國家工程院院士、德國漢堡大學教授張建偉主持,智昌科技集團股份有限公司董事長兼總經理、復旦大學教授甘中學,月泉仿生公司聯(lián)合創(chuàng)始人任雷,小米集團技術委副主席、手機部副總裁、機器人公司總經理許多,加速進化科技有限公司董事長程昊,Noetix Robotics聯(lián)合創(chuàng)始人、首席執(zhí)行官張世璞,樂聚(深圳)機器人有限公司董事長冷曉琨,智平方創(chuàng)始人兼首席執(zhí)行官郭彥東,大連蒂艾斯科技發(fā)展股份有限公司聯(lián)合創(chuàng)始人、總裁李博陽,眾擎機器人創(chuàng)始人兼首席執(zhí)行官趙同陽參與對話。
數說2024世界機器人大會
論壇
26 家國際支持機構
3 大主題 26 場專題論壇
416 名國內外頂尖科學家、國際組織代表、院士和企業(yè)家
74 位國外嘉賓及港澳臺嘉賓參會
線上線下聽眾達 160萬 人次
展覽
27 款人形機器人集中亮相
首發(fā)新品 60 余款
近 170 家參展企業(yè) 600 余件參展產品
參觀人數近 25萬 人次
大賽
全球 10 余個國家和地區(qū)的 7000 余支賽隊
13000 余名參賽選手
每天參賽人數 4000 余人
媒體關注
近 400 家國內外媒體
短視頻平臺話題播放量達 2.9億
對話—探索人形機器人新紀元:創(chuàng)新、挑戰(zhàn)與機遇
以下是對話內容實錄
張建偉:今天下午我們經歷了一個非常密集的人形機器人的討論,最后還有大概一個小時的時間,我們10個專家同臺,最后再討論一些具體的問題。
我想今天的嘉賓包括兩位學術的教授,同時也是創(chuàng)業(yè)者,還有6位嘉賓在現(xiàn)場展示他們機器人產品的創(chuàng)始人CEO,現(xiàn)在我們有請嘉賓上臺。
Alois C. Knoll教授已經組織了有國際經歷的幾位人形機器人的座談,談了很多問題,今天我準備了幾個問題,也多多少少相關,但是我們可能更具體一點。
我們看到今天的世界機器人大會有27個人形機器人展覽,今年一年以來全世界估計有幾百億美金的投資匯到人形機器人里面,據統(tǒng)計現(xiàn)在全世界已經有100多家稍微有點規(guī)模的人形機器人。
我的第一個問題是在大家群雄共爭的情況下,我們如何把獨特技術突出來,如何進行合作,避免重復開發(fā),實現(xiàn)協(xié)同發(fā)展,請幾位簡單發(fā)表一下意見。
甘中學教授主持過ABB的雙臂機器人,也是教授,現(xiàn)在在工業(yè)應用領域非常有經驗,甘教授先開個場。
甘中學:剛才張院士提的問題很重要,現(xiàn)在中國有100多家,今天上午我碰見一個剛從硅谷回來的,也是想做機器人的,他說現(xiàn)在美國公司大概一周能做一兩個,王興興他們公司今年做10萬臺,規(guī)模和發(fā)展速度在中國是非常讓人鼓舞的,想想我們中國高鐵行業(yè)的發(fā)展,就是因為我們中國集群體眾力來做這件事。
中國現(xiàn)在有這么多做人形機器人的,我還是這個觀點,要用群體的力量和群體的智能共同做這件事,會加快我們國家人形機器人的發(fā)展。我多說一句話,現(xiàn)在上海人形機器人訓練場開源的軟硬件是中國的一個非常好的形式。
張建偉:謝謝,任雷教授現(xiàn)在負責中國國家基金委的重大研究項目,在研究人的肌腱和整個骨骼的結構,如何用在行走方面,也創(chuàng)立了一個公司,你來評論一下這個獨特的技術如何在未來人形機器人的創(chuàng)新方面發(fā)揮作用。
任雷:謝謝張院士。我們公司這個技術是我們在世界上首次提出來的,也是原創(chuàng)的,叫仿生拉壓體機器人原理與技術,這是我在2017年的時候原創(chuàng)提出的。我們這個技術實際上是基于我們對人體20多年的深入理解,揭示了人體骨骼肌肉的智能原理。
我們現(xiàn)在實際上是在國家自然基金重點項目、重大項目,剛才張院士介紹的,實際上我們取得了一些初步的成果,其中一個比如說我們現(xiàn)在把它用在行走上,我們第一代仿生拉壓體行走機器人可以像人一樣大步走,它的步速和步長非常接近于人。單位行走距離消耗的總能量已經逼近人體,是人體的1.38倍,實際上波斯頓動力的Atlas是高達人體的一百倍,弘達的Asmo也高達人體的32倍,這是我們取得的一個初步結果。
另外我們也把這個技術應用到了人的手和手臂上去,我們現(xiàn)在做的仿生靈巧手的自由度已經接近于人的生理自由度數了,可以高達34個以上,而且我們現(xiàn)在測試的結果,它這個靈巧手做起各種類人的操控,它的成功率已經接近于人手,比如說它可以用筷子夾幾個花生米,它也可以拿手在這兒轉筆,玩魔方,穿針引線,做很多這樣的工作。
所以我們本身這個公司是有很多自己獨創(chuàng)的,而且是在國際上原創(chuàng)的東西,我們這個公司落地的初衷也就是想把我們新的技術能夠真正做成量化的產品,讓國家和社會都能用上。
張建偉:下面還有一個問題,產學研合作,咱們會繼續(xù)深入。下面我們請許多總,許多總是小米集團,曾經負責過手機的智慧制造,現(xiàn)在也是技術集團的副主席,現(xiàn)在主要負責小米的人形機器人項目,從手機的智能制造到未來人形機器人的智能制造,我們都非常關注小米未來的規(guī)劃。
許多:張院士的問題問了兩點,第一點是如何涌現(xiàn)獨特的技術,第二點是如何協(xié)同創(chuàng)新。我相信大家在這兩天的參觀中會感受到今年我們在人形相關的技術和零部件上會比去年有很多的看點,我非常贊同甘教授的觀點,這些進步是中國集體涌現(xiàn)的一個結果,我也相信明年這些技術無論在靈巧手、在視覺這些方面都會有更大的進步。
我講一些獨特性的技術,人形最大的改變,相對我們過去做工業(yè)設備、智能化設備一個最大的改變是它從固定機變成了浮動機,就是我們沒辦法對于它和環(huán)境的接觸做固定點的校準,就能實現(xiàn)很高的精度了,這其實對范式的挑戰(zhàn)很大。
比如視覺的精度,現(xiàn)在RealSience的視覺大概能提供兩三毫米級別的空間深度的精度,這個視覺的精度能不能從兩三毫米級別變成兩毫米級別,至少對今天人形機器人的落地會產生非常好的促進作用,我們會在這方面進行工作。
大家說希望能很好的去收集數據,比如說靈巧手,現(xiàn)在普通的市場靈巧手還都在3萬以上,我們認為可能5000到1萬的靈巧手,大家用來做訓練,可能會產生很多可以買得起靈巧手,可能買得起4090,他就可以來做機器人抓取行為或者放置行為的訓練,為人形機器人的落地提供非常好的行為,那個小的端到端的模型,加速這些的落地。
人形機器人的移動或者四足的移動上,我們已經看到了很多這樣的小朋友,其實本質上都是針對某種獨特的和環(huán)境的接觸做出來的模型。一個高精度便宜的眼睛,一個高精度便宜的手會加速抓取功能訓練,讓人形機器人加速落地,這是我的觀點。
張建偉:剩下六位大家可以看出區(qū)別,都是創(chuàng)始人CEO,他們公司機器人都在底下有展示,每個人稍微說一下自己展示的獨特特點在哪,技術在哪里?
程昊:謝謝張老師,我是加速進化的CEO程昊,我們機器人的特點總結下來叫做輕巧靈活,皮實耐摔,專為開發(fā)者打造,因為我們自己就是開發(fā)者。感覺用機器人時其實希望它小一點輕一點,一個人就可以在上面開發(fā)算法、操作。這次展臺特點就是做了機器人踢足球,現(xiàn)場氛圍非常好,我們也很以外。尤其小朋友響應非常熱烈,所以第二天開始準備了棒棒糖,發(fā)現(xiàn)響應更好了。
機器人特點它是為數不多搞機器人對抗的,這個過程中真的會有機器人對腳,胳膊會纏在一起,踩到別的機器人腳后跟,機器人差點摔倒。有的時候摔倒了自己會爬起來,這是我們一直秉持的特點,我們覺得機器人要敢摔。如果作為一個機器人公司不敢當中摔機器人的話,可能很多問題暴露不出來。我們認為敢摔機器人的公司,會是一個更好做出機器人本體的公司。同時我們也想把上面的開發(fā)平臺做好,讓更多開發(fā)者在我們機器人上做二次開發(fā)。
張世璞:我們公司叫Noetix Robotics,中文叫松延動力。大家可以從這個展覽館走出去左拐模仿人類表情的機器人是我們公司的,同時還在A137展臺展示了機器人連續(xù)超過一分鐘的單腳跳躍、雙腳定向跳躍包括超過3.2米每秒的高速奔跑。大家可以看到我們公司是專著在高自由度解決方案的一家科技供應商,本質來講我們以后為2B、2C或者2C客戶提供一種以前和物理世界相對隔離,用低自由度解決的方案,我們希望把它從低自由度提高到高自由度,同時在物理仿真和模擬上做的stem to real gap更小,因此我們現(xiàn)在帶來的多款機器人都證明了我們在過去的效率上有了非常非常大的提效和成果。未來三年內我們希望能夠把人形本體或者多自由度本體在服務市場進行商業(yè)化,謝謝。
冷曉琨:大家好,我是來自樂聚機器人的冷曉琨。我們團隊是2016年十個哈工大師兄弟成立的專門做雙足人形機器人的。2022年之前我們人形機器人在產業(yè)里的差異化比較好聊,因為那時候是比較冷門的賽道,幾家人形機器人公司基本一聊各家都有差異化。但是2022年開始到現(xiàn)在無論是從本體、控制以及具身智能學習上,技術路線都有趨同的趨勢了。所以去年我們發(fā)布夸父人形機器人全尺寸時,我們定位就是要做人形機器人加產業(yè)生態(tài)。就是我們把本體做好做穩(wěn)定以及把操作系統(tǒng)以及平臺做好之后,更多和上下游合作伙伴一起合作進入產業(yè)里來。假設我們做的是手機本體和操作系統(tǒng),上面的app是和大家一起開發(fā)的。
所以大家今天在我們展臺看到的包括機器人的炒菜、榨汁這些本體是我們的,上面操作系統(tǒng)是鴻蒙,大模型是華為盤古。包括另外一個場景是北大清華以及北京通研院一起合作做的。我們現(xiàn)在主打本體運動能力夠用之后,盡快和產業(yè)合作方盡快落入場景中,盡快實現(xiàn)人形機器人產業(yè)化應用的探索。
郭彥東:謝謝張院士,我是郭彥東,來自于智平方機器人。其實幾年前我們參加機器人大會時,印象很深,看到以色列的仿真機器人公司放蝴蝶機器人空中飛。想到了《梁?!纺菚r候很感動。但是這次去看世界機器人大會,我和張院士的感受類似,我們多了非常多的人形,不管是雙足人形還是輪式人形的機器人公司。
第一、我覺得挺有道理,因為以前機器人是為專用場景,專用任務設計的專用設備,它一定是多種多樣的?,F(xiàn)在我們愿景是通過人工智能技術,通過足夠泛化的本體技術承擔更多任務,一定會有更多資源導向于這樣全新的品類,我們叫它通用人工智能機器人。
在通用智能機器人賽道里,剛才冷總說前些年好現(xiàn)在不好了,但是對我們來說也比較容易講清楚。其實在A129展位給大家提供機器人制造咖啡,像這樣的例子其實在很多的機器人展會都看到過。但是日常生活當中看到的不是很多,究其本質的原因是,當你更換咖啡機的位置、狀態(tài)包括換咖啡機的種類等等,大家就需要重新再做二次開發(fā)和定制。
智平方的機器人做咖啡是對咖啡機的位置、品種類、操作順序沒有任何要求,可以全自動地泛化到各種各樣的設備上。今天可以做咖啡機,明天可以讓智平方的通用智能機器人操作各種各樣的電器。背后一定程度上回到智平方機器人的獨特性,我們用通用的感知能力、泛化的操作能力把大模型和機器人操作做非常深度的軟硬整合,這是我們切入點比較獨特的方向。
我自己從微軟回來之后,在兩家大的主機廠,一個是小鵬汽車,一個是OPPO都擔任高級研發(fā)管理工作,可能也表達一個有點得罪人的觀點。整個機器人技術點技術站是非常龐雜和龐大的。很多人從小米出來,在這樣主機廠待過的人都會有一個共識,就是不太可能有一家企業(yè)把里面機器人所有的核心技術全部都完全自己搞定。如果一個企業(yè)完全都自己搞的話,可能很難和市場上最好的分門別類的企業(yè)競爭。
這次智平方在A129展示自己從智能逐步向通用智能機器人轉變的同時,也結合非常多生態(tài)上的伙伴,包括訓練芯片、推理芯片、關節(jié)芯片、關節(jié)包括很多靈巧手合作伙伴。我們堅信機器人賽道技術站找到最合適自己的技術點發(fā)力,結合產業(yè)最好的合作伙伴是在機器人賽道里獲得成功最核心和必要的技術路徑,謝謝。
張建偉:博陽,你們公司每次都參加世界機器人大會,每次都招到很多關注。今年展位也非常明顯,總結一下,今年有什么樣新的技術?
李博陽:我是來自EX機器人的李博陽。EX機器人就是在序廳的入口位置,也有朋友戲稱我們?yōu)槭澜鐧C器人大會的序廳之王。因為每年到我們那關注的人特別多。我們主要做的仿生人形機器人其實是從2013年公司成立,那個時候我們核心團隊從日本留學回國,剛剛講到機器人發(fā)展史時,介紹過一家日本的學校,就是我的母校早稻田大學。我們團隊回來之后始終秉持著東方人對機器人傳統(tǒng)的感情。
因為從小看到的科幻作品、動漫作品,機器人都是生活中的伴侶,都有非常生動的表情表現(xiàn)。所以我們始終堅持要做可以細膩和人進行交互的機器人產品。所以現(xiàn)在帶來的一系列機器人現(xiàn)階段就是我們把人形機器人和大模型做了深度融合。這種融合不是簡單技術的大模型,我們更強調情感AI以及有角色的NPC大模型,所以我們的機器人大家可以看到和它進行交互的時候,它其實更加像一個人。這里面也做了很多工作,包括面部表情和情緒的識別和表達,包括它的多模態(tài)實際上更接近于人的五感,甚至結合了周邊采集設備的第六感的多模態(tài)分析。
所以我們的方向定位為家庭服務,公共服務這樣的服務場景,當然我們也和很多應用場景結合,打造了線下可以體驗的綜合體項目,我們可能在圈子里是比較特殊的分支,我們可能也是人形機器人企業(yè)中最早擁有股票代碼的企業(yè)之一,也是最早實現(xiàn)了盈利的企業(yè)之一。
趙同陽:我是第一次參加世界機器人大會,公司成立不到一年時間,因此這一次我的團隊給大家?guī)砹艘豢铍p足機器人,它只有下半身,我們的理念是先做一款全球能用得起,還能用得好的機器人,并且要足夠專業(yè)。你們去展臺看,可以發(fā)現(xiàn)它的行走姿態(tài)、外觀造型以及行走的動態(tài)能力都是非常棒的,但是它的價格只有38000多,比友商9萬多的還是要低不少,當然價格不是我們唯一的優(yōu)勢。我們團隊過去有八年以上的技術沉淀,不管從低端的行恒減速機到諧波??胤桨敢恢钡街本€推桿方案我們都是成為全球為數不多同時具有三種動力方案的企業(yè)。
但是時間我們成立的并不是太長,因此我覺得在未來兩三個月之內,后面給大家?guī)淼牧硗鈨煽顧C器人希望給大家?guī)聿诲e的驚喜。
張建偉:我提出這個問題時,想著這個問題很苛刻,你們的回答基本給你們及格分,不錯。也希望你們未來多交流,現(xiàn)在融資好的時候大家都在并行開發(fā),但是有不好困難的時候你們要多合作多交流,形成合力,避免低水平重復,這也是我們做機器人大會的一個初衷之一。
第二點想問稍微批量一點的。今天幾位也提到了上千臺或者上萬臺的應用,真正能夠創(chuàng)造價值而不是給人看的感覺這種應用,瓶頸技術在哪里。前面幾位報告還有上一個部分都多少提到了,包括具身智能數據瓶頸問題,Marc教授也提到了能源問題還有其他的包括材料、關鍵零部件包括其他的能源材料等等。從你們具體實踐來講,你們覺得還有哪些瓶頸技術問題,有哪些突破建議?
甘中學:現(xiàn)在人形機器人真正用到實踐中,不管是工業(yè)界還是服務業(yè)還是其他的特種行業(yè)還是有差距的。我們如果把機器人分成三類來看,一個是能跑會跳的,做得不錯的像宇樹科技。有的做得心靈手巧的像因時,還有能夠有親情情感的。我認為這對于應用這三方面很重要。從我的角度來看,目前真正對于工業(yè)界和服務界一個比較關鍵的技術就是心靈手巧技術,只有把心靈手巧技術做好才能在工業(yè)界大部分復雜的動作可以實現(xiàn),服務界也是照顧人做得很好。目前我們在能跑會跳上很多做得不錯了,但是手的方面真正離做實用,不管是特斯拉做的還是國內做的,可以看它的手動作和人的動作比相差很遠。我認為具體來講應該是把心靈手巧更加重一些。
任雷:我比較同意甘老師的說法,實際上距離現(xiàn)在落地能用上,還有很多的問題需要解決。一個是能耗問題剛才甘老師講了。另外我們這個技術能耗已經降到了傳統(tǒng)機器人能耗的三十分之一,接近于三十二分之一的樣子,接近人的能耗了,這個我覺得是非常重要的事。另外手和手臂其實是真正決定我們這個機器人能完成什么任務,真正干些實際工作的關鍵技術。這里說白了我們離人手差得非常多,這就是為什么我們提出了新的技術。新的技術這個機器人按照人的肌肉骨骼作用原理來做的。我們實際上把關節(jié)完全放開了,而且它的驅動是采用人工肌肉的驅動,就是我們自己專利的磁極電驅人工肌肉。就是所有關節(jié)我們都恢復了人體的自然生理運動,膝關節(jié)自由度高達十二了。
大家可以想現(xiàn)在的人形機器人膝關節(jié)一般就一個自由度,但是我們完全放開了,大腿骨和小腿骨是6個,臏骨和大腿是六個自由度,你放開之后我們原來可能覺得比較難,但是實際上真正能夠重現(xiàn)人體自然的行走步態(tài),能耗有顯著的下降。這些是沒有發(fā)表的東西,我在這里講一下。
另外還有一個事情我們必須在批量生產或者落地之前解決的,就是人機物理接觸安全性的問題,因為這個事情非常重要,真正走進家庭,真正為人類服務,和人類協(xié)同工作,那你物理接觸安全性是非常重要的事。如果是金屬的剛性部件,高速運動起來和人近距離接觸那非常危險,而且對于貴重儀器設備包括家里家電家具都是不友好的。所以我們現(xiàn)在提出一個什么概念呢,就像人一樣,一定要采用剛柔耦合的結構解決問題。
它和人接觸起來感覺就像另外一個人,另外它對你周邊環(huán)境,包括和你近距離接觸,你不會有任何恐懼感,這個我覺得是我們在批量生產,真正使用之前必須要解決的幾個核心技術問題。
張建偉:許多總,你是最有發(fā)言權的從手機的批量生產到未來人形機器人批量生產,你覺得還有哪些技術瓶頸?
許多:要進入規(guī)?;瘧梦覀冋J為是三個東西的平衡。第一個是精度決定了它能不能有效完成以及完成的成功率。第二個是速度決定了你的效率,它是商業(yè)成功很重要的一點。第三個是負載,負載決定了它能干多少工作,尤其是汽車工廠。在三生工廠還好都不會挑戰(zhàn)額定,汽車工廠是從很輕的東西到十幾二十公斤的東西,它的變化還是比較大的,你要用一個通用本體其實壓力很大。
回到核心技術我們認為,其實核心還是要解決三個核心部件的問題。第一個還是眼,現(xiàn)在市場上大部分還是想用純視覺,IGBT解決。但是到底數據規(guī)模到多少它的精度才能提升,一條十一條現(xiàn)在大家講不清楚。
至少現(xiàn)在的到一億條生成數據訓的純視覺的模型,它的精度大概還是在厘米級,沒有像我們期待的亞毫米,因為我們工業(yè)上用還是要亞毫米視覺精度收斂。我覺得這個時候其實還是需要主動雙目的,因為主動雙目能提供穩(wěn)定的亞毫米空間點云信息,至少暫時是需要的。亞毫米的空間,點云的這種主動雙目的機器視覺的部件要怎么去做,其實是今天產業(yè)界非常核心的一個問題。
第二個是靈巧手的問題,從工業(yè)角度看起來三指比較合適,五指是有點多余了,因為五指的可靠性現(xiàn)在看起來用推桿電機的方式是非常難以做好的,現(xiàn)在的靈巧手還是很容易壞的,負載一大,其實基本上就壞了。
另外可能還有一個核心技術,就是小臂的技術,現(xiàn)在大臂走工業(yè)的這套,基本上用25的諧波,大概7到10公斤是沒有問題的,但是小臂是讓整個載動能力急劇下降,因為小臂我們要去協(xié)同速度和精度,對小臂的犧牲還是比較大的,在小臂設計上,其實我很期待任雷老師完整的臂過來給我們去適用,因為現(xiàn)在看起來我們用傳統(tǒng)諧波的方式做的小臂有非常多的問題,要么做的很重,因為人形的電機,它的腿步或者是電機能力定了之后,比如說我們設計出100公斤可以0.5米的速度行走,但是你節(jié)省下來的重量就是給載重的,臂做的越輕,你做到70公斤,可能有30公斤的載重空間,你做到80就只有20了,其實這個差距還是比較大的。
我認為手、小臂和眼睛是未來人形機器人非常核心的技術,工業(yè)應用其實是比較高精度的,高速度的,往民用去拓展就是要解決剛才任雷教授說的安全的問題,相對是比較容易的,還要先解決精度和速度的問題,再去解決安全的問題,加上各種力控,那就是相對比較容易的。
以上是我的觀點。
張建偉:程昊,有什么樣的情境要突破?
程昊:如果真的是說被批量使用,無論用在體育場景還是其它場景,其實我覺得不一定是純技術問題,之前移動互聯(lián)網的時候,我們經常提到一個詞叫PMF,就是產品和市場匹配,我感覺到機器人可能叫TPMF,就是技術、產品、市場的匹配。
有些前沿的技術要去突破,比如說真的實現(xiàn)量產可能是市場需求在這兒,它需要什么樣的產品,這些產品需要什么樣的技術,然后把這些匹配度做高,可能是最先說能批量生產并且形成商業(yè)化規(guī)模的關鍵。
其實我感覺我們正處在第一輪的技術產品市場匹配階段,其實這一輪從電驅的關節(jié),無論是直線的還是旋轉的,結合現(xiàn)在算力的主控,構型標準也在統(tǒng)一,這是第一輪的成熟,接下來就看把它包裝成一個什么產品,打什么市場正好能夠匹配上。
比如說無論讓它踢球也好還是讓它去家庭也好,以家庭為例,它可能需要的就比較高,目前來看大家都會覺得挑戰(zhàn)比較大。我們會傾向于選一些偏簡單的場景,對技術要求沒那么高的,盡快把第一輪的技術產品還有市場匹配走完,然后再走第二輪,第二輪可能就是更高的技術,然后它能做出更好的產品,能滿足更復雜的需求,我覺得得一輪一輪來,這可能是接下來發(fā)展的一個節(jié)奏。
張世璞:我們公司在硬件方向上來講,其實過去的半年時間會發(fā)現(xiàn)當我們1.0版本的時候能夠讓它穩(wěn)定的行走跟跑,不出任何問題的時候,但是當我們自己強化學習再去迭代的過程當中,再去測試跑和跳的過程的時候,又會暴露新的問題,因此我們在想能不能去借鑒比如車企的影子模式,無論是后面的量產還是說把研發(fā)的體系量化,而且還能夠很好的去發(fā)現(xiàn)在這次demo里面bug到底在哪,怎么去組止。
其實大家都在談算法是黑盒,但其實研發(fā)在某種程度上來講,現(xiàn)在它的范式也存在一個黑盒,所以我覺得可能影子模式是一個比較好的方式去解決這個問題。
第二點是在商業(yè)化的過程當中,不管是去工廠還是去服務業(yè),還是去2C,自動駕駛都是最重要的一環(huán),因為不可能再讓一個人站在它的后面拿著手柄去遙控機器人,現(xiàn)在我們再去解決的一件事就是自動駕駛并不是簡單的從一個位置到另外一個位置,而是從一個位置到另外一個過程當中,它的姿態(tài)也要發(fā)生變化,所以怎樣能夠把感知、視覺和強化學習結合在一起,能夠讓它很穩(wěn)定的很魯棒的做到自動駕駛,這是我們現(xiàn)在正在突破的一個方向,所以分享這兩點,謝謝!
張建偉:從控制和智能的角度。曉琨。
冷曉琨:我們今年一直在探索人形機器人進入到場景產業(yè)化過程中遇到的問題,因為我們也是分階段。今年我們銷量最高的場景還是科研、展廳包括高校這些場景里面,大概在100多臺,過去一年把問題解決的差不多。
但是現(xiàn)在我們第二步在進行工業(yè)場景,包括跟幾個車廠簽的協(xié)議,包括海外幾個場景,反倒是遇見了一些新的問題,并且這些問題不是人形機器人公司能搞定的。
第一個,剛剛前面專家提到的能源問題,其實現(xiàn)在我們大部分的人形機器人,包括能連續(xù)續(xù)航作業(yè)時間大概也就在一個半小時,兩個小時已經是極限了,可能大部分應該是在一個半小時以內的時間,其實這個時間你用換電的方式也不太夠用,但是電池的功率現(xiàn)在已經擺在這邊,我覺得這可能是接下來雙足人形機器人,兩條腿的機器人進入到產業(yè)化的一個很大的問題,這是一個基礎學科的問題,我們現(xiàn)在想基礎學科沒有突破之前,我們要怎么解決,因為這是產業(yè)上急需要的,因為它的節(jié)拍也很快,沒法去頻繁的換電。
第二個,電機的功率密度問題。從工業(yè)機器人的時候大家就在討論這個問題,之前大家在說現(xiàn)在100公斤的機械臂拉一個10公斤的物品,如果有一天10公斤的機械臂能拉動100公斤物品的時候,其實我們的很多控制包括智能算法會有一個很大的提升幫助。
同樣的,人形機器人是一個欠驅動的系統(tǒng),所以說對于電機的功率密度問題也是一個很大的需求點,但是我們現(xiàn)在看電機這個方向,每次功率密度的提升都是在2%、5%的方式,很難有一個很大質的突破,其實這個基礎學科也會反過來,因為這涉及到材料一些學科,反倒這方面也會影響到接下來人形機器人產業(yè)化落地的一些點,并且我認為能源和電機這兩個問題接下來會較長時間的卡住人形機器人的發(fā)展。
郭彥東:我可能對這個問題有一個不完全一樣的思考,因為您剛才提到說怎樣批量去做研發(fā)的核心技術,其實我覺得我們作為一個機器人公司,面向產業(yè)做的,更多思考的是怎樣去研發(fā)批量的技術,而不是怎么去批量已經有的技術。
要想在量產當中使用通用智能機器人,首要思考的問題跟在實驗室是非常不一樣的,我也結合智平方的一些核心技術,為什么我要投這些核心技術為例子解釋有哪些不一樣,第一個例子是通用且精細或者叫通用且稠密的感知,這個問題我們公司一成立就重點投入去做,但是行業(yè)里面可能會覺得感知這個問題是不是聽起來大家已經做了很多年,或者甚至在實驗室已經有非常好的結果。
但其實我們不管是在量產汽車還是量產手機的時候,發(fā)現(xiàn)當環(huán)境多變的時候,我想要在通用的場景下實現(xiàn)非常精細化的感知,我把它定義為在批量當中就會遇到的核心技術和核心問題,這也是為什么我們在公司一成立的時候就把通用且精細的感知列為我們最核心的技術,并且在這個方向取得一定的進展,也非常榮幸得到不管是國家的還是客戶的一些認可。
今天我也非常開心的聽到不管是小米的許多總,我其實看到硅谷的一些公司在人形機器人火了一小段時間之后,再翻過頭來認為空間感知是機器人里面最核心的問題之一。
我想提的第二個小例子是泛化操作,其實在機器人不做大規(guī)模量產的時候,大家可能不會覺得操作的泛化是一個非常重要和了不起的一定要做的問題,包括端到端的架構,如果我只是做一個原形,我可能用代碼去實現(xiàn),效率是更高的。
但是如果我們的設備在生產實驗當中持續(xù)的使用,隨著設備量的增大,隨著環(huán)境的多變,隨著適應操作的任務越來越多,那要寫的代碼就越來越多。其實大家討論需不需要做端到端這樣一個大的背景和前提,我們如果把它放在要去批量的大背景下,其實就比較容易有一個非常有傾向性的答案。
第三個是軟硬整合能力。因為我自己在主機廠做過,不管是負責自動駕駛,還是AI的中臺,其實在主機廠做AI還是很不一樣的。我想到2016年、2017年Robotaxi公司把PC機放在汽車后備廂里面,去做Robotaxi的展示,真正在量產汽車公司里面去做智能化,我們怎么樣把算法跑小,跑在一個算力受限的端側芯片上,怎么樣去適應量產裝置的不完美。
我如果發(fā)現(xiàn)這個硬件裝置這個地方不是最好,我就花1、2億去把裝置這部分通過投研發(fā)做好,其實我們要做的是如何能夠把現(xiàn)在所有的硬件性能,通過智能和軟件的能力發(fā)揮到極致,這個是一個非常經典的,帶有主機廠色彩,去研發(fā)批量技術的一個思考。
我先分享這么多,謝謝主持人。
李博陽:我想說的一點,我們實際上做任何的智能決策也好,做服務也好,感知是第一步。所以我覺得現(xiàn)在機器人感知的能力,還有很大的欠缺,不光是廣泛說到的空間的感知,可能還包括它對自身本體狀態(tài)的感知,包括它跟客戶、使用者之間的關系的感知,以及它跟周圍環(huán)境,以及應用場景的感知。
所有我們人覺得我們能夠做出一個恰當的、準確的反饋,都是基于我們非常充分的感知到了我們所處的環(huán)境,以及我們現(xiàn)在應該做什么?,F(xiàn)在我覺得這個感知的階段,現(xiàn)在從語音、傳感器一些方式上去獲取了一些信息,但是跟人本身來相比,還遠遠不夠。
從機器人廠商來講,講到批量化,考慮的問題比較多,我們最主要要考慮的就是做取舍,我應該在什么樣的場景下做出一個可批量化生產的產品。這里面首先考慮的是這個市場真的有需求,我們如果做的是一個偽需求的項目,實際上我們不管怎么做,它都不可能有批量化的可能性。
另外,我們的產品要在這樣的需求狀態(tài)下,我們達到一個可用的狀態(tài),可以達到我們希望它達到的一個效果。現(xiàn)在我們很多的機器人企業(yè)做出來的產品,都在這個需求場景下還沒有可用的狀態(tài),這個意味著它現(xiàn)在還沒有到一個量產的階段。
還有一個是成本的問題,如果是量產,不管是零部件也好,還是日常使用的算法,或者是大模型的支出也好,其實它都應該是一個成本可控的階段。我覺得現(xiàn)在考慮這個問題還過早,也就是說現(xiàn)在還是一個百花齊放的階段,先不去考慮量產,先考慮怎么能讓我們的機器人達到在這個應用場景下可以用,并且賣的出去,然后再考慮去降成本,能夠讓它批量化的問題。
趙同陽:我認為人形機器人分為四大塊:優(yōu)秀的本體、高動態(tài)性能的控制算法,以及更具有泛化性的具身智能、非常接近人的通用人工智能這四大塊。其實每一塊它的落地在這個階段還是有巨大的挑戰(zhàn)。
首先在本體這一塊,我們可以看到現(xiàn)在大家都走的是電動方案,不管是從電機、減速機以及控制器,其實它都是一個傳統(tǒng)行業(yè),尤其在中國這塊是一個非常傳統(tǒng)的行業(yè)。在機械臂行業(yè),在其它行業(yè)都經過一定的驗證,但是在人形機器人的使用還是第一次。
我們機器人未來我認為做到工業(yè)級別的,至少成本需要10萬到12萬之間,如果這樣的一個機器人,我們希望它接近一個汽車,那么對它的一個要求可能就是達到工業(yè)級的。比如說你具有10-15年的壽命,如果你家買一個機器人10-18萬之間,你可能希望它能工作10年以上,所以耐久性、可靠性還是非常具有挑戰(zhàn)性的。
另外,人形機器人它不像四足機器狗,狗你可以走出什么樣的步態(tài)都無所謂,只要往前走,走的快就OK了。但是人形機器人我們希望它走平、走快、走穩(wěn),最重要它走出優(yōu)雅的步態(tài),我們現(xiàn)在很多機器人走起來還是咵咵響、小碎步、彎著腿,其實這都不是我們所希望看到的,我們所希望看到的都像人一樣,走的虎虎生威或者走的非常優(yōu)雅。
因此行走它不僅是一門技術,我認為它還是一門藝術,只有達到藝術這個級別,我認為我們至少需要1-2年的時間去做準備。另外在解決完運動控制算法本體,最大一塊在通用人工智能,我們希望我們的機器人不僅有很好的軀體,還需要有足夠有趣的靈魂,這塊我認為是機器人行業(yè)后面非常大的坑,它可以類別以前的個人計算機時代,跟計算機時代很多家都在做電腦的時候,微軟做了軟件這塊。
所以,對于通用機器人來說,我們要警惕的是不僅要關注到本體這塊,可能有一家具形公司它成為未來的微軟,不管我們誰家的機器人,搭載它的智能之后會立馬變的具有靈魂。
最近我和一些在做大模型的公司交流,最近百模大戰(zhàn),我發(fā)現(xiàn)他們做的東西讓我非常驚訝。但是有一點我會感覺到很多家公司都在做一個大而全的東西,我問它什么東西它都知道,因此給我的感覺它更像一個百科全書,其實有的時候我們需要機器人是一個萬能的上帝嗎?不是的。
現(xiàn)在很多大模型,它的服務器上面可能就住著一個萬能的上帝,問什么樣的問題,它的回答可能都是非常全面,但可能都是比較雷同的。我們希望我們的大模型以后的發(fā)展,希望每個機器人都有每個機器人的性格,是有趣的靈魂。
這是我的幾點看法。
張建偉:這一輪大家對Bottle neck的匯聚,咱們也都能夠總結出機器人有多么復雜,不是一個Bottle neck,是一圈的Bottle neck。從材料到能源、驅動密度、感知精度、智能高度等等,我想今天是我們有史以來最大的一個Panel,我也希望把我們的觀點記錄下來,形成一些文字,來推動中國和世界人形機器人的有序發(fā)展。
我上面提的問題,大家回答好的部分是對Bottle neck都發(fā)表了觀點,但是怎么解決,怎么突破,實際上是我下一個問題。我們說現(xiàn)在的人形機器人還需要很大的研發(fā)投入,包括特斯拉的方案,你把它做便宜、做穩(wěn)定,也是不可能批量銷售的。
后面如何讓我們現(xiàn)在人形機器人的公司獲得不斷的技術源泉,靠你們自己的研發(fā)肯定是遠遠不夠,我提的問題就是如何產學研更有效的合作,咱們橫向項目跟縱向項目,國家有重點研究計劃,有基金委的重點項目,橫向你們可以成立聯(lián)合實驗室等等,下一步如何讓產學研更好的有效合作,使得人形機器人這么復雜的系統(tǒng)能夠源源不斷的獲得高校的技術支撐,大家發(fā)表一點看法。
甘中學:產學研合作很難,但是我想從另外一個角度談這個問題,現(xiàn)在我們做大模型也好,包括后來做算力也好,有點跟隨性的做法。大模型,還有算力、TPU等等,我覺得我們中國要想要在這方面走出自己的路來,一定要換一換研發(fā)的思路。
建議一:要把大算力和算法的創(chuàng)新結合起來,現(xiàn)在很多人說有了大算力,我們也發(fā)明了電動機,電動機不節(jié)能,我們現(xiàn)在開始節(jié)能,幾十倍、上百倍的算力搞完了,回來我們再去做節(jié)能,這個路子實際上是現(xiàn)在的芯片公司或者算力公司(所做的)。
所以,我覺得我們國家必須是算力和算法同時并行進行,才能找到一個多快好省的辦法,來和國外去競爭。
建議二:具身智能目前正在開發(fā)當中,基于語言的大模型我們實際上已經不如國外先進,那么在具身智能里面,昨天我才知道張建偉院士很好的提出中國的知行合一,今年我看好多人提到,知行合一這個做法我認為是具身智能最好的方式。
這里面就涉及到我們研究的方法和我們研究的途徑,以及我們產和研的結合,所以我認為我們應該基于知行合一,其實知行合一和現(xiàn)在世界上提的信息領域的最小進行原理是一樣的。
中心意思就是我們應該做起來認真思考一下,我們的產學研方向和出發(fā)點應該和國外有所區(qū)別,否則我們永遠是跟隨,這對我們的發(fā)展是不利的。
張建偉:你的基金研發(fā)項目,怎么讓這些人形機器人公司來共享你的研發(fā)成果,有什么看法?
任雷:產學研融合幾乎是一個大趨勢,因為大家也聽到張老師問的前一個問題,實際上人形機器人它有很多的技術瓶頸需要去突破。因為人形機器人它是一個高度復雜、集成的系統(tǒng),它不光包括了我們的感知、驅動,包括了材料、結構的這些東西,實際上它是一個綜合的多學科交叉的攻關項目。
所以,很多問題還涉及到基本的科學問題我們沒有解決,首先我認為學校應該負責很多,比如說新型的創(chuàng)新結構設計,尤其是仿生的設計。另外新型的感知材料、驅動材料,未來也都應該往人形機器人上去考慮應用,這個我覺得是企業(yè)需要學校的一塊。
另外,我們學校也非常需要企業(yè),我們應該多了解企業(yè),因為學校有的時候更偏重于發(fā)論文,出一些專利。這些東西究竟能不能用上,怎么用,這個有的時候是有問題的。比如說開發(fā)一些新的技術,但是有可能只考慮性能,不考慮成本,不考慮這個批量能不能做出來,這個工藝的問題不去考慮,這個脫離了我們未來批量生產的需求。
還有一個很重要的事,企業(yè)需要做的是什么呢?我們不能光去整一些比較炫酷的Demo,應該真正的去了解我們的應用方,這個場景到底需要什么。比如說我們真正需要人形機器人的這些企業(yè),這些應用場景,人家真正需要解決什么問題,它是什么樣的場景下解決一個什么樣的具體任務需求,這個我覺得是未來我們產學研融合去做的事情。
張建偉:許多總,分享一下小米在以前產學研合作的成功經驗。
許多:我們在這邊是這么考慮的,還是看技術的成熟度,一些科學問題還沒有突破的,我們是堅決和高校合作,去做一些科學范式的探索,比如說我們的相機有和黃老師合作做一些探索。
另外,有些成熟技術遷移過來的,本質上從其它行業(yè)或者其它領域遷移過來的,我們堅決的去做產業(yè)化,去把那個產業(yè)做好。大家都有一個痛點,舉個例子這兩天展館有一家企業(yè)特別火,一家深圳的,原來做彈出式攝像頭的企業(yè),它拋出一個觀點,要做99的推感電機,我相信在座的都很興奮,如果它能做到,我們手某種程度上就有了巨大的突破,你至少敢于把自由度做上去了,不是6個了,可以做到15個、20個。下一步可能再做小型化,某種程度上就突破了。
像這種實感電機,還是要先去做產業(yè)化,比如說特斯拉大的實感可能還在將近2萬塊,如果能做到1萬塊,至少大腿的部分用推感是比較好的,因為大腿也不需要高動態(tài),只需要非常大的出力就好了,因為小腿是需要高動態(tài)的,需要非常高的響應。
其實這還是說在整體構型上,我們既要基于科學和高校、研究機構合作,我們也要基于應用去做產業(yè)的深度開發(fā),最后把這兩者在一個軟件平臺上、仿真平臺上深度的融合,去加速我們整個的應用。
可能小米相對比較好,它相對生存壓力比較小,我建議大家選擇做的東西,還是要把這個產業(yè)堅決的做透。大家覺得一體化電機相對比較通俗,這里面MCU還是用英飛凌的,這個價格還是很高的,國產化的也不充分。
比如說,電機里面的編碼器,國產做的還是有非常大的差距,我認為還是有很多值得做的東西。在過去機械臂行業(yè),因為它的量比較小,沒法做。加上人形機器人,整個市場規(guī)模還是會比原來擴大到若干倍,過去那些做零部件的企業(yè)進來之后重新去思考這個東西,在整個市場規(guī)模擴大的時候,怎么把零部件堅決做到更好。
以上是我的分享。
程昊:我覺得現(xiàn)在這個階段,尤其是對于人形或者具身智能產學研結合非常重要,有點像70年代信息革命剛開始的時候,其實硅谷是發(fā)源地,它的特點就是有個斯坦福、伯克利,但是具體它的政策我覺得得去研究,非常好,然后孵化很多企業(yè)出來。
因為創(chuàng)新是一個失敗率很高的事情,交給創(chuàng)業(yè)團隊去做可能就得很多創(chuàng)業(yè)團隊,100個創(chuàng)業(yè)團隊都去創(chuàng)新,最后活一到兩個,剩下那些都死掉了。但是這些如果放在學校里面,學生、老師拿經費去做會更好,但是公司也要創(chuàng)新,學校里面做創(chuàng)新更能承受試錯的。
如果這個能接受好,在公司里面去做商業(yè)化,再把賺來的錢回來反哺學校,形成一個非常好的循環(huán),我覺得可能就是我們這個階段在產學研融合上非常有價值的事情。我覺得可能現(xiàn)在更重要的是抄作業(yè),抄成功的案例,無論是通過政府、高校、公司,找到一個好的模式,盡快去推。
AI我認為是一個等同信息革命,AI革命的初期,越是初期的時候,產學研越重要,如果這個時候沒有抓好機會,可能就錯過了,到后面都是產業(yè)了。比如現(xiàn)在移動互聯(lián)網,互聯(lián)網的很多創(chuàng)新其實不是高校在做,而是企業(yè)在做了。
因為企業(yè)會有更多的錢,它就能去容錯,內部賽馬去搞,但是現(xiàn)在對于AI、具身智能、人形機器人其實都沒有到那個階段,現(xiàn)在除了小米,我非常敬佩小米這個級別的公司愿意去做。其實很多大的公司不是非常篤定入局的,這個時候更需要產學研結合好,我建議抄作業(yè)抄成功的案例。
張建偉:從平臺創(chuàng)新到硬科技、黑科技的創(chuàng)新是一個新的提升,需要新的創(chuàng)新模式。
張世璞:我簡要的說,近兩年我們發(fā)現(xiàn)非常多炫酷的Demo,其實背后都是現(xiàn)在讀博一、博二非常優(yōu)秀的00后,或者2000年左右的年輕人去做出來的?,F(xiàn)在技術發(fā)展迭代的速度非???,甚至是按月來計,產學研來講我們會發(fā)現(xiàn)一個很重要的問題,一個學生他拿到了一臺機器人配好了環(huán)境才開始調,調的過程中還有很多的問題。
我們作為企業(yè)能夠幫的一點,盡量去減小這個時間,縮短成本,讓這些優(yōu)秀的年輕人拿到了這些基礎設施以后,很快的就可以驗證自己的想法,讓他們自己的POC得到一個快速的迭代,所以我覺得這個是作為創(chuàng)業(yè)公司、企業(yè)應該要去做的,而不是讓大批研發(fā)型的人才過度的浪費時間在工程上面去,其實必要的一些工作也是磨煉研發(fā)人才必須的階段。
這個可能是我想分享的一點,謝謝。
冷曉琨:產學研這部分其實樂聚一直在做這個事情,2016年我們10個哈工大師兄弟成立樂聚的時候,都在讀書,我那時候比較大,博一,剩下的都是研一或者本科生,我們10個人成立的。
2021年我博士畢業(yè),學校特聘了教授兼任我們實驗室的副主任,一直就是我跨著產和研兩個部分。其實現(xiàn)在整體看下來,尤其是人形機器人這次的節(jié)奏來看,特別符合總書記前段時間在全國科技工作者說的發(fā)揮企業(yè)創(chuàng)新主導作用,因為人形機器人它是一個集成度特別高的場景或者是產品,一個高校、一個實驗室很難聚集這么多的技術來做這個事情,但是企業(yè)適合于做這種大工程性的工作,并且進行產業(yè)化落地的。
尤其在這個工作中,發(fā)揮企業(yè)和高校兩方的優(yōu)勢,實驗室這邊更擅長于創(chuàng)新性的工作,可以去布局未來1年、3年的工作,但是企業(yè)就會擅長于把最近的一些創(chuàng)新性的工作,盡快的給落地下來,這時候很考驗高校和企業(yè)之間的磨合,我覺得是一個比較有挑戰(zhàn)的工作。
郭彥東:我自己在美國讀博士也好,還是在微軟、小鵬、OPPO,都牽頭了大量的跟學校非常了不起的教授包括院士的合作。從產學研當中,我在企業(yè)做技術管理的時候收獲非常多。
我自己做機器人企業(yè),前面幾位老師也好,創(chuàng)業(yè)的伙伴也說到本身技術非常新,非常需要產學研的加持,我也很開心的看到我們有很多老師堅持做創(chuàng)業(yè),也看到很多創(chuàng)業(yè)者堅持做老師,我覺得這也是一種挺新的模式,去把產學研的一些成果跟企業(yè)更緊密的結合在一起。
有一本書《科學無境的前沿》,雖然是70多年前的一些思考,怎么樣用創(chuàng)新來驅動經濟的發(fā)展,其實產學研或者說科研的研發(fā)有非常典型的紡錐型,對于結果不是那么敏感的,更長期的、更高遠利益的一些投入,我覺得這個其實是真正的源頭。
不管人形機器人創(chuàng)業(yè)有多么的火爆,呼吁不要把這個源頭的重要性忽視掉,我們還是有非常多的硬核科學問題,等著我們的教授們去解決。
第二,我們在做批量的研發(fā)或者系統(tǒng)級的創(chuàng)新時候,在這個時候企業(yè)通常會有一個更成規(guī)?;蛘叱上到y(tǒng)的平臺,這個時候我們怎么去把老師們了不起的單點技術,引進到企業(yè)的創(chuàng)新系統(tǒng)里面去消化,這個其實需要一些年的積累和一些實操的手感,讓老師們覺得他的技術既不浪費時間做大量的工程化,同時也能讓他的技術真正的在產業(yè)當中,不管是對于國家、老師、企業(yè)來說,都是一個多贏的狀態(tài)。
在這個方向上,以技術驅動型的公司發(fā)展也好,經濟的發(fā)展也好,都還是有很多的思考和打磨需要繼續(xù)去做的。
李博陽:我覺得現(xiàn)在高校老師手里面還有很多的好東西,還沒有充分的挖掘出來,有一些項目本身在做的初期,可能并不是專門為人形機器人做的,但是那些技術可以去跟人形機器人做結合。
所以我覺得可以在體制的設計上更加的開放,把高校的科研成果更多的讓企業(yè)接觸得到,我們打造這樣的一個機器人的硬件也好,或者應用場景也好,我們可以到學校里面去選擇覺得適用的,經過再一步的轉化到產品中來的技術。
另外還有人才方面的問題,因為現(xiàn)在我們也接觸了很多的高校,有一些非常優(yōu)秀的博士、碩士到了人形機器人企業(yè)里面來,他很難馬上上手,馬上融入到完全創(chuàng)新的交叉學科的環(huán)境中來。
所以我覺得學校在學校期間,除了老師帶他們做一些項目之外,其實我們企業(yè)也可以提供更多的前沿項目。比如說跟市場、跟產品更緊密結合的,因為我們對市場和產品更敏感,可以把這些東西拿到學校去,從中提煉出科學問題,讓學生們更多的參與進來。我們在招人方面、用人方面也會更容易。
趙同陽:對于產學研這塊我是深有體會,也是非常有體感的,其實在我2016年創(chuàng)業(yè)的時候到2018年期間,我們碰到了很多關于算法的問題,第一個想到的就是學校,尤其在2016年的時候,市面上找不到對于人形非常有研究的。
我記得2018年到2019年年初的時候,我們的本體出來了,但是我們的算法在國內力控算法都還沒有,當時我記得有一個契機是MIT開源,也是學校的力量,但是開源之后國內真正能玩起來的沒有幾個人。
當初我們?yōu)榱税堰@套算法引入國內,讓更多的人去了解,我找到了山東大學的李老師,他們是控制學院的,他們的學生還是比較厲害的。但是他們告訴我可以把算法搞定,但是本題硬件這塊可能需要6個月的時間,這恰恰是我們企業(yè)的一個能力。
我記得用了不到6周的時候,我就把本體給做出來了,聯(lián)合他們的軟件沉淀和積累,把MIT的那套算法在國內復現(xiàn),并且把它分享出來,成為一個開源的項目,所以國內現(xiàn)在很多做力控算法的,在這方面都得益于那套算法。這是以前我非常大的一個體會。
另外在合作過程中,我也發(fā)現(xiàn)一些問題,鐵打的學校,流水的學生,一代一代的沉淀和積累,并不是說非常有系統(tǒng)性的,這會造成人才的斷鏈問題。在過去的3年中,一位關于控制的人才隨著學校的成長足夠多起來,當我在今年重新做人形的時候,我發(fā)現(xiàn)這樣的人才仍然是非常稀缺的,第一個想法仍然是求助于高校。
高校他們關于算法一直處于行業(yè)的前沿,但是他們落地有非常大的難度,尤其很多高校他們在仿真環(huán)境非常棒,但是一落到實物上都一塌糊涂。因此它需要和企業(yè)聯(lián)合起來去解決stem to real,甚至技術到工程落地的gap問題。
另外,關于企業(yè)和高校他們之間利益的問題,很多高校他們需要發(fā)些paper我們可以協(xié)助他們做這個事情。企業(yè)需要有些知識產權還有商業(yè)上的成功,兩方面可以互利互惠。
最后一點是我們的一個教育體系,我發(fā)現(xiàn)很多課程他們提的內容還是比較傳統(tǒng)、比較老的知識。對我們企業(yè)現(xiàn)在所需要的先進算法還有差距,但是課程已經固化了。因此希望高??梢噪S時更新課程,這樣能保證企業(yè)和高校時刻處于行業(yè)前沿這樣會好一些。
張建偉:最后再問一個問題,大家每個人花一分鐘時間簡要回答一下,這個問題是關于未來的預測,什么是人形機器人,在符合倫理的情況下,今天多次提到倫理約束。不能什么樣機器人都做,倫理約束下你們現(xiàn)在的best seller是什么,你們對未來一年三年五年或者2B2C的預測是什么。不需要每個都回答,但是每個人挑一個回答。
甘中學:我覺得第一個問題說得好,我們除了要研究通用人工智能的智能水平,同時現(xiàn)在應該研究機器人智能向善的問題。這個問題不解決時間長了就會造成禍害。第二句話中國現(xiàn)在這么大的人群群體來做人形機器人,我們產業(yè)化的速度肯定比任何其他國家都高。
比如說現(xiàn)在第一年像宇樹科技等等已經開始進行量產,當然范圍可能是在科研領域,或者展覽館。但是逐漸三年會到服務行業(yè),五年可能到工業(yè),我認為完全有可能。
任雷:我不做時間預測,談一下可能落地的先后順序。感覺人形機器人如果最有可能落地,很可能在產線某些特殊崗位,或者特種機器人,比如巡檢、維修這塊。因為它本身場景有的時候相對簡單,它是一種結構化場景,識別起來做起事來相對簡單。我反倒覺得家庭家務、養(yǎng)老護理有可能是最后落地的。因為家里環(huán)境看著可能簡單,實際上是高度非結構化場景,而且在動態(tài)變化。還包括了倫理問題,先不談復雜倫理,單說之前提到的人機物理接觸安全性問題。你這個機器人如果在家里出現(xiàn)任何鼓掌出現(xiàn)任何問題,比如說他要是摔倒的話,都有可能把孩子砸著,像這種情況如果一旦發(fā)生,這個由誰負責?所以像照顧老人照顧孩子包括做家務這件事情很有可能是最后才能落地。
許多:我可能認為大家看到了像星海圖像,銀河通用這種移動+B的可能短期內可以落地,人形可能還要很長很長時間,另外落地結構我認為要看接觸精度。它包含移動精度、定位精度、抓取精度、放置精度、語義精度、反饋精度等等一系列精度,要看綜合場景對所有精度的需要。保證這個場景數據搜集難易程度來解決系統(tǒng)問題??雌饋砭拖窠洺Uf的工業(yè)簡單場景包括物流場景里可能是優(yōu)先落地,包括導覽的展示的對移動相對要求沒有很高,其他的可能還是要花很長時間。因為它和環(huán)境的連續(xù)性接觸精度問題怎么解決,這還是一個科學問題,需要很長時間研究。
程昊:其實我一直覺得人形機器人和當年的微型計算機PC有很多借鑒之處。PC最早能在哪落地,從歷史來看它是給學計算機開發(fā)的,它現(xiàn)在機房落地,無論是學校機房還是公司機房。因為那個時候PC也很弱,和現(xiàn)在比簡直就像一個計算器,很多問題也解決不了。但是大家很多人都認為它是個趨勢所以愿意去學,學了之后才在上面長出系統(tǒng)、長出軟件、長出游戲、長出互聯(lián)網。
所以我覺得人形機器人接下來真能落地且能健康迭代落地可能得找人形機器人的機房是什么,網吧是什么。但是這只是一些思考。
張世璞:如果用一句話來總結的話,我覺得短期內真就是工業(yè)里靈活用工或者某一個單獨的環(huán)節(jié)。長期不知道多長,但是個人意見更看好2B、2C服務領域。
冷曉琨:對于人形機器人,樂聚這邊基本原則是三步走,沿途下蛋。今年一百多臺主要核心還是定位在高校、科研和展廳行業(yè)。這個特點是盡量少地介入到物理環(huán)境中進行展示。但是我認為它這個不屬于正經的人形機器人進入到產業(yè)當中來。
第二個是這半年時間把國內所有的車廠一家不落地都進行走訪,并且選擇兩家簽了協(xié)議開始落地,它來解決的就是工業(yè)生產的最后一公里,非高精度的場景。并且雙方包括聯(lián)合高校已經開始做了,預計明年上半年包括今年年底正式的,已經可以算得過來ROI可以進入投產了,所以給的量的卡點在500臺。如果一個場景中人形機器人包括輪臂機器人,合起來能過500臺產量的話,基本上代表人形機器人可以用到工業(yè)場景中來了,我認為這是明年我們使勁的地方,就是在工業(yè)中應用。
未來三年核心肯定還是工業(yè)為主,進入家庭、進入康養(yǎng)這部分,現(xiàn)在和海爾、中國移動都在合作。但是我認為是3-5年甚至更久的時間段。
郭彥東:說到應用其實智平方是以輪式雙臂,輪式人形的形態(tài),更容易被市場接受,ROI也更容易算得出來。所以輪式雙臂已經一定程度上邁過了to developers的階段,逐步地向真實場景使用。
但是我們也很需要有雙足人形的機器人為更下一代場景落地做些儲備。什么樣的市場是輪式人形,或者輪式雙臂機器人的場景,其實第一個是這個市場非常寬廣。一個市場品類最好的需求是要看非常經典的TPMF問題,什么樣的技術是最大的變量?我們的公司和之前的機器人最大區(qū)別是什么。
對于智平方來講我們最大的區(qū)別是智能的通用化,所以我們要找準的市場是以前一些因為機器人不夠智能或者它的智能不夠通用而沒有辦法提供服務的一些場景。就是我們最先要去服務的一些場景,我想我對于這個場景的不管是市場的體量還是種類,都非常的樂觀。
回到張院士的第一個問題,也正是因為這個市場足夠的寬廣,并且我們并沒有真正意義上實現(xiàn)像人一樣那么強大,不管是聰明的程度還是靈巧的程度,像人一樣那么強的機器人,就導致大家面對的市場會有不同,背后所牽引的技術也會有所不同。
我跟上場對話的嘉賓有一個很類似的觀點,整個機器人的應用會從慢到快,我們仍然在這樣一個慢的階段,我們這個對話也快要結束了,我也呼吁大家給這個賽道一點耐心,非常的寬廣,前景非常的遼闊,但是所有的企業(yè)都還在起步應用階段,也會有非常多的企業(yè)在這個賽道去開花結果。
李博陽:我也認同,最先落地的可能是一些工業(yè)場景和特種場景,但是我認為最先落地的不一定是完全形態(tài)的人形機器人,可能是另外一種形態(tài),比如剛才說到的輪式或者手部不是一個完全五指的狀態(tài),這種場景我覺得在短期之內就可以有很多落地的應用了,而且我覺得這個賬也能算得過來,它真的是可以提高效率或者完成一些實際的工作。
未來我覺得真正需求更大的還是2B2C的服務場景,我們也可以看到很多產品在剛出來的時候,其實它是生產力工具,比如說電腦、手機、汽車,最開始完成的都是工作相關的內容,但真正迎來市場爆發(fā),迎來最大量消費的還是滿足了我們更多生活上的需要,滿足了我們時間、消耗、娛樂的甚至是情緒價值的需要,所以未來真正能夠迎來機器人大爆發(fā)的階段應該是2C端的應用,特別是服務場景或者是生活娛樂場景。
趙同陽:雖然說我們的未來星辰大海,我們機器人的話,我們的想法是進入千家萬戶和進入每一個工廠,去替代人類做一些繁瑣簡單但是又比較勞累的一些事情,它不是跟人搶活、搶工作的,但是這個過程是一個比較長遠的過程,至少我認為以目前的技術,3到5年內不可能大規(guī)模的進入工廠和進入家庭,這點應該在座各位都有相同感受。
但是在中間會有一些產品,它既然是為人類服務,如果能為學生服務,就剛才說了人才方面稀缺,快速給全球高校帶來人形機器人的人才、技術和價值。
接下來關于工業(yè)和家庭使用,路很長,先進去再改善,才能進行用戶反饋,才能進行下一步的改進,我認為還需要3年的時間。
張建偉:我們還節(jié)省了7分鐘,這個話題非常大,我們希望在今后多多交流,到明年的世界機器人大會,希望大家有新的成果。
今天這場對話是ChatGPT絕對做不出來的,我想各位也都并發(fā)出來非常多新的主意,激發(fā)出來非常多對未來的向往。我一直說人形機器人對人類來講是最后一個夢,把我們自己復制出來,然后理解我們的認知、行為、交互,另一方面有巨大的應用場景,目標設的非常高,只有協(xié)同合作、長期支持才能把這個賽道可持續(xù)的做下去,風景無限,謝謝大家的分享。
(本文根據錄音整理)
掃描二維碼關注
中國電子學會公眾號
掃描二維碼加入
中國電子學會會員
鐘山縣開展“惠民興縣”科技志愿服務活動——科技實驗秀進校園
中國電子學會總部政策研究與國際合作處黨支部赴中國機械工程學會開展主題黨日活動
第四屆智能人機交互技術年會圓滿落幕
中國電子學會召開2024年統(tǒng)戰(zhàn)工作座談會
2024年全國導航技術與應用大會在京盛大召開
相約廣西綠城 2024世界機器人大賽南寧錦標賽開幕!
“科創(chuàng)中國”新質生產力賦能電子智造論壇(寧波)成功舉辦
中國電子學會網絡空間安全專家委員會走進山東大學暨第40期中國電子學會青年人才托舉沙龍成功舉辦