辦公系統(tǒng)
個(gè)人會(huì)員
單位會(huì)員
首頁 新聞中心 新聞資訊 正文

【W(wǎng)RC大咖論道】對(duì)話—為人形機(jī)器人發(fā)展提供新“動(dòng)力”

2024-11-22

2024世界機(jī)器人大會(huì)以“共育新質(zhì)生產(chǎn)力 共享智能新未來”為主題,為期三天的主論壇和26場(chǎng)專題論壇上,416位國(guó)內(nèi)外頂尖科學(xué)家、國(guó)際組織代表、院士和企業(yè)家聚焦前沿技術(shù)、產(chǎn)業(yè)動(dòng)向和創(chuàng)新成果,深入研討人工智能與機(jī)器人技術(shù)深度融合帶來的新趨勢(shì)、新機(jī)遇,共同打造了一場(chǎng)十分精彩的機(jī)器人領(lǐng)域前沿觀點(diǎn)盛宴!

在8月24日下午的主論壇上展開了一場(chǎng)以“為人形機(jī)器人發(fā)展提供新動(dòng)力”為主題的對(duì)話,對(duì)話由德國(guó)慕尼黑工業(yè)大學(xué)教授Alois C. Knoll主持,波士頓動(dòng)力人工智能研究所執(zhí)行主任,波士頓動(dòng)力公司創(chuàng)始人Marc Raibert,北京具身智能機(jī)器人創(chuàng)新中心總經(jīng)理熊友軍,北京星動(dòng)紀(jì)元科技有限公司創(chuàng)始人,清華大學(xué)交叉信息研究院助理教授陳建宇,宇樹科技創(chuàng)始人、首席執(zhí)行官兼首席技術(shù)官王興興,北京大學(xué)前沿計(jì)算研究中心助理教授、北大銀河通用具身智能聯(lián)合實(shí)驗(yàn)室主任王鶴參與對(duì)話。


數(shù)說2024世界機(jī)器人大會(huì)


論壇


26 家國(guó)際支持機(jī)構(gòu)

3 大主題 26 場(chǎng)專題論壇

416 名國(guó)內(nèi)外頂尖科學(xué)家、國(guó)際組織代表、院士和企業(yè)家

74 位國(guó)外嘉賓及港澳臺(tái)嘉賓參會(huì)

線上線下聽眾達(dá) 160萬 人次


展覽


27 款人形機(jī)器人集中亮相

首發(fā)新品 60 余款

近 170 家參展企業(yè) 600 余件參展產(chǎn)品

參觀人數(shù)近 25萬 人次


大賽


全球 10 余個(gè)國(guó)家和地區(qū)的 7000 余支賽隊(duì)

 13000 余名參賽選手

每天參賽人數(shù) 4000 余人



媒體關(guān)注


近 400 家國(guó)內(nèi)外媒體

短視頻平臺(tái)話題播放量達(dá) 2.9億


1732758463196676.jpg

對(duì)話—為人形機(jī)器人發(fā)展提供新“動(dòng)力”


以下是對(duì)話內(nèi)容實(shí)錄 

Alois C. Knoll:歡迎各位,大家下午好!剛才我們聽到了幾位嘉賓非常精彩的演講,我們現(xiàn)在已經(jīng)有點(diǎn)推遲了,但是我們會(huì)花一點(diǎn)時(shí)間在接下來的對(duì)話上面,因?yàn)檫@是大家都非常期待的。

我作為主持人,希望做一個(gè)簡(jiǎn)短的介紹,在人形機(jī)器人方面已經(jīng)有了很長(zhǎng)的發(fā)展歷史,為不太了解這段歷史的觀眾做一下介紹。大家可能不知道人類創(chuàng)造的第一臺(tái)機(jī)器人就是人形機(jī)器人,是1920年一位捷克的作家寫了一部科幻劇,它在1921年進(jìn)行了全球的首演,這是100多年前的事情了,這部科幻劇就是首次在英語和整個(gè)科幻小說界引入機(jī)器人Robot這個(gè)詞,即便那個(gè)時(shí)候我們已經(jīng)在思考機(jī)器人統(tǒng)治人類的一個(gè)想象,所以從最開始機(jī)器人就有著非常負(fù)面的意義,所以我們當(dāng)年創(chuàng)作的第一部科幻劇當(dāng)中,就說機(jī)器人會(huì)征服人類。

您可以在右邊看到這是當(dāng)時(shí)在舞臺(tái)上演出時(shí)候使用的機(jī)器人,它實(shí)際上是1939年為世界博覽會(huì)創(chuàng)造的機(jī)器人,叫做Electro,它能夠行走,能通過語音指令來執(zhí)行任務(wù),能抽煙,能做其它有趣的事情,它能說大概700個(gè)單詞,甚至它的眼睛通過光電的程序可以區(qū)分紅光和綠光。此外Electro有一個(gè)機(jī)器狗叫做Sparkle,這是差不多80年前的事情了,所以太陽底下無新事。

這是我個(gè)人認(rèn)為的一些重要的歷史時(shí)間點(diǎn),1973年實(shí)際上是微處理器發(fā)明之后不久,全尺寸人形機(jī)器人Robot1被創(chuàng)造出來了,它來自日本早稻田大學(xué)。后面我們又發(fā)布了Robot2,這款機(jī)器人可以閱讀樂譜,并且彈奏電子鍵盤,它的頭部有攝像頭,已經(jīng)具備5根手指的機(jī)械手了,這是在1980年,44年之前了。

然后我們進(jìn)入了第二個(gè)時(shí)代,就是會(huì)行走的人形機(jī)器人,這里有很多實(shí)驗(yàn)室,有一家日本的公司,他在1984年就創(chuàng)造了能夠行走的人形機(jī)器人,本田其實(shí)也做了一些機(jī)器人,他在2005年也做了第二個(gè)機(jī)器人的項(xiàng)目,很不幸的是本田把這個(gè)項(xiàng)目砍掉了,就像Marc剛才說的,你要是想掙大錢,特別是在那個(gè)時(shí)候,機(jī)器人這個(gè)賽道,尤其是人形機(jī)器人并不是你最佳的選擇,但是在未來我們期待它會(huì)有變化的。

第一波的研究是從1980年到2005年,主要關(guān)注于行走。第二波大概1985年到2010年,除了步行之外還有全身的運(yùn)動(dòng),在右邊可以看到它當(dāng)時(shí)在玩一個(gè)桌面游戲,另外這個(gè)機(jī)器人也是來自早稻田大學(xué),也是差不多20年前的事情了。

自我來推介一下,2000年的時(shí)候我就開始來參加人形機(jī)器人方面的一系列會(huì)議,2000年的時(shí)候我們出現(xiàn)了HRPR核森,國(guó)際電氣電子工程協(xié)會(huì)就創(chuàng)造了機(jī)器人和自動(dòng)化協(xié)會(huì),我當(dāng)時(shí)就開始做參會(huì)。這些年我們不斷發(fā)展,最近這期是2024年在法國(guó)會(huì)舉辦。如果大家感興趣可以去我們網(wǎng)站查看,它可以看到最新的信息,大家可以借此探索一下人形機(jī)器人的歷史。

剛才我們看到了各位嘉賓給大家看到的非常精彩的機(jī)器人視頻,大家自有判斷。但是像剛才王先生說的一樣,現(xiàn)在已經(jīng)進(jìn)入新的時(shí)代,我們發(fā)展可能是指數(shù)級(jí)爆炸性的增長(zhǎng)。這就是我作為主持人簡(jiǎn)單的介紹,現(xiàn)在進(jìn)入討論和問答環(huán)節(jié)。我想問一下討論嘉賓,請(qǐng)每位嘉賓簡(jiǎn)短地向我和聽眾們介紹一下您和人形機(jī)器人的聯(lián)系。為什么對(duì)機(jī)器人感興趣,何時(shí)對(duì)機(jī)器人干興趣。

我先來介紹,我一般是作為討論嘉賓,但是今天擔(dān)任主持人也給大家說一下。我來自慕尼黑工業(yè)大學(xué),2001年開始就在計(jì)算機(jī)科學(xué)領(lǐng)域工作。我對(duì)于人形機(jī)器人一直都非常感興趣,我認(rèn)為它對(duì)智能具身來說非常重要。慕尼黑工業(yè)大學(xué)之前有一位先驅(qū)已經(jīng)退休了,他和我當(dāng)時(shí)就在研究具身智能。我們認(rèn)為人形機(jī)器人最好發(fā)展就是以人形來設(shè)計(jì)機(jī)器人,它會(huì)和世界和自然建立緊密聯(lián)系。機(jī)器人的身體應(yīng)該和人的身體有同樣的設(shè)計(jì)和科學(xué),否則機(jī)器人要發(fā)展很困難。所以大家可以看到這里有一系列機(jī)器人圖片,左下角是可以在手里滾球。

下面到marc這邊,能不能再多分享一下。剛才已經(jīng)說到您和人形機(jī)器人聯(lián)系,從何時(shí)您開始對(duì)人形機(jī)器人感興趣?


Marc Raibert:我認(rèn)為您剛才展示的圖片,對(duì)我這個(gè)問題的回答非常有幫助。如果說人形就意味著直立行走,兩臂兩腿還有頭,那我直到最近才開始感興趣。因?yàn)槲乙恢闭J(rèn)為作為一個(gè)公司來說功能最重要。包括靈活性、感知、智能,形式和外觀是次要的。另一方面對(duì)于人的精氣神來說它的動(dòng)能像生命一樣像人一樣。我一直是人形機(jī)器人的文思,雖然我們第一個(gè)做的只是向人形機(jī)器人漸進(jìn)的過程,但是我認(rèn)為核心就像做的蹦跳機(jī)器人一樣。我們剛開始做也是這樣的概念,它要像人一樣,有時(shí)候還要有一個(gè)腦袋直立行走。

它不是只關(guān)于工程和科學(xué),而是公眾們對(duì)此非常感興趣,特別熱情。我們當(dāng)時(shí)做的大狗沒有像后來做的人形機(jī)器人那樣獲得公眾如此熱烈的反應(yīng)。


Alois C. Knoll:非常感謝,下一位熊友軍博士,您能不能分享一下您自己的觀點(diǎn)。


熊友軍:我讀博士的時(shí)候2000年開始做人形機(jī)器人研發(fā),那時(shí)候更多是做工業(yè)領(lǐng)域,特種領(lǐng)域的機(jī)器人,用在一些危險(xiǎn)的環(huán)境里。因?yàn)槟菚r(shí)候機(jī)器人技術(shù)還是非常非常不成熟,但是在很多特種領(lǐng)域,尤其是微型場(chǎng)景有很多是需要機(jī)器人完成工作,但是那時(shí)候機(jī)器智能很差。所以我們當(dāng)時(shí)想的辦法是將機(jī)器人智能和人的智能結(jié)合起來,所以做了些激情搖操作的事情。但是搖操作完成工作過程中,發(fā)現(xiàn)很多場(chǎng)景用工業(yè)機(jī)械手臂,用人式機(jī)械臂解決不了,尤其是有時(shí)候在特種場(chǎng)景環(huán)境比較狹小,比較復(fù)雜。輪式、履帶式根本進(jìn)不去,但是人式可以進(jìn)去。

還有一種是需要很多工具去完成工作,當(dāng)時(shí)用機(jī)械手臂或者其他機(jī)器人時(shí)也很難完成,所以當(dāng)時(shí)我們就說如果那個(gè)時(shí)候有人形機(jī)器人,應(yīng)該是很好的解決工具或者解決方案。但是當(dāng)時(shí)也看到日本本田的P1、P2時(shí)代給我們提供了很多啟發(fā)。所以那個(gè)時(shí)候我對(duì)人形機(jī)器人就非常感興趣,后來畢業(yè)一直在這個(gè)領(lǐng)域做機(jī)器人相關(guān)工作。上海2012年我和周劍一起創(chuàng)建了現(xiàn)在的優(yōu)必選。所以后面一直在做人形機(jī)器人和機(jī)器人研發(fā)工作。

去年從深圳到北京籌建北京具身智能機(jī)器人創(chuàng)新中心,現(xiàn)在也是一直在聚焦人形機(jī)器人方面的研發(fā),主要想法是希望能夠解決人形機(jī)器人方面共性的關(guān)鍵技術(shù)。比如說本體技術(shù)研發(fā)不足,實(shí)際上我們現(xiàn)在人形機(jī)器人本體在關(guān)鍵核心器件,傳感器上有非常多要攻克的地方。

另外,在運(yùn)動(dòng)控制,實(shí)際上我們也做了非常多的運(yùn)動(dòng)控制技術(shù)研發(fā)。包括原來基于MPC或者WBC的model based的運(yùn)動(dòng)控制研發(fā)轉(zhuǎn)向,采用深度學(xué)習(xí)強(qiáng)化學(xué)習(xí)的運(yùn)動(dòng)控制方式?,F(xiàn)在也用神經(jīng)網(wǎng)絡(luò)的一些方式去做運(yùn)動(dòng)控制,同時(shí)現(xiàn)在還在做關(guān)于智能方面的研發(fā)。比如說用具深智能的方式,剛才講了我們要建具身智能一些基礎(chǔ)的工作。比如說建數(shù)據(jù)集研發(fā)具身智能模型框架等等,這就是我現(xiàn)在做的事情。


Alois C. Knoll:非常感謝,我們之后再展開這個(gè)話題。下一位有請(qǐng)陳建宇博士,您為什么對(duì)人形機(jī)器人產(chǎn)生了興趣?


陳建宇:其實(shí)興趣是很小的時(shí)候一直對(duì)機(jī)器人或者智能機(jī)器人感興趣。剛才興興說他是10歲的時(shí)候,我估計(jì)也是差不多類似的時(shí)候。當(dāng)時(shí)關(guān)注的是阿西莫系列機(jī)器人,我當(dāng)時(shí)就非常著迷。創(chuàng)業(yè)的事情其實(shí)充滿了挑戰(zhàn)性,像marc創(chuàng)辦了波士頓動(dòng)力做了四十多年,我是非常尊敬的。你沒有一個(gè)發(fā)自內(nèi)心的天生熱愛的話,很難堅(jiān)持下來。所以對(duì)我來說,對(duì)機(jī)器人的熱愛某種程度上是從小就有。真正開始做是本科的時(shí)候,當(dāng)時(shí)在學(xué)校里真正意義上接觸機(jī)器人研究,當(dāng)時(shí)接觸了雙足機(jī)器人,主要做步態(tài)規(guī)劃相關(guān)研究。

博士階段繼續(xù)做機(jī)器人,雖然不是人形機(jī)器人,但是也是相關(guān)機(jī)器人領(lǐng)域控制、學(xué)習(xí)包括無人車和機(jī)械臂。真正全力做人形機(jī)器人是在回國(guó)之后,在清華這邊遇到一個(gè)project真實(shí)投入去做,后來也孵化了星動(dòng)紀(jì)元公司。圖上是最新一代的第六代機(jī)器人,展會(huì)也帶來了實(shí)物,歡迎大家關(guān)注。


Alois C. Knoll:非常感謝下一位請(qǐng)王興興先生。


王興興:大家好,剛才提到我十歲時(shí)就看過Marc Raibert先生在MIT實(shí)驗(yàn)室做的雙足還有單腿雙足機(jī)器人,印象非常深。2009、2010年大一寒假做過小的人形機(jī)器人,當(dāng)時(shí)做得不是特別滿意。后來研究生期間做了Xdog這款機(jī)器人,差不多2013-2015、2016年。這款機(jī)器人采用了比較低成本的硬件,運(yùn)動(dòng)性能非常好,可以直接實(shí)現(xiàn)關(guān)節(jié)力控以及整機(jī)的力控。

后來剛才有提到,本身一開始我對(duì)人形機(jī)器人技術(shù)相對(duì)來說比較悲觀,但是后來在2022年左右,整個(gè)機(jī)器人AI技術(shù)進(jìn)步,再加上ChatGPT出來以后大家都看到了人形機(jī)器人和AI結(jié)合可能性,所以我們公司重新開始做高性能人形機(jī)器人。

其實(shí)說實(shí)在的我真正感興趣的并不是人形機(jī)器人,而是新的智能體是什么形態(tài)。人形機(jī)器人只是目前大家比較公認(rèn)的最有可能性的通用機(jī)器人和通用AI的結(jié)合體。但是這可能并不是唯一的,我真正希望的還是真正能誕生一個(gè)甚至比人更高級(jí)的智能體形態(tài),可以大大推動(dòng)整個(gè)人類工業(yè)變革,推動(dòng)新的工業(yè)革命,謝謝大家。


Alois C. Knoll:非常感謝,下一位嘉賓是王鶴。


王鶴:大家好,我是北京大學(xué)計(jì)算機(jī)學(xué)院助理教授,也是北大銀河通用具身智能聯(lián)合實(shí)驗(yàn)室的主任王鶴。我和人形機(jī)器人和具身智能結(jié)緣主要是從我在斯坦福大學(xué)讀博的時(shí)候。2016年當(dāng)時(shí)深度學(xué)習(xí)技術(shù)已經(jīng)出來了,也應(yīng)用在了很多圖像識(shí)別、分類這些任務(wù)當(dāng)中。當(dāng)時(shí)作為前沿研究,我們?cè)噲D理解人類是如何把感知、思考、交互的能力融合在一起。

所以,博士期間第一個(gè)工作當(dāng)時(shí)用一個(gè)視覺模型來看桌面上人的動(dòng)作和物體的運(yùn)動(dòng)。推理人下一步想要什么,這是一個(gè)語言模型。最后再用簡(jiǎn)單的機(jī)器人,智能的馬克杯去響應(yīng)人的動(dòng)作。這個(gè)工作,獲得了歐洲圖形學(xué)最佳論文提名,但是我們認(rèn)為它非常不足。一個(gè)馬克杯只能在桌面上移動(dòng),響應(yīng)人的動(dòng)作,它沒有和人交互的能力。

我們的視覺只能看有限的幾種物體,語言模型只能根據(jù)人和這些桌面東西的一些動(dòng)作來做簡(jiǎn)單的推理。通過過去八年的研究,怎么樣把機(jī)器人操作能力搞得更泛化,什么東西都能抓,都能夠放置,還有和現(xiàn)在的多模態(tài)大模型技術(shù)結(jié)合,真的明白人類想讓你干什么,言出法隨地執(zhí)行。所以去年我們就孵化了北京銀河通用這家人形機(jī)器人公司。現(xiàn)在也是把視覺、語言、動(dòng)作三種不同的模態(tài)融合到大模型當(dāng)中,真正賦能人形機(jī)器人,這是我們的愿景,讓人形機(jī)器人能夠走進(jìn)千行百業(yè),千家萬戶。


Alois C. Knoll:非常感謝,我想給大家一點(diǎn)點(diǎn)引導(dǎo)。我們只有35分鐘了,大家要注意時(shí)間,我們先從Marc開始,請(qǐng)各位兩分鐘內(nèi)回答各自的問題,您認(rèn)為我們今天擁有的哪些重要技術(shù)是十年前沒有的,但是對(duì)于實(shí)用化人形機(jī)器人來說是至關(guān)重要的嗎,未來5年,你覺得它將會(huì)如何發(fā)展?時(shí)間限制在兩分鐘內(nèi)。


Marc Raibert:我認(rèn)為硬件的發(fā)展會(huì)繼續(xù)有重要性,未來5年毫無疑問。它的基礎(chǔ)模型和其它AI可以將語義理解的障礙移除,這是有最大影響的因素,人類可以做的事情就是通用化,并且明白他們看的東西的意義,我認(rèn)為這是AI還不能做的。如果AI真的能做到這一點(diǎn),那影響很大。

另外現(xiàn)在大家都有長(zhǎng)足的進(jìn)步,在過去的十年,計(jì)算機(jī)、傳感器、感知、電池和控制,很多時(shí)候人們會(huì)忘記電池,尤其在工業(yè)方面,你不要忘記它的重要性,以及電機(jī),在過去的5年我認(rèn)為電機(jī)的發(fā)展非常巨大,我們會(huì)看到更多這方面的發(fā)展,包括電車以及消費(fèi)電子這方面。


陳建宇:如果按照十年前的話,其實(shí)是2014年左右,當(dāng)時(shí)是DeepLearning剛剛出來不久,它其實(shí)解決了一部分圖像處理問題。后面我認(rèn)為有兩個(gè)重要的里程碑:

一個(gè)是以2016年AlphaGo為代表的深度強(qiáng)化學(xué)習(xí),不是強(qiáng)化學(xué)習(xí),強(qiáng)化學(xué)習(xí)有非常長(zhǎng)的歷史了,深度學(xué)習(xí)出來之后,緊接著把它用在了強(qiáng)化學(xué)習(xí)上面,做深度強(qiáng)化學(xué)習(xí)。

第二個(gè)以ChatGPT為代表的大語言模型。

這兩個(gè)我認(rèn)為是過去十年沒有的,但是又對(duì)未來人形機(jī)器人或者具身智能的發(fā)展起非常大的決定性作用。

在接下來的這幾年時(shí)間,這兩項(xiàng)技術(shù)會(huì)非常深度的跟人形機(jī)器人、具身智能去融合起來,但它們也分別需要經(jīng)過一定程度的skill,我們的強(qiáng)化學(xué)習(xí)也需要去skill到能訓(xùn)練比較通用的模型,我們的大語言模型為代表的foundation model也需要去skill到能夠解決更加豐富的物理世界的數(shù)據(jù)。

我相信在接下來的5年,這幾項(xiàng)技術(shù)都能取得非常大的進(jìn)展,我們可能會(huì)在5年內(nèi)迎來機(jī)器人的ChatGPT時(shí)刻。


王興興:最大的還是AI技術(shù)帶來的大家對(duì)AI能做的事情有更多信心了,除了AI技術(shù)本身,最大的點(diǎn)對(duì)于人形機(jī)器人包括對(duì)AI,整個(gè)社會(huì)共識(shí)的增加也是非常關(guān)鍵的,目前大家更加相信AI,更加相信人形機(jī)器人可以誕生更多的價(jià)值,這在十年前是完全不能想象的,當(dāng)時(shí)整個(gè)社會(huì)對(duì)這個(gè)都基本上完全沒有信心。

另外一點(diǎn),我覺得在未來5年,總體上AI模型的變化會(huì)非???,因?yàn)槟壳暗腁I真的是日新月異,大家可以用AI底層技術(shù)去搭建各種自己的模型,去做訓(xùn)練,整個(gè)已經(jīng)變成了非常的扁平化以及容易操作的過程,其實(shí)大家都可以參與進(jìn)來,去做機(jī)器人模型并且去做訓(xùn)練,所以我覺得未來5年,這塊各種AI模型的創(chuàng)新,包括更新的一些神經(jīng)網(wǎng)絡(luò)模型都有很大的機(jī)會(huì)。


王鶴:2014年(10年前)那個(gè)時(shí)候人形機(jī)器人甚至不是一個(gè)在西方的學(xué)術(shù)界比較受歡迎的詞匯,過去的十年我覺得一大技術(shù)的進(jìn)展就是我們?cè)诰呱碇悄芾镱^已經(jīng)有一些技能實(shí)現(xiàn)了非常強(qiáng)的泛化性。

以我個(gè)人的研究舉例,在抓取的問題上,我們?nèi)〉昧吮容^長(zhǎng)足的進(jìn)步,我們從智能抓方塊,圓的這些特定形狀的物體,到基于三維視覺傳感器,我們可以抓不透明、不反光,也就是在深度傳感器里頭能完美成像的這些物體,到我們最近的技術(shù)能夠預(yù)測(cè)透明、高反光、金屬吸光這些非常有挑戰(zhàn)材質(zhì)的物體的深度,基于它去做泛化的抓取。

我們現(xiàn)在已經(jīng)能把抓取這件事情做的相當(dāng)好了,在今天的展廳我們都接受觀眾給我們的各種形狀、各種材質(zhì),隨便堆疊亂七八糟的物體,我們的機(jī)器人展示了非常泛化和高成功率的抓取能力。

現(xiàn)在的問題是像這樣的每一個(gè)技能,大家都在分別去做開發(fā),很多人會(huì)提問,你能幫我抓這個(gè)水瓶,你能不能幫我把瓶蓋擰開,我非常不好意思的說,現(xiàn)在泛化的開瓶蓋技能,我們還沒有訓(xùn)練出來,這就是大模型能夠帶給我們的機(jī)會(huì)。

語言大模型里的涌現(xiàn),它能夠在只見一次或者是0次演示的情況下,它都理解你要生成什么樣的文字,我們相信未來的5年給我們的機(jī)會(huì)就是發(fā)展機(jī)器人的基礎(chǔ)大模型,能夠?qū)崿F(xiàn)涌現(xiàn)能力,它吞吐了足夠大量的數(shù)據(jù)以后,以靈巧手為例,它能夠抓,能夠夾,能夠擰、掰,各種基本的手的各種運(yùn)動(dòng)能力都有了以后,它能涌現(xiàn),我們給它看一個(gè)視頻,它就能理解這個(gè)活怎么干,到那個(gè)時(shí)候我們真正的就有一個(gè)通用的至少做操作任務(wù)的機(jī)器人了,這是我認(rèn)為未來5年的一個(gè)機(jī)會(huì)。


熊友軍:我覺得這一輪技術(shù)的進(jìn)步主要是由AI來驅(qū)動(dòng)的,毫無疑問。

AI驅(qū)動(dòng)體現(xiàn)在各方面:

第一,人機(jī)交互的性能得到極大的提升。我記得十年前我們做人工智能、做機(jī)械手的那些交互,如果說我要加語音、加視覺,首先成本非常高,其次我們要做大量的研發(fā)工作,我們需要幾個(gè)博士碩士帶著一個(gè)團(tuán)隊(duì),花很長(zhǎng)的時(shí)間才能完成一些物體的識(shí)別、語音的合成、自然語言理解的工作,甚至包括導(dǎo)航。

但是現(xiàn)在隨著技術(shù)的進(jìn)步,我們現(xiàn)在做大模型,把指令給它,很快它就可以有比較好的行為輸出,有很好意圖的理解,有做任務(wù)的規(guī)劃等等。我覺得這對(duì)人機(jī)交互、對(duì)用戶的規(guī)劃、對(duì)執(zhí)行都有巨大的提升,在十年前這些很難去想象。

第二,硬件方面也有極大的提升。體現(xiàn)在兩個(gè)方向,首先是關(guān)節(jié)性能的提升是非??斓模蠹铱梢钥吹胶芏喙镜臋C(jī)器人開始去做一些非常動(dòng)態(tài)的劇烈的運(yùn)動(dòng),實(shí)際上這離不開關(guān)節(jié)性能的提升、高的能量密度比、高的性能等技術(shù)的提升,實(shí)際上在十年前我覺得是很難去做到的,當(dāng)然這也有運(yùn)動(dòng)控制能力的提升,當(dāng)然也有電機(jī)的提升,現(xiàn)在其實(shí)要采用更多結(jié)構(gòu)設(shè)計(jì)的方式,布局都有非常大的進(jìn)步,包括轉(zhuǎn)成慣量,把電機(jī)往上提等等,有各種各樣結(jié)構(gòu)設(shè)計(jì)技術(shù)的變化。

另外剛才還提到能量,十年前我們做機(jī)器人的時(shí)候,一個(gè)電池就像我們背后要背一個(gè)非常巨大的電池包、能源包,而且能夠持續(xù)的時(shí)間很短,但是這幾年隨著新能源汽車對(duì)電池技術(shù)的推動(dòng)作用,其實(shí)我們看到電池的能量密度大幅提升,現(xiàn)在一個(gè)比較小的電池可以支持比較長(zhǎng)的時(shí)間,我覺得這是一個(gè)非常重大的技術(shù)突破。

未來5年之后這幾個(gè)方向可能還是一個(gè)重大的要突破的方向,像剛才說的在人機(jī)交互方面我們希望大模型能給我們提供更長(zhǎng)程的任務(wù)規(guī)劃,做地圖的理解等方面,我們?nèi)酥灰o它一個(gè)非常模糊的指令,它就可以給我們輸出很自然的交互結(jié)果。

規(guī)劃實(shí)時(shí)任務(wù)也是一個(gè)非常重大要攻克的方向,我們的環(huán)境會(huì)經(jīng)常變,我們面對(duì)的是一個(gè)動(dòng)態(tài)的環(huán)境,希望機(jī)器人能夠根據(jù)環(huán)境的變化實(shí)時(shí)去改變它執(zhí)行的策略,當(dāng)然像能量這方面我覺得是持續(xù)要提升的,畢竟現(xiàn)在能量執(zhí)行效率和我們?nèi)讼啾冗€是有非常大的差距。

我要說的就這么多,謝謝!


Alois C. Knoll:非常感謝,我剛才記了很多筆記,我也覺得很有趣,沒有人提到網(wǎng)絡(luò)這個(gè)詞,哪一位想要就此再多說幾句。剛才各位嘉賓也說到了像現(xiàn)在的人形機(jī)器人也得益于很多技術(shù)的融合,也可能有一天它也可以幫助這些技術(shù)獲得快速的發(fā)展,如果我們現(xiàn)在業(yè)界有人形機(jī)器人得到大規(guī)模部署,可以反過來助推其它技術(shù)的發(fā)展。

我們看到機(jī)器人可以站,可以行走、可以跳躍等等,但是我不太確定它對(duì)大眾是否有很多的用途,Marc做的機(jī)器人是工業(yè)機(jī)器人,用在廠房里面,所以如果想要人形機(jī)器人大規(guī)模部署,它們需要以高魯棒性執(zhí)行的任務(wù)是什么,這樣才能被業(yè)界或者公眾接受,或者大家愿意花錢去買這些人形機(jī)器人,請(qǐng)大家分享一下。


Marc Raibert:我其實(shí)不在乎這件事。


Alois C. Knoll:對(duì)的,Marc是個(gè)研究者,他是學(xué)者,他不在乎。


Marc Raibert:我覺得在夢(mèng)想當(dāng)中,其實(shí)就好像是爬喜馬拉雅山、珠穆朗瑪峰一樣,這是個(gè)挑戰(zhàn),不斷的會(huì)激勵(lì)你前行,會(huì)讓你努力做的更好,讓機(jī)器人做的更好,對(duì)我來說就是爬喜馬拉雅山,我就是這么想的。


Alois C. Knoll:那我們展望一下未來,您剛才說你如果想要靠機(jī)器人掙錢的話,實(shí)際上不會(huì)進(jìn)入這個(gè)賽道了,但是其他人也需要在這個(gè)行業(yè)當(dāng)中養(yǎng)家糊口,所以你覺得人形機(jī)器人要大規(guī)模部署,需要執(zhí)行什么任務(wù)呢?


Marc Raibert:我認(rèn)為要有長(zhǎng)遠(yuǎn)的眼光,要得到真正的進(jìn)步,我們應(yīng)該暫停個(gè)人的一些夢(mèng)想,而是讓機(jī)器人整體變得更加可靠。比如說我們?cè)诩又萦凶詣?dòng)駕駛的汽車,它當(dāng)時(shí)在事故當(dāng)中造成了一個(gè)人死亡,它甚至可能都不是自家系統(tǒng)的問題,但是現(xiàn)在整個(gè)地區(qū)就禁止了自動(dòng)駕駛汽車。

我覺得這種問題很容易發(fā)生在機(jī)器人身上,所以系統(tǒng)的可靠性是重中之重,我們不希望大家投入了大量資源和精力的這些項(xiàng)目,未來反而對(duì)人類造成更多的問題,我們希望它可以造福子孫后代,我的話就是我心里想要說的表達(dá)的意思,不理解什么叫做真正有用,但是我認(rèn)為可靠性、安全性是非常重要的。


Alois C. Knoll:確實(shí),我們?cè)谧渌灿幸恍I(yè)界的專家,看看其他兩位中國(guó)嘉賓。


陳建宇:要做到大規(guī)模應(yīng)用的話,有非常重要的兩個(gè)事情。

第一,能不能找到大規(guī)模的需求。

第二,我們的技術(shù)能不能去滿足這個(gè)需求。

要真正達(dá)到大規(guī)模應(yīng)用,現(xiàn)在其實(shí)有很多零散的需求,一些表演等等,但如果你真的非常大規(guī)模的話,我覺得主要還是看勞動(dòng)力非常密集的一些產(chǎn)業(yè),非常大面的劃分是三個(gè)階段:工業(yè)、商用、服務(wù),大體我認(rèn)為技術(shù)也基本上是按照這樣一個(gè)方向去成熟。

我的感受,我認(rèn)為工業(yè)可能會(huì)比較快就能夠用上,其實(shí)剛才Marc已經(jīng)展現(xiàn)出來了,不管是人形還是輪式機(jī)器人在工廠搬運(yùn)的這類環(huán)境里面,已經(jīng)是達(dá)到了非常接近人類的節(jié)拍,在未來它可能會(huì)更快、更強(qiáng)大以及成本更低。達(dá)到這個(gè)時(shí)候的話,其實(shí)它的第一個(gè)大規(guī)模應(yīng)用的點(diǎn)就到了。


王鶴:我覺得具身智能的今天自然不能講完全成熟,但是我們今天有的能力搭配上人形,其實(shí)已經(jīng)能夠在很多場(chǎng)合干事情了,像我們今天在展臺(tái)展示了一個(gè)零售的場(chǎng)景,用戶可以下單,我們的機(jī)器人可以根據(jù)你具體下單的內(nèi)容,是拿一個(gè)冰紅茶還是拿一個(gè)巧克力,我們從貨架把它取下來,同時(shí)我們也可以從地面的籃子里頭把這些貨不斷的上到貨架上,我們也可以從更大的倉儲(chǔ)料架上抱著一箱東西放到傳送帶上。

這些場(chǎng)景其實(shí)都展示了目前具身智能對(duì)于比較糙的活就是抓取、放置和雙手抱持,這樣的能力已經(jīng)走向成熟。在這種情況下,我們還要問一個(gè)問題,為什么是人形,有很多人現(xiàn)場(chǎng)問我,你們?yōu)槭裁匆龀扇诵?,如果貨架上的一個(gè)商品掉在地上了,我的這個(gè)機(jī)器人得有能力去撿地面這么低的東西,我的貨架可能兩米到,我要能夠抓到兩米那么高的東西,同時(shí)我還得來回走動(dòng),還要得有兩只手才能抱住一個(gè)箱子,又有兩只手又能高又能低,又能夠來回走,它基本上就把形態(tài)往人非常的靠攏了。我們目前用的是一個(gè)輪式底盤,沒有腿,也已經(jīng)達(dá)到這樣的能力了。

我們認(rèn)為像這樣的抓取、放置、搬運(yùn)的能力,在很多行業(yè),比如說零售、工廠、服務(wù)的場(chǎng)景全都可以用起來,所以我判斷人形的大規(guī)模應(yīng)用,2025年、2026年將從百臺(tái)級(jí)到千臺(tái)級(jí)快速的增長(zhǎng)。


王興興:我個(gè)人對(duì)目前整個(gè)人形機(jī)器應(yīng)用落地總體還是需要一些時(shí)間,但是當(dāng)下包括今年和明年對(duì)一些簡(jiǎn)單場(chǎng)景,像特斯拉場(chǎng)景里面把一個(gè)電池從什么地方裝到什么地方里面,這種簡(jiǎn)單的用模仿學(xué)習(xí)能做的事情,目前的AI技術(shù)成功率做的比較高了,今年或者明年可以做一些應(yīng)用,包括把整個(gè)的節(jié)拍速度提升。

但是我覺得真正要人形機(jī)器人大規(guī)模應(yīng)用,確實(shí)還需要更多的時(shí)間把機(jī)器人的模型本身做的更好一點(diǎn),讓它更通用,無論更精細(xì)化或者更泛用性的事情都可以做起來。我還是希望社會(huì)大眾對(duì)AI和機(jī)器人能更多些耐心,但是中國(guó)還有很多人比較心急,但是大家可以多給一點(diǎn)耐心,謝謝。


熊友軍:我覺得人形機(jī)器人大規(guī)模應(yīng)用,這個(gè)涉及到商業(yè)化場(chǎng)景選擇問題,并不是說現(xiàn)在人形機(jī)器人不能應(yīng)用,而是看什么場(chǎng)景。有一些剛需場(chǎng)景或者對(duì)人有傷害,對(duì)人不是很友好和不可達(dá)到的場(chǎng)景,還是有些可以用。尤其是剛性需求對(duì)人有傷害的場(chǎng)景。比如說搶險(xiǎn)救災(zāi),對(duì)于核輻射,有毒,有害的氣體環(huán)境等等,這些是可用的。

大家更多想技術(shù)怎么提升,怎么讓人形機(jī)器人快速適應(yīng)更多場(chǎng)景,把成本快速降下來。只有這樣一方面通過技術(shù)提升,讓人形機(jī)器人有更多的工作效率,更好的體驗(yàn)感,更多人愿意用它。第二個(gè)把成本繼續(xù)往下降,讓大家更能買得起,我覺得這個(gè)是要想的方式。

另外還有商業(yè)模式的探索,人形機(jī)器人是集大成者,基本涵蓋了激情和人工智能絕大部分技術(shù)領(lǐng)域。人形機(jī)器人上的研究可以大大推進(jìn)技術(shù)成熟、技術(shù)市場(chǎng)化??梢圆捎醚赝鞠碌胺绞将@得商業(yè)利潤(rùn),通過人形機(jī)器人產(chǎn)品孵化的其他技術(shù)的商業(yè)化產(chǎn)業(yè)化來推動(dòng)人形機(jī)器人的研究。

一個(gè)典型的例子,現(xiàn)在我們有些人形機(jī)器人公司已經(jīng)在其他機(jī)器人產(chǎn)品實(shí)現(xiàn)了盈利,實(shí)現(xiàn)了很好的商業(yè)化,我覺得這是非常好的模式,謝謝。


Alois C. Knoll:非常感謝,您已經(jīng)觸及了下一個(gè)問題。就是作為技術(shù)專家,我們是否意識(shí)到在技術(shù)研發(fā)以外,人們對(duì)很多道德方面有所顧慮,比如Marc已經(jīng)對(duì)此做出了回應(yīng)。比如建立了一個(gè)部門或者一些小組如何管理,大家可以在這個(gè)問題上分享一下嗎?


Marc Raibert:我認(rèn)為最高級(jí)別的了解我們的技術(shù)如何發(fā)展以及風(fēng)險(xiǎn)、機(jī)會(huì)是重要的。各個(gè)國(guó)家的跨政府的探討,如何更好治理AI,一個(gè)重要議題是聚焦在最不好的結(jié)局上。比如英國(guó)來的一位專家說大家特別害怕一些可能發(fā)生的恐怖事情,我們要防止最壞的結(jié)局發(fā)生。但是如果害怕壞事發(fā)生,不利用這些機(jī)會(huì)也很可惜。所以我認(rèn)為要了解,并且做平衡。

我們寫論文會(huì)說一開始就要列出所有做的研究的好結(jié)果,但是從來不談?dòng)锌赡芡ㄟ^我們研究會(huì)出現(xiàn)不好的結(jié)果,我們必須在這方面解放思想,要兩方面都顧及進(jìn)行平衡。不想說人們因?yàn)樘貏e害怕所以不敢抓住這個(gè)機(jī)會(huì),這是我們很好的解決公眾恐懼的方式。


陳建宇:人們對(duì)于人形機(jī)器人或者相應(yīng)的具身智能或機(jī)器人技術(shù)擔(dān)憂,其實(shí)核心來自于對(duì)自身安全性的擔(dān)憂。這個(gè)安全有幾個(gè)不同的層次,最底層的層次是物理安全,大家擔(dān)心這個(gè)機(jī)器人會(huì)不會(huì)在工作的時(shí)候傷害到人,這是一個(gè)層次。

當(dāng)然這個(gè)分情況,比如剛才說的在工廠里面,如果我們把它和人工作環(huán)境隔開,一定程度上能解決這個(gè)問題。同時(shí),我們也需要從算法、硬件等等方面做得更魯棒來優(yōu)化這個(gè)問題。

第二個(gè)層次也是生存上的問題,但是不是物理層面。不是全人類的擔(dān)憂,而是一部分人的擔(dān)憂,他擔(dān)心這個(gè)會(huì)替代某些工作。這個(gè)事情可能希望需要政府有些引導(dǎo),我們盡量開始做勞動(dòng)力非常緊缺的產(chǎn)業(yè)。比如惡劣的工業(yè)環(huán)境,或者養(yǎng)老等等。

第三個(gè)層次如果未來假如具身機(jī)器人真正擁有了意識(shí),這個(gè)會(huì)對(duì)人類自我存在價(jià)值可能產(chǎn)生一些擔(dān)憂。我覺得這是更遠(yuǎn)更大的topic。


王興興:我覺得人形機(jī)器人倫理道德和安全性問題是非常非常重要的事情。而且希望在場(chǎng)所有人大家共同維護(hù)這件事情。有點(diǎn)像現(xiàn)在新能源汽車以及無人駕駛,它其實(shí)還有很多安全性問題,比如早些年新能源汽車,比如有家汽車起火了,或者有家新能源汽車無人駕駛出了交通事故。這對(duì)整個(gè)行業(yè)包括媒體報(bào)道各個(gè)行業(yè)影響非常大,會(huì)降低普通老百姓對(duì)這個(gè)技術(shù)這個(gè)行業(yè)認(rèn)可度以及信心,這個(gè)事情也很容易發(fā)生在人形機(jī)器人以及AI領(lǐng)域。所以我一直覺得當(dāng)下及未來大家都應(yīng)該在機(jī)器人安全性上,無論出臺(tái)規(guī)章政策或者做更好的引導(dǎo),或者需要全世界政府出臺(tái)相關(guān)的政策共同健康地推動(dòng)這個(gè)行業(yè)健康發(fā)展。


王鶴:我就補(bǔ)充一點(diǎn),問題是as technology,所以我就從技術(shù)的角度出發(fā)。人形機(jī)器人面向終局的技術(shù)必然是大模型。其實(shí)只有大模型才可能實(shí)現(xiàn)非常高的通用性,把很多能力全部匯集在一起,把很多模態(tài)從視覺感知到語言理解、動(dòng)作執(zhí)行融會(huì)貫通。今天我們?cè)诩夹g(shù)上其實(shí)有方法對(duì)大模型的行為進(jìn)行限制,就是對(duì)齊alignment。文模型里已經(jīng)對(duì)alignment技術(shù)進(jìn)行深入研究,未來會(huì)對(duì)vision language action model這樣的聯(lián)合模態(tài)模型進(jìn)行更深入的對(duì)齊。讓它不會(huì)傷害到人類,并且技能會(huì)被局限在服務(wù)的范疇里。這些是技術(shù)上能做的,技術(shù)之外必然需要政府、社會(huì)和國(guó)際的合作。


熊友軍:我覺得前幾位都說得很好,我就補(bǔ)充一點(diǎn)。應(yīng)該由一些行業(yè)組織或者政府出來,更多地在法律法規(guī)、立法、全社會(huì)機(jī)器人使用包括道德方面的教育。因?yàn)槲矣X得任何一個(gè)機(jī)器人也是一種工具,放在不同人的手上可能會(huì)有不同的使用方法。

只有加強(qiáng)教育,提升人工智能對(duì)人形機(jī)器人的使用,讓大家向著安全的角度考慮才是正確的方式,謝謝。


Alois C. Knoll:謝謝,您剛才提到機(jī)器人因?yàn)橛腥斯ぶ悄芸梢詫W(xué)習(xí),我們回看AI那代的機(jī)器人比如說交通事故還有自動(dòng)駕駛汽車會(huì)有什么結(jié)果。會(huì)讓AI以后就知道發(fā)生什么樣的結(jié)果,但是現(xiàn)在這個(gè)技術(shù)還不能達(dá)到,以后有AI以后可能就會(huì)自己意識(shí)到會(huì)有什么樣的后果,所以要避免,我們以后也要增加系統(tǒng)的可建設(shè)性。

其實(shí)還是想問一下大家,我們?cè)诠I(yè)發(fā)展和產(chǎn)業(yè)發(fā)展方面,回答這個(gè)問題不是技術(shù)而是行業(yè)。雖然可能有些人有自己的看法,或者認(rèn)為自己對(duì)這個(gè)行業(yè)定位不一樣。我們有很多人認(rèn)為AI寒冬,但是您比較樂觀對(duì)吧,可以分享一下行業(yè)觀點(diǎn)嗎?


Marc Raibert:我認(rèn)為人形機(jī)器人的出現(xiàn)讓問題又變得復(fù)雜了,工業(yè)使用已經(jīng)有很大的進(jìn)展了,現(xiàn)在還有很多擔(dān)心,大家都說技術(shù)已經(jīng)有了,可以讓機(jī)器人越來越成熟,并且還會(huì)繼續(xù)成熟。我認(rèn)為這個(gè)產(chǎn)業(yè)會(huì)繼續(xù)前行,人形機(jī)器人還沒有完全成熟,至少可以看到一些人形機(jī)器人的展示。他們還和汽車公司合作,但是一定程度來說這更多是一種展示而不是行動(dòng),如果我們要做這種需要系統(tǒng)集成。

不是說重新為了機(jī)器人建一個(gè)工廠,很多機(jī)器人工廠倉庫的提供者他們都有很多問題。因?yàn)橐ㄟ@種工廠已經(jīng)將很多資金用了,真正運(yùn)行工廠和倉庫的人他們不想改變傳統(tǒng)的方式,希望機(jī)器人做的事情也可以讓人去做,所以這個(gè)在行業(yè)應(yīng)用里各種形式的機(jī)器人都有困難。

但是剛才也說了對(duì)于一些特定場(chǎng)景的使用,五年后人形機(jī)器人行業(yè)發(fā)展,有些特別令人印象深刻的例證,我認(rèn)為以后還會(huì)有更成功的例證。我們做的一些實(shí)驗(yàn),比如可以有他們自己的傳感器,因?yàn)椴恢廊藗兿胍裁礃拥膫鞲衅?,所以找各種傳感器制造商去做實(shí)驗(yàn)?,F(xiàn)在我們對(duì)于用戶如何使用機(jī)器人更加了解,所以開發(fā)者更加關(guān)注這寫潛在機(jī)會(huì),讓那樣以后有更多使用機(jī)會(huì)。


Alois C. Knoll:可能我們還需要更多具有企業(yè)家思維的人士在這方面探索,但是仍然在實(shí)驗(yàn)階段。人形機(jī)器人可能還有更多想法,問一下中國(guó)的企業(yè)家,哪位嘉賓想回答一下五年之后會(huì)怎樣?


王鶴:我對(duì)人形機(jī)器人的發(fā)展總體比較樂觀。未來五年我們要完成真正的大規(guī)模應(yīng)用,這件事情對(duì)于整個(gè)人形機(jī)器人仍然是先慢后快其中的慢的階段。一個(gè)里程碑應(yīng)該是什么?就是五年的時(shí)候我們能達(dá)到萬臺(tái)級(jí)別應(yīng)用。這樣的市場(chǎng)大約對(duì)標(biāo)現(xiàn)在什么機(jī)器人的應(yīng)用?就是商業(yè)清潔機(jī)器人,我們舉個(gè)例子。

在超市萬達(dá)廣場(chǎng)寫字樓一層,我們看來回洗地擦地的機(jī)器人。中國(guó)最領(lǐng)先的公司大約每年出貨一萬臺(tái),它做的事情很局限就是做這么簡(jiǎn)單的事情。但是能達(dá)到各種場(chǎng)景不管是商超還是寫字樓,很多不同的場(chǎng)景進(jìn)行清潔,當(dāng)然是平面清潔,對(duì)于人形機(jī)器人來說希望做到立體操作,但是能力可能是局限的。

我就是搬運(yùn)、上貨、取貨,沒有更多的能力。但是我也要實(shí)現(xiàn)跨場(chǎng)景應(yīng)用,不是可以在超市里、工廠里,可以在服務(wù)場(chǎng)景等等。能達(dá)到每年一萬臺(tái)市場(chǎng)規(guī)模的話,相信后面有真實(shí)世界數(shù)據(jù)回流,我們能看到人形機(jī)器人應(yīng)用的規(guī)模會(huì)快速加快,從慢時(shí)代進(jìn)入快時(shí)代。


Alois C. Knoll:非常感謝,您就企業(yè)家角度來說五年以后展望如何?


熊友軍:我覺得我對(duì)于人形機(jī)器人的應(yīng)用可能會(huì)更加樂觀一點(diǎn)。大家看到這兩年人形機(jī)器人進(jìn)步非常非???,尤其是AI驅(qū)動(dòng)下。市場(chǎng)應(yīng)用方面已經(jīng)可以看到國(guó)內(nèi)有些企業(yè),包括全球企業(yè)已經(jīng)開始在一些場(chǎng)景做試點(diǎn)應(yīng)用。比如說汽車廠,比如一些商用服務(wù)場(chǎng)景已經(jīng)開始做試點(diǎn)。我覺得這個(gè)試點(diǎn)就是啟動(dòng)一個(gè)數(shù)據(jù)非組織的效益,所以試點(diǎn)進(jìn)展會(huì)有更多的迭代,會(huì)有更多的數(shù)據(jù)驅(qū)動(dòng),機(jī)器可能會(huì)在這個(gè)環(huán)境里,特定環(huán)境里它的效率、速度,隨著量的增長(zhǎng)價(jià)格也會(huì)大幅度降低。

這樣我覺得會(huì)更快地促進(jìn)產(chǎn)業(yè)應(yīng)用,今年年底大家應(yīng)該可以看到有一部分公司已經(jīng)能夠在新能源汽車廠,比如說在一些對(duì)人有傷害地方的應(yīng)用。明年應(yīng)該可以看到千臺(tái)左右量的出貨,我看到了很多有些公司實(shí)際現(xiàn)場(chǎng)測(cè)試情況來看的一些結(jié)果。


Alois C. Knoll:是的,我們說五年,你說一年就能做到?,F(xiàn)在從商業(yè)的角度確實(shí)時(shí)間不太夠了。


Marc Raibert:我想分享一下,馬斯克因?yàn)樗馁Y源和野心,他自己可能就有一萬臺(tái)機(jī)器人幾年之內(nèi)部署出來。不一定通過這個(gè)直接賺錢,但是就像他最開始對(duì)電動(dòng)汽車的熱衷。我其實(shí)對(duì)這個(gè)事情持批判性態(tài)度,所以從馬斯克當(dāng)年做這個(gè)事情的時(shí)候,大家都不相信,當(dāng)時(shí)所有的汽車廠商還是在做油車。但是他說電車可能是未來的想法,當(dāng)時(shí)是很瘋狂的想法,人形機(jī)器人可能也是如此,我不知道馬斯克對(duì)于機(jī)器人是不是有這么大的支持力度。但是確實(shí)我們知道m(xù)odel Y現(xiàn)在也是世界上最受歡迎的電車車型。


Alois C. Knoll:確實(shí)非常了不起,剛才的討論很精彩,也看到了各位專家在這方面展現(xiàn)出來了熱情。今天在座的有很多年輕人,想問一下各位嘉賓,您對(duì)于年輕人有什么建議?如果想要在年輕人心中點(diǎn)燃星星之火,讓他們對(duì)人形機(jī)器人感興趣,我們?nèi)绾渭ぐl(fā)這些年輕人,能給出一些簡(jiǎn)單的建議嗎?因?yàn)镸arc是機(jī)器人領(lǐng)域非常資深的專家了,他先來吧。


Marc Raibert:我想剛才大家看到了人形機(jī)器人在跳舞,這其實(shí)并不是一個(gè)合適的方向。機(jī)器人越有趣,越能和人有更多的互動(dòng),越能激起人們的興趣。我剛才也轉(zhuǎn)過了展臺(tái),也跟其他的專家說到了,其實(shí)有一些機(jī)器人是很無聊的,他們總是保持云端的連接,跟人互動(dòng)的可能性是有限的,如果我們能夠把機(jī)器人做的非常有趣,那公眾就會(huì)對(duì)它越感興趣,越熱衷。

我其實(shí)已經(jīng)很感激了,對(duì)于我來說,受邀參加今年的機(jī)器人大會(huì),最讓人興奮的一件事情就是見到了這么多同道,看到大家的一些事跡,而且很多人跟我說,我小的時(shí)候看過你的工作,你的機(jī)器人激發(fā)了我現(xiàn)在從事機(jī)器人,我也希望其他嘉賓未來也可以成為年輕人的引路明燈。


陳建宇:機(jī)會(huì)永遠(yuǎn)是留給有準(zhǔn)備的人,像Marc做這件事情做了好幾十年,包括臺(tái)上幾位也都是多年深耕在機(jī)器人或者相關(guān)的領(lǐng)域,人形機(jī)器人其實(shí)也是一個(gè)非常長(zhǎng)周期的事情,同時(shí)它也包羅萬象,從技術(shù)上、軟件、硬件、AI,再到商業(yè)、到產(chǎn)品等等,其實(shí)各方面都有,所以說大家應(yīng)該去問一問自己的內(nèi)心,在這個(gè)范圍內(nèi)自己最有激情、最喜歡的、最熱愛的是什么,然后從此刻開始就去積累它,等到未來總有時(shí)刻是你施展自己的機(jī)會(huì)。


王興興:我覺得對(duì)于所有年輕人,這個(gè)時(shí)代都是非常精彩的,機(jī)器人和AI都是階梯性發(fā)展的,就像ChatGPT沒有出來之前,大家覺得語言模型沒什么用,非常差,但突然發(fā)生了僭越性的進(jìn)步,非常好。

其實(shí)機(jī)器人AI也會(huì)遵循這種規(guī)律,大家現(xiàn)在可能看到機(jī)器人的AI都比較弱,但實(shí)際上這是好事,因?yàn)榇蠹叶加袡C(jī)會(huì)去做的更好,真正把人類目前可以預(yù)估的最偉大的技術(shù)就在當(dāng)下,就在未來幾年,所以這個(gè)事情大家都是非常值得去的。

而且機(jī)器人和AI另外一個(gè)比較適合年輕人的點(diǎn)是它沒有那么多歷史包袱,不像數(shù)學(xué)有幾百上千年的(歷史),要非常天才的數(shù)學(xué)家,你一定要比他們做的好才可以做,但是當(dāng)下的AI和機(jī)器人都非常新,尤其是AI技術(shù),就最近幾年的東西,非常適合年輕人。

如果在未來5年到10年或者幾十年回看我們現(xiàn)在這個(gè)時(shí)代,跟我們從現(xiàn)在這個(gè)時(shí)代看原始人其實(shí)都是差不多的感覺,想想這種感覺吧,真的非常激動(dòng)人心。


王鶴:其實(shí)未來的15年在我心目中會(huì)是人形機(jī)器人從當(dāng)下在產(chǎn)業(yè)中沒有規(guī)?;瘧?yīng)用,成長(zhǎng)到跟今天汽車每年產(chǎn)量萬億市場(chǎng)的過程。在這個(gè)過程中,大家做好自己就可以了,因?yàn)?5年之后,很多工作都是跟人形機(jī)器人相關(guān)的,今天可能你負(fù)責(zé)賣車,15年后你可能崗位就調(diào)到賣人形機(jī)器人,今天你是班級(jí)里頭的佼佼者,你學(xué)AI,你可能發(fā)現(xiàn)你的職業(yè)生涯就是圍繞著進(jìn)一步提升人形機(jī)器人能力展開的,所以大家做好自己,我們一起共享光明的人形機(jī)器人的未來。


熊友軍:其實(shí)我經(jīng)歷過智能手機(jī)時(shí)代、移動(dòng)互聯(lián)網(wǎng)時(shí)代,現(xiàn)在我們正在經(jīng)歷智能汽車的時(shí)代、電動(dòng)汽車的時(shí)代,我覺得下一個(gè)時(shí)代實(shí)際上就是具身智能的時(shí)代,而具身智能時(shí)代的典型代表其實(shí)就是人形機(jī)器人。我給現(xiàn)在年輕人的建議是保持野心。


Alois C. Knoll:非常棒。Marc剛才其實(shí)已經(jīng)說到了,他其實(shí)也曾經(jīng)激勵(lì)了在座的一些嘉賓,這些嘉賓也激勵(lì)了在座的年輕人,我想問一下各位嘉賓,向?qū)Ψ接袥]有什么問題,我們還是有機(jī)會(huì)能夠提出來,大家每個(gè)人有機(jī)會(huì)提一個(gè)問題,我相信大家私下已經(jīng)交流了很多,但是Marc在臺(tái)上,是不是幾位中國(guó)的嘉賓可以借機(jī)問他一些問題。


陳建宇:好的,我來問Marc一個(gè)問題,您認(rèn)為最重要的研究需要克服的問題是什么呢?說AI和機(jī)器人,選一個(gè)研究項(xiàng)目,您認(rèn)為最重要的是哪個(gè)呢?


Marc Raibert:我來試圖非直接的回答一下問題,我不是不想回答你的問題,我最后一個(gè)幻燈片沒給大家看到,它實(shí)際上是一個(gè)視頻,是機(jī)器人摔倒的視頻,大概有兩分鐘時(shí)間。

在這兩分鐘時(shí)間,機(jī)器人有25種不同摔倒的方法,所以我想在研究的過程當(dāng)中從失敗當(dāng)中汲取教訓(xùn)是最有趣,也是最有用的一些過程,大家要留意失敗和錯(cuò)誤,從中學(xué)習(xí),不要再重蹈覆轍,這是最有趣的。不能說是一個(gè)研究主題,而是一種研究的精神,永不言敗。

我沒有看到目前為止大家就曾經(jīng)失敗的產(chǎn)品和研究做一個(gè)報(bào)告,但是我們也相信教會(huì)你們的機(jī)器人去后空翻等等,這中間應(yīng)該犯過很多次錯(cuò)誤,你享受這些錯(cuò)誤嗎?


Alois C. Knoll:我想說他是很喜歡的,我記得應(yīng)該是1995年的時(shí)候,我當(dāng)時(shí)看他第一個(gè)視頻,我們第一個(gè)部分做的非常好,然后他會(huì)說在實(shí)踐當(dāng)中機(jī)器人是犯很多錯(cuò)誤的,我給大家看了這些失敗的視頻。


Marc Raibert:是的,這個(gè)視頻我反復(fù)拿出來放。


Alois C. Knoll:還有其他人想問Marc問題嗎,或者可以回答其他人的問題。


王興興:Marc先生,很榮幸今天見到您,我好奇想問一下,您覺得對(duì)于人形機(jī)器人的手,您覺得未來幾年比較合適的有幾個(gè)手指或者幾個(gè)電機(jī)是比較好的一個(gè)方向?


Marc Raibert:我還是要試圖非直接的回答這個(gè)問題,我們之前在人工智能研究所召開了一個(gè)研究的主題,就是關(guān)于操控的一些問題,我想靈巧性是很重要的,但是目前我們的進(jìn)展還不是很多,很多人在這方面有大量的研究,至少15年大家都在研究靈巧手。

但是我想大家可能會(huì)嘗試不同的事情,就好像我今天最開始說到的一樣,可能我們需要更多的一些動(dòng)力控制,而不是靜態(tài)的抓握。我想在整個(gè)學(xué)習(xí)的世界當(dāng)中,要達(dá)到要求,獲得相應(yīng)的靈巧性已經(jīng)很困難了,哪怕做很容易的任務(wù)也是不容易,但是我想這里有很多的需求。多少個(gè)手指,我覺得最多5根手指吧,但是我也不知道未來會(huì)怎樣。

可能更有趣的重點(diǎn)就是我們的手心怎么樣,其實(shí)我們的手心也有很多的用途,它不是一個(gè)靜態(tài)的肌肉的總和,但是很多的機(jī)械手有很多的手指,但是它掌心、手心這個(gè)部分做的不是很好,這些手指必須是獨(dú)立的運(yùn)作。


王鶴:如果說人形機(jī)器人可以實(shí)現(xiàn)自動(dòng)化,最后能夠用什么樣的科技可以實(shí)現(xiàn)這種通用的視覺和語言,能不能實(shí)現(xiàn)人形機(jī)器人的自動(dòng)化呢?


Marc Raibert:這比較困難,也許最后可能會(huì)有這方面的發(fā)展,但是我認(rèn)為我們知道的太多了,說實(shí)話人們太多關(guān)注學(xué)習(xí)了,有點(diǎn)過譽(yù)了。我們對(duì)學(xué)習(xí)應(yīng)該有樂觀的態(tài)度,但是現(xiàn)在我們看到學(xué)習(xí)的作用并不是很重要,在我們那里,今天我們做的學(xué)習(xí)很少,其實(shí)我們有做,我認(rèn)為控制理論和方式以及我們過去30年的監(jiān)視系統(tǒng)是更重要的。

我希望我們真的能夠迎接學(xué)習(xí),但是將它和我們現(xiàn)在已有的技術(shù)結(jié)合在一起,在未來5到10年也許會(huì)有不同的情況發(fā)生。


Alois C. Knoll:我也同意,為什么要用幾百萬個(gè)神經(jīng)系統(tǒng)去學(xué)一個(gè)AIT的傳感器,現(xiàn)在就可以做的事情了,要用那么大的成本去做簡(jiǎn)單的事情,我們有很多的理論、技術(shù)以及方法論,為什么我們要將傳統(tǒng)這些成果扔入廢紙簍,我們既要學(xué)習(xí),也要使用過去傳統(tǒng)的智慧,將它們結(jié)合在一起。


熊友軍:我的問題是說Marc作為波士頓動(dòng)力的創(chuàng)始人,您之前引導(dǎo)開發(fā)了像阿特拉斯這樣非常令人驚奇的產(chǎn)品,但是前不久我們看到阿特拉斯應(yīng)該是終止了研發(fā),由原來的液壓驅(qū)動(dòng)轉(zhuǎn)向純電驅(qū)動(dòng)的方式,這方面是處于什么樣的考慮,是因?yàn)槌杀镜目紤]嗎,因?yàn)槲覀冎腊⑻乩沟闹圃旃に嚪浅8撸F(xiàn)在轉(zhuǎn)向電動(dòng)方式是出于成本的考慮還是處于商業(yè)化的考慮,同時(shí)我還想知道波士頓動(dòng)力未來5年商業(yè)化的計(jì)劃,謝謝!


Marc Raibert:為什么轉(zhuǎn)變,有兩個(gè)主要的元素,我喜歡液壓,我們建的很多機(jī)器人都是用液壓,包括建筑機(jī)器人、人形機(jī)器人還有更多的空間可以繼續(xù)使用液壓。

但我認(rèn)為有兩個(gè)情況,一個(gè)是它特別的大,特別的重,而我們想要做一些更高的性能,我希望它們完全沒有流出來,比如說到工廠或者家里面,它們不能夠滴油,這是一個(gè)問題,很難找到這方面的人才,因?yàn)槿藗冋J(rèn)為這是比較老的技術(shù),我們也做了很多的研發(fā)創(chuàng)新,在軸承器上面怎么用液壓來實(shí)現(xiàn)。

我認(rèn)為現(xiàn)在的電機(jī)變的足夠功率強(qiáng)大,所以它有競(jìng)爭(zhēng)之地了,雖然我現(xiàn)在還是董事會(huì)成員,并且是它的創(chuàng)始人,但他們現(xiàn)在有自己的計(jì)劃,他們會(huì)自己去復(fù)盤,您可以去看公司的公開信息,非常感謝。


Alois C. Knoll:本來我們想問更多的問題,但是我們確實(shí)沒有時(shí)間了,感謝參會(huì)者和專家,我認(rèn)為這個(gè)環(huán)節(jié)非常的令人印象深刻,明年我們也會(huì)有同樣的會(huì)議,希望我們可以邀請(qǐng)大家再來。

(本文根據(jù)錄音整理)


返回列表頁

加入會(huì)員

學(xué)會(huì)官微