久久在线视频在线_欧美在线一级va免费观看_欧美日韩国产在线一区_亚洲一区二区三区在线观看视频

您當前的位置: 首頁 > 新聞 > 其他

比真狗還狗!鵝廠機器狗登Nature子刊封面:可定向越野

來源:量子位   編輯:非小米 時間:2024-08-03 13:15人閱讀

騰訊機器狗,登上了Nature子刊封面!

比真狗還狗!鵝廠機器狗登Nature子刊封面:可定向越野

在它的控制下,機器狗的動作和真實世界中的狗越來越像了。

注意看,這里的兩只機器狗玩起了“定向越野”,還是帶追逐的那種。

比真狗還狗!鵝廠機器狗登Nature子刊封面:可定向越野

游戲當中,兩只機器狗分別要扮演追逐者和逃脫者,逃脫者需要在不被抓到的情況下到達指定位置。

一旦它到達了指定位置,兩只機器狗就會交換身份,如此來回進行,直到有一只被抓住。

這個游戲的一個難點在于有最大速度限制,兩只機器狗都不能單獨依靠速度取勝,必須規劃出一定策略。

甚至,還有更加困難的障礙賽,戰斗更加激烈、場面更加精彩。

比真狗還狗!鵝廠機器狗登Nature子刊封面:可定向越野

這場機器人越野大賽的背后,應用的正是這套全新的控制框架。

該框架采取了分層式策略,并運用生成式模型學習了動物的運動方式,訓練數據來自一只拉布拉多犬。

這套方法讓機器狗不再依賴物理模型或手工設計的獎勵函數,并能像動物一樣理解和適應更多的環境與任務。

像真的狗一樣運動

這只機器狗名叫MAX,重量為14kg,每條腿上有3個行動器,可提供平均22N·m的持續扭矩,最大能達到30N·m。

MAX的一大亮點,就是實現了對真實世界中狗的模仿。

在室內環境中,MAX掙脫了研究者,然后就開始了自由跑動。

比真狗還狗!鵝廠機器狗登Nature子刊封面:可定向越野

把MAX放到室外,它也能在草地上歡快地奔跑玩耍。

比真狗還狗!鵝廠機器狗登Nature子刊封面:可定向越野

當遇到有障礙的復雜地形時,這種模仿就更加惟妙惟肖了。

向上,MAX可以敏捷飛快地爬上樓梯。

比真狗還狗!鵝廠機器狗登Nature子刊封面:可定向越野

向下,它也能鉆過障礙物,擋在它前面的橫桿沒有被碰到一點。

比真狗還狗!鵝廠機器狗登Nature子刊封面:可定向越野

這一系列的動作背后,都是MAX的控制系統從一只拉布拉多的動作當中學習到的策略。

利用對真狗的模仿,MAX還能規劃更高級的策略,完成更為復雜的任務,前面展示的追逐大戰就是一個很好的例子。

值得一提的是,除了讓兩只機器狗相互競技之外,研究人員也通過手柄控制加入到了這場戰斗。

從畫面中不難看出,真人控制模式下的機器狗(下圖中1號),反而不如純機器方案(2號)來得靈活。

比真狗還狗!鵝廠機器狗登Nature子刊封面:可定向越野

最終的結果是,在開了掛(人類控制的機器狗最大限速更高)的情況下,人類仍然以0:2的比分徹底輸給了機器。

除了能讓機器狗靈活運動,該框架最大的優勢就是通用性,可以針對不同的任務場景和機器人形態進行預訓練和知識復用。

未來,團隊還計劃把該系統遷移至人形機器人和多智能體協作的場景。

所以,Robotics X實驗室的研究人員是如何打造出這套方案的呢?

加入生成式模型的分層框架

研究人員設計這套控制框架的核心思路,就是模仿真實動物的運動、感知和策略

該框架通過構建可預訓練、可重用和可擴展的原始級、環境級和策略級知識,使機器人能夠像動物一樣從更廣泛的視角理解和適應環境與任務。

具體實現上,該框架也采用了分層式的控制方式,之中的三個層級——原始運動控制器(PMC)、環境適應控制器(EPMC)和策略控制器(SEPMC)——分別與原始級、環境級和策略級知識形成了對應。

首先,人類會發出一個高級的指令(比如告訴機器競速追逐游戲的規則和目標),這也是(運行過程)全程唯一需要人參與的地方。

這個高級指令會被SEPMC接收,并根據當前情況(如機器人角色、對手位置等)制定策略,然后生成包括移動方向、速度等信息的導航命令。

導航命令接下來會傳給EPMC,然后結合環境感知信息(如地形高度圖、深度信息等),選擇適當的運動模式,形成一個類別分布,同時選擇合適的離散潛在表示。

最后,PMC又把這種潛在表示與機器人當前的狀態(如關節位置、速度等)結合,得到電機控制信號,并最終交付執行。

比真狗還狗!鵝廠機器狗登Nature子刊封面:可定向越野

訓練的順序則剛好與之相反——從PMC開始,到SEPMC結束。

第一階段PMC的訓練,也就是原始級訓練,是為了建立基礎的運動能力

該階段的訓練數據來自對一只訓練有素的中型拉布拉多犬的運動捕捉。

通過指導狗狗完成各種動作,作者收集了大約半小時的不同步態(如行走、奔跑、跳躍、坐下等)的運動序列,以每秒120幀的頻率采樣。

狗狗在捕捉過程中遵循直線、方形、圓形等不同的路徑軌跡。此外,作者還專門收集了約9分鐘的上下樓梯的運動數據。

為了彌合動物和機器人的骨骼結構差異,作者使用逆運動學方法將狗狗的關節運動數據重定向到機器人關節。

通過進一步的人工調整,最終得到了與四足機器人兼容的參考運動數據。

比真狗還狗!鵝廠機器狗登Nature子刊封面:可定向越野
△資料圖,不代表訓練數據來源

基于這些數據,作者使用了生成式模型VQ-VAE編碼器來壓縮和表示動物的運動模式,構建了PMC的離散潛在空間。

通過向量量化技術,這些連續的潛在表示離散化為預定義的離散嵌入向量,解碼器則基于選定的離散嵌入和當前機器人狀態生成具體的運動控制信號。

在VQ-VAE的基礎上,PMC的訓練目標,是最小化生成的運動軌跡與參考軌跡之間的偏差。

同時,作者引入了優先級采樣機制,根據不同運動模式的難易程度動態調整其在訓練中的權重,確保網絡對所有參考數據都能很好地擬合。

通過不斷迭代和優化,PMC逐步學習到一組能夠有效表達復雜動物運動的離散表征,直至收斂。

比真狗還狗!鵝廠機器狗登Nature子刊封面:可定向越野

PMC階段的結果,為EPMC生成更高級別的運動控制信息提供了基礎。

EPMC在PMC的基礎上引入了環境感知模塊,接收來自視覺、雷達等傳感器的信息,使得策略網絡能夠根據當前環境狀態動態調整運動模式。

EPMC的核心是一個概率生成網絡,根據當前的感知信息和指令信號,在PMC提供的離散潛在空間上生成一個概率分布。

這個分布決定了應該激活哪些原始運動模式,以最好地適應當前環境和任務。

EPMC的訓練,通過最小化環境適應和任務完成的損失函數來實現,逐步學習優化運動策略,提高機器人的適應能力和魯棒性。

比真狗還狗!鵝廠機器狗登Nature子刊封面:可定向越野

最后的SEPMC訓練階段進一步提升了機器人的認知和規劃能力,使其能夠在多智能體交互環境中制定和執行高層策略。

SEPMC在EPMC的基礎上,根據當前的游戲狀態(如自身和對手位置等)和歷史交互記錄,生成高層的策略決策(如追逐、躲避)。

MAX機器人玩的追逐式定向越野游戲,也正是SEPMC的訓練方式。

在該階段,作者采用了先進的多智能體強化學習算法PFSP,通過自我博弈不斷提升機器人的策略水平。

訓練過程中,當前策略不斷與歷史上的強對手進行對抗,迫使其學習更加魯棒和高效的策略。

得益于前兩個階段打下的堅實基礎,這種復雜策略的學習是非常高效的,即使在稀疏獎勵的情況下也能快速收斂。

值得一提的是,這樣的多智能體方案當中,還可以引入一些模擬人類的智能體,從而實現機器間或人機間的協作配合。

比真狗還狗!鵝廠機器狗登Nature子刊封面:可定向越野

以上的訓練過程都是在仿真環境中完成,然后以零樣本遷移到真實環境。

在仿真中,物理參數可以自由控制,作者隨機化了大量物理參數(包括負載、地形變化等),通過強化學習得到的策略必須能夠應對這些變化,得到穩定和通用的控制能力。

另外,作者在控制框架中的每一層都使用了LSTM,使得各個層級都具備一定的時序記憶和規劃能力。

傳感器方面,目前作者主要驗證了使用Motion Capture系統,或僅基于Depth Camera的視覺感知可以完成一系列復雜的任務。

為了處理更加開放和復雜的環境,作者未來將進一步整合LiDAR、Audio等感知輸入,進行多模態理解,更好的應對環境。

論文地址:https://www.nature.com/articles/s42256-024-00861-3

項目主頁:https://tencent-roboticsx.github.io/lifelike-agility-and-play/

本站所有文章、數據、圖片均來自互聯網,一切版權均歸源網站或源作者所有。

如果侵犯了你的權益請來信告知我們刪除。郵箱:business@qudong.com

標簽: 騰訊 機器狗

相關文章

久久在线视频在线_欧美在线一级va免费观看_欧美日韩国产在线一区_亚洲一区二区三区在线观看视频
亚洲毛片在线| 宅男在线国产精品| 亚洲人妖在线| 欧美3dxxxxhd| 最新亚洲电影| 9国产精品视频| 国产精品人人做人人爽| 欧美一区二区播放| 欧美一区二区视频观看视频| 精品成人一区二区三区四区| 欧美xxx在线观看| 欧美国产亚洲视频| 亚洲综合二区| 久久九九99| aa日韩免费精品视频一| 亚洲视频网在线直播| 国产一区二区0| 亚洲国产一区二区三区高清| 国产精品毛片在线看| 久久视频在线免费观看| 欧美国产精品日韩| 久久激情一区| 欧美日韩一区二区欧美激情| 欧美在线欧美在线| 欧美岛国激情| 久久久噜久噜久久综合| 欧美激情第一页xxx| 久久精品91久久香蕉加勒比| 欧美国产一区二区| 久久成人羞羞网站| 欧美日韩国产123| 嫩草国产精品入口| 国产欧美精品xxxx另类| 亚洲精品女人| 国产日产精品一区二区三区四区的观看方式| 蜜桃久久av| 国产精自产拍久久久久久| 亚洲国产精品福利| 国内精品伊人久久久久av影院| 夜夜嗨网站十八久久| 国产最新精品精品你懂的| 在线午夜精品自拍| 亚洲美女电影在线| 久久婷婷久久| 亚洲欧美在线网| 欧美日韩一区二区免费在线观看| 欧美一区91| 欧美日韩一区二区在线观看| 女人色偷偷aa久久天堂| 国户精品久久久久久久久久久不卡| 9色精品在线| 99国产精品久久久久久久成人热| 香蕉免费一区二区三区在线观看| 亚洲影视在线播放| 欧美日韩亚洲综合| 亚洲品质自拍| 亚洲精品一区二区三| 久久婷婷麻豆| 欧美成人精精品一区二区频| 国产一区二区三区在线观看网站 | 国产性做久久久久久| 亚洲午夜精品网| 亚洲一级黄色| 欧美午夜免费电影| 欧美jizzhd精品欧美喷水| 久久亚洲私人国产精品va媚药| 国产精品久久久久免费a∨| 亚洲精品美女在线观看| 亚洲人成在线观看网站高清| 久久裸体视频| 欧美成人精品一区| 亚洲欧洲精品一区二区三区不卡| 久久久天天操| 欧美丰满少妇xxxbbb| 亚洲国产成人在线| 欧美aa国产视频| 99国产欧美久久久精品| 亚洲小说欧美另类婷婷| 国产精品久久99| 亚洲一区二区成人在线观看| 欧美呦呦网站| 激情文学一区| 欧美xx视频| 日韩亚洲欧美精品| 久久精品一二三| 亚洲国产裸拍裸体视频在线观看乱了中文 | 一区二区日韩伦理片| 国产精品豆花视频| 亚洲欧美韩国| 蜜桃伊人久久| 中文成人激情娱乐网| 国产精品亚发布| 久久亚洲视频| 日韩亚洲欧美综合| 久久中文字幕一区| 99精品视频免费在线观看| 国产精品久久网| 久久乐国产精品| 99热在这里有精品免费| 欧美在线播放视频| 亚洲精品一品区二品区三品区| 国产精品r级在线| 久久久久久一区| 99pao成人国产永久免费视频| 欧美在线观看网址综合| 亚洲欧洲视频| 国产麻豆日韩欧美久久| 男女精品视频| 性欧美暴力猛交69hd| 亚洲人成77777在线观看网| 亚洲欧美国产毛片在线| 在线看欧美日韩| 国产精品毛片a∨一区二区三区| 久久久综合香蕉尹人综合网| 亚洲色图在线视频| 亚洲高清一二三区| 久久久免费精品视频| 亚洲在线第一页| 亚洲成人中文| 国产一区二区中文| 欧美午夜a级限制福利片| 免费看成人av| 久久精品国产成人| 亚洲一区在线看| 亚洲精品日韩综合观看成人91| 久久久免费av| 久久精品国产99国产精品澳门 | 国产午夜精品在线| 欧美日韩在线播放三区| 欧美国产日本韩| 日韩视频在线一区二区| 亚洲国产一区二区三区青草影视 | 国产精品扒开腿爽爽爽视频| 久久综合色播五月| 午夜精品视频在线| 亚洲视频每日更新| 夜夜夜久久久| 亚洲麻豆一区| 最近看过的日韩成人| 欧美搞黄网站| 老牛国产精品一区的观看方式| 欧美在线免费观看视频| 亚洲免费在线观看| 亚洲欧美一区二区原创| 亚洲视频电影图片偷拍一区| 99视频超级精品| 夜夜狂射影院欧美极品| 亚洲美女免费视频| 99re66热这里只有精品3直播| 亚洲另类一区二区| 日韩亚洲在线观看| 99国产精品视频免费观看| 亚洲茄子视频| 一区二区免费在线视频| 亚洲女与黑人做爰| 亚洲女同在线| 久久久99精品免费观看不卡| 久久亚洲欧美| 亚洲国产高潮在线观看| 亚洲精品免费一二三区| 在线亚洲国产精品网站| 亚洲欧美日韩爽爽影院| 欧美伊人久久| 免费一级欧美片在线播放| 欧美黄色免费网站| 国产精品电影网站| 国产一级久久| 亚洲国产精品尤物yw在线观看| 亚洲国产欧美一区二区三区久久| 亚洲日韩欧美一区二区在线| 一本一本大道香蕉久在线精品| 午夜免费在线观看精品视频| 久久人人爽人人爽| 欧美国产日韩免费| 亚洲最快最全在线视频| 小黄鸭精品密入口导航| 免费成人在线观看视频| 欧美视频一区二| 国产一区二区三区四区| 亚洲日本一区二区| 久久成人精品无人区| 欧美激情欧美狂野欧美精品| 在线视频中文亚洲| 久久亚洲国产成人| 欧美午夜三级| 在线看国产日韩| 欧美一区午夜精品| 亚洲黄色尤物视频| 欧美中文字幕不卡| 欧美日韩国产综合视频在线| 国产一区二区按摩在线观看| 亚洲品质自拍| 蜜月aⅴ免费一区二区三区| 一区二区三区成人精品| 久久久综合精品| 国产美女精品人人做人人爽| 99v久久综合狠狠综合久久| 久久精品国产v日韩v亚洲| 一本大道久久a久久精二百| 美女视频一区免费观看|