機械臂DRL控制為什麼集中在力矩控制?

時間 2021-06-08 05:18:28

1樓:Robot Seller

實名反對題主的問題。

我覺得吧。最終給到機械人機械臂關節的當然是力矩指令,但是不代表DRL給的就是力矩指令,我覺得大部分還是給的位置指令,在機械臂的實時控制器中進行位置控制。如下圖2例子:

而直接給力矩的話,如果你說的是完整的關節控制力矩,我個人覺得是不靠譜的,畢竟那就是典型的力矩控制,要算動力學而且以1000HZ頻率計算才能保證穩定性,誰家的DRL能算這麼快還基於影象的;而且目前學術圈能買到的開放力矩環的機械臂只有Franka, iiwa,可能還有倒閉的rethink,反正不多。

但是也不是說用DRL計算出力矩給控制器就是不行,可以少給一點嘛,比如residual reinforcement learning 就是這個思路,大部分基本的力矩還是動力學去算(其實慢悠悠的就只要重力項就好了),然後深度學習算出來的力矩加上去,也就是DRL的力矩控制了,但是要知道,DRL算出的力矩佔總力矩佔比不會很大,大了容易飛車,畢竟RDL更新太慢。

2樓:咯咯咯

我理解,action應該是我正在做什麼,而不是我將要變成什麼樣,因此最直接的動作就是力和力矩,或者說加速度。速度,位置都屬於動作的後果。並不是完全不能做action,而是因為有延遲,影響效果

3樓:側耳傾聽

純屬猜測,對快速性要求使然?畢竟位置資訊有180度相位滯後,再加上測量訊號滯後…

或者,我猜題主的研究領域是人工智慧?我估計這幫傢伙這麼乾有可能因為他們只關心有沒有模型,而不關心模型是什麼,是什麼是控制系統結構的問題。

自控原理裡面閉環控制為什麼輸出要和輸入做比較?如果輸出跟隨輸入的話那傳遞函式又有什麼意義?

momoko 輸入是應該得到的量,輸出是實際的量,作比較之後才知道怎麼調整。比如汽車踏板與車速的關係,輸出是車速,但是輸入不是踏板角度,而是理想的車速,根據差值來調整踏板角度,這就是控制器,汽車特性就是被控物件。我感覺之前的回答都不是很明白,冒昧挖個墳。 首先要明白乙個邏輯關係,就是先有被控物件,後...

既然南韓娛樂圈被財閥控制,為什麼還能拍這麼多反應黑暗現實的電影

天乾物燥 因為這些電影就是財閥讓拍的,為了讓人民群眾有發洩的渠道,畢竟電影裡的壞人或者說是財閥,犯了罪是會受到懲罰的,這不就是廣大人民群眾想看到的嗎 專心考證 我覺得,就是因為是財閥控制,才有這麼多現實的電影,因為財閥的本質是資本,只要有利益,管你拍了啥。財閥有錢賺,導演編劇有素材,人民樂意為這樣的...

為什麼傳統認為機械人只是機械臂,而現代認為機械人是人形機械人?

單純從分類學的角度來說,概念和定義會隨著新發現不斷改變。就和古人覺得的宇宙和我們現在認識的不大一樣。這個時代機械人發展的速度很快,我們應該能見證很多次 機械人 這個概念定義和範圍的變化。 力克胡喆 可能是之前受工業機械人的影響,而現在隨著技術的發展,以及一些機械人的設計開發,人形機械人逐漸進入人們的...