機械臂DRL控制為什麼集中在力矩控制？

1樓：Robot Seller

實名反對題主的問題。

我覺得吧。最終給到機械人機械臂關節的當然是力矩指令，但是不代表DRL給的就是力矩指令，我覺得大部分還是給的位置指令，在機械臂的實時控制器中進行位置控制。如下圖2例子：

而直接給力矩的話，如果你說的是完整的關節控制力矩，我個人覺得是不靠譜的，畢竟那就是典型的力矩控制，要算動力學而且以1000HZ頻率計算才能保證穩定性，誰家的DRL能算這麼快還基於影象的；而且目前學術圈能買到的開放力矩環的機械臂只有Franka， iiwa，可能還有倒閉的rethink，反正不多。

但是也不是說用DRL計算出力矩給控制器就是不行，可以少給一點嘛，比如residual reinforcement learning 就是這個思路，大部分基本的力矩還是動力學去算（其實慢悠悠的就只要重力項就好了），然後深度學習算出來的力矩加上去，也就是DRL的力矩控制了，但是要知道，DRL算出的力矩佔總力矩佔比不會很大，大了容易飛車，畢竟RDL更新太慢。

2樓：咯咯咯

我理解，action應該是我正在做什麼，而不是我將要變成什麼樣，因此最直接的動作就是力和力矩，或者說加速度。速度，位置都屬於動作的後果。並不是完全不能做action，而是因為有延遲，影響效果

3樓：側耳傾聽

純屬猜測，對快速性要求使然？畢竟位置資訊有180度相位滯後，再加上測量訊號滯後…

或者，我猜題主的研究領域是人工智慧？我估計這幫傢伙這麼乾有可能因為他們只關心有沒有模型，而不關心模型是什麼，是什麼是控制系統結構的問題。

機械臂DRL控制為什麼集中在力矩控制？

自控原理裡面閉環控制為什麼輸出要和輸入做比較？如果輸出跟隨輸入的話那傳遞函式又有什麼意義？

既然南韓娛樂圈被財閥控制，為什麼還能拍這麼多反應黑暗現實的電影

為什麼傳統認為機械人只是機械臂，而現代認為機械人是人形機械人？

其他用戶還看了：