你怎麼看OpenAI Gym

時間 2021-06-01 12:31:06

1樓:Friedrich Yuan

我覺得主要有兩點:

For Benchmark

從計算機視覺領域的研究來看,題主的問題相當於在問:

你怎麼看待MS COCO資料集?這些大型資料集的出現,一步步造就了現在CV界的benchmark研究正規化。怎麼說明我的網路結構比你的好呢?

那我就需要在COCO等資料集上取得比你更好的表現。因為我無法從數學上嚴格證明這一點,所以我只能用實驗說話,用「事實」說話。反觀強化學習,雖然已知的數學背景要比CV多一些,但也沒法嚴格驗證乙個演算法比乙個演算法好,老掉牙的Q-LEARNING有時候還比SOTA的演算法好用。

因此,RL也需要乙個benchmark,通過大量的合理環境得出的實驗結果來驗證演算法的效能。要不然怎麼水文章???

2. For demonstration強化學習是乙個很抽象的東西,看不見摸不著,這不利於學科的發展(不利於「傳火」),你把bellman那一套東西往初學者面前一丟,直接勸退一大半。而GYM提供了視覺化的功能,只要呼叫render()函式,你就能看到自己的智慧型體是如何與環境互動和改進的,比起黑不溜秋的神經網路,看的見摸得著的東西總是讓人安心的。

婚前同居你怎麼看?

Leah 當身邊有批判和指責聲,當事人可以客觀判斷,有用的就聽,無用就過濾,努力生活還來不及,短暫的人生,什麼愛情婚姻啊,都只是其中一部分,值得自己欣賞的,就夸夸,看不慣的,就遠離,何必費心去謾罵網爆呢?勸人歸正而不是辱罵網爆!人的素質層次不齊,無法要求別人,那就管好自己。不論自己錯了還是遇到錯的人...

你怎麼看歐陽娜娜?

就說一件事,有一次在wb群裡聊天,忘記聊的啥提到了一句oynn,我擦,您猜怎麼著?群裡下起了大提琴雨!我 WTF! 水道渠成的自然養成的山茶花。長相偏甜,性格軟,完全不單純的白兔。也不用說是刻意撩男生,我感覺完全是自然流露的家庭教養,會很自然地獲得好感。別的女明星搞出來可能就是生硬的心機婊,但是她搞...

男女離婚你怎麼看

7ky1in 既然是結婚了,就是利益共同體!夫妻的收入就是共同財產!女方自己的父母生病,作為子女盡自己所能去做了是理所應當!如果是這錢借來的,該還是應當的!但如果是女方自己的錢,還把賬算在男方頭上這有點說不過去!法律上規定了贍養和撫養義務!離婚了孩子不管歸哪方,另一方都應該支付撫養費用!如題主所說這...