DS200TCQAG1BHF
DS200TCQAG1BHF
DS200TCQAG1BHF
環(huán)境中尋找目標
16年,李飛飛組放出了一篇論文,基于深度強化學(xué)習(xí),在以目標圖像為輸入的情況下,不建圖去找東西。大致思路是:根據(jù)機器看到的圖,決定怎么走,然后再看圖,再決定新走的一步,直到找到東西。論文將目標圖像作為輸入,訓(xùn)練出來的神經(jīng)網(wǎng)絡(luò)具有通用性。
這種方式找東西更接近人的思維。訓(xùn)練出的控制器并沒有記住物體的位置,更不知道房屋的結(jié)構(gòu)。但它記住了在每一個位置,通向各個物體應(yīng)該怎么走。
機器人抓取
傳統(tǒng)的機器人學(xué)研究認為,需要非常清楚要抓取的物體的三維幾何形狀,分析受力位置和力的大小,再反向計算機器手如何一步步移動到這些位置。但這種方式抓取不規(guī)則形狀和柔性物體會很困難。例如毛巾,可能需要看成一系列剛體的鏈接,再進行動力學(xué)建模分析,但是計算量比較大。而小黃鴨那樣的橡膠,外部并不能看出彈性程度,難以計算出需要施加的正確的力。
PieterAbbeel、DeepMind和OpenAI關(guān)于機器人控制的研究,都以此深度強化學(xué)習(xí)為基礎(chǔ)?;趶娀瘜W(xué)習(xí)進行機器人抓取,以機器視角看到的圖像為輸入,以機器終抓到物體為目標,不斷對機器進行訓(xùn)練,從而在不建模和不做受力分析的情況下,實現(xiàn)對物體的抓取。PieterAbbeel已經(jīng)展示過機器人疊毛巾,開瓶蓋,裝玩具等復(fù)雜的動作。
不過基于強化學(xué)習(xí)也仍有很多問題,如效率低、推理過程長、任務(wù)難以描述、不能終身學(xué)習(xí)、不能限度從真實世界獲取信息等。其中一些通過meta學(xué)習(xí),one-shot學(xué)習(xí),遷移學(xué)習(xí),VR示教等方法的引入得到了改善,有些則還暫時難以解決。
Bussmann 170M1571
Bussmann 170M3466
Bussmann 170M6546
Bussmann 170M6419
BUSSMANN 170M5258
Bussmann 170M5952/5953/5954/5955/5956/5957/5958
Bussmann 170M6421
BUSSMANN 170M6146/6147/6148/6150/6151
BUSSMANN 170M7062/7063/7102/7103/7122/7123
BUSSMANN 170M5566/5567/5568/5518/5467/5468
Bussmann 170M6494/6495/6496/6497/6498/6499/6500/6501
Bussmann 170M6418/6468/6469/6518/6519/6568/6569/6393
BUSSMANN 170M4145/4146/4147/4195/4196/4197
Bussmann 170M5195/5196/5197/5198/5199/5200
Bussmann 170M6188/6189/6190/6191/6192/6193/6194/6195
Bussmann 170M5018/5068/5167/5168/5217/5218
Bussmann 170M5241/5242/5243/5244/5245/5246/5247
BUSSMANN 170M3558/3559/3560/3561/3562/3563/3564/3565
BUSSMANN FWP-60B