機(jī)器人如何學(xué)習(xí)人類?
人工智能一直是一個很熱門的話題。搜狗CEO王小川在近的一次演講中,介紹了機(jī)器是怎么學(xué)會思考的。
機(jī)器人學(xué)習(xí)人類的過程,一共分三個階段。
個階段,我們把人已經(jīng)懂得的規(guī)則交給機(jī)器。這是開始的方法。程序員把規(guī)則寫成一個代碼交給機(jī)器,告訴機(jī)器什么數(shù)據(jù)要怎么處理。比如我們要做一個電飯鍋,寫好一個程序,到了103度,電飯鍋就會跳閘。所以傳統(tǒng)的機(jī)器學(xué)習(xí),就是人告訴機(jī)器求解的方法。但這里有個問題,很多時候我們自己都不知道方法是什么。比如人臉識別這個技術(shù),你想讓機(jī)器認(rèn)出張三的臉,但你怎么告訴機(jī)器這就是張三的臉,眉毛是粗的還是臉是方的?我們發(fā)現(xiàn)很難用一個技術(shù)把人臉識別出來。
這時候就到了第二個階段,我們不告訴機(jī)器方法,只告訴機(jī)器問題和對應(yīng)的答案是什么,讓機(jī)器進(jìn)行學(xué)習(xí)。比如人臉識別,我們只要告訴機(jī)器這是張三的臉,那是李四的臉,不用告訴機(jī)器為什么這個臉是張三或者李四的。機(jī)器通過大量的數(shù)據(jù)訓(xùn)練就能夠?qū)W會。去年開始圖像人臉識別機(jī)器超過了人,準(zhǔn)確率超過了人一倍。谷歌機(jī)器人學(xué)圍棋就是這么學(xué)的,把人類棋手六段以上對弈的30萬盤棋放在機(jī)器面前,告訴他在什么局勢下,人是怎么落子的。機(jī)器不僅把這30萬盤棋學(xué)會了,它在這個過程里面還產(chǎn)生了對類似問題的分析能力,所以棋局變了之后,它也能根據(jù)以前的經(jīng)驗去做判斷。
第三個階段,只給機(jī)器人目標(biāo),而不是告訴它怎么做,這是演進(jìn)中很重要的一步。機(jī)器學(xué)習(xí)人下棋的方法,后戰(zhàn)勝人,這是一個超越進(jìn)化的路徑。但谷歌還在做另外一件事情,讓機(jī)器不學(xué)人的下棋方法,隨機(jī)落子,自己和自己下,然后告訴它輸贏,看能不能進(jìn)化出來一臺跟人走棋風(fēng)格完全不同的機(jī)器。這就像一個人在中原學(xué)會了所有武功,把它融匯貫通,然后再進(jìn)行提高;另外一個人從來沒有來過地球和中原,卻要學(xué)武功,你說它的武功跟人會一樣嗎?這是人類所好奇的,看看重新開始會出現(xiàn)什么智慧。