成人午夜激情影院,小视频免费在线观看,国产精品夜夜嗨,欧美日韩精品一区二区在线播放

AlphaGo再下一城,是否代表已經(jīng)誕生了真正的智能?

2016-03-11 21:48:17來源:機器人網(wǎng)作者:

在剛剛結(jié)束的圍棋人機第二場比賽中,AlphaGo執(zhí)黑再下一城,原來對李世石抱有很大期望的圍棋界人士信心受到重創(chuàng),。那么問題來了,AlphaGo再下一城,這是否代表真正的智能已經(jīng)誕生?

在剛剛結(jié)束的圍棋人機第二場比賽中,AlphaGo執(zhí)黑再下一城,原來對李世石抱有很大期望的圍棋界人士信心受到重創(chuàng),同樣作為職業(yè)九段的選手,柯潔甚至在第二場比賽未結(jié)束時就表示,現(xiàn)在只希望李世石贏一場扳回面子就好。那么問題來了,AlphaGo再下一城,這是否代表真正的智能已經(jīng)誕生?

\

AlphaGo:是黑科技,但不神秘

可以這樣說,AlphaGo代表了當(dāng)今最先進的人工智能,它基于深度學(xué)習(xí)算法,只能模擬人類神經(jīng)元的行為模式,從一種輸入得到一種輸出結(jié)果。雖然這是一種黑科技,但是并沒有什么神秘的東西在里面。

\

上圖是深度學(xué)習(xí)的基本模型,就是模擬人的神經(jīng)元軸突建立過程。當(dāng)前的問題是深度學(xué)習(xí)軟件模擬神經(jīng)元,效率非常差。除非有憶阻器這種突破性技術(shù),完全的重構(gòu)計算機技術(shù)架構(gòu)。這種技術(shù)要求一個單元能與數(shù)十萬個其他單元建立物理連接電路,并且能不斷更新。想象下如果有模擬一億個神經(jīng)元。每個神經(jīng)元模擬100萬個連接。就是100萬億條線路。人腦有800億個神經(jīng)元。能達到人類一樣計算能力的深度學(xué)習(xí)機器要能產(chǎn)生8萬億條線路。GOOGLE的DEEP MIND要匹敵人腦的判斷能力,可能背后需要數(shù)萬顆高度集成的記憶單元的超級電腦集群來支持的。如果有一天這種技術(shù)得到普及,那么計算機會到達人一樣高速識別圖像和視頻等功能。當(dāng)然,ALPHAGO是智能的。因為它能模擬人腦的部分功能,實現(xiàn)一種類似人腦模式運算部分的功能,也可能模仿人類的行為惟妙惟肖,但是如果你要是問里面這里面會不是產(chǎn)生意識。答案是絕對沒有。

ALPHAgo不可能產(chǎn)生任何自我意識。任何人工智能連意識的邊都沾不上。實際上已知技術(shù)中,除了跟妹子造人,產(chǎn)物能產(chǎn)生意識之外。還沒有任何路徑可以產(chǎn)生有意識的產(chǎn)品。

人的大腦分兩個部分。一部分(大腦皮質(zhì))負責(zé)產(chǎn)生意識。一部分負責(zé)記憶、運算。DEEP MIND這種深度學(xué)習(xí)算法模擬的是后者。但對于前者,我們?nèi)祟愡一無所知,連理論方向都沒有,更不要說模擬了。

AlphaGo利用兩個大腦贏了李世石

AlphaGo是通過兩個不同神經(jīng)網(wǎng)絡(luò)“大腦”合作來改進下棋。這些大腦是多層神經(jīng)網(wǎng)絡(luò)跟那些Google圖片搜索引擎識別圖片在結(jié)構(gòu)上是相似的。它們從多層啟發(fā)式二維過濾器開始,去處理圍棋棋盤的定位,就像圖片分類器網(wǎng)絡(luò)處理圖片一樣。經(jīng)過過濾,13 個完全連接的神經(jīng)網(wǎng)絡(luò)層產(chǎn)生對它們看到的局面判斷。這些層能夠做分類和邏輯推理。

\

這些網(wǎng)絡(luò)通過反復(fù)訓(xùn)練來檢查結(jié)果,再去校對調(diào)整參數(shù),去讓下次執(zhí)行更好。這個處理器有大量的隨機性元素,所以我們是不可能精確知道網(wǎng)絡(luò)是如何“思考”的,但更多的訓(xùn)練后能讓它進化到更好。

第一大腦: 落子選擇器 (Move Picker)

AlphaGo的第一個神經(jīng)網(wǎng)絡(luò)大腦是“監(jiān)督學(xué)習(xí)的策略網(wǎng)絡(luò)(Policy Network)” ,觀察棋盤布局企圖找到最佳的下一步。事實上,它預(yù)測每一個合法下一步的最佳概率,那么最前面猜測的就是那個概率最高的。你可以理解成“落子選擇器”。

\
落子選擇器是怎么看到棋盤的?數(shù)字表示最強人類選手會下在哪些地方的可能。

團隊通過在KGS(網(wǎng)絡(luò)圍棋對戰(zhàn)平臺)上最強人類對手,百萬級的對弈落子去訓(xùn)練大腦。這就是AlphaGo最像人的地方,目標(biāo)是去學(xué)習(xí)那些頂尖高手的妙手。這個不是為了去下贏,而是去找一個跟人類高手同樣的下一步落子。AlphaGo落子選擇器能正確符合57%的人類高手。(不符合的不是意味著錯誤,有可能人類自己犯的失誤)

更強的落子選擇器

AlphaGo系統(tǒng)事實上需要兩個額外落子選擇器的大腦。一個是“強化學(xué)習(xí)的策略網(wǎng)絡(luò)(Policy Network)”,通過百萬級額外的模擬局來完成。你可以稱之為更強的。比起基本的訓(xùn)練,只是教網(wǎng)絡(luò)去模仿單一人類的落子,高級的訓(xùn)練會與每一個模擬棋局下到底,教網(wǎng)絡(luò)最可能贏的下一手。Sliver團隊通過更強的落子選擇器總結(jié)了百萬級訓(xùn)練棋局,比他們之前版本又迭代了不少。

單單用這種落子選擇器就已經(jīng)是強大的對手了,可以到業(yè)余棋手的水平,或者說跟之前最強的圍棋AI媲美。這里重點是這種落子選擇器不會去“讀”。它就是簡單審視從單一棋盤位置,再提出從那個位置分析出來的落子。它不會去模擬任何未來的走法。這展示了簡單的深度神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)的力量。

更快的落子選擇器

AlphaGo當(dāng)然團隊沒有在這里止步。下面我會闡述是如何將閱讀能力賦予AI的。為了做到這一點,他們需要更快版本的落子選擇器大腦。越強的版本在耗時上越久-為了產(chǎn)生一個不錯的落子也足夠快了,但“閱讀結(jié)構(gòu)”需要去檢查幾千種落子可能性才能做決定。

Silver團隊建立簡單的落子選擇器去做出“快速閱讀”的版本,他們稱之為“滾動網(wǎng)絡(luò)”。簡單版本是不會看整個19*19的棋盤,但會在對手之前下的和新下的棋子中考慮,觀察一個更小的窗口。去掉部分落子選擇器大腦會損失一些實力,但輕量級版本能夠比之前快1000倍,這讓“閱讀結(jié)構(gòu)”成了可能。

第二大腦:棋局評估器 (Position Evaluator)

AlphaGo的第二個大腦相對于落子選擇器是回答另一個問題。不是去猜測具體下一步,它預(yù)測每一個棋手贏棋的可能,在給定棋子位置情況下。這“局面評估器”就是論文中提到的“價值網(wǎng)絡(luò)(Value Network)”,通過整體局面判斷來輔助落子選擇器。這個判斷僅僅是大概的,但對于閱讀速度提高很有幫助。通過分類潛在的未來局面的“好”與“壞”,AlphaGo能夠決定是否通過特殊變種去深入閱讀。如果局面評估器說這個特殊變種不行,那么AI就跳過閱讀在這一條線上的任何更多落子。

\
局面評估器是怎么看這個棋盤的。深藍色表示下一步有利于贏棋的位置。

局面評估器也通過百萬級別的棋局做訓(xùn)練。Silver團隊通過 復(fù)制兩個AlphaGo的最強落子選擇器,精心挑選隨機樣本創(chuàng)造了這些局面。這里AI 落子選擇器在高效創(chuàng)建大規(guī)模數(shù)據(jù)集去訓(xùn)練局面評估器是非常有價值的。這種落子選擇器讓大家去模擬繼續(xù)往下走的很多可能,從任意給定棋盤局面去猜測大致的雙方贏棋概率。而人類的棋局還不夠多恐怕難以完成這種訓(xùn)練。

增加閱讀

這里做了三個版本的落子選擇大腦,加上局面評估大腦,AlphaGo可以有效去閱讀未來走法和步驟了。閱讀跟大多數(shù)圍棋AI一樣,通過蒙特卡洛樹搜索(MCTS)算法來完成。但AlphaGo比其他AI都要聰明,能夠更加智能的猜測哪個變種去探測,需要多深去探測。

\
蒙特卡洛樹搜索算法

如果擁有無限的計算能力,MCTS可以理論上去計算最佳落子通過探索每一局的可能步驟。但未來走法的搜索空間對于圍棋來說太大了(大到比我們認(rèn)知宇宙里的粒子還多),實際上AI沒有辦法探索每一個可能的變種。MCTS做法比其他AI有多好的原因是在識別有利的變種,這樣可以跳過一些不利的。

Silver團隊讓AlphaGo裝上MCTS系統(tǒng)的模塊,這種框架讓設(shè)計者去嵌入不同的功能去評估變種。最后馬力全開的AlphaGo系統(tǒng)按如下方式使用了所有這些大腦。

1. 從當(dāng)前的棋盤布局,選擇哪些下一步的可能性。他們用基礎(chǔ)的落子選擇器大腦(他們嘗試使用更強的版本,但事實上讓AlphaGo更弱,因為這沒有讓MCTS提供更廣闊的選擇空間)。它集中在“明顯最好”的落子而不是閱讀很多,而不是再去選擇也許對后來有利的下法。

2. 對于每一個可能的落子,評估質(zhì)量有兩種方式:要么用棋盤上局面評估器在落子后,要么運行更深入蒙特卡羅模擬器(滾動)去思考未來的落子,使用快速閱讀的落子選擇器去提高搜索速度。AlphaGo使用簡單參數(shù),“混合相關(guān)系數(shù)”,將每一個猜測取權(quán)重。最大馬力的AlphaGo使用 50/50的混合比,使用局面評估器和模擬化滾動去做平衡判斷。

這篇論文包含一個隨著他們使用插件的不同,AlphaGo的能力變化和上述步驟的模擬。僅使用獨立大腦,AlphaGo跟最好的計算機圍棋AI差不多強,但當(dāng)使用這些綜合手段,就可能到達職業(yè)人類選手水平。

\
AlphaGo的能力變化與MCTS的插件是否使用有關(guān)

這篇論文還詳細講了一些工程優(yōu)化:分布式計算,網(wǎng)絡(luò)計算機去提升MCTS速度,但這些都沒有改變基礎(chǔ)算法。這些算法部中分精確,部分近似。在特別情況下,AlphaGo通過更強的計算能力變的更強,但計算單元的提升率隨著性能變強而減緩。

然而,AlphaGo還遠不是真正的人工智能

AlphaGo獲勝,讓很多人心里更加惶恐,不久的未來,機器人是否就會取代大部分人類的工作,甚至?xí)y(tǒng)治人類呢?從AlphaGo目前的水平來看,這是不可能的,先給大家一個安心的結(jié)論,AlphaGo還遠不是真正的人工智能,也沒有誕生真正的智能,會下圍棋跟誕生智能是兩碼事情,下棋很厲害的人工智能跟真正的類人智能AI也是兩碼事情。

重新回到這場備受矚目的人機大戰(zhàn),讓我們來好好分析一下AlphaGo到底是怎么下棋的。

首先,自我對弈幾千萬局得出阿爾法狗面對李世石可以秒落子,這個并不嚴(yán)謹(jǐn)。AlphaGo只是個引擎,它的那幾千萬局自我對局訓(xùn)練跟這次下棋比賽是完全不同的。訓(xùn)練的時候AlphaGo是連接著全球最豪華的谷歌云網(wǎng)絡(luò)數(shù)據(jù)、云計算網(wǎng)絡(luò),有數(shù)千臺服務(wù)器來協(xié)助它進行對局訓(xùn)練,以達到快速提升的目的。而這次比賽中AlphaGo是被禁止聯(lián)網(wǎng)以防止作|弊,純粹依靠自身來應(yīng)對局面。顯然這二者進行時它的運算能力是完全不同的,實際上AlphaGo也并沒有出現(xiàn)所謂的秒落子的情況,當(dāng)然它計算所花的時間是極短的著是毫無疑問的。

其次,秒落子這件事本身并沒有多么可怕,這個是建立在計算機強大的計算性能上的,與AI的智能程度也沒多大關(guān)系。圍棋的規(guī)矩擺在那里,就算李世石落一子,電腦跟著秒落子。然后呢?然后他還是要等李世石落下一子之后它才能接著下,不存在說不給李世石思考的時間。就算你是秒下,人家并不是,圍棋是回合制,你再快下完了也得等人家接了才能走下一步。

從實際來看也是如此。至于消耗的時間本身也不難理解,硬件性能和算法本身都有個局限性在那里,所以對于計算機來說,它既可以可以秒下,也可以計算無限長的時間。

舉個例子,如果是給一道數(shù)學(xué)計算題,要人和電腦算結(jié)果。人要算十分鐘,計算機一秒不到就夠了,這是確確實實計算能力的差距,因為這道題結(jié)果是唯一的,是有標(biāo)準(zhǔn)答案的。但圍棋不同,不存在你一秒鐘找到了個最優(yōu)解,因為本來就無所謂最優(yōu)解,后續(xù)有無窮的變化。花費的時間短,只是計算考慮的情況就越少。當(dāng)然花費的時間多,算得越多,也不代表就越正確。

所以這個思考時間說明不了什么,這里本來就是機器的長處所在,算得比人類快很正常。如果算的時間長也只能說明它計算得更詳細更復(fù)雜以力圖尋求更好的可能,也屬正常。

所以說,AlphaGo所謂的“思考”,本質(zhì)上還是跟人類棋手一樣的。只是在模擬和預(yù)測之后棋局的變化,這跟我們所說的超級人工智能的思想有本質(zhì)區(qū)別。這里是超級電腦在專業(yè)領(lǐng)域戰(zhàn)勝人類的問題,那是類似著名的“故意不通過圖靈測試”的AI人性化問題。

從這個比賽,目前只能看出AlphaGo下棋厲害,而沒看出來它多么像人。它目前沒有什么違反常理的行為,它體現(xiàn)出來的強大是在純憑邏輯分析推算的能力上強大無比,但是其原理并非類人人工智能,并沒有表現(xiàn)出感情,它仍是冰冷的機器。它獲勝了,也就獲勝了,沒有自己給自己斷個電來壓壓驚。

注意——人工智能邏輯分析和計算決策等能力變得比人類厲害,和人工智能變得更像一個真正的人類,這二者是有區(qū)別的。AlphaGo顯然不屬于后者的情況,它的誕生和發(fā)展是并不是為了變得更像一個真人,而是承擔(dān)著在計算機擅長的領(lǐng)域代替人類完成那些受限于人腦計算能力所不能解決的運算決策問題的重任。它下棋已經(jīng)足夠優(yōu)秀,但是離廣泛實用的計算平臺還差得遠。但是畢竟是巨大的進步,它的未來是作為人類的助理,去處理那些純邏輯分析的問題;而不是作為人類的伙伴,來跟你交流對話。

所以,AlphaGo目前還只是個下棋機器而已。棋手跟它下棋與跟人下棋也是不同的。下棋本身也是一種交流,這個很多大師都講過,稍微對圍棋文化了解的人也都知道。圍棋的魅力絕不僅僅在于計算。對局也是一種交流,棋手的性格、心態(tài)也會影響落子的判斷,對于對手的心態(tài)、性格的估計也會計入對局的考量,這并非純理性思考的競賽,這也是圍棋比賽和棋手實力的一部分。然而在AlphaGo面前這些都不存在,它無所畏懼也不會緊張。李世石也不需要去考慮AlphaGo有什么想法。這是比下棋,并不是比畫畫或者寫詩。

所以這壓根不能算是個討論AI是否真正誕生智能的例子,我們也無需擔(dān)憂。AlphaGo代表的是另一個領(lǐng)域的顯著進步,代表的是未來全新的前景。但就像李開復(fù)所說的一樣,我們真正要擔(dān)心的,是這些繁瑣的計算和思考都可以由電腦來完成之后,當(dāng)臟活累活都可以被機器代替之后,人類會不會變得不思進取,無所事事而開始墮落放縱。

李開復(fù)表示,AlphaGo雖然很厲害,但是說白了其實還是一個聰明的機器,擁有高速的思考和運算能力,會幫助我們在購買股票、醫(yī)療等領(lǐng)域有很好的幫助。不過機器終歸沒有情感,只是人類工具而已,所以我們主要需要利用人工智能創(chuàng)造更大的商業(yè)和科技價值。

關(guān)鍵詞:AlphaGo機器人
主站蜘蛛池模板: 衡山县| 交口县| 克什克腾旗| 大港区| 新平| 黑河市| 湟中县| 长岭县| 舞阳县| 昌图县| 凌源市| 南木林县| 哈密市| 兴仁县| 永顺县| 梁山县| 九龙县| 象州县| 宜良县| 项城市| 武定县| 游戏| 石楼县| 海淀区| 原平市| 枞阳县| 尉氏县| 华安县| 改则县| 禹州市| 浦县| 保德县| 都匀市| 宜丰县| 高青县| 巴南区| 项城市| 成安县| 古田县| 江陵县| 建始县|