明知AlphaGo變得無法戰(zhàn)勝,柯潔為何還迎難而上?

圍棋如同所有競技賽事一樣,柯潔也是專業(yè)的運動員。對于運動員來說,勝敗乃兵家常事,面對實力懸殊很大的對手,任何人都很難取勝?,F在柯潔面對的就是這樣一個對手。
明知AlphaGo變得無法戰(zhàn)勝,柯潔為何還迎難而上?
柯潔與AlphaGo對弈

   柯潔輸了,在與AlphaGo的第一場對決中,以四分之一子的落后惜敗。

  這個結果在很多人意料之中,其中也包括柯潔。

  第一場賽后發(fā)布會上,柯潔直言AI的進步速度太快了,并且每一次都是巨大的進步。這也是為什么他在大賽前夕發(fā)布微博稱,此次將是他與人工智能的最后三盤對決。

  柯潔心中已經清晰的知道,人類已經無法戰(zhàn)勝AlphaGo。他形容AlphaGo越來越像“圍棋上帝”,想贏它只能去找一些BUG,但目前,他還沒看到AlphaGo的任何弱點。

  這里引用搜狗CEO王小川在知乎上發(fā)布的內容,再向大家科普一下AlphaGo。

  去年的AlphaGo 混合了三種算法,即蒙特卡洛樹搜索+監(jiān)督學習+增強學習。

  其中蒙特卡洛樹搜索是一種優(yōu)化過的暴力計算;監(jiān)督學習,是通過學習3000萬部人類棋譜,對六段以上職業(yè)棋手走棋規(guī)律進行模仿,也是AlphaGo獲得突破性進展的關鍵算法;而增強學習作為輔助,是兩臺AlphaGo從自我對戰(zhàn)中學習如何下棋。

  每當獲取棋局信息時,AlphaGo 會根據策略網絡探索哪個位置同時具備高潛在價值和高可能性,進而決定最佳落子位置。在分配的搜索時間結束時,模擬過程中被系統最頻繁考察的位置將成為AlphaGo 的最終選擇。

  簡單來說,AlphaGo下棋依靠的是概率,而概率的得出則依靠前期學習。而這次與柯潔對戰(zhàn)的AlphaGo相較于去年,已經判若兩人。

  最初的AlphaGo主要依靠監(jiān)督學習,即學習對象幾乎全部來自人類棋手,而新版的AlphaGo則強化了增強學習,主要對機器自我對弈產生的棋局進行學習。

  難怪柯潔會覺得,去年AlphaGo的下法還很接近人類,但今年自己對戰(zhàn)時,AlphaGo已變得更加不合乎“常理”,下了很多人類棋手不可能下的棋子。

柯潔與AlphaGo對弈
  第一局結果

  DeepMind創(chuàng)始人、AlphaGo之父Demis Hassabis證實了這一點,他說與柯潔對戰(zhàn)的AlphaGo更多的是根據自身學習,對人類數據的依賴性越來越小。

  除了開始脫離人類數據,更讓人類望塵莫及的是其恐怖的進步速度。我們常說要“取長補短”,AlphaGo則可以把這個過程加快成百上千倍。

  取長方面暫不多說,AlphaGo的研發(fā)團隊一直在找它的缺口。去年輸給李世石之后,他們回去馬上改善了AlphaGo的知識缺口,并且投入更多精力去改進算法,讓AlphaGo變得更強。

  這次的AlphaGo在算法上就強大了很多。去年,AlphaGo還是通過分布式的計算機來運作,而今年只用了一個單一的機器。所以,柯潔非但沒有讓AlphaGo的CPU因為飛速運轉而發(fā)熱,相反,今天的AlphaGo的計算能力比去年要小10倍。

  從比賽用時上來看,柯潔幾乎是AlphaGo的兩倍。雙方第一場比賽共耗時4小時17分37秒,其中柯潔用時2小時46分43秒,AlphaGo用時1小時30分54秒。

  學的又多又快,人類棋手確實很難看到勝算??聺嵰部吹搅诉@一點,但他為什么還要應戰(zhàn)。

  這也是普通網友最關心的問題了,柯潔的輸贏到底是否需要將其上升到“人類尊嚴”這種高度?答案肯定是不能。

  圍棋如同所有競技賽事一樣,柯潔也是專業(yè)的運動員。對于運動員來說,勝敗乃兵家常事,面對實力懸殊很大的對手,任何人都很難取勝。

  現在柯潔面對的就是這樣一個對手。所以對于比賽接下來的關注點不該是柯潔能否勝一局,而是AlphaGo所代表AI技術將為人類帶來什么。

  目前來看,AlphaGo已經顛覆了傳統的圍棋??聺嵲诒荣愔幸矅L試了一些“非常規(guī)”下法,他認為AlphaGo已經改變了自己很多最初的看法,現在覺得比賽中沒有什么棋是不能下的。

  Demis Hassabis在賽前的致辭中說道,圍棋的樣式變化繁多,可能再過一萬年,人類也無法窮盡圍棋的打法。

  而AlphaGo可以作為一個工具,通過它去幫助人類對于圍棋的理解,讓偉大的棋手去發(fā)現圍棋更多的奧妙。

  這確實是一種很奇妙的感覺。當你認為一件幾乎是唯一的事情,突然有了另外一種可能,這就像哥倫布發(fā)現新大陸后,給未來開啟了一扇新的大門。

  柯潔說活到現在,最大的榮幸是和AlphaGo進行了對戰(zhàn),很感謝能有這樣的對手。他從AlphaGo身上獲得了很多比賽的快樂,這種快樂來自于競技,而非結果。

  比賽結束以后,柯潔更希望把AlphaGo當做幫助自己提升棋藝的工具。在人與機器之間,他選擇跟人類下棋,他笑著說,“我跟人類比賽的勝率還是可以的。”
讀者們,如果你或你的朋友想被手機報報道,請狠戳這里尋求報道
相關文章
熱門話題
推薦作者
熱門文章
  • 48小時榜
  • 雙周榜
熱門評論