人機大戰瘋狂一周,四季酒店究竟發生了什么?自媒體
騰訊科技 俞斯譯 3月16日韓國首爾報道
若干年以后,假如機器文明取代了人類,那么這場對決就像是萊克星頓傍晚的槍聲;假如我們像《瘋狂動物城》里的動物們一樣和諧地生活在一起,那么這將是兩種文明歷史上重要的章節。
從Koreana酒店出門,穿過兩個十字路口,向前走200米就是首爾最好的五星級酒店之一--四季酒店。早上10點出門,步行10分鐘,在酒店門口的報刊亭花1000韓元買一份當天的《韓國時報》,然后在灑店里一直呆到晚上7點,就是我過去一周每天的工作。
坦白說,“上下班”路上的20分鐘,是我所經歷的“瘋狂一周”中最乏味的部分。除此以外的每一分鐘,我都愿意再經歷一次。
1:4的比分,五場精彩絕倫的圍棋比賽,只是其中最為人所知部分,更多的故事,還隱藏在四季酒店深色玻璃幕墻的背后。對于這一周究竟發生了什么,我們或許能從之后Google DeepMind的紀錄片,或者是李世石的回憶錄中找到更多答案。
在這里,我希望通過一些現場的觀察,帶你完成記憶拼圖中最初的部分。一方面,作為一名旁觀者,我了解到的實在太少。另一方面,一切都發生得太快。
DAY1:AlphaGo小分隊的“伏擊”
一群穿著統一黑色T恤的年輕人,突然聚集在了國際媒體直播間門口。他們在相互擊掌、擁抱,臉上的笑容,就像是在圣誕節早晨得到了心儀禮物的孩子。
這是3月9日下午3點30分左右,就在幾分鐘之前,李世石出人意料地做出了投子認輸的決定,這也就意味著AlphaGo第一次擊敗了職業9段圍棋手。媒體們一齊擁向了十幾米外的長廊兩側,這里是李世石從比賽現場走到發布會房間的必經之路。
其中一個年輕人為了躲開一個從身邊匆忙跑過的媒體,往后退了一步。他對身邊的另一個戴眼鏡的哥們兒聳了聳肩,露出了一副“看我們干的好事”的神情。這時候,英文解說嘉賓Chris Garlock從媒體直播間走了出來。“太棒了,實在是太棒了。恭喜你們。”Garlock對這種小伙子說。在說這句話時,他似乎還沒有從剛剛的興奮中緩過來,當李世石投子認輸時,他一連喊了三個“wow”。
黑色T恤背上的AlphaGo字樣暴露了這群人的身份,他們正是來自DeepMind公司,開發了AlphaGo的那群人。就在幾分鐘之前,他們創造了歷史。
這是一支15人的小分隊,為了這次比賽特地從倫敦飛到韓國,從2月底開始,就住在四季酒店,為比賽做著各項準備。
George Van Den Driessche 和 Julian Schrittweiser 是兩位最主要的工程師,他們的主要任務,就是保證AlphaGo能在這里順利運行。“他們許多與系統相關的檢查,包括查看各個接口,準備備用方案。”DeepMind的創始人,CEO Demis Hassabis 告訴騰訊科技。除了工程師,這個團隊中還有人專門負責IT基礎設施。盡管韓國是全球網速第一的國家,但團隊仍然在酒店周邊鋪設了特別的網線,保證全球直播過程中的高速和穩定。
另一部分團隊成員則與Google的團隊一起,負責比賽的組織。不同顏色的號碼牌代表不同的權限,每一個區域交接處都有至少兩名安保人員站崗;直播間為國際媒體和DeepMind團隊專門預留座位,所有發布會和采訪時間的誤差均不超過10分鐘。
“我從來沒有見過組織比賽這么細致的,所有的事情都要排練好多次。”樊麾告訴騰訊科技。作為這次比賽的裁判,他從比賽前5天就來到了首爾,幫助小分隊一起準備。
更早的準備從半年前就開始了,AlphaGo的團隊在去年10月初給它做了一輪測試。在與歐洲圍棋冠軍樊麾的五盤棋較量中,AlphaGo以5:0完勝。包括比賽的過程,AlphaGo的算法原理,都以論文形式公布在了今年1月27日的《自然》(Nature)雜志上。幾乎是在同時,Google宣布AlphaGo的下一個對手將是世界冠軍李世石。
與其說是李世石輕敵,不如說是AlphaGo的團隊刻意隱藏了實力。與樊麾交手的AlphaGo被普遍認為只有業余5?6段的實力,根本無法挑戰李世石。盡管團隊表示AlphaGo每天都在進步,但包括李世石在內的所有人都不相信,人類棋手需要花費數十年取得的進步,這臺機器用五個月時間就能完成。
這也是為什么在賽前的新聞發布會上,李世石突然從原先自信滿滿預測的5:0獲勝,改口為可能不會全勝。直到那個時候,他才對AlphaGo這個對手有了更多的了解,作為職業棋手的敏感,他可能意識到了這個對手有所不同。
當然,除了DeepMind團隊本身,誰也沒有真的認真看待這個所謂的人工智能圍棋程序。直到所有人在大屏幕上看到李世石苦笑了一聲,然后把兩顆棋子放到了棋盤上,棄子認輸。
在半小時后的第一場賽后發布會上,AlphaGo項目的主要負責人David Silver和公司CEO Demis Hassabis、李世石一起上臺接受了采訪。而在離他幾米遠的地方,小分隊的成員們聊得正high。
發布會一結束,李世石匆匆離場。這個角落,被媒體團團圍住。
“伏擊”就此完成,他們成了英雄。
DAY2:第37手
即便是第一天李世石失利后,從媒體和棋手都表現得相對樂觀。沒有人懷疑李世石會拿下第二場,畢竟從第一場的情況來看,AlphaGo同樣出現了不少“失誤”。直到第二天比賽,確切地說是第37手的出現,所有人都傻了。
這其中就包括英文解說嘉賓麥克·雷蒙。他不敢相信自己看到的畫面,右手在空中足足停留了兩秒,其間四次扭頭看向電腦屏幕上的棋盤,才把一顆黑棋貼在了AlphaGo剛剛走的位置上。
作為一名職業9段的圍棋高手,雷蒙已經習慣了把自己的情緒隱藏起來。他是這次人機大戰的英文解說嘉賓,一本正經又慢條斯理的解說風格,有時會讓人犯困。不過一秒前他臉上的困惑以及隨后的嘴角上揚,都說明了賽場上發生了一件不同尋常的事,而這一切,剛好被掃過的特寫鏡頭逮到。
因為現場轉播信號的延遲,古力比雷蒙晚了一分多鐘才看到這一手棋。他的反應與雷蒙如出一轍,只不過更加激烈,“AlphaGo怎么會下這里?” 整個騰訊的直播間也因這一步棋炸開了鍋,國家圍棋隊總教練俞斌表示“反常規”,職業棋手唐奕覺得“是業余水準”,沒有人覺得這是一步“對”的棋。
李世石抽完本場比賽的第一支煙,回到座位上。他也看到了對手的這一步棋,第一次露出了疑惑的神情。不過這種疑惑持續了只很短的時間,隨后,他陷入了長時間的思考,臉色也變得越來越難看。“印象中我從沒見過職業高手下這樣的棋,李世石可能也沒有,所以看得出,他要好好考慮一下。”雷蒙評論道。
這一幕發生在“人機大戰”第二場比賽開始后50分鐘,AphaGo所下的第37手。
根據比賽的規則,每名選手都有兩個小時的常規時間,再此期間選手可以任意分配每一步棋的時間(10秒或者10分鐘)一旦時間用完,就要進入“讀秒”,每步棋考慮時間不能超過60秒。
李世石明白,第一場的失利很大程度上是因為自己下得太快,考慮不周全。在投子認輸時,他還有近半小時的常規時間,比AphlaGo少用了25分鐘。因此在第二場比賽中,他有意放慢了每一步棋的節奏,希望可以考慮得更周全。在這一步棋之前,他的總用時是25分2秒,比AlphaGo多用的5分鐘幫他換回了盤面上的一點優勢,于是他放松地起身,去抽了第一支煙。
AlphaGo無法感受到李世石心情的變化,所以這一步“怪棋”也不像只是簡單地想把當前的局面攪亂,而是跟前面的36步一樣,進行過分析后的決定。李世石明白這一點,也正是因為如此,他花了更多時間去思考這棋背后的“深意”。
“當你覺得它足夠厲害時,即使它真的下了一招爛棋,你也會覺得它有別的什么意圖,只是自己沒有看出來。然后你會越來越懷疑自己。”在回顧0比5輸給AlphaGo的心理變化時,樊麾這么告訴騰訊科技。
在賽后接受采訪時,作為裁判的他對AlphaGo的這一步棋贊不絕口。在此之前,他曾經說過“AplhaGo缺點是他無法理解圍棋之美”,但在這一刻, AlphaGo卻用自己的一步棋讓他體會到了其中的美和優雅。
麥克·雷蒙也感受到了這種“刺激”,他說經過這兩天的觀察,自己非常想和AlphaGo下一盤棋。“許多圍棋高手都會有自己習慣的套路,尤其是在布局階段。這樣做確卻更加穩健,但是下多了也少了許多變化的樂趣。”雷蒙說,“而這也是AlphaGo與眾不同的地方。”
15分37秒,這是李世石在這一步棋上花掉的思考時間。從結果上看,這一部棋并沒有對之后的棋局產生巨大的影響。但在下完這步棋后,他的用時已經比AlphaGo多了20分鐘。有意思的是,李世石比AlphaGo先讀秒的時間,也恰好是20分鐘。
在賽后的新聞發布會上,李世石用“完美”來形容他對手的表現。“我沒有找到它的弱點,所以我輸了。”李世石說。
DAY3:哈薩比斯的煩惱
哈薩比斯(Demis Hassabis)飛快地從會議室走出,朝我的方向走來,手里抓著一臺Macbook Air和一副蘋果耳機。還沒等我開口,他做了一個禮貌的拒絕手勢。一名工作人員緊跟在他身后,一臉緊張,不停地跟對講機說著話。
兩人來到連接6層和7層的旋轉樓梯口,停下來耳語了幾句。樓下不斷傳來嘈雜的說話聲和三角架相互的碰撞聲。哈薩比斯往下走了半層樓梯,讓自己保持在不會被看到的區域。然后像一名偵察兵一樣彎下腰,探出頭,開始觀察樓下“敵人”的情況。
他有些猶豫,似乎還有些懊惱,懊惱自己沒有早一點離開房間,悄悄地下樓。現在,他必須要穿過前方那個十幾米的區域,才能和他的組員們會合。
如果是四天前,哈薩比斯完全不用擔心這些。他和我一樣隨意地在四季酒店六層的公共區域穿梭,自由地選擇金槍魚三明治、蔬菜沙拉或是奶油大蝦等幾十種食物,一邊吃飯一邊和組員交談。沒有幾個人認得這張臉,更重要的是,沒有太多人真的關心DeepMind是個什么公司,AlphaGo是個什么東西。
而在AlphaGo贏得首場勝利之后,這個名字一夜之間出現在了3300篇韓國媒體的文章當中。等到第二次敗擊李世石時,哈薩比斯的照片已經登上了包括《朝鮮日報》在內的各大報紙的頭版,KBS、MBC、SBS等電視臺爭著想要對他進行采訪。
記者們努力練習著這個名字的正確發音,然后在發布會上高高舉起手,只是為了問這個不知道從哪里冒出來,小個子,戴著黑框眼鏡的英國人一個問題。
而就在哈薩比斯下樓的十幾分鐘前,由他領導的團隊所開發的人工智能圍棋程序AlphaGo在四天內第三次迫使世界圍棋冠軍,那個曾一度聲稱要5比0完勝的李世石投子認輸,從而也以3比0的比分,讓這次人機大戰的勝負失去了懸念。
現在的哈薩比斯,意味著版面、話題、收視率,他就是一個十足的K-POP明星。而他也遇到了所有K-POP明星都會遇到的問題,如何躲避媒體。
顯然,他還沒有完全適應這種情況。探了幾次頭之后,他終于準備走完另一半臺階,接受一輪閃光燈的掃射。但就在邁腿的那一刻,又想起了什么。他招呼身后的工作人員過去,把手上的筆記本和耳機遞給了她。像是準備經歷一場機場安檢,或者準備沖刺跑。
就在這個時候,他發現了佯裝下樓,一直躲在背后觀察他的我。為了掩視我的真實目的--當然,我覺得他心里肯定無比清楚--我開口說:“我可以從這里下去嗎?” “當然,你先下,你先下。”哈薩比斯回答道,同時讓出了半個身位。
于是我只好從他的身邊走過,下樓,隔著電梯間看到了對面一堆“長槍短跑”和幾十個包麥當勞薯條一樣擠在一起的記者和攝影師。有幾個可憐的同行看到有人下來,下意識地抬起了掛在胸前相機,才發現走過他們身邊的是個“冒牌貨”。
這時候,真正的主角哈薩比斯也跟著下了樓。兩手空空,腳步飛速,有些媒體還沒反映過來,他已經低著頭沖過了“封鎖”,一頭扎進了邊上的會議室中。
會議室大門被迅速關上,里頭傳來了歡呼和掌聲。
DAY4:“李世石!李世石!”
在韓國,李世石并不是一個招媒體喜歡的棋手。
“目中無人”、“口無遮攔”、“不尊重對手和前輩”,你可以在任何一個韓國圍棋記者口中得到這些形容李世石的話。在過去15年,這些標簽就像他的成績一樣耀眼,即使他現在已經比過去收斂許多,這些輕狂之言也時常會被翻出,雖然大部分時間僅僅是作為談資。
比如在2001年第5屆LG杯決賽中輸給前輩李昌鎬之后,年僅18歲的李世石卻說“在所有高手中,昌鎬的水平是最差的”,同樣在兩年后的LG杯中,李世石再一次語出驚人,他說自己心目中世界冠軍的候選中,沒有包括馬曉春。在對尊卑位份異常重視的韓國,李世石常常因此受到媒體詬病。
他還經常在大賽前做出樂觀的預測,2005年1月第二屆豐田杯,李世石與常昊冠亞軍決賽前,他聲稱自己“有65%至70%的勝算”,盡管當時雙方歷史交手的成績是1比4;2010年第12屆農心杯前,李世石面對10位中日高手,聲稱要取得“十連勝”。
即便在這兩年有所收斂,但是在接受Google AlphaGo的圍棋挑戰時,李世石仍然在第一時間表示,比賽將會是他以5:0取勝。
這一次,李世石不僅是代表韓國,而且是代表人類出戰。這個巨大的噱頭無疑刺激到了韓國媒體們的神經,只要他能贏,他說什么都行。
一時間,李世石以一種“民族英雄”的形象登上了報紙和電視的頭版頭條,所有的報道都在極力渲染這次比賽的重大意義,“從沒有見過這么多媒體如此關心一個圍棋選手和圍棋比賽”,一位跑了15年圍棋的韓國記者告訴騰訊科技。
這種關心的“保質期”并沒有想象得那么久,比賽當天那種300多家媒體涌進四季酒店,為了提前進場占據一個有力位置不惜提前一個小時排隊的盛況已經不再。來到現場的韓國媒體數量大概只有前一天的70%,中餐自助午餐的消耗速度也不像第一天那么快。
過去幾天里,每場比賽的賽后發布會,對李世石是另一種折磨。
你能看到他盡可能表現得讓所有人滿意,認真地傾聽和回答媒體的提問,即便有些問題比較刺耳,他也會禮貌的回復,或者用聰明的方式躲過。
但與同時,他一秒也不想在這個屋子呆下去。在沒有輪到自己說話,或者翻譯的時間,他的雙手拿著話簡,垂在兩腿之間,兩個大姆指來回打轉,眼睛會不自覺得看向他左前方一二排的方向,進行暫短的放空。只要與他有關的問題,就會立刻抽神回來,抬頭并保持嘴角微微上揚,看向提問者,進行回答。然后,又會進入新一輪的放空。
“很抱歉,我讓許多人失望了。雖然勝負已經沒有的懸念,但我還是希望大家可以繼續關注最后兩場比賽。”在連續三場輸給AlphaGo之后,這個世界上最高傲的棋手,只剩下了卑微。
李世石離場的時候,所有人為他送上了掌聲。他沒有抬頭,他只想快點離開這里。那個時候的他一定無法想象,就在24小時之后,當他再一次走進這個屋子的時候,他會受到完全不一樣的待遇。
比賽第四天,當坐在李世石對面,代表AlphaGo擺子的黃士杰(Aja Huang)將兩顆黑子放到棋盤上時,現場的兩個媒體直播室同時爆發出了巨大的觀呼聲和掌聲。現場鏡頭掃向黃士杰身邊的顯示器,棋盤的中央多了一個彈窗,上面寫著:AlphaGo Resigns (AlphaGo認輸)。
李智秀(Lee Jisoo)第一個從歡呼聲中反應過來,拿起相機就往外走。他大概20出頭,皮膚很白,只穿一件短袖T恤,T恤背面是一個準備出拳的拳擊手圖案,上方用英文印著一句“狀態正佳”。作為一名朝鮮電視臺的攝影師,對于現在應該去哪,他再清楚不過了。
他穿過長廊,找了一個自己滿意的拍攝位置,守在從比賽現場到發布會必須的這條路上。他把一只腳踩在小梯子上,如果有必要,他會站到這個梯子上以更高的角度拍攝。此刻,李智秀正在專心調試手上的佳能相機,在這么關鍵的時刻,他可不能讓設備出問題。
盡管離賽后發布會開始還有半小時,但現場的媒體席已經基本塞滿。媒體席的左右兩側也都架滿了攝影機,把整個現場圍了起來。與第三場比賽之后的安靜不同,此刻這里就像一個熱鬧的菜市場,當然,媒體們的表情也比前兩天輕松很多。
我在第三排左側中間找到了一個空隙擠了進去,一邊在筆記本上寫著待會兒準備提問的問題,一邊和邊上的韓國記者搭話。“謝天謝地,李世石終于贏了。”這是她跟我說的第一句話,“不然我都不知道要怎么報道了。”過去幾天,和李世石同樣處于煎熬的,還有不少這樣的賽前對他抱有巨大期待的韓國媒體。
這些情緒在積壓了幾天之后,在李世石進入發布會現場的那一刻徹底爆發。掌聲和尖叫持續了一分鐘,還有記者有節奏的喊著“李世石!李世石!”。他又成為了這個國家的英雄。
DAY5:一個兩歲的孩子
由于前四場1:3的比分,加上李世石剛剛在前一場取勝,第五場比賽的結果已經變得不那么重要。李世石希望用黑棋再贏一次,媒體們則期盼一個Happy Ending。
最終李世石還是沒有從AlphaGo手上拿到第二場勝利,總比分也定格在了1:4。李世石在賽后發布會上的發言,也超出了勝負和比賽的范疇,他開始談論AlphaGo改變了他對圍棋固有的認知,與此同時他也有點后悔,認為自己可以表現的更好,讓人類在與人工智能的較量中,有更多的可能性。
AlphaGo與以往所有人工智能程序的不同之處就在于,它不是簡單的“算”出最好的棋,而是試圖用人類的思考方式,去模似人類下棋的思維。而這種思考方式將是“通用”型的,你可以用來理解圍棋,也可以用來“理解”成千上萬的癌癥論文,做出最為科學的診斷;或是讓Siri愈發接近《她》里面那個性感的私人助理。
當哈薩比斯跟你討論起這些問題時,他會顯得異常嚴肅,同時兩眼放光。6年前,當他創立DeepMind這家公司時,他的目標就是“解決智力,然后用它解決其它一切。”(solve intelligence, and then use that to solve everything else)
戴維席爾瓦(David Silver)可能是最了解哈薩比斯的人之一。他倆同在1990年代的劍橋大學學習計算機科學,成為了好友,又同時喜歡上的人工智能和圍棋。一起創辦了一家游戲公司,開發了《共和國:革命》這樣優秀的游戲,游戲里的電腦角色要比以往聰明得多。
“當你開發電腦游戲的時候,你實際上只是在假裝人工智能,你需要做的只是讓游戲玩家覺得這些電腦玩家很聰明。但是,這與讓電腦變得智能是兩碼事。”David Silver告訴騰訊科技,于是在公司開門后,戴維和哈薩比斯都回到了學術界,戴維攻讀的是“增強學習”的博士,而哈薩比斯則對準了“神經科學”。
若干年后,這些知識都被注入了AlphaGo的“身體”里,哈薩比斯教會了它如何像人腦一樣思考,而戴維則讓AlphaGo可以像人類一樣強化學習。一定程度上來說,他們就是造物主。
在第四場比賽結束后,哈薩比斯被問到AlphaGo開發了多久,他說,“它還只是個兩歲的孩子”。
我不知道,AlphaGo會給我們帶來什么樣的驚喜。就像我不知道,這些雄心勃勃的年輕人,他們的極限到底在哪里。
我只知道,超越人類的,終究還是人類自己。沒有比這更令人興奮的事了。
1.砍柴網遵循行業規范,任何轉載的稿件都會明確標注作者和來源;2.砍柴網的原創文章,請轉載時務必注明文章作者和"來源:砍柴網",不尊重原創的行為砍柴網或將追究責任;3.作者投稿可能會經砍柴網編輯修改或補充。