![](http://static.javashuo.com/static/loading.gif)
也許咱們之後能拜 AI 爲師學習打麻將算法
成爲雀壇冉冉升起的一代新星機器學習
![](http://static.javashuo.com/static/loading.gif)
在小說《圍城》中,錢鍾書先生曾這樣描述過麻將:學習
「麻將固然是國技,又據說最近在美國很流行,打起麻將,既能夠緩解思鄉之苦,又符合國際潮流。」人工智能
因而可知,自那時起,這一蘊含東方哲學和智慧的古老博弈遊戲早已風靡全球。3d
在今天,不管是逢年過節的熱鬧團圓,仍是平常小聚的茶餘飯後,隨時隨地,湊齊「四我的 一桌牌」就能打個熱火朝天。orm
可當這一項傳統技藝融合了現代Ai技術後,又該是怎樣一番場景呢?cdn
今年6月,「Suphx」成爲首個在國際專業麻將平臺「天鳳」上榮升十段的AI系統,這是目前AI系統在麻將領域取得的最好成績,其實力超越該平臺公開房間頂級人類選手的平均水平。blog
「十段」是什麼概念呢?遊戲
在「天鳳」平臺上,全球範圍內現役十段的人類選手僅十幾位。「Suphx」取得「十段」的成績,大體可至關於圍棋中「AlphaGo」挑打敗了李世石。開發
這是一個不凡的成績。
除了「Suphx」,還有另外兩個 AI 也獲准進入「特上房」比賽,分別是「爆打」和「NAGA25」。
目前,Suphx 是惟一一個達到「特上房」最高段位的 AI。
因爲單局麻將存在着很大的運氣成分,因此天鳳平臺會經過「穩定段位」來衡量一位玩家的真實水平。
在 5760 場比勝過後,Suphx 的穩定段位超過了8.7,不只高於「爆打」和 「NAGA」,還超越了頂級人類選手(十段及以上)的總體穩定段位。
![](http://static.javashuo.com/static/loading.gif)
這些成就意味着,「Suphx」在四個月內成長爲了最強日麻 Ai。日本麻將的愛好者和專業參賽選手,紛紛尋找着它背後的開發者,但一無所得。
![](http://static.javashuo.com/static/loading.gif)
「Suphx」 的官方社交帳號上,只有簡單的介紹
直到2019世界人工智能大會舉行,「Suphx」 的身世才被公諸於世。
微軟全球執行副總裁、微軟人工智能及微軟研究事業部負責人沈向洋博士對外宣佈,「Suphx」是微軟亞洲研究院的工做成果,由劉鐵巖博士帶隊研發。
從圍棋到德州撲克,再到麻將 AI,這幾年機器學習已經在「拼智力」這條路走了很遠。
那麼爲何微軟此次會選擇傳統的麻將遊戲做爲研發重點呢?
對此,微軟稱,與象棋、圍棋等棋類相比,麻將在遊戲對弈的過程當中存在大量隱藏信息,具備高度的不肯定性。
與其餘棋牌類遊戲相比,劉鐵巖將麻將形容爲比其餘棋牌類遊戲更「AI」, 由於麻將自己並無像其它類遊戲那樣經過控制鍵盤來決定出招快慢,它更多關注的是策略,把沒必要要的、人和機器的差異抹掉,體現的是智慧智能的做用。
所以,麻將的複雜度遠高於其餘棋類,對 AI 技術存在着特殊挑戰。
目前爲止,Suphx 在「天鳳」中只是在與人類選手對打,天鳳平臺CEO角田真吾在交流會上表示,將來會考慮將 Suphx 引入更高階的「鳳凰房」中。
可是出於「鳳凰房」中對戰的人數有限,引入 AI 將產生的影響還不肯定,所以會慎重考慮這一作法會帶來的影響,好比引入有大量 AI 進入,「鳳凰房」可能就不是原來的「鳳凰房」了。
爲了讓 Suphx 更加成熟,微軟將從哪些維度進一步推動呢?
劉鐵巖表示,麻將 AI 還有不少值得繼續研究的方向,好比因爲麻將遊戲有大量的隱藏信息,因此傳統的樹搜索的方式很難應用,微軟如今是以預測爲主而不是搜索爲主,這是 Suphx 團隊的一個方向性認識。
從更大的維度來看,搜索算法和預測算法結合也是一個值得研究的技術焦點,這對解決不少實際問題都有幫助。
另一個維度是微軟關心 的 AI 的可解釋性,Suphx 如今打比賽有着本身獨特的風格,但到底是什麼樣的風格微軟自身並不清楚,劉鐵巖表示這一方面是由於麻將 AI項目的研究員的麻將「修爲」比較淺,沒法像專業選手同樣能夠看懂Suphx的風格,另外一方面也是由於這個技術路線自己含有大量參數,須要經過很複雜的訓練產生,如何讓 Suphx 的模型有自解釋的能力,是微軟下一步的重點。
最後,劉鐵巖還提到 Suphx 最主要的訓練收益是經過線下(將近 2000 萬場)的自我博弈,數量遠遠超出線上數量(5000 場)。其中,線下自我博弈學到的信號數量不少,可是學到更多的是如何自我提高,可是 5000 場線上對弈中,系統能夠學到別人的打法、風格和實戰中解決問題的能力。
這兩類信號的做用各有千秋,而微軟正在考慮如何將兩者結合。這也是最近一段時間人工智能領域的新的研究熱點,即從人類或有經驗的玩家的行爲中進行抽象與海量的自我博弈結合。
正如洪小文所說:「遊戲一直是人工智能研究的最佳試驗田,訓練遊戲 AI 的過程能夠不斷提高人工智能的算法和人工智能處理複雜問題的能力。麻將 AI 系統 Suphx 的技術突破,對於探索及擴展人工智能算法的邊界是很是有益的嘗試。同時,麻將這類遊戲中的推理、決策過程與人類真實且複雜的生活更貼近,咱們但願經過對麻將 AI 系統的研究,提高人工智能在現實環境中解決複雜問題的能力,推進人工智能技術的發展。」
![](http://static.javashuo.com/static/loading.gif)