摘 要函數
本文介紹了計算機博弈的不徹底信息博弈的基本概念,對比分析了徹底信息博弈和不徹底信息博弈的模型差別,並詳細探討了不徹底信息博弈模型在計算機博弈引擎決策、對戰平臺和棋譜標準等領域的應用。工具
關 鍵 字佈局
不徹底信息;計算機博弈;模型優化
0 引言編碼
人工智能領域對計算機博弈的研究由來已久。徹底信息博弈是計算機博弈研究者最先關注的一個方向,目前已經取得了巨大的成就。1997年IBM 計算機DeepBlue 打敗了國際象棋世界冠軍卡斯帕羅夫,首次向世人展現了計算機人工智能在複雜的棋牌智力遊戲上打敗了人類。2017 年Google 程序AlphaGo 打敗了圍棋世界第一人柯潔,再一次在這個被稱之爲世界上最複雜的智力遊戲上超越了人類。人工智能
與徹底信息博弈不一樣的是另外一種博弈,遊戲雙方並不徹底掌握決定勝負所需所有信息。典型的不徹底信息博弈遊戲項目有幻影圍棋、軍棋、橋牌、鬥地主、德州撲克和麻將等。這些項目因爲每一個玩家掌握的信息都不完整,所以在較短的對局過程當中,很難做出準確的判斷或對即將造成的局面有準確的估值。加密
1 計算機博弈的信息徹底性
1.1 徹底信息博弈spa
徹底信息博弈是指每一個博弈遊戲參與者對各方參與者全部信息都準確掌握。好比象棋遊戲,每一個玩家不只知道本身的棋子大小和位置,也知道對手棋子大小和位置;再好比圍棋遊戲,每一個玩家都知道雙方的所有棋子位置。所以,這類遊戲的人工智能研究更關注對規則的描述和計算,以及搜索的優化。設計
1.2 不徹底信息博弈blog
另外一類博弈是徹底信息博弈技術不能解決的,被稱爲不完備信息博弈。博弈參與者只掌握己方信息,卻不清楚對方的信息,形成博弈狀態信息隱蔽、不可見。好比,在二人軍棋遊戲中,每一個玩家只知道己方棋子的位置和大小,以及對方棋子的位置,可是不知道對方棋子的大小;還有一種幻影圍棋,玩家只掌握本身的棋子位置,不知道對方的棋子位置。這些遊戲都須要裁判完成信息的溝通、規則的檢驗和勝負的斷定。與徹底信息博弈相比,不徹底信息博弈更復雜、更有現實意義。
在傳統徹底信息博弈項目的計算機對戰中,影響勝負的因素對雙方都是信息完備的,研究者更多的重點放在戰法策略研究和搜索速度優化方面。不徹底信息博弈項目的計算機對戰中,除了按照規則合法獲取對手信息之外,若是經過其餘非法途徑獲取更多信息則會嚴重致使遊戲的不公平。例如,在不少即時策略類單機遊戲中,遊戲設計者爲了彌補人工智能的短腳,不惜爲機器一方提供更多信息,使玩家處於信息劣勢,從而勉強維持遊戲的平衡性。
在兩個或多個程序採用統一對戰平臺系統的狀況下,爲了提升博弈效率,一般將多方信息存儲在統一平臺上,這些信息對單獨的參與者程序是不透明的。
3 不徹底信息博弈模型的應用
3.1 對戰引擎的設計
經過對幻影圍棋博弈模型的分析,能夠發現信息空間和收益函數之間存在較大的聯繫。在9 路圍棋中,選手要吃掉對方孤立的棋子是比較困難的,由於位於棋盤中央附近的孤立的1 個棋子要被對方4 個棋子圍住才能被吃掉。所以被吃一方只要在對方圍住本身的第四個棋子落下以前及時鏈接逃跑就有很大機會存活。而在幻影圍棋中,因爲玩家掌握的信息不完備,玩家沒法及時瞭解本身孤立的棋子是否已經處於危機,所以把本身的棋子連在一塊兒的防護佈局策略比鬆散進攻佈局策略一般更有優點。
一樣的,在二打一(鬥地主)中,因爲不能事先知道其餘參與者手中的牌和底牌的分佈,所以玩家不能樂觀地認爲本身叫牌成功後,底牌必定會對本身有幫助。也不能肯定其他34 張牌是如何分配在另外兩位玩家手裏的,是否會組成更強的牌。所以多數玩家會在手中的牌有很大的優點或成功率時纔會叫牌,而不是高於平均水平就叫牌坐莊。不少資深玩家在初期信息不足的狀況下,每每寧肯不使用炸彈而失去高分,也要避免因爲對手牌的分佈恰好不利於本身而由得變失。
在研究中發現,因爲不徹底信息博弈中信息的不對稱性,每每要付出很大的代價來換取信息,在設計引擎時要仔細考慮所付出的代價是否與帶來的收益相符;同時,在設計棋譜時,也要側重與信息的描述,這樣的棋譜實際應用價值更高,閱讀者獲取的收益也會更大。
3.2 博弈規則、對戰平臺和交互協議的設計
計算機博弈研究中比賽是檢驗研究成果的主要方式。爲了提升比賽效率,每每須要使用獨立的比賽對戰平臺系統,加載比賽選手引擎完成對局。可是因爲不徹底信息的特徵,所設計的平臺須要充分考慮對須要保護信息的特殊須要。所以,對戰平臺應該準確區分哪些信息是能夠提供給哪些玩家的,哪些信息是須要加密保存的。在設計選手引擎與裁判平臺交互的協議時,也要把握好交換信息的尺度,對各類棋位和棋子或牌花色點數進行高效的編碼。
博弈遊戲是人們對智力的鍛鍊工具,博弈遊戲的規則要知足如下的兩個條件。
(1)博弈規則對遊戲雙方儘可能是公平的。
(2)博弈結果應儘可能避免平局。
在設計軍棋計算機博弈規則時,考慮到傳統軍棋規則並未對消極防護有任何懲罰約定,因此不少選手傾向於不進攻對方,使對局很容易陷入平局。
2020年 第10卷 第2期 機器博弈專題