雀神!騰訊AI登頂國際麻將平臺:10.68段遙遙領先
快科技7月11日消息,AI早已不是一件新鮮事,生活中處處可見AI的身影,
此前有網友建議騰訊研發一個麻將AI,用這個技術就可以成為雀神,沒想到,騰訊還真的做了,甚至還拿了國際第一的成績。
今日,騰訊官方宣布,騰訊麻將AI在日本麻將天鳳平臺特上房達到穩定段位10.68段,刷新了AI在麻將領域取得的最好成績。
官方表示,這代表著騰訊研發團隊在決策AI方向上取得了業界領先的成績和突破。
據介紹,“天鳳”是知名日本麻將競技平臺,擁有較為體系化的競技規則和專業段位規則,全世界的麻將AI基本都在這里進行訓練和打段。
“段位”類似于《王者榮耀》,天鳳按照1段—11段來進行排位,10段就相當于《王者榮耀》的榮耀王者段位。
騰訊表示,由于麻將除了正常的摸牌、打牌外,還要決定是否吃牌、碰牌、杠牌以及是否胡牌,任意一位玩家的行為都會改變摸牌的順序,涉及大量決策。
傳統離線策略訓練方法、傳統的在線搜索算法對麻將來說并不完全適用,于是騰訊AI Lab提出了ACH(actor critic hedge)的新型策略優化算法。
據了解,該算法采用了基于強化學習和遺憾值最小化的自我博弈技術,使AI能從零開始自我學習和提高。
該算法具備傳統強化學習可擴展性好(算的快)的優點,又部分繼承了遺憾值最小化算法的一些理論性質(算的好),相比傳統的強化學習方法,該策略優化算法在非完美信息游戲中訓練得到的策略更平衡(攻守兼備)。
另外,不同于過去搜索與離線策略的結合方式,騰訊將搜索返回的結果作為一種“特征”輸入到自研的策略神經網絡,使得AI在有海量隱藏信息的游戲狀態中,仍可以實時調整當前策略。
騰訊稱,訓練麻將AI,其實就是在訓練AI更好地去認識人類的世界,最終讓AI能早日走進那些人類生活中,如金融交易、自動駕駛、交通物流、拍賣系統等,解決真實世界的復雜問題。
本站所有文章、數據、圖片均來自互聯網,一切版權均歸源網站或源作者所有。
如果侵犯了你的權益請來信告知我們刪除。郵箱:business@qudong.com