盤點大數據在遊戲行業中的應用

本文來自網易雲社區算法

伴隨應用商店和社交網絡的興起,遊戲市場規模空前擴大,大數據和人工智能對於遊戲運營特別是延長產品壽命的積極做用愈加明顯。但什麼樣的數據有價值?如何更有效的利用數據的價值?以及人工智能具體能夠將遊戲行業顛覆到何種程度?都逐漸成爲遊戲行業共同關注的問題。那麼,遊戲企業能夠利用大數據爲本身帶來些什麼?大數據爲遊戲行業帶來了哪些變革?後端

基於玩家所產生的海量數據,咱們怎樣去獲取玩家的具體畫像、他們的特色以及預測他們將來的一些行爲以服務咱們的運營、發行以及研發過程當中的一些系統改造? 微信

咱們圍繞畫像展開。網絡

舉個例子,若是一我的玩CS,他是一個狙擊手,狙擊手最想要什麼?衝鋒槍。那麼,若是咱們沒事送他點別的,他可能以爲這個遊戲對他不太友好,這種贈送就沒有爲遊戲帶來什麼價值。若是咱們能利用數據對玩家進行分類,好比分爲高活躍用戶、中活躍用戶和低活躍用戶,而後分發一些活動,那就可能引起他們的付費慾望。可是這個分層作得並不完全,由於一個類別中,他們的行爲模式會很不同,咱們能不能經過研究玩家的具體行爲,而後將行爲模式類似的用戶彙集起來?好比一款動漫遊戲,咱們將它分爲三個維度,遊戲、社交、元素,遊戲是指我被這款遊戲的系統吸引了,社交是指身邊有人在玩因此來玩和留下,元素是指被遊戲中的哪一個動漫元素吸引而加入。架構

可能那些關注元素自己而忽略另外兩項的用戶是迷弟迷妹類型的,關注遊戲自己的用戶多是聚焦遊戲類型的,而有一些交際型的用戶,那它們可能更注重各類遊戲裏有沒有他的好朋友。運維

對於關注元素的這一類,咱們是否是應該抓內容、抓劇情、世界觀?再也不是單維度描述玩家,是多維度。機器學習

 

提到多維度就不得不說起一個概念——聚類。模塊化

聚類比簡單的分類更多維。聚類是對玩家未知的分類,比常規的維度要多,會對活躍度、消費、玩法、參與、社交等等進行評估、打分。聚類至關於將N個散亂的點經過機器學習的算法聚爲一類,這一類的點之間會是最類似的。學習

經過多維度的分析,經過聚類,從一個未知的角度去分析,咱們能夠發現一些比較難發現的用戶特色,咱們能夠從用戶那裏獲得更多能夠爲咱們借鑑的東西。大數據

舉個例子,定位潛在的流失玩家和潛在的付費玩家,付費玩家和流失玩家在遊戲中都會有本身的必定的行爲模式,咱們能夠經過分析這些行爲模式從而去構建模型,而後將這個模型應用到咱們那些未流失、未付費玩家身上,看一下他們這些玩家的行爲模式、行爲軌跡和模型中的這些玩家行爲軌跡、行爲模式有什麼類似之處,若是類似度很是高,那咱們能夠認爲這個玩家未來也有可能會流失,可是目前尚未流失,這個時候就給咱們留下一個時間窗口,咱們能夠在流失以前去定位這個用戶,去幹預和挽留,而不是在它流失以後經過發短信、發郵件去挽回,這會爲咱們減小成本。

固然還有從系統分析的角度,好比由於能夠經過分析不少數據,例如玩家升級、觀察駐留率,包括人家喜歡哪些道具,喜歡你的哪些商品等等,從而幫助咱們去改變遊戲裏的一些不平衡的地方或者被玩家詬病的地方。

遊戲行業將會產生很是多的數據。遊戲行業對大數據的需求是最迫切的。拿現階段來講,一款遊戲從研發到運營,全部的成本回收都要靠運營。運營怎麼作?這就要依託數據作指導。在遊戲行業運營指標是很是多的,有200多個,因此咱們很是重視數據行業。遊戲行業是離錢最近的行業,是商業模式最清楚的行業。

 

如何應用大數據在遊戲行業產生實實在在的價值?

遊戲數據的構成分爲四個層面:

第一層是論壇媒體的數據,這是遊戲外的數據;

第二層是運營數據;

第三層是玩家的行爲數據,玩家登錄了、聊天了、釋放技能了等等,這些都會以日誌的形式記錄下來,這個數據量是很是恐怖的。

第四層是業務常規數據。

從大的方面來看,遊戲的數據構成能夠分爲遊戲外和遊戲內,遊戲內的遠大於遊戲外的。

 

遊戲外數據

遊戲外的數據咱們能作哪些事?

一、情感識別:在採起玩家發言的時候,能判斷玩家的態度是正面仍是負面。

二、話題檢測:自動對一段時間內新增的帖子進行檢測,而且概括出玩家討論的熱點話題。以便讓運營者清楚的瞭解玩家的狀態。

三、畫像追蹤:經過玩家的發言、資料,分析玩家擁有什麼樣的特徵。

四、輿情監控:監控玩家,好比在出現bug、外掛的時候第一時間進行警告。

五、事件預警:不少突發事件都是從論壇裏爆發的,若是咱們沒有及時發現,形成的損失是很是大的,或者說是致命的。

六、立項調研:好比遊戲有哪些須要改進的地方,市場怎麼樣,這些均可以進行挖掘。

 

遊戲內的數據

一、數值系統合理性評估:一款遊戲在內測期間數值體系是否是有漏洞、生產線怎麼樣、精密系統有沒有問題,這些都是能夠進行合理性評估的。

二、玩家眷性聚類:經過算法自動把玩家歸類。

三、系統關聯性分析:各個系統之間有什麼關聯,是很是經常使用的算法。

四、流失玩家預警:玩家有沒有流失,將來某個時段有沒有流失的風險,這些均可以計算出來。

五、遊戲健康度評估:綜合判斷整個遊戲各類指標是否健康,尤爲是在平臺運營數據較多的時候,能夠給咱們一個比較正確的全局指導。

六、潛在付費玩家定位:經過分析付費玩家的特色,去匹配潛在的付費玩家。

七、玩家行爲預測:基於以上的特徵把玩家分類,就能夠預測玩家的行爲。這能夠幫助遊戲在精細化時,有比較系統科學的決策依據。

其實能夠作的遠遠不止這些,咱們能夠從玩家行爲中判斷他是否是外掛,是否是異常玩家。還能夠經過玩家的行爲數據和聊天記錄,分析這個玩家是否是騙子,有沒有作非法的事情。


對於產品來講,獲取的數據越多越好,數據被放棄的理由主要有兩種:一,遊戲版本增長了生化對戰模式,只實行一個月,一個月以後這個模式沒有了,數據就會自動消失。二,數據量比較大,使用率比較低。從數據管理層面給產品進行反饋,說明這個數據意義不大,存儲浪費不少空間。
數據的重要性,更多的是指遊戲用戶行爲關鍵的數據,例如能影響到遊戲運營的關鍵環節:活躍仍是流失,或是付費等。這些數據關係到遊戲內部的核心運營數據,就會要求遊戲開發商必須上報,不然將沒法提供標準化、模塊化數據經營分析的基礎服務。因此,每次跟遊戲開發作對接的時候,會給一個標準化、必要的日誌模板,剩下的日誌能夠選擇性上報,根據遊戲的運營節奏適當的增長或減小。

在電商或者微信領域,場景比較單一,更多的經歷放在推薦場景上。而遊戲裏的場景多種多樣,變化很快,在遊戲內產生的行爲規則也很是多,數據的維度或擴散的度量也不少。如何經過實時運算來保證在清晰的實時規則指標下快速清洗完,反饋到遊戲裏來作實時干預,是相當重要的。以《王者榮耀》爲例,十一活動的時候,一天最高峯每秒鐘日誌量超過一百萬,對於後端來講,既要把一百萬承接下來,又要作實時計算,還要把實時計算反饋到遊戲裏,這個過程須要作不少優化,包括採集端、存儲端、傳輸端,還有實時計算。


大數據架構在底層來講必定是一致的,也沒有太大區別,遊戲中也有所謂的精準推薦,也有實時規則。包括如今比較火的如何把分析作的更快,必定是結合到本身產品的實際場景當中來作相關的區分,舉個例子,在電商平臺購物,用戶關注的物品,平臺就會爲用戶作推薦,甚至跳過任何一個網站,都能看到以前瀏覽的產品。電商平臺會把用戶的行爲推給第三方,在登陸第三方平臺的時候,若是用戶確實在以前買過這個產品,就會受到彈出的方式的不停干預。互聯網任何一個網頁裏面均可以實時的干預用戶。實際上電商已經作好了模型,這個網站已經有這個模型作所謂的廣告推薦的方式。

一樣在微博產品中,一些內容諮詢的推薦,例現在日頭條,產品推薦、內容推薦是比較核心的,基於用戶和用戶看到的文章不停地作模型訓練,這樣就能夠不停地加實時規則向用戶推薦。
對於遊戲,實際上也是如此。遊戲有不少渠道,不只是遊戲內,還有平臺渠道:微信手Q,官網等,將這些渠道分層,例如官網,遊戲用戶在上面去點,就會把規則類嵌到平臺或者營銷渠道里,思路和方法都是同樣的,只是說如何利用大數據架構把這種推薦放在合適的遊戲和營銷場景裏來,幫助產品或平臺作更多的精細化運營。若是數據作不到實時與產品和遊戲相結合,提供給產品更多的大數據的增值精細化服務價值,那麼最後大數據服務可能只是數據諮詢服務了。
平臺內遊戲急速增加,遊戲個數多;數據源異構化突出,數據量大;一遊戲一世界,數據抽象模型困難。如何利用大數據技術幫助產品快速、有效的實現遊戲數據精細化運營?這些都是擺在遊戲大數據應用面前的問題。

大數據的架構大同小異,基本上都包含採集、傳輸、存儲、計算、應用,還有相關數據挖掘。在遊戲特定場景下有一些應用的服務痛點和想要突破的問題。在遊戲大數據應用服務高頻營銷場景中,須要用戶行爲的實時規則。遊戲內和遊戲外咱們所涉及到的相關技術包括:機器學習、數據挖掘、文本婉拒、天然語音處理和深度學習。其中深度學習尤其重要,是很是強大的武器。
遊戲數據分析能讓遊戲開發商、渠道、分發平臺都能實現精細化運營。


網易猛獁大數據平臺做爲一站式的應用開發和數據管理平臺,經過大數據開發套件,將數據開發、任務運維、自助分析、數據管理、項目管理等工做經過工做流的方式有效的串聯起來,提供敏捷易用的用戶操做界面,下降了大數據分析的使用門檻,顯著的提升了數據開發工程師和數據分析師的工做效率。猛獁大數據平臺在電商、音樂、雲課堂學習、企業工業製造等領域已普遍應用,基於持續的需求驅動,經過多行業的業務驗證,同時豐富全面的組件,提供完善的平臺能力,知足不一樣類型的業務需求。基於猛獁大數據平臺成熟而穩定的大數據分析處理技術,對海量數據進行ETL分析,實如今營銷過程當中針對特定場景提供精準化銷售行爲。

點擊免費試用

相關文章
相關標籤/搜索