您的当前位置:游戏狗新闻 > 人物访谈 > 正文

专访《游戏数据分析实战》作者黎湘艳 游戏人必备

2018-02-12 来源:Gamelook 作者:虚无 评论

在国内游戏业,PRAPA是最早的系统性的游戏产品数据分析模型,由盛大游戏在十几年前提出,且成为国内游戏业的事实标准。PRAPA意味着大量的数据分析工作,盛大游戏到底怎么做的?

中国游戏业持续多年高速增长、新人一茬接一茬入行,从业者多了、但知识却被摊薄缺乏沉淀,这一直是个严峻问题。

在国内游戏业,PRAPA是最早的系统性的游戏产品数据分析模型,由盛大游戏在十几年前提出,且成为国内游戏业的事实标准。PRAPA意味着大量的数据分析工作,盛大游戏到底怎么做的?最近,一本专业游戏业工具书《游戏数据分析实战》的出版,可谓解开了这个谜团,作者之一的黎湘艳正是有着多年从业历史的盛大游戏资深游戏数据分析师,该书系统性的梳理了游戏全生命周期的数据分析工作的内容,选用了大量真实案例来讲解,同时这本书也得到了盛大游戏高管的力荐。

《游戏数据分析实战》作者黎湘艳:干货满满,游戏业人手必备!

实际阅读本书后给其的评价是,“为游戏人架构数据分析的世界。”这可能是过去十多年出版的大量游戏类专业书中可读性、实战性、含金量最高的一本,甚至足以作为游戏人“人手一本”的必备读物。其不仅适合数据分析工作的人士阅读,也非常适合市场、运营、研发、策划人员了解数据分析工作的方式和方向。

在《游戏数据分析实战》正式出版之际,有幸采访到了该书的主要作者黎湘艳,其向行业讲解了这本书的情况,以及她对游戏数据分析工作的理解。

《游戏数据分析实战》作者黎湘艳

以下是采访实录:

首先问下,《游戏数据分析实战》这本书目前能通过哪些渠道购买到?

黎湘艳:这本书在当当、京东、亚马逊、天猫、淘宝,全国线下新华书店都能买到。这本书80%的内容是我来完成,20%是另一前同事叶洋撰写,我主要负责贯穿游戏生命周期的日常数据分析章节。

能否介绍下你在游戏业的从业经历?

黎湘艳:我2002年进入盛大游戏,2003-2008年分别在《传奇世界》研发团队、研发中心、技术保障中心任职过。2008进入数据中心,2013年到公司各个项目支持,亲历游戏从预热到公测一系列的数据分析工作,并且建立了自己的数据分析体系。2016年到手游事业部,负责游戏数据分析、数据挖掘、行业研究和用户调研的相关工作。

全书章节目录

数据本身是一种工具,要正确解读在于人对游戏的理解

游戏是一个创意产业,有人说数据驱动产品,比如之前有Zynga这样常常采取A/B Test来数据驱动的欧美游戏公司,但也有人对此有怀疑,你怎么看?

黎湘艳:A/B Test在国内游戏行业的确用的不多,主要原因是游戏做A/B Test的成本整体会比较高也比较耗时,比如产品迭代过程中的A/B Testt可能从设计多种因素的评估,这种A/B Test实验通常会比较耗时也比较复杂,可能涉及多种因素的评估,A/B Test最简单的实验只能解决一个因素的问题。

数据本身是一种工具,工具的使用方式方法各有不同,有些以专业角度出发,通过更理性的方式来运用和解读,有些则通过自身的经历以及感受为基础,数据对他们而言不过是一种出现判断正确时候的证明,正确解读的前提在于人本身对于项目的理解和需求。

一份完整的分析报告完成需多长的时间?如何对项目真正产生积极影响?

黎湘艳:一份完整的数据分析报告完成的时间主要取决于这份报告的深度和广度,因为报告的深度、广度、分析思路以及数据丰富度相关。数据分析有6个步骤,分别是明确需求->数据收集->数据处理->数据分析->数据展现->报告撰写。前五个步骤大约占用整个分析过程的80%的时间,报告撰写约占用20%的时间。

一份完整的数据分析报告完成时间,在没有需要大量复杂数据的前提下,一般在一天之内完成,如果有大量的数据,基本需要一周左右的时间。另外,熟悉业务,有数据分析经验,能大大缩短分析报告的撰写时间。

数据分析报告是否能对项目真正产生积极影响,取决于报告是否能击中业务痛点以及报告对象对报告建议的重视程度。比如:游戏预热期的用户调研,能找到目标用户的特点,发行人员是否会参考分析报告结果确定时间、地点及宣传方式。比如游戏封测期间的用户调研,能了解用户对游戏各项功能的体验评价及相关建议,在于研发人员是否采纳,是否以数据反哺研发;测算最优市场费用,能帮助项目合理分配资源,避免资源浪费。市场投放效果分析,能监控广告投放效果数据并结合各媒体的特性,在于发行人员是否通过数据去发行问题,调配资源,使其效果最大化;流失用户分析能找到用户流失点,在于研发人员是否根据数据来优化游戏;付费习惯分析能找到付费用户的特点,在于运营人员是否根据数据制定相关的活动,从而吸引更多的人来付费。总体而言,数据是否会产生积极影响不在于数据本身,而在使用数据的人。

撰写完数据报告后,分析师是直接给项目组反馈意见,还是由项目研发团队自己根据数据来做优化呢?

黎湘艳:这就看分析师对于游戏的理解。在做游戏分析时,我们一般是分析数据背后原因。而对于一些资深数据分析师,他们会结合自身对游戏的了解和用户特性,给到一些产品优化建议。至于这个建议是否采纳,还是在于看数据的人是否会真正的去运用数据,判断这个数据是否对游戏改进有帮助。

在游戏优化过程中,一些公司会出现越修改数据越差的情况,您认为主要问题是在哪?

黎湘艳:越改越差主要取决于提出意见的人,他本身对于游戏各个模块的数值是否足够了解。有可能修改了某个模块,在这个模块上是有调优,但游戏所有模块都是相辅相成的,可能导致其他模块出现状况,所以修改后整体数值并没有得到提升。

数据分析师的日常状态:单兵作战,跟踪游戏全生命周期

要做全游戏的各类数据报告,研发团队需要提供哪些基本的工具?数据分析团队需要多大的规模?

黎湘艳:分析师会在游戏上线前会提前跟游戏研发团队沟通,设计数据埋点,我们公司有专门的大数据团队,提供数据计算和查询的支持,用到的工具主要是hive、spark。spark主要用于实时计算和离线计算,Hive是日常的数据查询工具。

我们的数据分析团队规模是跟随游戏数量变化的,团队人均负责3-4款游戏。在游戏测试期间和刚公测期间,工作量非常大,基本上每个人主要负责一款正在上线的游戏。

在产品数据优化过程中,哪些部分数据改善可能性是最有效的?

黎湘艳:关于游戏改进上,我们一般会在测试期做一些分析。比如用户分析,这其中就包括付费用户和流失用户分析。这类分析结果都游戏改进的提升比较大。

游戏公司普遍比较关心付费用户的反馈,这类用户如何去把握他们的反馈意见?

黎湘艳:关于大R用户的反馈意见,首先我们会通过游戏内的一些数据知道他们的一些付费习惯和具体的付费情况。其次,我们有一些大R的QQ群,通过聊天记录分析他们对于游戏的诉求,然后提供一些建议给相关工作人员。第三,我们有专门的大R客服部门,会定期与这些大R沟通维护。

这本书中大量的案例是怎样的选取标准?能否当作业内人士可参考的真实项目数据?

黎湘艳:本书的案例均来自于实际工作。案例本身是真实的,有成功案例、也有失败案例,涉及卡牌、RPG、音乐、MMO、FPS等游戏类型。但对数据做了一些调整,其中一些趋势数据可以作为真实项目的数据参考。

案例选择的标准是具有一定的代表性且涉及的游戏类型多样化。比如本书中的用户调研案例就是一款射击类游戏的真实项目数据,覆盖游戏各个内容,这样便于读者理解。

版本更新效果分析章节案例选取的是上线后数据有明显变化的版本;活动效果分析选取的是涉及活动内容多,且能说明不同活动效果差异的案例; 开新服效果分析选取是一个不能盲目依赖数据,需要深度挖掘了解数据上涨的真正原因的案例。

而聊天纪录分析则是选取了三种不同的数据来源,含游戏内聊天、QQ群聊天和贴吧发帖记录。流失用户分析和渠道质量分析案例和书中提到的数据分析方法5W1H法和综合评价法紧密结合。

您认为日常数据分析团队工作主要聚焦于哪些问题?哪些部分该高频研究?哪些需要做定期研究?

黎湘艳:日常数据分析团队工作主要聚焦主要有四大块:

1、贯穿游戏整个生命周期的数据体系工作,从预热->封测->公测各个节点的主要数据分析工作在本书中有提到。

2、各个游戏项目的数据需求,这块工作比较零散,但是时效性和重要度非常高。

3、行业研究,从宏观上把握市场发展趋势,及时发现市场热点,帮助公司在游戏生态圈中更好的定位,协助游戏发行。

4、数据模型的建立和优化,挖掘用户特点构建用户画像、预估人数和收入。

和测试节点相关的日报和周报,和版本相关的版本更新分析,活动效果和市场投放分析,以及项目组需求是高频观察的。

对于行业研究(这其中包括畅销榜各类型游戏变迁、国内和国际市场用户规模、各游戏财报收入和利润等)是定期观察的。

玩家问卷调查,如何保证调研的质量?

黎湘艳:首先对于问卷调研的数量上我们有要求,至少要有500-1000的样本才能支持数据结果的参考性。其次,在筛选这些调研结果时,我们会做一些问题排查,尽量保证这些样本里没有乱填的用户。第三,我们在做调研时,会给予一些奖励,促使玩家认真参与。

调研的目的就是找到目标用户,为游戏提供一些优化建议。从调研工作本身而言,可以贯穿游戏整个生命周期,每个节点和每次调研的目的各不相同。虽然调研可以在各阶段进行,但实际上并不意味着每款游戏各个节点都需要调研,还是看游戏本身的需求来进行。比如做预热时,我们需要找到目标群体,每款游戏基本都会有这个过程。游戏在测试期和公测期对于玩法的一些建议调研,这方面就根据不同游戏自身的状况来决定。对于一些引进的游戏,我们无法做二次开发时,做玩法建议调研对于产品并没多大帮助,更多的是匹配我们所理解的数据与玩家反馈数据是否一致。

本书一部分内容是对产品现状的数据分析,还有一部分内容则是对产品未来的预测,实际预测准确率怎样?

黎湘艳:关于收入预测的准确率,一般要结合样本数量来看,大数据预测模型的样本数量要求是10万以上的数据量。我们更多还是根据整体数据趋势以及运营经验来预估,其准确率与实际结果还是很接近的。

给入行新人的建议:学好统计学和软件,熟悉游戏热爱游戏更易上手

做游戏数据分析工作有没有学科专业上的要求,和技能要求?如果不是统计学科班出身的同学,你有什么建议?

黎湘艳:首先专业上,如果是数学、统计学和计算机相关专业,都能快速的上手,并且成长的比较快。

但是在技能上,需要具备:

1、扎实的SQL基础;

2、熟练使用Excel;

3、有统计学基础;

4、至少掌握一门数据挖掘工具和语言(R、SAS、Python、SPSS);

在掌握以上技能的基础上,如果深入了解业务,和项目团队紧密沟通,通过数据分析输出的结果,及时有效地反馈到游戏项目,能形成良性和有效的循环。

如果不是统计学科班出身的同学,建议一定要自学统计学,如果觉得看书太枯燥,可以看公开课的统计学课程。实际工作中的分析模型可以说都是来自于统计学基础模型和方法论,因此掌握数据分析的统计学基础知识是必须的,这也是在招聘数据分析师岗位时要求应聘者具有统计学知识的原因。

了解统计学基础的目的是为了数据建模吗?你认为软件技能重要、还是建模能力更重要?

黎湘艳:统计学一方面是为了建模打基础,另一方面统计学是数据分析理论和依据。如果没有学统计学,有一些数据规律你无法去描述并深入应用。如果你学了统计学,这些问题都会迎刃而解。

您认为对于刚入行的新手来说是直接做数据分析师合适还是先在其他岗位熟悉下?

黎湘艳:数据分析岗位也能兼顾了解其他产品,数据分析师如果自身就非常热爱游戏,了解游戏,就没必要去其他部门先了解产品了。如果是有产品运营和研发经验的人员转行做分析师时,会有一些经验加分,他们本身对游戏就非常了解,能在最短的时间内熟悉业务,解读数据。