集微网消息,网络舆情是社会舆情在互联网空间的映射,是社会舆情的直接反映。传统的社会舆情存在于民间,存在于大众的思想观念和日常的街头巷尾的议论之中,前者难以捕捉,后者稍纵即逝,舆情的获取只能通过社会明察暗访、民意调查等方式进行,获取效率低下,样本少而且容易流于偏颇,耗费巨大。
而随着互联网的发展,大众往往以信息化的方式发表各自看法,网络舆情可以采用网络自动抓取等技术手段方便获取,效率高而且信息保真(没有人为加工),覆盖面全。
在游戏的开发和运营过程中,通过各种方式收集游戏用户对游戏的反馈信息也是一项非常重要的工作。通过对收集到的这些信息进行分析,不仅可以挖掘玩家的需求、了解游戏用户的喜好,也可以观察游戏用户近期对某个游戏的态度,对游戏玩法的喜好。凭借这些信息,战略制定者可以调整游戏的方向,游戏开发团队可以改进游戏内容。可以说,游戏用户的反馈信息对于一个游戏团队来说是非常重要的参考。
今天带来的就是网易的和游戏舆情监管有关的一项发明专利。早在14年12月22日,网易就申请了一项名为“游戏舆情的检测方法及系统”的发明专利(申请号:201410805964.3),申请人为网易(杭州)网络有限公司。
根据目前公开的专利资料,让我们一起来看看这项游戏舆情专利吧。
如上图为游戏舆情的检测方法流程示意图。
首先,采集网络文本中的舆情数据,这里使用的是爬虫技术,通过爬取包括微博、论坛中的帖子、好友社交网页中的内容,来完成收集数据,并且保存在数据库中。
其次,对所述舆情数据进行分词,获得所述网络文本中的词语。基于游戏词语词库和停用词词库,采用结巴分词,对所述舆情数据进行分词,获得所述网络文本中的词语。
在完成分词后,查询预先建立的游戏关键词词典,从分词得到的词语中找出游戏关键词,保留具有游戏关键词的网络文本,过滤掉与游戏内容无关的网络文本,提高游戏舆情检测的效率。
接着,根据预先建立的情感词典,计算游戏关键词的情感值,具体包括:查询预先建立的情感词典,判断游戏关键词的修饰词语是否为情感词。情感词典为存储多种情感词及其对应的权值的数据库,修饰词语为游戏关键词与其所在的网络文本的句首之间的词语。若修饰词语为情感词,则读取情感词对应的权值;根据权值,计算所述游戏关键词的情感值。
最后,再根据所述网络文本中的游戏关键词,采用贝叶斯分类算法对网络文本进行分类,获得网络文本的类别。游戏关键词是基于关键词分类训练集来进行分类的,而关键词分类训练集可根据需求预先设置,如关于游戏漏洞的类别,关于游戏装备的类别等。
以上就是网易的游戏舆情检测方法,很多人都在吐槽游戏中的种种不文明行为,而这样的专利,就恰恰可以解决这样的问题,帮助监管游戏内不文明行为,创建一个良好的游戏环境!