数据科学家蹭热度,看谷歌百度腾讯如何用数据分析乌克兰战争的(如何借助数据分析做好产品运营)

咱们今天基于新闻舆情,看一看搜索热度指数相关的内容,看如何用数据衡量新闻热度的现状与趋势。主要看Google trends(谷歌趋势)、百度指数、微信指数这三大产品的数据表现及产品化设计。

 一夜之间,俄罗斯乌克兰就开战了;一个午觉之间,乌克兰全军覆没了……


战情发展过于迅速,这次的热点咱们得蹭一蹭。我一个搞数据的,咋蹭热点呢?咱们今天基于新闻舆情,看一看搜索热度指数相关的内容,看如何用数据衡量新闻热度的现状与趋势。主要看Google trends(谷歌趋势)、百度指数微信指数这三大产品的数据表现及产品化设计。




01

Google Trends


首先看一下谷歌在搜索热度上的产品化设计



Google Trends 是谷歌旗下的一款数据工具,主要用于探查某个或者某组搜索词的数据表现、地理位置等。网址:trends.google.com。不过国内朋友们应该需要翻墙才能上。所以我就多截图,方便朋友们了。


(1)热度走势


首先,Trends 可以洞察某个关键词的搜索热度走势。我们这里选取UKraine(即乌克兰)和Russia(即俄罗斯),来看看该关键词的搜索热度情况(这里的分析截图时间是2月24日晚9点)。


过去90天搜索热度走势:



过去24H搜索热度走势:



可以明显看出,这俩关键词在1月20多号有一波热度上涨,然后就是最近几天开始暴涨。24日10点多达到高峰。这个和咱们的大体感受比较吻合。


谷歌这里对数据是进行了指数化的,指数化后的取值范围为0-100,热度100代表了最高。而且这里的100只能在当前图表里进行对比分析,跨图表的热度数值分析是无意义的,因为量纲不一样。所以这里的指数化本质上是0-100标准化进行的数据处理。



因此,这里只能分析趋势。需要对比只能在当前图中添加对比关键词,才能有对比意义。


这个逻辑我觉得对于数据呈现非常好,避免了极大值极小值的出现。但是对于不太懂数据逻辑的用户,我估计可能会出现错误使用。大家可以参考借鉴。


(2)地域分布


下面是搜索该关键词的地域分布,这里的关键词是Ukraine。



搜索热度最高的几个国家竟然是德国、卢森堡、奥地利。看来这几个邻国的民众对于乌克兰战争比较担心啊!


乌克兰为啥不是最高呢?可能乌克兰的民众已经顾不上搜索新闻了……而且关键是,乌克兰会用俄语搜索吧,哈哈~(是的,谷歌这里的不同语言是不一样的,因为我不认识俄语,就只能输入英文了)。



注意一点,这里的热度是相对热度,有点类似TGI的意思。由于不同国家使用Google的情况不一样,肯定不能用绝对热度。因此这里采用了相对热度是非常合理和科学的。


(3)相关搜索


再来看一下和该关键词(Ukraine)相关的搜索关键词表现。



这里分了相关主题查询和相关关键词查询。基于搜索量上升还是搜索热度,可以进行两种排序方法。上图是搜索量上升,即基于的是相对值。基于搜索热度的表现如下,基本都是大词。



看一下官方说明。



可以看出,对于基数过少的搜索词,进行了异常值剔除。非常细节的产品设计体验,赞!


(4)搜索热度


刚才都是基于某个具体关键词的数据分析,下面我们看看乌克兰国内大家现在都在关注啥?



嗯……我真的看不懂,大家不行自己图片识别一下,哈哈~不过闭眼也能猜出来,都是和战争相关的吧~如果不相关,就比较有意思了。


看一个能看懂的吧,香港最近关注啥:



嗯,看来香港人民还是比较关注疫情多一些。国际局势离我远点。哈哈~




02


百度指数


看完国外的民众关注,咱们得看看国内人民对于乌克兰战争关注度咋样。毕竟咱们国人不用谷歌,用百度占了绝大部分。


因此,有百度指数这个产品供咱们分析。


网址:index.baidu.com。大家可以自己多多探索。


(1)搜索趋势


首先同样有趋势相关的分析。这里选取了关键词:乌克兰、俄罗斯。



哈哈,没想到啊,咱们大家都喜欢搜乌克兰,倒也合理。基本走势和谷歌的也差不多,能对上。


大家可以看到,这里的纵轴是绝对数值,没有进行0-100标准化。关键是走势图竟然做了平滑……嗯,平滑的有点过度了,不利于数据分析。


下面是资讯相关的热度表现:



能看到2月17日乌克兰的一个小峰值吧~当天应该有媒体不少报道,但是大家搜索热度一般。


(2)相关搜索


同样,百度指数也有相关搜索。



这里也是区分了热度和变化率两种排序逻辑。


不过上面的“需求图谱”有点意思,可以选择时间轴,看不同时间的相关关键词。能看出来,目前和乌克兰最相关的关键词就是俄罗斯了,还有就是问冲突原因是啥的、局势进展的。


我们看看几个月前,大家关注乌克兰的啥。



嗯,看来俄罗斯乌克兰一直关联度比较大。但我个人觉得可能是有些数据处理的有问题,比如去年8月有可能很多人关注乌克兰和俄罗斯的军事冲突吗?我是怀疑的。


(3)人群画像


最后看一下相关人群画像。基本也是基于地理位置、年龄和性别的。



这里基本都是绝对值,没做TGI。所以搜索的区域基本都是沿海城市,因为沿海城市人多。


总之,和Google Trends 相比,我觉得百度指数有一些亮点,但是在数据细节的处理上,还是有许多要做的工作。




03


微信指数


最后,咱们看看微信搜索指数吧。


估计很多朋友应该不知道这个。可以在微信中搜索「微信指数」,专门有个微信的小程序。应该是刚起步,功能不是很多。


(1)指数趋势


同样,首先是指数的趋势。这里我选取关键词「乌克兰」。


   

左侧指数不赘述了,重点是指数图下侧的「数据异动记录」。这个简直了,没想到微信这样一款小工具,竟然给出了很多专业数据分析平台都没有的异动分析,具体见右图。


当然,具体的异动逻辑没给,但是这个方向我就觉得很赞了!后面有机会,我们会专门分享一篇文章,讲讲如何进行异常的识别的。


(2)数据来源


最后简单看一下微信指数特有的来源分析,看一下相关搜索都是来源于哪里。



关于行业中的热度指数,咱们今天就分享这些。主要的想法是给大家提供一个新的数据分析的阵地和工具,关于舆情新闻事件,可以借助这些工具平台,进行更多的数据分析,辅助分析目标,丰富分析结论。最后,愿世界和平,我国复兴。



文章来源:作者:NK冬至。公众号:首席数据科学家。

图片来源:部分图片来源网络,版权归原作者所有,不为商业用途,如有侵犯,敬请作者与我们联系。文章为作者独立观点,不代表135编辑器立场。

文章评价
登录后可以评论
立即登录
分享到