快捷导航

        关于鸿蒙操作系统的知乎讨论热点分析

        2019-9-23 10:06| 发布者: ym| 查看: 810| 四怀论坛官网: 0

        摘要: 从华为的鸿蒙操作系统上线以来,就引发了不少热议,有赞美的,也有质疑的。为了全面地和量化地评估鸿蒙的舆论态势,我们就从知乎上四怀论坛免费了关于鸿蒙问题的回答,看看大家说了哪些东西,围绕鸿蒙这个概念形成了一种什么 ...

        从华为的鸿蒙操作系统上线以来,就引发了不少热议,有赞美的,也有质疑的。为了全面地和量化地评估鸿蒙的舆论态势,我们就从知乎上四怀论坛免费了关于鸿蒙问题的回答,看看大家说了哪些东西,围绕鸿蒙这个概念形成了一种什么样的话语环境,我们将识别组成这个话语环境的特征词和相关统计。

        下面主要介绍数据分析过程,将使用集搜客GooSeeker的网络爬虫、文本分词和分类检索工具,数据四怀论坛免费和整理的过程详见《四怀论坛免费知乎上关于华为鸿蒙的问题和回答》。

        1.分词处理

        把整理好的知乎问答和文章数据,导入的集搜客文本分词和分类检索工具。然后在“分词选词”那里筛选出鸿蒙发布相关的特征词。

        所有的词按照词频进行排序,通常按照从高到低的顺序,虽然高频词更加重要,其实很多低频词也相当重要,很有可能会有爆冷的词。

        选词过程中,有些词语没有切出来,所以需要人工整理再添加进去,大家可以点击样本数据来查看原文是说了哪些内容,从而找到一些核心词,词语重复添加也没有关系,系统会自动过滤重复的。

        完成选词后,把数据表下载下来,然后做一些整理和统计。


        2.数据分类整理

        2.1 对话语环境进行观察

        这次分析主要用到的是选词结果表,所选词根据词频进行了排序,词频高低代表了声量大小。我们可以先观察围绕“鸿蒙”的话语环境,可以选择一些直观的方式把特征词排序展示出来。

        首先用wordart在线词云图工具,把数据生成词云图 。

        由上图可以发现,同一个对象会有多种词语表述,为了更加精确的发掘核心词,我们会把同义词进行合并处理,名词类同义词的意思表达比较明确,而动词或形容词等会与其他词有关联,就不好合并,所以,同义词合并如下:

        把上面词语的词频合并计算到其中一个词语身上,再删除被合并的词语,重新生成词云图如下。从下图可以看出,鸿蒙系统的发布,在操作系统方面,鸿蒙、安卓、IOS三者总会被拿来比较;在公司方面,大家讨论最多的是华为、谷歌、苹果,其次是微软,谷歌和苹果就对应了两大手机操作系统安卓、iOS的母公司,微软主要是电脑操作系统;在系统生态方面,比较多讨论的是软件、硬件、开发者、兼容等;还有一些是表达态度的词语,指向性不是很明确,所以下面会结合原数据来看。

        2.2 对话题进行分类

        将特征词划归不同的类,可以横向统计对比,也可以深入划分子类,钻取下去后再进行对比观察,也可以观察下级子类对上级的解释程度。

        把词语结合原数据的具体内容来看,根据其关联的对象或情景进行分类,整理如下:

        2.3 话题总貌

        上面的分类,看着可能不是很好理解,所以,又画成思维导图。从下图可以看到鸿蒙引发的讨论,可以归纳为操作系统、国民的关注点、国民的看法、相关产业、政治背景、企业提及这6个方面。


        3.数据统计、钻取和解释

        3.1,将文本进行类别打标

        前面我们已经将话语态势表达成了特征词,那么原数据哪些归属哪个类别?这需要用到集搜客的分类检索功能。

        把前面的分类表按下图的表结构整理后,导入到分类检索工具里,在“分类检索”的“关注”里,会自动根据标签词把原数据划分到主题、领域里。

        然后我们导出数据表,就可以看到每条文本都打上了类别标签。集搜客GooSeeker文本分词和分类检索工具支持两级分类:领域和主题。如果需要更多级,可以在excel中利用筛选功能进一步细分。下图是导出的打上了类别标签的数据。

        接下来,通过数据透视表进行快速统计,然后绘制出可视化的统计图。

        3.2,将文本进行类别统计

        对应前一章展示的话题全貌图,统计得到如下结果:

        下图是关于鸿蒙的讨论热点分布,从数值大小上看,排在前5的是国民的看法、生态建设、竞品品牌、企业提及、真实性存疑。

        3.3,钻取探索

        在知乎上讨论最热的应该是国民的看法,无论专业人士还是普通民众,大家还是相当关心民族品牌能开先河做出自己的操作系统。那么,我们深入探索一下,贡献了“国民的看法”这么大声量的讨论到底在说啥。

        对于“国民的看法”,知乎上持“相信并支持”的比例是最多的,超过一半,其次是“质疑,不太可信”,相信的占比是质疑的两倍。

        对于“生态建设”,主要讨论的因素有软件、用户、兼容、硬件、开发者、厂商,它们的讨论比重依次递减。

        对于“真实性存疑”,有44%的问答是更加关心有没有源码开放,其次是关注技术上是否可行。

        作为专业人士,可能会更加关心行业生态建设以及民众舆论反映出来的走势,不妨继续深入钻取,并采用更多的分析角度去观察这个主题。

        2

        鲜花

        握手

        雷人

        路过
        1

        鸡蛋

        刚表态过的朋友 (3 人)

        相关阅读

        最新四怀论坛官网

        GMT+8, 2019-11-1 17:30