Professional Documents
Culture Documents
王琳炜 2020 突发性公共事件微博舆情中热点网民关注偏好研究
王琳炜 2020 突发性公共事件微博舆情中热点网民关注偏好研究
cn
Knowledge Management Forum http://www.kmf.ac.cn
【学术探索】
突发性公共事件微博舆情中热点网民关注
偏好研究
王琳炜
广西大学新闻与传播学院 南宁 530004
摘要:[ 目的 / 意义 ] 旨在通过对热点网民微博词汇频率进行量化处理,总结其在突发性公共事件
中的关注点,以实现在舆情防控与治理方面找到新的突破口。 [ 方法 / 过程 ] 通过爬取微博热点网民的
微博数据,利用 Word2vec 向量模型和 TF-IDF 权值算法得到热点网民微博词云图中的词类、词性占比
和词汇相似比等指标,最后对自然灾害、事故灾难、公共卫生事件和社会安全事件的指标进行汇总分析。
[ 结果 / 结论 ] 在突发事件舆情中,热点网民对包括事件人物、事件名称和事件过程在内的事件基本组成
部分较为关注,且 4 类突发性事件舆情中热点网民的关注指向性均表现出差异且较为分散,但仍存在共
性。同时,通过分析热点网民词云图发现了明星超话、传播能量层级化以及相似度极端化等传播现象。
关键词:突发性公共事件 微博舆情 热点网民 关注偏好
分类号:G210.7
DOI:10.13266/j.issn.2095-5472.2020.026
1 引言 征与后果无法预估的特性,政府与各应急部门
对其关注度日益提高。政府部门对公共政策的
根据 2007 年 11 月 1 日起施行的《中华人
发布,需要基于突发性公共事件的防控与应急
民共和国突发事件应对法》规定,突发事件是
角度,对应急措施作出相应调整,其体现了国
指突然发生、造成或可能造成严重社会危害,
家机构及社会公共团体的一致目的。在政府部
需要采取应急处置措施予以应对的自然灾害、
门对社会舆情掌握与公共政策发布执行、调整
事故灾难、公共卫生事件和社会安全事件 [1]。
修订等过程进行渠道选择时,新浪微博以其独
美国危机管理机构 ICM 则将危机分为突发危
特的开放平台与公共资源成为政府选择的必然
机(sudden crises) 与 积 发 危 机(smoldering
渠道。我国目前也形成了以新浪微博、微信朋
crises)[2]。
友圈、知乎等为代表的网络互动平台,其中新
突发性公共事件因其具有事态多变的特
作者简介:王琳炜(ORCID:0000-0002-8302-1020),硕士研究生,E-mail:403390448@qq.com。
收稿日期:2020-05-10 发表日期:2020-10-19 本文责任编辑:刘远颖
271
知识管理论坛
2020 年 第 5 期(总第 29 期)
272
知识管理论坛,2020(5):271-282
DOI:10.13266/j.issn.2095-5472.2020.026
的量化值,通过相关计算得到各参与因素对舆 件从发生到结束的时间窗内,爬取事件相关热
情关注度的影响。以分析突发公共卫生事件网 点网民名称、热点网民发博数量、热点网民发
络舆情网民关注度的区域分布为目的,利用回 博数量排名、各网民微博词云图和词汇词频数
归方程、聚类分析等方法,最终得到网民数量、 量等数据。
城市经济发展水平与舆情发展水平之间的关系。 3.2 操作化定义
②以网民关注点作为出发点分析网络建设组成 基于研究素材内容,对热点网民、词汇密度、
和网民内在需要。通过分析网络发展报告和近 热点网民微博相似度进行具体定义:①热点网
几年网民关注的热点问题,深刻分析网民的关 民。基于新浪舆情通系统,在事件发展全程中,
注点及其内在需要。③将网民关注点作为网络 发布有关舆情事件微博数量排名前 10 的微博用
传播中的一个节点,民众关注点转移现象属于 户。②词汇密度。词云图中某一词汇(目标词汇)
网络舆论的一部分,分析其在不同类型事件中 所涉及的所有字号权值与对应字号出现次数的
转移和变化的规律。 乘积的加和,加和结果代表目标词汇在所处舆
通过总结目前的研究,众多学者均认为网 情事件热点网民微博中的提及程度,也能够反
民的关注点与关注度已经成为网络舆情传播中 应热点网民的关注焦点。③热点网民微博相似
非常重要的影响因素。网民的关注点不仅可以 度。热点网民发布相关微博词云图中出现相同
反映网民对网络生活真实的内在需求,还反映 词汇数量与出现次数的加权值。
了网络结构的组成和网络舆情的变化规律。该 3.3 研究变量及其操作化
领域的研究包含量化分析和质化分析,研究网 热点网民关注偏好实证研究中,有词云词
民关注点在各类事件中的变化规律,有利于政 类、词云图相似度、词汇密度和微博用户类型 4
府正确管理和引导网络舆情,打造健康和牢固 个关键变量,本节将对关键变量的计算展开分析。
的网络环境。 3.3.1 热点网民微博词云词类划分
LDA 模 型(Latent Dirichlet Allocation, 文
3 实证研究设计 档主题生成模型,也称为三层贝叶斯概率模型)
3.1 研究素材 是自然语言处理领域的常用模型,它能够提取
研 究 素 材 的 选 取 原 则 主 要 包 括: ① 在 事 文本主题,以概率分布的形式给出,主题与描
件性质方面应满足事件发展过程曲折起伏,社 述词展示清晰。但在实际应用中,LDA 模型无
会反响较大,对网民的情绪与观点激发产生较 法准确计算词汇之间位置关系变化这一常见场
大影响;②在传播效果方面应该满足舆情发酵 景,方法存在缺陷,并且模型限制了文本长度、
程度高且能激发产生参与行为的受众范围广; 内容和格式,使用便捷性降低。而 Word2vec 模
③在传播范围方面应该满足以微博为主要传播 型将词语转化为词向量,实现以词向量来表示
平台,传播覆盖面广。④在舆情传播方面应该 文本相似度的功能,不限文本长度和格式,计
满足发展周期长,包含舆情阶段性起伏变化。 算准确性高。
同时按照突发性公共事件分类,均匀覆盖自然 笔者在构造向量空间过程中使用了
灾害、事故灾难、公共卫生事件和社会安全事件。 Word2vec 模型,将热点网民微博的词云图词汇
依据上述选取素材原则,可全面地分析热点网 转化成词向量,在向量空间计算结果的基础上,
民在突发事件舆情中的传播与关注偏好。 对词汇语义的相似度进行表示。多目标事件的
案例数据源的获取使用新浪微博舆情通系 场景下,会出现大量干扰信息,影响聚类效果。
统,以“事件名称 + 地点 + 人物”为关键词创 因此,在构造了向量空间后采取 TF-IDF 算法,
建事件方案,该方案包含 20 起案例事件,在事 将词云图词汇的重要程度进行量化,根据量化
273
知识管理论坛
2020 年 第 5 期(总第 29 期)
结果得出词汇与舆情事件的关联度。在得到聚 热点网民微博词云图中能够出现的次数最大值
类结果后将词云词类通过词性进行区分,例如 为 10。对单个词汇重复率进行统计后,通过将
单位名称、地点、时间等,再结合舆情事件的 所有重复词汇的重复率进行相加运算,可以得
传播要素:舆情主体、舆情客体、舆情本体、 到 10 位热点网民微博词云图的相似度,如公式
舆情媒体、舆情空间,经过人为细粒度划分, (2)所示:
得出突发公共事件舆情微博词云图的 11 类词云 U=U1+U2+U3…Un 公式(2)
词类。例如,山东平度退役老兵聚集事件中热 根据所获得的微博词云图,并根据不同词
点网民微博词云图中的“犯罪分子”“退役军人” 频水平将图中词汇通过 5 个层次字号呈现。综
属于舆情主体部分,因此这两个词汇就被划分 合 20 起事件案例热点网民微博词云图词频水平,
到“事件人物 / 企业 / 单位”这一类别当中。 笔者将 5 个不同的字号所代表的词频计算权重,
词云词类的划分方法首先基于 Word2vec 模 如公式(3)所示:
型对词云图进行词向量转化处理,生成热点网 N
TF(ti,d)×log
民微博词云语料库后,再使用特征词权重计算
weight(ti,d)= n ti +a
方法 TF-IDF 对初始数据的词向量进行提取,最 N
2
274
知识管理论坛,2020(5):271-282
DOI:10.13266/j.issn.2095-5472.2020.026
表 1 突发性公共事件案例编码
自然灾害 事故灾难 公共卫生 社会安全
11.桂林帝禾国际大酒店食
1.金沙江堰塞湖山体滑坡 6.重庆公交车坠江 16.陈羽凡吸毒
物中毒事件
2.山东寿光水灾 7.张家口爆炸事件 12.丁香医生挑战权健帝国 17.湖南衡东故意驾车伤人
3.台风山竹 8.福建泉州碳九泄漏 13.首例艾滋病婴儿诞生 18.山东平度老兵聚集事件
4.台风玉兔 9.山东龙郓煤业事故 14.辽宁非洲猪瘟疫情 19.深圳佳士科技公司员工维权
10.安徽碧桂园工地
5.云南普洱地震 15.阿里员工白血病身故 20.郑州滴滴司机奸杀空姐
坍塌
275
知识管理论坛
2020 年 第 5 期(总第 29 期)
表 2 20 起案例事件热点网民微博词云词性量化数据分布
案件 事件 事件人物/ 事件 事件 事件 事件相关 事件相关 事件涉及政府单 网民 明星 无关
编码 类型 企业/单位 过程 结果 地点 数据 名词 位/部门/领导 观点 超话 词类
1 0.36 0.12 0.24 0 0 0.14 0.91 0 0.1 0 0
2 0.05 0.03 0.05 0 0 0 0 0 0.16 0.65 0
3 0.1 0.03 0.33 0 0 0 0.03 0.22 0.09 0.13 0.05
4 0.62 0 0.1 0 0 0 0.29 0 0.05 0 0
5 0 0.05 0.05 0.15 0 0 0.27 0 0.04 0.11 0
6 0 0.16 0 0.16 0 0.05 0 0 0 0 0
7 0.41 0.09 0.26 0.22 0.08 0.11 0.19 0.16 0.07 0 0
8 0.34 0.65 0.05 0 0 0.08 0.26 0 0.11 0 0
9 0 0.29 0.49 0 0 0.03 0.24 0 0.08 0 0
10 0 0.18 0.09 0 0.04 0 0.56 0 0.09 0 0
11 0.40 0.76 0.28 0.44 0 0 0 0.01 0 0.58 0
12 0 0.88 0.31 0.29 0 0.06 0 0 0.29 0 0
13 0 0.04 0.22 0 0 0.04 0 0 0.66 0 0
14 0.2 0.46 0.56 0 0 0.1 0.02 0 0 0 0
15 0.05 0.22 0.13 0.04 0 0 0.04 0 0.41 0 0
16 0.12 0.08 0.04 0.04 0.2 0 0 0.08 0 0 0
17 0.36 0.1 0.18 0 0.08 0 0.24 0.36 0.1 0 0
18 0.13 0.22 0.62 0 0.03 0.11 0.03 0 0.24 0 0.03
19 0.05 0.13 0.45 0 0 0 0.05 0 0 0 0
20 0.07 0.76 0.2 0.13 0.07 0.07 0.03 0 0.48 0 0.05
表 3 四大类型案例事件热点网民微博词云词性量化数据汇总
事件 事件人物/ 事件 事件 事件 事件相 事件相 事件涉及政府单 网民 明星 无关
案件类型
类型 企业/单位 过程 结果 地点 关数据 关名词 位/部门/领导 观点 超话 词类
自然灾害 1.13 0.21 0.77 0.15 0.00 0.14 1.50 0.22 0.44 0.89 0.05
事故灾难 0.75 1.37 0.89 0.38 0.12 0.27 1.25 0.16 0.35 0.00 0.00
公共卫生 0.65 2.36 1.50 0.77 0.00 0.20 0.06 0.01 1.36 0.58 0.00
社会安全 0.73 1.29 1.49 0.04 0.38 0.18 0.35 0.44 0.82 0.00 0.08
0.82
社会安全 1.49
1.29
1.36
公共卫生 1.5
2.36
276
知识管理论坛,2020(5):271-282
DOI:10.13266/j.issn.2095-5472.2020.026
从横向角度对比分析,发现社会安全类、 众产生消极影响。事件组织者的动机可分为两
公共卫生类和事故灾难类事件微博舆情中,网 类:①试图通过事件的爆发产生一定社会影响,
民的关注点都包含了事件涉及的人物 / 企业 / 单 扩大其目的的宣传范围,再通过群体动员的方
位、事件过程和事件中相关名词细节。3 类事件 式带动更多的社会公众投入情感达成共识,最
都是以人为主体源进行发散,人物、过程和事 终实现其目的。②基于对事件预设的基础上,
物成为组成事件的重要成分,也是事件舆情的 并不期望事情公之于众而产生社会效应,但对
重要元素。自然灾害类事件的突发性来源于自 社会造成的危害存在隐匿性与潜伏性。一旦事
然力量,通过网民的关注点也可以明显地看到 件爆发,其突发性危害极大;若事件就此进入
其更加关注事件地点与事件类型。网民在该类 潜伏期直至平稳期,其隐匿的社会安全危害会
事件与其他 3 类事件中关注点的不同,反映的 更为严重,增加了演化为该类事件爆发的隐形
是事件性质的区分,同时也是事件突发性来源 动机的几率。
的区别。针对此特点,可以为政府部门提供治 网民对事件人物和事件名词的关注度较高,
理舆情的应急出口,利用该类事件中与其他类 可以认为是网民对舆情事件事态发展水平的一
型事件相区别的网民关注点作为切入口,统筹 种判断。若事件中涉及的事件人物、企业、单
掌握网民关注的心理与情绪,根据网民关注的 位在横向同类事物中处于较高地位或者影响力
热点、焦点、头条事件置顶报道,同时针对该 较大,或者事件中涉及的相关名词数据水平较
事件相关报道的频率、次数、报道版面来进行 高,例如伤亡人数、救援车辆数量、医药费用等,
议程设置,从而扭转舆情态势,削弱负面舆情 则代表事件的舆情发展已经到了需要人为干预
的扩散力度。 控制的局面。一般来说,事件舆情发展迅速、
在突发性舆情事件中,明确突发性来源是 影响力大且社会效应不能随时间淡化的事件更
判断舆情发展和采取治理措施的首要工作。所 能够引起网民的关注,并能够通过舆情的传播
谓突发性来源,是指在突发性事件中促使事件 使网民的情感爆发值降低,从而通过微博参与
诱发的某种人为因素或自然因素。突发公共事 舆情讨论。
件网络舆情的内部因素包括有意图的传播者、 (2)公共卫生事件微博舆情中。通常会涉
网络媒体和受众。首先要明确的是,确定突发 及到卫生部门、相关企业及医护类工作人员。
性来源,并非所有的突发事件的突发性来源均 事件的性质多种且灵活多变。此类事件中,网
为非人为因素。其次,要评估突发性来源的推 民对“事件人物 / 单位 / 部门”的关注度与网民
动因素。 观点、事件过程形成了明显的差异。由此,可
(1)社会安全类事件微博舆情。一般是群 以推断出在公共卫生类突发事件中,事件的利
体性事件,涉及的人数较多,具有人为性、预 益相关者在各类舆情要素中的牵制性最强。同
谋性、暴力性和政治敏感性。相较于其他类型 时,舆情的发展也是围绕事件的利益相关者而
突发事件来说,网民对该类事件的发展过程表 展开。所谓“利益相关者”,是在斯坦福研究
现出较高的关注度,这与此类事件性质普遍恶 院首次的学术研究法中引入的概念,此后学界
劣存在密切关系。此类事件的突发性存在两面 逐渐出现了对该概念的几十种定义。这些定义
性:一方面,事件的组织者或主要参与人物在 都从不同的角度认识到以企业为中心进行扩散
事件发生之前对事件的发起过程和社会影响进 而产生利害关系的个人和群体。从舆情事件的
行了规划,事件为达到预设目而发生。另一方 本质来说,事件产生的结果涉及到多个行为主
面,该类事件所产生的的社会影响恶劣,事件 体的利益,这些行为主体将通过自己的行为来
的组织者或参与者往往会得到法律制裁,对公 影响这种结果的发生,从而可能由于各行为主
277
知识管理论坛
2020 年 第 5 期(总第 29 期)
278
知识管理论坛,2020(5):271-282
DOI:10.13266/j.issn.2095-5472.2020.026
所不同。通过研究发现,热点网民的词云图相 战线。较长的时间战线为网友提供了充足的客
似度呈现一定的规律性特点,其具体表现有以 观条件,促使事件在潜伏期、萌动期、加速期、
下两点:①在出现词云相似现象的舆情事件中, 成熟期、衰退期 5 个阶段保持较高的舆论生产率。
10 位热点网民的词云相似度呈现极端化特点。 即使是在完全不确定因素面前,也不可避免部
所谓极端化,是针对热点网民词云图而言,词 分网友站在“从众”角度来表现其对事件舆情
云图中词汇呈现出相似度极低或相似度极高现 的关注,即对高热度微博的转发和复制行为。
象。换言之,热点网民对目标事件舆情的关注 公共卫生与社会安全两类突发性事件热点
力度也呈现单向极端化现象。②通过对 4 类事 网民词云相似度均值高于 1,是两类事件舆情中
件相似度均值计算之后,可以发现事件的突发 舆论产生率较低与重复率较高的量化表征。结
性来源会直接影响热点网民的词云相似度。 合热点网民词云图中词汇类型进行分析,两类
笔者通过统计词云中词汇相似个数,发现 事件中排名前 3 的词汇类型完全一致,网民对
出现相似词汇的词云图中相似词汇数基本都超 这两类事件舆情的关注点停留在事件具体细节
过总数的一半,因此以单个热点网民词云图中 信息和社会舆论。
完全相同的词汇数与总词汇数比值为 0.5 设定 4.4 微博热点网民类型分析
为判定临界值。在目标事件舆情中,热点网民 根据热点网民在微博舆情事件中的角色对
的词云词汇相似比值基本分布在 [0.5,+ ∞)区 其身份进行分析划分,确定出六大身份类型:
间。也就是说,热点网民词云图中一旦出现相 名人、媒体、当事企业、政府部门、当事人、
似现象,相似比都会超过 0.5,整个词云图中接 普通网民,见表 5。
近 70%-80% 的词汇都呈现完全相同状态的频率 4.5 热点网民词云现象回归分析
极高。同时,在出现相似现象的舆情事件中, 4.5.1 舆情传播能量层级化
10 位热点网民中持有相似词云图的网民有 5 位 由表 5 可知,参与舆情传播与带动舆情发
以上,在某些事件中还出现了近九成热点网民 展的微博用户多数为普通网民,其次为媒体微
词云图完全相似的现象。通过分析,可以判断 博与政务微博。热点事件的微博舆情传播需要
词云图词汇相似比在 0.5 以上的热点网民微博是 各类身份的网民共同参与,其在舆情传播过程
对该事件舆情中转发率较高的微博进行转发或 中所起到的作用不尽相同。热点事件作为微博
复制,在此基础上没有任何个人观点产出。 舆情的传播客体,会由多个传播主体对其进行
根据表 4,将微博词云词汇相似比按照事件 分散能量传播,根据传播主体的传播动机可将
类型进行汇总得出:自然灾害与事故灾难两类 其分为 4 类 [8]:①自媒体时代应运而生的自由
突发性事件微博舆情中热点网民词云相似度均 主体,与舆情事件不存在某种直接或间接关联;
值低于 1,公共卫生与社会安全两类突发性事件 ②个人影响力催生的领袖主体,由记者、评论
微博舆情中热点网民词云相似度均值高于 1。前 员、作家、微博大 V 等组成,既表达媒体的观
两类突发性事件的突发性来源属于非人为因素, 点又反映民众的意见;③政府法规的发声者——
人们对于事件的发生完全没有预料与准备。在 管控主体,对舆论走向起到引导作用;④与舆
这种未知的情况下,网民潜意识中会根据事件 论事件密切相关的利益相关主体,是舆论发展
的不确定性进行发散思维联想,能够从事件涉 的关键性因素 [9]。
及的各类因素出发而产生不同的观点。同时, 舆情事件是各类社会事件与矛盾的集体
这两类事件在空间地理位置与涉及的利益人群 反 映, 微 博 用 户 通 过 微 博 平 台 发 表 具 体 的 态
两个方面相较于其他两类事件有更强的影响力, 度或情绪,当参与的微博用户达到一定规模,
能够在交错的影响关系下拉长舆情发展的时间 该 事 件 在 微 博 中 便 构 成 热 点 话 题。 当 热 点 事
279
知识管理论坛
2020 年 第 5 期(总第 29 期)
件 舆 情 扩 散 到 一 定 范 围 时, 主 要 引 导 作 用 归 账 号 等。 普 通 微 博 用 户 由 于 个 体 能 量 较 小,
功 于 具 有 高 关 注 度、 高 流 量 和 较 大 影 响 力 的 只 有 当 一 定 数 量 的 用 户 聚 合 传 播 时, 其 传 播
微 博 意 见 领 袖, 例 如 微 博 大 V、 明 星、 营 销 作用才得以显现。
表 5 案例事件热点网民身份
案例名称 名人 媒体 当事企业 政府部门 当事人 普通网民
山东寿光水灾 10
台风山竹 2 1 7
金沙江堰塞湖山体滑坡 6 4
台风玉兔 2 8
云南普洱地震 2 8
重庆公交坠江 10
河北张家口爆炸 2 8
山东龙郓煤业事故 3 1 6
泉州碳九泄露 10
安徽六安碧桂园工地坍塌 1 9
阿里员工白血病身故 10
丁香医生挑战权健帝国 10
辽宁非洲猪瘟疫情 1 1 8
首例免疫艾滋病婴儿诞生 10
桂林帝禾国际大酒店食物中毒事件 10
湖南衡东故意驾车伤人案 10
郑州滴滴司机奸杀空姐案 3 7
山东平度老兵聚集 1 9
深圳佳士科技公司维权 10
陈羽凡吸毒 10
热点事件舆情在达到一定讨论热度与传播 舆情传播能量将由普通微博用户上升至微博达
广度之前,媒体报道作为舆情演化开端的契机 人,例如公众人物、著名媒体等。此后,位于
将事件信息由新闻形式转化为微博形式。事件 不同能量级的微博用户迅速聚集共振后,将事
信息在微博中得以传播,依靠的主要动力来自 件的舆情范围不断扩大。
普通身份的微博用户对事件的关注、转发与评 因此,根据研究数据可以得出,微博舆情
论,因此产生热点网民。当信息、舆论观点、 的形成、演化与传播所遵循的能量由微博用户
意见评论大量聚集涌入微博平台后,事件舆情 影响力从低到高逐渐分层,且微博用户影响力
的发展会进入白热化阶段,舆情发展速度与微 与能量饱和点呈反比例线性关系,与能量级别
博用户关注度呈正比例线性增长。经过这一阶 呈正比例线性关系,能量级别越低,对舆情传
段,事件舆情的第一能量级已达到饱和状态, 播的推动作用越弱,所需储蓄的能量越多。
280
知识管理论坛,2020(5):271-282
DOI:10.13266/j.issn.2095-5472.2020.026
281
知识管理论坛
2020 年 第 5 期(总第 29 期)
A Study on the Focus Preferences of Hot Netizens in Public Opinion on Weibo of Unexpected
Public Events
Wang Linwei
School of Journalism and Communication, Guangxi University, Nanning 530004
Abstract: [Purpose/significance] The purpose of this paper is to find a new breakthrough in the
prevention and control of public opinion by quantifying the vocabulary frequency of hot netizens’ microblog
and summarizing their concerns in public emergencies. [Method/process] In this study, by crawling the
microblog data of hot Netizens, Word2vec vector model and TF-IDF weight algorithm were used to obtain
the indexes such as the proportion of part of speech and the similarity ratio of words in the cloud map of
hot Netizens’ microblog words, and finally the indexes of the four kinds of events were summarized and
analyzed. [Results/conclusion] In the public opinions of emergencies, the hot netizens pay more attention
to the basic components of events, including the event person, event name and event process. Moreover, in
the public opinions of the four types of emergencies, the hot netizens show different and dispersed attention
directivity, but there are still some commonalities. At the same time, through the analysis of the hot internet
users’ word cloud map, we found that the star hypertalk, the dissemination of energy hierarchy and extreme
similarity and other dissemination phenomena.
Keywords: sudden public events public opinion on Weibo hot internet users focus on preferences
282