发表在17卷,第10位(2015): 10月

社交倾听:推特上电子烟讨论的内容分析

社交倾听:推特上电子烟讨论的内容分析

社交倾听:推特上电子烟讨论的内容分析

原始论文

通讯作者:

Erik Augustson,公共卫生硕士,博士

国家癌症研究所

烟草管制研究处

医疗中心路9609号

MSC 9761

马里兰州贝塞斯达,20892

美国

电话:1 240 276 6774

传真:1 240 276 7907

电子邮件:augustse@mail.nih.gov


背景:电子烟(电子烟)的使用在美国有所增加,导致公共卫生领域就电子烟的使用和监管展开了积极的辩论。为了更好地了解电子烟态度和行为的趋势,公共卫生和传播专业人员可以求助于Twitter等流行社交媒体平台上的对话。

摘要目的:本研究的目的是利用历史Twitter数据进行内容分析,以确定关键的对话趋势和模式。

方法:从2013年5月1日至2014年4月30日期间发送的所有公开推文中随机抽取与电子烟相关的战略关键词匹配的推文样本,对其进行了五类内容分析。相关推文从大约10000条推文的随机样本中分离出来,并根据情绪、用户描述、类型和主题进行分类。描述性分析包括单变量和双变量关联,以及对所有类别进行相关性分析,以确定模式和趋势。

结果:分析显示,从2013年5月到2014年4月,与电子烟相关的推文有所增加,推文通常是积极的;71%的样本推文被归类为具有积极情绪。前两类用户是普通人(65%)和参与电子烟社区运动的个人(16%)。这两个用户组负责大部分信息性推文(79%)和新闻推文(75%),相比之下,信誉良好的新闻来源和基金会或组织总共提供了5%的信息性推文和12%的新闻推文。个人观点(28%)、营销(21%)和第一人称电子烟使用或意图(20%)是三种最常见的推文类型,它们往往具有积极的情绪。营销是最常见的主题(26%),政策和政府是第二常见的主题(20%),其中86%的推文来自普通人和电子烟社区运动,相比之下,5%的政策和政府推文来自政府、知名新闻来源和基金会或组织。

结论:普通人和电子烟社区是几个类型和主题的主导力量,有必要继续监测,以了解趋势及其对公众舆论、电子烟使用和戒烟的影响。分析社交媒体趋势是一种有意义的方式,可以让公共卫生从业人员了解当前对电子烟的看法,这项研究提供了一种可复制的方法。

医学互联网研究,2015;17(10):e243

doi: 10.2196 / jmir.4969

关键字



近年来,电子烟在美国的使用势头日益强劲,2013年接受调查的现有吸烟者中有36.5%报告曾使用过电子烟,而2010年这一比例为9.8% [1]。从2010年到2013年,电子烟的认知度提高了近40%,除了18-24岁的人群、西班牙裔和生活在美国中西部的人群外,所有人口亚群中“曾经使用”电子烟的人数都有所增加。全国青少年烟草调查的结果表明,目前高中生中电子烟的使用量比去年增加了两倍,这标志着目前电子烟的使用量首次超过了目前所有其他烟草产品的使用量。2]。最近一轮健康信息全国趋势调查(提示4周期2)的数据表明,在了解电子烟的人群中,51%的人认为电子烟的危害比传统香烟小[3.]。电子烟在美国和世界范围内的日益普及导致了一系列研究,包括减少危害、使用模式(戒烟与双重用途)、健康影响、环境影响、营销和产品设计。迄今为止,为公共卫生决策者提供指导的数据仍在收集中,在公共卫生领域,关于电子烟的使用和监管存在着积极的辩论[4]。目前的调查结果和意见范围相当大。虽然一些人认为电子烟有助于结束与使用可燃烟草相关的全球发病率和死亡率,但另一些人认为电子烟有可能延长或恶化烟草流行[4-8]。尽管这些立场是正在进行的辩论的一部分,但人们普遍支持对电子烟进行监管。美国专家敦促美国食品和药物管理局(FDA)采取必要行动,将电子烟纳入其监管范围。9FDA已经表示他们打算这样做[10]。然而,充分解决电子烟对公共卫生影响的数据收集和电子烟法规的实施可能需要一段时间。与此同时,电子烟的销量正在迅速攀升。2013年全球电子烟零售额约为25亿美元。按照目前的发展轨迹,预计2017年的零售额将超过100亿美元。1112]。

鉴于电子烟仍然相对较新,对电子烟的看法往往存在分歧,社交媒体上围绕电子烟的对话越来越多。为了理解电子烟对健康的影响,我们还必须试图辨别围绕电子烟讨论的核心声音、信息框架和情绪。了解这些对话可使公共卫生和传播专业人员确定态度和行为的趋势,并制定传播事实信息的战略,并为包括传统香烟和电子烟在内的尼古丁产品制定与文化相关的戒烟干预措施。

对Twitter数据的分析已经成为一个活跃的研究领域,为行为科学和社会科学提供了见解,并提供了接触在研究中往往代表性不足的人口群体(如少数民族)的途径。根据皮尤研究中心[13], Twitter的使用在“年轻人、城市居民和非白人”中尤为流行。Twitter为少数族裔群体提供了更大的代表性,25%的拉丁裔、27%的黑人和21%的白人使用社交媒体平台[14]。此外,31%的18-29岁的年轻人使用Twitter,而在所有成年互联网用户中,这一比例为18% [13]。微博作为一种社会支持系统,可以实时分享信息、想法和信念,提供调查分析可能遗漏或需要较长时间才能收集到的见解[15]。

就烟草使用和戒烟而言,对社交媒体数据的检查可以继续揭示知识、态度和行为方面的趋势;确定营销策略;告知公共卫生和公共政策;并为通过社交媒体进行干预铺平道路[16-22]。利用社交媒体信息以这种方式发现公共卫生趋势被称为"信息监测"或"信息流行病学" [23-26],以及数字流行病学或数字疾病检测[27]。

考虑到数据的深度、受众的广度以及捕捉实时趋势的能力,这项研究只关注于理解Twitter上围绕电子烟的对话快照。此分析的目的是进行内容分析,以使用历史Twitter数据确定关键对话趋势和模式。


为了进行分析,我们使用战略关键词收集2013年5月1日至2014年5月1日期间可能与电子烟相关的历史推文。关键词的选择采用增量加减的迭代过程。使用电子烟和蒸汽等词进行了初步搜索,然后进行了改进,删除了捕获不相关推文的术语。单词的添加在很大程度上受到先前发表的关键词列表的影响[22]。我们使用社交媒体洞察软件Radian 6运行了几个样本搜索,并使用频率、相关表和描述性可视化(如条形图)非正式地测试了搜索的性能。产品名称从搜索关键字中省略,因为我们无法确定每个电子烟产品名称的详尽列表,并且不希望将结果偏向特定品牌。策略关键字的最终列表提供在多媒体附录1

数据由Gnip提供,该公司可以完全访问Twitter Firehose(整个Twitter数据流),提供无法通过Twitter应用程序编程接口(API)获得的历史tweet。搜索结果获得了370万条可能相关的推文。本研究使用的Gnip数据包括时间、日期、用户简介链接、tweet内容和tweet链接。为了方便6位分析人员对tweet进行用户友好的评估,我们开发了一个数据库和Web表单,预先填充了每个tweet以及编码类别(参见多媒体附录23.).每条推文都包含到推特帖子和用户资料的链接。在推特链接被删除的情况下,分析人员使用历史网页缓存来获取信息。当分析人员无法从提取的信息中获得足够的信息时,他们可以自行访问完整的网页和用户资料。我们没有跟踪分析师点击网页和用户资料的次数,但有趣的是,分析师点击这些链接的次数约占所有编码推文的一半。所有分析师都受过大学教育,并参加了培训课程,以便在分析推文之前与主要作者一起熟悉电子烟主题和推文分析技术。

使用手动内容分析根据通过先前文献开发的编码类别列表对tweet进行分类,并根据本研究的目的进行了改编[22]。内容分析包括两个阶段:(1)从完整数据集中随机抽取推文,并对内容进行电子烟相关性分类,直到获得至少10,000条相关推文的可管理样本;(2)对每条相关推文的内容进行情感、用户描述、类型和主题分类。每个阶段包括一个初始步骤,其中分析师对250条相同的推文进行编码,直到达成可接受的相互协议水平。使用Fleiss kappa来确定评估者的信度,在阶段1和阶段2中每个类别的得分至少为0.64,表明基本或良好的一致性[2829]。第一阶段的相关性分类排除了符合以下任何规范的推文:“转发”,没有提供来自发布推文的人的额外信息,原始推文是对话的一部分,需要更大的背景来解释,或者来自用户帐户的重复推文,这些推文已被暂停或主要用于垃圾邮件或不必要的招揽。垃圾邮件是根据Twitter概述的指导方针识别的,并考虑了以下因素:主要是链接而非个人更新的更新,多个账户发布的重复内容,以及由不相关的热门话题标签组成的内容[30.31]。

第二阶段的情绪、用户描述、类型和主题分类是根据基于先前研究的推文分类开发的代码本进行的[1722]和本分析的重点(参见多媒体附录3).每个内容类别的示例tweet包含在多媒体附录4).

情绪指推文中对电子烟和电子烟使用者的立场是正面、中性还是负面的(表1).对电子烟和电子烟用户的立场是情绪的唯一考虑因素,对任何其他主题或概念的情绪都被忽略。

表1。情感的内容类别。
类别 定义
积极的 支持电子烟、相关产品和使用的推文
中性 推特上支持或反对电子烟的声音都不强烈
这样的推文是反对电子烟的

用户描述根据从用户档案中收集的信息(例如,电子烟公司,Twitter的日常用户,信誉良好的新闻来源)来描述推文发送者的特征;看到表2).特别是,“电子烟社区运动”的用户资料类别被专门添加,以代表那些似乎是电子烟的强烈倡导者,但与营销或电子烟公司没有明确联系的人。这一类别与“日常人士”类别不同,因为用户的大部分时间都致力于电子烟的宣传和信息,很少提及那些出于个人目的使用Twitter的人的日常生活特征。

表2。用于用户描述的内容类别。
类别 定义
名人 流行文化中的名人,网络名人,拥有Twitter认证账户的人
政府 国家卫生研究院,疾病控制中心,政治人物等
基金会/组织 像美国心脏协会这样的知名组织
有信誉的新闻来源 新消息来源,如《纽约时报》、《华盛顿邮报》、《华尔街日报》、美联社等
每天人 具有合理数量的帖子、关注者和合理数量的追随者的Twitter帐户;时间表涵盖了各种主要与电子烟无关的主题
电子烟社区运动 时间轴主要致力于电子烟对话的团体或个人(例如,Vape的女性,Vape俱乐部,John Doe的整个电子烟推文时间轴)。
零售商 销售电子烟的网点(在线或实体店)
烟草公司 生产电子烟的公司(如blue、Apollo、Njoy)
Bot /黑 看起来是假的/计算机化的账户,主要是推广电子烟产品(或其他产品);大多数账户都伪装成“普通人”。

类型代表tweet的格式(例如,新闻或更新,第一人称体验,营销;看到表3).主题,最细粒度的分类级别,指的是推文内容的主题领域(例如,戒烟、健康和安全、渴望;看到表4).

表3。类型的内容类别。
类别 定义
新闻/更新 更新来自有信誉的新闻来源的当前事件,或来自新闻来源的用户关于相关新闻的帖子
信息 Factoid或资源,可以是个人博客或论坛,也可以是产品评论的链接(由普通人或电子烟社区运动发布)
第一人称电子烟的使用或意图 报告个人使用、意图或兴趣使用电子烟
第二/第三人称体验 报告其他人使用电子烟的情况
个人意见 个人对电子烟的看法
市场营销 将商品从生产者或销售者转移到消费者或购买者的活动,例如,电子烟产品或配件的销售,招聘公告,电子烟公司/零售商发布的产品审查
表4。主题的内容类别。
类别 定义
停止 提到使用电子烟戒烟或其他非电子烟烟草产品
健康与安全 直接或间接提及使用电子烟对健康的影响
未成年人使用 未成年人使用电子烟,尤其是高中年龄或以下的人
渴望 渴望使用电子烟;“紧张的一天。我的#vapepen时间到了。”
其他物质 电子烟与其他成瘾物质(如酒精、咖啡因)有关
电子烟中非法物质的使用 提到使用电子烟获取尼古丁以外的任何东西(例如大麻)
政策或政府 提到与电子烟有关的政府或政策,包括监管、认定、禁令和限制
父母使用电子烟 推文中提到海报者的父母或推文中提到的人的父母使用电子烟
广告/促销 电子烟的广告、赠品、样品、促销、卖家网站的直接链接、口碑和评论
口味 推特讨论电子烟口味(普通或混合,包括薄荷)

情感和用户描述是相互排斥的类别——这意味着每个类别只能有一个选择,而类型和主题则不是——这意味着每个类别可以有多个选择。除了主题之外,所有类别都是必需的,因为内容的粒度和每个主题都无法实际表示。此外,在第二阶段,分析人员记录了每条tweet中包含的媒体链接(例如,图像、视频、位置、网站)。

内容分析完成后,对数据样本进行描述性统计分析,包括各类别的单向频率;类别、时间趋势和媒体类型的双向交叉表,以及类别间统计关联的卡方检验(使用单元格计数的精确检验);以及基于克莱默V系数的类别间相关分析(将每个类别选项表示为二元变量)。卡方检验和克莱默V相关分析都对不同类别之间关系的显著性和强度提供了统计上合理的评估。所有分析均使用SAS 9.3版本。当前分析的目标是识别与总体内容类别(情感、用户描述、类型和主题)相关的tweet样本中的模式和趋势。

报告整个编码tweet样本的总体趋势;每个类别只讨论统计上显著的趋势(P< . 05)。此外,报告了类别间的趋势,再次只讨论了主要的统计上显著的发现(P< 0.05),基于双变量关联和类别间相关性评估。


样品描述

第一阶段共编码了17098条推文,其中10128条(59.23%)被发现具有相关性和可解释性。间信度范围为0.64 -。70,见表5.在被排除的推文中,有2384条被发现完全不相关,而其余的则是没有附加上下文的转发、没有上下文的对话,或者来自用户帐户的重复推文,这些推文已经被暂停,或者主要用于垃圾邮件或不必要的招揽。对于本次讨论的剩余部分,最终样本由10128条相关推文组成。

表5所示。推文类别手动标注的互估者信度得分。
类别 评分者间信度
相关性一个 2
情绪b 主板市场
用户描述b
类型 .64点
主题 主板市场

一个为了分析的目的,除了多类版本之外,还创建了这个类别的二进制版本。

b类别是相互排斥的,因此被分析为多类。

2013年5月至2013年11月,每个月对整个样本推文的贡献为4.29-6.53%;然而,2013年12月,有关电子烟的推文数量明显增加。2013年12月的推文数量(n=1388)是2013年11月的推文数量(n=631;看到图1).2013年12月至2014年4月之间的月份分别占样本中推文总数的10.09%至14.01%,这代表了观察期间发生的大部分推文(参见图1).

几乎一半的推文(48.00%)包含在内容分析时有效的链接。带有图片的推文占样本的8.30%。

图1所示。2013年5月至2014年4月电子烟推特的月度频率。
查看此图

情绪

如下所示表6在美国,被认为情绪积极的推文占样本的大多数(71.11%)。积极推文的绝对数量在2013年12月最高,但2013年5月的积极情绪推文比例最高(图2).从2013年12月到2014年4月,积极情绪稳步下降,在此期间,负面和中性推文的比例上升。这导致2014年4月的负面推文比例最高(17.90%),中性推文比例最高(22.48%)。

表6所示。基于情绪的Tweet分布(N=10,128)。
情绪 N (%)
积极的 7202 (71.11)
中性 1699 (16.78)
1227 (12.11)
图2。2013年5月至2014年4月,按情绪和月份划分的推文绝对数量。
查看此图

用户描述

大多数样本由分析师确定为日常用户的推文组成(64.99%),第二大人口是电子烟社区(15.92%)表7).来自政府、名人和知名新闻来源用户账户的推文分别占样本的不到1%。2013年11月,来自零售商(10.59%)和烟草公司(4.24%)的推文比例最高,而来自电子烟社区运动用户的推文比例在2013年12月达到峰值(26.72%)图3).

表7所示。用户描述的Tweet分布(N=10,128)。
用户描述 N (%)
名人 45 (0.44)
政府 8 (0.08)
基金会/组织 122 (1.20)
有信誉的新闻来源 73 (0.72)
每天人 6582 (64.99)
电子烟社区运动 1612 (15.92)
零售商 787 (7.77)
烟草公司 200 (1.97)
Bot /黑 699 (6.90)
图3。2013年5月至2014年4月按月、按用户的推文数。
查看此图

类型

三种最常见的推文类型是个人意见导向的推文、营销相关的推文和个人体验相关的推文(参见表8).在分析期间,与个人观点相关的推文的月数量增加了一倍多,从2013年10月到2014年3月出现了明显的增长,尽管这些推文的百分比在2014年2月最高(见表9).与营销相关的推文在2013年5月(29.95%)至2014年4月(18.46%)期间出现了相当稳定的下降,尽管这些推文的绝对数量在此期间翻了一番。与个人观点相关的推文占每个月推文的五分之一以上,2013年12月达到峰值,占当月电子烟相关推文的近一半(44.52%)。从2013年5月到2014年4月,新闻相关推文的比例从1.84%增加到15.22%,这段时间内新闻相关推文的数量增加了27倍。营销、新闻和信息相关推文的网站链接率(60.12%、88.51%和70.40%)远高于平均水平(35.42%)。

表8所示。按类型划分的Tweet分布(N=10,128)。
类型 N (%)
新闻/更新 828 (8.18)
信息 1459 (14.41)
第一人称电子烟的使用或意图 2056 (20.30)
第二/第三人称体验 797 (7.87)
个人意见 2850 (28.14)
市场营销 2142 (21.15)
表9所示。按月划分的Tweet类型分布(N=10,128)。
类型 N (%)
五月 6月 7月 8月。 9月。 10月。 11月。 12月。 1月。 2月。 3月。 4月。 总计
个人经验 102 (23.50) 122 (22.90) 109 (24.49) 106 (23.35) 131 (19.12) 134 (23.63) 152 (23.00) 196 (14.12) 230 (19.97) 248 (24.27) 270 (19.74) 256 (18.04) 2056
市场营销 130 (29.95) 140 (26.27) 128 (28.76) 115 (25.33) 157 (22.92) 130 (22.93) 167 (25.26) 239 (17.22) 225 (19.53) 174 (17.03) 272 (19.88) 262 (18.46) 2139
个人意见 95 (21.89) 112 (21.01) 97 (21.80) 105 (23.13) 191 (27.88) 137 (24.16) 176 (26.63) 618 (44.52) 363 (31.51) 285 (27.89) 349 (25.51) 321 (22.62) 2849
第二个人 34 (7.83) 52 (9.76) 34 (7.64) 45 (9.91) 50 (7.30) 37 (6.53) 48 (7.26) 82 (5.91) 96 (8.33) 93 (9.10) 112 (8.19) 114 (8.00) 797
信息 65 (15.00) 74 (13.88) 51 (11.46) 62 (13.66) 99 (14.45) 93 (16.40) 82 (12.41) 165 (11.89) 150 (13.02) 145 (14.19) 221 (16.15) 249 (17.55) 1456
新闻 8 (1.84) 33 (6.19) 26日(5.84) 21日(4.63) 57 (8.32) 36 (6.35) 35 (5.30) 87 (6.27) 88 (7.64) 77 (7.53) 143 (10.45) 216 (15.22) 827
总计 434 533 445 454 685 567 661 1388 1152 1022 1368 1419 10128年

主题

表10描述数据集中呈现的总体主题。在编码过程中,推文主题并不是一个互斥的类别,这导致样本中26.35%的推文有多个主题。对于一个主题的推文,广告和促销相关的推文是最大的单一内容主题类别,在样本中出现了19.62%,其次是政策和政府相关的推文,占11.77%,健康和安全相关的推文占4.27%。仅为戒烟主题编码的推文占样本的1.42%。

表10。按主题分发推文。一个
主题 N (%)
停止 638 (6.30)
健康与安全 1327 (13.10)
未成年人使用 423 (4.18)
渴望 394 (3.89)
其他物质 116 (1.15)
电子烟中非法物质的使用 160 (1.58)
政策/政府 2042 (20.16)
父母使用电子烟 74 (0.73)
广告/促销 2663 (26.29)
口味 451 (4.45)

一个包括推文编码与多个主题。

Intercategory趋势

二元关联

报告的双变量关联在统计上是显著的(P< . 05)。几乎所有与营销相关的推文都是积极的(98.46%),而88.72%的第一人称电子烟使用或意图以及69.78%的个人观点推文都是积极的。大约一半(51.65%)的信息性推文是正面的,14.22%是负面的。与新闻相关的推文是所有类型中最不积极的,其中19.11%为积极,53.10%为中性,27.81%为消极。

超过92.27%的包含图片的推文是积极的。在包含图片的推文中,零售商占19.74%,而与营销相关的推文中包含图片的可能性(17.30%)是推文中出现图片的平均比率(8.30%)的两倍。电子烟社区用户发布的含有网站链接的推文占23.47%。营销、新闻和信息相关推文的网站链接率(60.12%、70.40%和88.51%)远高于整体平均水平(35.43%)。

近一半(49.60%)的推特信息来自普通人,29.28%来自电子烟社区运动。日常人士占新闻推文的62.27%,而知名新闻来源占新闻推文的6.41%,占信息推文的0.96%。基金会/机构提供了3.98%的信息推文和5.20%的新闻推文。此外,32.40%的营销推文来自普通人,而零售商和烟草公司分别占26.18%和6.40%。推文类型的用户相关趋势如图所示图4

图4。每个用户类别的tweet内容类型分布。
查看此图
相关分析

作为相关性的额外度量,在将每个类别选项表示为二元变量后,计算所有类别的克莱默V统计量。多媒体附录5显示了克莱默V相关性分析的结果,突出显示了那些中等强度的相关性(≥0.3)。结果与前面讨论的双变量关联相似。


主要研究结果

这项内容分析揭示了2013年5月至2014年4月期间与电子烟相关的推文的值得注意的趋势。在数据收集期间,这些推文的数量有所增加,并在2013年12月达到峰值。绝大多数推文都是积极的,并且经常由普通人和电子烟社区运动账户发布。

与电子烟相关的推文的增加恰逢几个电子烟里程碑,从政府的政策和法规提案[32],大型烟草公司推出自有品牌的电子烟,并购买现有品牌的电子烟[33],以及电子烟行业通过营销和零售扩张提高了知名度。这一趋势也可能受到电子烟促销活动的推动,以及随后电子烟产品销量和认知度的提高[34]。例如,2014年2月,NJOY King公司连续第二年在超级碗期间播放电子烟广告[35]。美国有超过1.11亿人观看了这一电视直播活动,使其成为当时历史上观看人数最多的电视活动[36]。

从2013年5月到2014年4月,普通人主导了Twitter上的电子烟对话,占数据集中推文的三分之二以上。电子烟社区运动是第二常见的用户类型。不出所料,尽管电子烟社区运动账户也占了相当大比例的个人观点推文,但日常生活中的人占了个人观点和个人体验推文的大部分。这两个用户群体占信息推文的80%,来自政府、公共卫生非政府组织和信誉良好的新闻来源的信息很少。未来的研究可能会关注共享信息的合法性、来源以及如何在Twitter上共享。这将帮助我们了解电子烟信息传播的程度,以及这将如何影响人们对电子烟的看法和看法。日常生活中的人们也发布了近三分之一的营销相关推文,这相当于零售商和烟草公司营销推文的总和。值得注意的是,来自特定用户组的推文数量并不能反映其推文的覆盖范围或展示次数,因为该分析没有考虑推特账户的关注者数量,也没有考虑推文收到的转发或收藏次数。虽然这是当前研究的一个局限性,但它为未来的研究提供了机会,以确定哪些推特声音是“最大的”,因为他们的推文被看到和分享得最多,以及这些可见的推文如何影响人们对电子烟的看法和使用。

2013年12月,电子烟社区的推文数量激增,比前一个月增加了四倍。电子烟社区运动推文急剧增加的原因尚不清楚,但在此期间有几个电子烟里程碑。例如,2013年12月,菲利普莫里斯国际公司宣布与奥驰亚集团公司合作销售电子烟[37]。四分之一的电子烟社区推文包含网络链接,这远远高于平均水平。这一点值得一提,因为Web链接通常是营销工具,该数据集中60%的营销tweet都包含Web链接。在电子烟社区用户中使用网络链接可能表明消费者愿意推动营销努力,并有助于电子烟的规范化和普及。

来自有信誉的新闻来源和政府机构的推文占样本的不到1%。在美国和许多国家,关于如何监管电子烟的争论仍在继续。我们在Twitter上的分析表明,公共卫生领域所表达的不确定性并没有反映在正在进行的社交媒体对话的性质中。在公共卫生当局缺乏信息对话的情况下,围绕电子烟的个人意见和营销内容已成为最常见的主题。该样本显示,来自显然是电子烟产品营销人员的账户的推文数量出现了决定性的下降,但个人和电子烟社区仍在发布大量营销内容。

除了了解谁在推特上说话之外,有必要仔细分析他们在说什么。大多数推文被确定为具有积极情绪,这表明推特对话倾向于电子烟,尽管积极推文的比例在分析期间有所下降。随着时间的推移,这种趋势值得进一步监测,具体考虑是什么引发了意见。此外,本研究建立了一个电子烟情绪基线,作为公共卫生专业人员制定运动和干预措施的有价值的起点。大多数与营销相关的推文都有积极的情绪,而大约五分之一的新闻相关推文是积极的。最普遍的类型是个人观点,其次是市场营销,占样本的近一半。可以预见,像Twitter这样的平台有利于分享个人观点;然而,32%的营销推文来自普通人,32%来自零售商和烟草公司的总和。

优势与局限

与任何研究一样,我们的研究也有局限性。必须指出的是,我们的分析是非常特定于电子烟的主题,因此我们的关键字列表仅限于与电子烟直接相关的术语。我们可能忽略了一些话题,这些话题在社交上与电子烟(如电子水烟)相似,但又不完全相同。此外,围绕电子烟的词汇也在不断增长和变化。这是由于人们参与的产品、品牌和电子烟相关活动的范围不断扩大。因此,本研究中使用的关键词列表需要重新考虑,而且几乎肯定会扩大,以适应不断变化的电子烟和电子烟术语。此外,计算搜索的精度和查全率可以更好地理解搜索所检索的术语的有效性。但是,我们相信,只要有适当的资源,我们的方法是可以复制的,因此可以扩大,以便探索其他正在出现的趋势。我们建议使用Stryker等人所描述的系统定量方法计算精度和召回率,以改进搜索和报告有效性[38]。

此外,我们的相关性排除方法,包括排除没有额外信息的转发和来自暂停账户的重复推文,可能导致低估了这些类型推文的真实流行程度。然而,我们认为,即使我们的研究提供了Twitter上与电子烟有关的信息的保守估计,这些信息仍然有助于了解总体趋势。未来的研究可能会对利用较少限制的相关性标准和使用社会网络分析等方法来确定网络结构以及这与电子烟态度和观点的传播之间的关系感兴趣。

Twitter用户并不代表一般人群,因此这项研究的结果必须在使用这一特定社交媒体平台的人群的背景下考虑[33]。尽管如此,考虑到推特在年轻人、黑人和拉丁裔人群中的流行,14],从像我们这样的研究中获得的信息提供了一个机会,可以从这一特定人群中获取公众意见,并利用这些信息形成假设,为未来的研究提供信息,以及补充之前的研究。

此外,在我们的分析中,我们没有采用明确的加权或校正方法来调整推文数量随时间的变化,因为任何进行此类调整的方法都可能使结果产生偏差。考虑到我们的大多数描述性指标比较的是特定分类的推文在时间点上的部分,而不是推文的绝对数量,我们认为,随着时间的推移,电子烟相关推文景观的比较图是有效的。

尽管有一些限制,但这种分析还是有很多优点的。我们的研究访问了Twitter Firehose(即访问Twitter上的所有每日推文)的数据,并利用了大量推文样本。此外,在电子烟领域的关键时期进行了分析,并扩展了先前建立的Twitter主题分析方法。

这项工作的另一个关键优势是花费了大量的时间和精力手动构建从Twitter Firehose(而不是免费API)采样的数据集。这项研究的数据集是10128条人工编码的推文,比之前关于推特和新兴烟草产品的研究要大得多[2122]。例如,Huang等人提出的研究包括2000条人工编码的推文,作为超过75,000条电子烟相关推文的机器学习训练集。Myslín等人的工作极大地影响了我们的研究,尽管它包括传统烟草产品和其他新兴产品(如水烟)除了电子烟[22]。Myslín等人的研究使用了超过7300条人工编码的推文作为其机器学习训练集,其中只有4200条与烟草相关,其中不到100条与电子烟相关。

对于未来的研究,该内容分析的数据可以用作训练数据集来构建监督机器学习算法。这些算法可用于实现对Twitter上与电子烟相关的对话的自动监控。这样可以用更少的人力分析更多的数据,也可以在更长的一段时间内观察和分析推特上电子烟对话的趋势。这种形式的信息监测有助于烟草控制的几个方面,包括营销条例、未成年人使用、戒烟和健康结果。

结论

继续了解电子烟的社交媒体情况,可能有助于政策制定者和公共卫生专业人员评估不断变化的趋势,并为戒烟干预提供信息。确定将这些类型的评估和分析纳入传统流行病学和监测方法收集的数据的方法可能特别有价值[22]。此外,本研究还强调了一种可复制的方法和5类编码方案,可用于未来的其他主题领域。

致谢

本研究由美国国立卫生研究院国家癌症研究所烟草控制研究分部,国家癌症研究所HHSN261200900022C,分包合同号D6-ICF-1资助。作者要感谢Shinett Boggan, Alex Feith-Tiongson, Samantha Letizia, Thomas Madden, Delsie Sequiera, Nick Ngugi和Emily Grenen对这项研究的贡献。

利益冲突

没有宣布。

多媒体附录1

Tweet过滤关键词。

PDF文件(adobepdf文件),169KB

多媒体附录2

数据收集Web表单。

PDF档案(Adobe PDF档案),268KB

多媒体附录3

注释类别的定义。

PDF档案(Adobe PDF档案),191KB

多媒体附录4

按注释类别提供tweet示例。

PDF档案(adobepdf档案),194KB

多媒体附录5

内容类别的相关矩阵。

PDF档案(adobepdf档案),290KB

  1. 张建军,张建军,张建军。电子烟使用与认知的研究进展。中国烟草科学,2010-2013。烟草学报,2015;17(2):219-227。[CrossRef] [Medline
  2. 疾病控制和预防中心(CDC)。MMWR Morb Mortal weekly rep 2015。2011-2014年美国初中生和高中生的烟草使用情况[amp;#8212]http://www.cdc.gov/mmwr/preview/mmwrhtml/mm6414a3.htm?s_cid=mm6414a3_e[查阅时间:2015-09-02][WebCite缓存
  3. 陈志强,陈志强。电子烟认知和感知危害:流行程度及其与戒烟结果的关系。中华预防医学杂志;2014;47(2):141-149 [J]免费全文] [CrossRef] [Medline
  4. 格林TJ。电子烟和烟草控制的未来。中华肿瘤杂志;2014;31(3):394 - 398。[CrossRef] [Medline
  5. 李建军,李建军,李建军,等。电子烟戒烟:一项随机对照试验。柳叶刀2013年11月16日;382(9905):1629-1637。[CrossRef] [Medline
  6. 电子烟作为控烟减害策略:向前迈进还是重蹈覆辙?公共卫生杂志,2011;32(1):16-31。[CrossRef] [Medline
  7. 刘建军,刘建军,刘建军,刘建军。电子烟对烟碱释放装置的影响:一项前瞻性研究。中华医学杂志2011;11:786 [j]免费全文] [CrossRef] [Medline
  8. 电子烟:对人体健康的影响。Tob Control 2014 May;23增刊2:ii36-ii40 [免费全文] [CrossRef] [Medline
  9. 上瘾的途径?一项调查流行的电子烟制造商和目标营销的年轻人。2014.URL:http://www.durbin.senate.gov/404[查阅时间:2015-07-20][WebCite缓存
  10. 美国食品和药物管理局新闻发布。马里兰州银泉;2014年4月24日。FDA建议将其烟草授权扩展到其他烟草产品,包括电子烟。http://www.fda.gov/newsevents/newsroom/pressannouncements/ucm394667.htm[查阅时间:2015-07-20][WebCite缓存
  11. 古德曼·a·福布斯。电子烟很火——投资电子烟的四种方法http://www.forbes.com/sites/agoodman/2013/12/05/e-cigarettes-are-smoking-hot-4-ways-to-approach-them/[访问日期:2015-10-20][WebCite缓存
  12. 罗宾·n·福布斯。电子烟销售额超过10亿美元http://www.forbes.com/sites/natalierobehmed/2013/09/17/e-cigarette-sales-surpass-1-billion-as-big-tobacco-moves-in/WebCite缓存
  13. 皮尤研究中心,2013年12月13日。2013年社交媒体更新http://www.pewinternet.org/files/old-media/Files/Reports/2013/Social%20Networking%202013_PDF.pdf[访问日期:2015-10-20][WebCite缓存
  14. Krogstad J. Pew研究中心。社交媒体偏好因种族和民族而异。http://www.pewinternet.org/files/old-media/Files/Reports/2013/Social%20Networking%202013_PDF.pdf[查阅时间:2015-07-20][WebCite缓存
  15. 莫菲J,林克M,斯特恩M,斯特恩M,社会媒体在民意研究中的作用:美国民意研究协会(AAPOR)新技术工作组报告。迪尔菲尔德,伊利诺伊州:美国公众舆论研究协会;2014.URL:https://www.aapor.org/AAPORKentico/AAPOR_Main/media/MainSiteFiles/AAPOR_Social_Media_Report_FNL.pdf[查阅时间:2015-07-20][WebCite缓存
  16. Harris JK, moeland - russell S, Choucair B, Mansour R, Staub M, Simmons K.推特支持和反对公共卫生政策:对芝加哥公共卫生部电子烟推特运动的回应。中国医学杂志,2014;16(10):e238 [J]免费全文] [CrossRef] [Medline
  17. 李建军,李建军,李建军。Twitter =半途而废呢?对Twitter戒烟社交网络的分析。烟草控制2012;21(4):447-449 [j]免费全文] [CrossRef] [Medline
  18. Emery SL, Vera L, Huang J, Szczypka G.想了解电子烟吗?信息曝光模式,在媒体平台上寻找和分享有关电子烟的信息。疾病控制2014年7月23日增刊3:iii17-iii25 [j]免费全文] [CrossRef] [Medline
  19. Pechmann C, Pan L, Delucchi K, Lakon CM, Prochaska JJ。开发基于twitter的戒烟干预措施,鼓励通过自动消息进行高质量的社交媒体互动。医学互联网研究,2015;17(2):e50 [J]免费全文] [CrossRef] [Medline
  20. Rocheleau M, Sadasivam RS, Baquis K, Stahl H, Kinney RL, Pagoto SL,等。戒烟推特账户中社会和情感支持的观察性研究:推特内容分析。医学互联网研究,2015;17(1):e18 [J]免费全文] [CrossRef] [Medline
  21. 黄杰,Kornfield R, Szczypka G, Emery L.推特上电子烟营销的横断面研究。疾病控制2014;23:30。[CrossRef
  22. Myslín M,朱s,查普曼W,康威M.使用twitter调查吸烟行为和新兴烟草产品的认知。中国医学杂志,2013;15(8):e174 [J]免费全文] [CrossRef] [Medline
  23. HA Carneiro, Mylonakis E. Google趋势:疾病爆发实时监测的网络工具。临床感染与疾病杂志;2009;49(10):1557-1564 [j]免费全文] [CrossRef] [Medline
  24. Chew C, Eysenbach G. Twitter时代的流行病:2009年H1N1爆发期间Twitter的内容分析。科学通报,2010;5(11):e14118 [j]免费全文] [CrossRef] [Medline
  25. 信息流行病学和信息监控:一套新兴的公共卫生信息学方法框架,用于分析互联网上的搜索、交流和出版行为。医学信息学报,2009;11(1):11 [J]免费全文] [CrossRef] [Medline
  26. 刘建军,刘建军,刘建军,等。2009年甲型H1N1流感大流行期间谷歌流感趋势的研究进展。PLoS One 2011;6(8):e23610 [j]免费全文] [CrossRef] [Medline
  27. Vayena E, salatherom, Madoff LC, Brownstein JS。大数据在公共卫生中的伦理挑战。科学通报,2015;11(2):e1003904 [j]免费全文] [CrossRef] [Medline
  28. 兰迪斯JR, Koch GG.分类数据的观察者一致性测量。生物识别技术[j]; 1997;33(1):159-174。[Medline
  29. Fleiss J, Levin B, Paik M.比率和比例的统计方法。第3版。纽约:Wiley & Sons;2003.
  30. Twitter, Inc. 2014。Twitter规则网址:https://support.twitter.com/articles/18311[查阅时间:2015-07-20][WebCite缓存
  31. Twitter, Inc. 2014。举报Twitter上的垃圾邮件https://support.twitter.com/articles/64986-reporting-spam-on-twitter[查阅时间:2015-07-20][WebCite缓存
  32. 电子烟的简史。:牛津大学出版社http://blog.oup.com/2014/11/e-cigarette-vape-timeline/[查阅时间:2015-07-20][WebCite缓存
  33. 《华尔街日报》。菲利普莫里斯明年将进军电子烟市场http://www.wsj.com/news/articles/SB10001424052702304337404579210180309728764[查阅时间:2015-07-20][WebCite缓存
  34. 截至2015年,Wahba P. US的电子烟销售额每年增长24.2%。2018.URL:http://fortune.com/2014/06/10/e-cigarette-sales-rising/[查阅时间:2015-07-20][WebCite缓存
  35. 格雷E.时间。今年你不会看到的超级碗广告网址:http://business.time.com/2014/01/23/the-superbowl-ad-you-wont-see-this-year/[查阅时间:2015-07-20][WebCite缓存
  36. 尼尔森。超级碗XLVIII吸引了1.115亿观众,2530万推特。URL:http://www.nielsen.com/us/en/insights/news/2014/super-bowl-xlviii-draws-111-5-million-viewers-25-3-million-tweets.htmlWebCite缓存
  37. 奥驰亚集团有限公司奥驰亚和菲利普莫里斯国际公司签署战略协议,授权和分销电子烟和其他创新产品。URL:http://investor.altria.com/phoenix.zhtml?c=80855&p=irol-newsArticle&ID=1886410WebCite缓存
  38. 李建军,李建军,李建军,等。基于数据集的信息检索方法及其应用。大众传媒学报,2006,31(2):413-430。[CrossRef


API:应用程序接口
疾病预防控制中心:疾病控制和预防中心
食品药品监督管理局:美国食品药品监督管理局
提示:健康信息全国趋势调查
情景应用程序:统计分析系统


G·艾森巴赫编辑;提交24.07.15;L Vera, M Conway, B Liang的同行评审;对作者的评论18.08.15;收到改版22.09.15;接受23.09.15;发表27.10.15

版权

©Heather Cole-Lewis, Jillian Pugatch, Amy Sanders, Arun Varghese, Susana Posada, Christopher Yun, Mary Schwarz, Erik Augustson。原载于医学互联网研究杂志(//www.mybigtv.com), 2015年10月27日。

这是一篇在知识共享署名许可(http://creativecommons.org/licenses/by/2.0/)下发布的开放获取文章,该许可允许在任何媒介上不受限制地使用、分发和复制,前提是原始作品首次发表在《医学互联网研究杂志》上,并适当引用。必须包括完整的书目信息,到//www.mybigtv.com/上原始出版物的链接,以及版权和许可信息。


Baidu
map