发表在24卷,第12号(2022): 12月

本文的预印本(早期版本)可在https://preprints.www.mybigtv.com/preprint/39460,首次出版
2019年电子烟和电子烟使用相关肺损伤爆发期间,Twitter和Reddit上围绕电子烟的话题和情绪:比较研究

2019年电子烟和电子烟使用相关肺损伤爆发期间,Twitter和Reddit上围绕电子烟的话题和情绪:比较研究

2019年电子烟和电子烟使用相关肺损伤爆发期间,Twitter和Reddit上围绕电子烟的话题和情绪:比较研究

原始论文

1美国南卡罗来纳州哥伦比亚市南卡罗莱纳大学综合信息技术系

2华盛顿大学医学院精神科,圣路易斯,密苏里州,美国

3.人工智能与信息部,梅奥诊所,罗切斯特,MN,美国

通讯作者:

黄明博士

人工智能与信息学系

梅奥诊所

西南第一大街200号

罗切斯特,明尼苏达州,55902

美国

电话:1 507 538 3287

电子邮件:Huang.Ming@mayo.edu


背景:近年来,电子烟在美国变得越来越流行。2019年,与电子烟和电子烟使用相关的肺损伤(EVALI)病例导致住院和死亡人数增加,许多病例后来与不受监管的产品有关。以前的文献利用社交媒体数据来监测健康话题。个人愿意在社交媒体平台上分享心理健康经历和其他个人故事,在那里他们感受到社区意识,减少耻辱和赋权。

摘要目的:本研究旨在比较两个流行的社交媒体平台(即Twitter和Reddit)上与电子烟相关的内容,以探索2019年EVALI爆发期间电子烟的背景,并支持使用这两个社交平台的数据在社交媒体上开发深度和智能电子烟检测模型的可行性。

方法:数据提取自2019年7月至2019年9月EVALI危机高峰期的Twitter(316,620条推文)和Reddit(17,320条帖子)。进行了高通量计算分析(情感分析和话题分析)。此外,我们还进行了深入的人工内容分析,并与两个平台(577条推文和613条帖子)上的内容计算分析进行了对比。

结果:从2019年7月到2019年9月,Twitter和Reddit上与电子烟相关的帖子和独立用户都有所增加,Twitter上每个用户的平均帖子从1.68条增加到1.81条,Reddit上的平均帖子从1.19条增加到1.21条。计算分析发现,Reddit上的积极情绪帖子数量更多。P<。001, 95% CI 0.4305-0.4475), Twitter上的负面帖子数量更高(P<。001, 95% CI为-0.4289至- 0.4111)。这些结果与临床内容分析结果一致,即Twitter(273/ 577,47.3%)上的负面情绪帖子高于Reddit(184/ 613,30%)。此外,根据关键词和人工帖子评论,两个平台上的热门话题包括提到年轻人、营销或监管、大麻和戒烟的兴趣。

结论:在2019年的EVALI期间,Twitter和Reddit上的帖子内容和热门话题重叠。然而,用户类型和内容关键字也存在重大差异,包括在Twitter上更频繁地提到与健康相关的关键字,以及在Reddit和Twitter上更多地提到电子烟对健康的负面影响。使用计算和临床内容分析不仅对于识别与电子烟相关的社交媒体内容中的公共卫生趋势信号至关重要,而且对于为电子烟的风险和行为提供背景也至关重要。通过利用Twitter和Reddit作为公开可用数据源的优势,这项研究可以提供技术和临床见解,为自动检测正在吸电子烟的社交媒体用户提供信息,并可能从这些平台上的数字干预和积极主动的外展策略中受益。

[J] .医学与互联网学报,2010;24(12):939 - 946

doi: 10.2196/39460

关键字



背景

在美国,电子烟近年来变得越来越流行,每20个美国成年人中就有1人使用电子烟设备,到2021年,美国有超过200万的中学生和高中生使用电子烟。12]。电子烟会给个人带来一些负面的健康后果,包括肺功能和心脏功能下降,对尼古丁的依赖,以及影响神经发育,尤其是在年轻人中[3.4]。然而,尽管有这些负面的健康影响,年轻人和年轻人对电子烟的危害了解有限。56如果想要戒烟,他们会有很强的戒烟能力[7]。更令人担忧的是,2019年,电子烟和电子烟使用相关的肺损伤(EVALI)导致住院和死亡,其中许多病例后来与维生素E醋酸酯(一种不受监管产品中的填充物质)有关[8]。在这些风险和负面健康后果的背景下,美国食品和药物管理局(fda)在2018年将青少年吸电子烟列为全国性流行病,并继续发布政策,以更有效地监管电子烟产品。9]。考虑到电子烟对健康的有害影响和EVALI风险的增加,未来有必要对来自社交媒体等来源的公开可获得的更大规模数据进行研究,以监测这一日益严重的公共卫生问题,并为戒烟的推广干预措施提供信息。以前的文献利用社交媒体数据来监测健康问题,包括非法药物使用[10],心理健康[1112],公共卫生[1314],以及其他与健康有关的经验[15]。Twitter是一个社交媒体网站,大约22%(1/5)的美国成年人使用它。16]作为信息来源和信息共享[17]。Twitter等网络平台上的个人可能更愿意公开分享有关心理健康或药物滥用的经历和个人故事,减少对判决或法律行动的恐惧,使他们能够获得社会支持和建议,并与有类似经历的其他人分享这些建议[18]。例如,一项对心理健康意识周期间1200条推文的研究发现,意识、耻辱和个人经历是推特用户讨论的中心主题[19]。因此,Twitter已被用作公共卫生监测的大量信息数据源,并可用于更好地了解个人对电子烟的态度和行为[20.-22]。例如,在COVID-19大流行期间,Twitter数据被用来更好地了解与该病毒有关的吸烟情绪和反应[23]以及个人对全球事件和与美国有关的生活方式变化的看法[24]。尽管Twitter在监控和公共健康监测方面有几个优势,但Reddit等其他社交媒体平台在提供个人用户吸电子烟行为数据方面可能具有互补优势。

Reddit是一个类似的匿名社交媒体平台,供公众讨论可能被污名化的个人经历[25-27],包括年轻人,他们可能会在不太担心线下伤害或后果的情况下披露个人信息[28]。Reddit的数据被用来调查使用非法物质的个人的态度和行为[29-31],在吸电子烟的人群中也进行了类似的研究。对Reddit帖子的一项分析表明,精神疾病患者吸电子烟的主要动机包括自我治疗、自由和控制、将电子烟作为一种爱好、社交联系以及为了戒烟而吸电子烟。32]。其他研究使用了Reddit的数据来分析公众对电子烟禁令的反应和担忧[33]、支持戒烟电子烟的社区[34],以及对电子烟产品的态度和评价[35]。

Twitter和Reddit都是流行的社交媒体平台,但它们在影响用户发布行为和发布内容的诸多方面有所不同。Twitter,月活跃用户超过3亿;36],只允许280个字符的短推文发布突发新闻、趋势和观点,经常导致不完整或误导性的陈述[37]。相比之下,每月活跃用户超过4.3亿的Reddit,没有字符发布限制,是匿名的,由社区网络组成,即子reddits,专门讨论特定主题,允许用户与具有相似背景,观点和生活经历的其他个人联系。由于Reddit的匿名性,人们可以诚实地表达自己的观点,并通过深入的文本和内容传播意识和重要新闻[3839]。因此,同一时期关于同一主题的帖子(即2019年关于电子烟的帖子)预计会因分享的内容类型和对公众认知的影响程度而有所不同,这取决于它们分享的平台。

使用计算机科学(CS)策略的大规模评估,包括使用自然语言处理和机器学习进行文本挖掘的策略,之前已经对社交媒体上的内容进行了评估。40-42]。例如,Visweswaran等[41开发了机器学习分类器来识别与电子烟相关的推文,以开发电子烟监控系统。结果表明,社交媒体内容可以用于整体信息监控,这些数据可以为未来的个人层面检测模型提供信息,以识别有风险的帖子和用户。权和朴的系统评价[32研究发现,在社交媒体网站上,人们对电子烟的看法往往更为积极,而此前在推特上进行的研究表明,吸烟者更有可能接受有关电子烟的错误信息。43]。在Reddit帖子上进行的研究表明了与电子烟有关的健康症状[44并强调了旨在支持那些想要戒烟的人的社区[45]。

目标

专门研究EVALI公共卫生危机可以帮助识别与社交媒体上分享的电子烟相关的急性和长期健康结果相关的内容和关键词,因为这种电子烟风险信号可能在此期间被放大了。通过利用Twitter和Reddit作为公开可用数据源的优势,以及使用跨学科方法来分析复杂的社交媒体内容,可能会获得技术和临床见解,为自动检测模型的未来发展提供信息,从而与可能从社交媒体平台上的数字干预中受益的电子烟用户建立联系。然而,迄今为止,很少有研究将Twitter和Reddit在同一时间段内对药物滥用的见解进行比较[4647],并且没有进行与电子烟相关的已知研究来分析2019年EVALI在个人用户水平和人口水平上的爆发。因此,本文研究了Twitter和Reddit上与电子烟相关的内容,以更好地理解(1)2019年EVALI时间框架内与电子烟相关内容相关的情绪和关键词,(2)Twitter和Reddit上内容之间的情绪和关键词差异,以及(3)电子烟相关内容的统计分析和临床编码之间的异同。


数据收集

在这项研究中,我们利用2019年7月至2019年9月这两个平台的数据,重点比较了EVALI爆发期间Twitter和Reddit上与电子烟相关的关键词频率和情绪,因为我们之前的工作已经确定这是与电子烟相关的社交媒体内容增加的时间框架[48]。为了定义大规模数据提取的标准,我们的团队首先对2019年时间线中随机选择的200条与电子烟相关的推文进行了人工分析,以生成临床相关关键词列表。我们的主要研究问题指导了这个关键字列表的创建,其中包括特许经销商vape,以及其他60项指明条款(多媒体附录1).使用这组关键字,在EVALI爆发期间(2019年7月、8月和9月)抽取了316,620条与电子烟相关的推文随机样本,平均每条推文27个单词。为了进行比较,我们使用相同的关键字集随机提取Reddit数据,得到17320篇Reddit帖子,平均每篇帖子有211个单词与EVALI爆发期间的电子烟有关。

GetOldTweets [49是一个开源的python库,它允许我们的团队从我们识别的关键词中随机抽取推文样本。该模块允许访问和提取任何日期和主题的历史tweet。使用此应用程序接口(API)的好处是它没有大小限制,并提供对历史tweet的访问[4950]。我们使用Pushshift Reddit API(4.0版本)[51],它提供了丰富的搜索和提取功能,以及灵活的方式来聚合公开可用的Reddit帖子和评论。

数据清理

在我们根据关键词从Twitter和Reddit上提取帖子后,我们在进一步分析之前清理了我们的数据集。由于我们在这项研究中只关注英语帖子,因此我们首先删除了包含非英语语言的帖子。我们还删除了标记为“已删除”或“已删除”的无效Reddit帖子。此后,Twitter的帖子数量从316620条减少到286703条,Reddit的帖子数量从17320条减少到12069条。

对于帖子中的文本,我们首先将所有字符转换为小写,以避免区分大小写的过程。然后,我们从文本中删除了所有非美国信息交换标准代码的特殊字符。对于文本缩略词,我们将它们扩展成多个单独的单词。接下来,我们从文本中删除对文本意义没有重大贡献的停止词(例如,is, a, the和of)。之后,我们从tweet文本中删除了特殊术语,包括提及、标签、链接、刻度、标点符号、数字和空格。然后,我们应用词序化函数将单词转换为它们的基本形式。

情绪分析

情感分析是一种常用的计算机技术,用于测量文本中的主观性、观点、态度和情感[52]。情感分析沿着连续尺度量化给定文本中的情感内容,例如,从−1到1 [4153]。我们应用了价感知词典和情感推理器(VADER)作为分析推文和Reddit帖子情感的工具,因为VADER是一个基于词典和规则的情感分析工具[54最近的研究[245556找到了有效计算情绪的社交媒体分析方法。更具体地说,维德已经适应了社交媒体的情绪,并通过黄金标准情绪词典进行了预训练。黄金标准情绪词典是基于社交媒体中成熟的情绪词库、流行的情绪表达和具有情感价值的常见俚语而开发的。为了确定情感,VADER将词汇特征映射到情感强度,即情感得分,可以通过总结文本中每个单词的强度来获得情感得分。然后将分数归一化为- 1(最极端的负)和+1(最极端的正)。在我们的研究中,如果文本情感得分>0,则文本被分类为积极的。如果情绪得分<0,则文本被分类为负面。中性文本的情绪得分为0。我们的研究利用这种情绪得分将帖子进一步分为积极、消极和中性情绪,并根据每月3种情绪类型计算帖子的分布。

关键词分析

除了前面描述的情绪分析之外,我们还使用卡方检验来比较Twitter和Reddit帖子中每个月关键字在以下主题中的频率差异:(1)情绪,(2)情绪相关关键字,(3)健康相关关键字,(4)年龄相关关键字,(5)营销相关关键字,(6)产品相关关键字,(7)成瘾相关关键字,(8)戒烟相关关键字。

术语频率-逆文档频率

词频逆文档频率(TF-IDF)是一种能够表示语料库中相关词的统计度量[57]。TF-IDF分数是根据术语频率和逆文档频率计算的。使用这种方法可以帮助我们在Twitter和Reddit上找到常用词。根据TF-IDF分数,我们可以在两个平台上识别出最重要的单词。公式如下:

TF =文档中的单词数/文档中的单词数(1)
IDF = log(文档数/带有单词的文档数)(2)
tf - idf = tf × idf(3)

临床编码比较

根据之前概述的内容和情绪分析,在EVALI爆发期间,2019年7月、8月和9月被确定为推特上与电子烟相关的讨论急剧增加的期间和之前的几个月。因此,从之前描述的Twitter和Reddit数据集中抽取每月200个帖子的随机样本,对上下文内容进行深入的人工编码分析。具体来说,我们的临床团队成员具有物质使用研究经验(心理学、社会工作或公共卫生研究生阶段的学生,并具有由临床心理学家PCR领导的对定性社交媒体数据进行编码的相关经验),他们使用归纳和演绎的方法基于对样本推文的审查并根据先前的文献构建了一个密码本[5859]。使用了三个主要编码类别:(1)帖子类型,包括个人,营销,或媒体或新闻或其他[60];(2)对电子烟的看法[61];(3)提及的健康结果,包括积极的(如戒烟)和消极的(如肺损伤、死亡、成瘾或依赖)[6062]。被编码为存在或不存在的次要概念包括(1)提到青少年或青少年或年轻人[63]和(2)提到大麻或杂草或大麻二酚或四氢大麻酚[6465]。两名独立的人类编码员审查每篇文章并根据文本内容分配适用的代码,编码员之间的一致性是实质性的,平均κ分数为0.62 [66]。然后第三个编码员审查每个初步编码员的代码,并为那些有分歧的推文提供最终代码[67],是以往定性分析文献中采用的第三方解析方法[68]。然后将频率和定性主题与CS分析的初步结果进行比较,以帮助对数据集中反映的临床主题进行概念化。

我们比较了2019年7月、8月和9月(3个月的总和)在Twitter和Reddit上提到的每个主题的总频率,以展示每个主题在各自平台上的相对权重。

伦理批准

华盛顿大学机构审查委员会(202101009)审查了本研究的数据提取和分析方法。考虑到这些数据在社交媒体上是公开的,这项研究被确定为非人类受试者研究,不受审查。


数据集汇总和唯一用户

本节给出了高通量计算分析的结果。我们总共在Reddit上收集了286,703条推文和12,096个帖子。Twitter和Reddit的样本量差异与每个Reddit帖子和tweet中包含的信息量有关。每条推文的字数限制是280个字符,而每条Reddit帖子的字数限制是40000个字符。因此,每个Reddit帖子包含的信息比tweet要丰富得多。在单词层面分析数据集并进一步进行内容分析,提取的Reddit帖子数量明显小于tweet数量。表1显示两个平台上的唯一用户数量和每个用户的帖子数量。总体而言,从2019年7月到2019年9月,Twitter和Reddit上与电子烟相关的帖子和独立用户的数量呈上升趋势。特别是,从2019年8月到2019年9月,推特上的帖子数量和独立用户数量增长了约4倍。Twitter和Reddit的人均发文数分别从1.68条增加到1.81条和1.19条增加到1.21条。

表1。在电子烟和与电子烟使用相关的肺损伤爆发期间,Twitter和Reddit上提到电子烟的独立用户数量和每个用户发布的帖子数量。
2019年1月 唯一用户,n (%) 每个用户的发帖数,n

推特 Reddit 推特 Reddit
7月 17904 (11.06) 2893 (28.75) 1.68 1.19
8月 28604 (17.67) 3066 (30.47) 1.66 1.2
9月 115373 (71.27) 4105 (40.79) 1.81 1.21

情感分析结果

对情绪的CS模式分析发现,在EVALI期间,Reddit(8905/ 12096, 73.62%)上对电子烟持积极态度的帖子比负面帖子更常见,而Twitter(174,448/286,703, 60.86%)上的负面情绪占主导地位(表2).在此期间基于小随机样本的临床结果与使用CS方法的结果相似,仍然表明Reddit有更多的积极情绪帖子,也反映了Twitter有更多的基于人工审查帖子内容的消极情绪帖子。

月度情绪趋势结果显示,在Twitter和Reddit上,7月份积极情绪的帖子比例高于消极情绪的帖子比例。8月和9月,推特上负面帖子的比例高于正面帖子的比例。此外,从7月到9月,Twitter上的积极情绪百分比显著下降,而在8月和9月,Reddit上的积极帖子占主导地位。

卡方检验(表S1)多媒体附录2)发现,不同平台之间的情绪总体上存在显著差异。Twitter的负面帖子(174,488/286,703,60.86%)明显多于Reddit (2281/12,096, 18.86%), Reddit的正面帖子(8905/12,095,73.62%)明显多于Twitter(85,209/286,703, 29.72%)。

除了情绪分析和趋势,我们还进行了卡方检验,以比较Twitter和Reddit上与情绪表达相关的帖子差异。我们从Twitter和Reddit上最常见的词汇列表中选择了常见的情感词汇。包括积极关键词安全的,好,,包括负面关键词杀死,坏的,危险的,关心的,严重的.统计结果显示,基于频率百分比,两个平台之间的发帖整体上存在显著差异。我们发现,在EVALI爆发期间的所有3个月里,Reddit上的积极情绪表达比Twitter上的积极情绪表达更为显著(表S2)多媒体附录2).

表2。在Twitter和Reddit上进行情感分析和临床编码。

情感分析,n (%) 临床编码,n (%)

Twitter (n = 286703) Reddit (n = 12096) Twitter (n = 577) Reddit (n = 613)
积极的 85209 (29.72) 8905 (73.62) 201 (34.8) 291 (47.5)
174488 (60.86) 2281 (18.86) 273 (47.3) 184 (30)
中性 27006 (9.42) 910 (7.52) 103 (17.9) 138 (22.5)

主题词分析

健康相关关键词分析

包含电子烟相关关键字的帖子的分布和百分比显示在表3图1展示了2019年7月、8月和9月与健康问题相关的前6个单词的频率。排名前6位的词汇在Twitter和Reddit上被广泛分享。在TF-IDF得分的基础上,见多媒体附录3,我们发现Twitter上经常提到的最重要的健康相关关键词包括死亡,肺,戒烟,吸烟,疾病,伤害,而Reddit帖子中最重要的单词包括死亡,肺,戒烟,吸烟,咳嗽,医生

我们使用卡方检验来比较与健康相关的关键词,包括死亡、肺、疾病、风险、危机、生病、医生、癌症、伤害、流行病、研究、损害、伤害、有害、病人、咳嗽、胸部、预防、吸烟、辞职根据2019年7月、8月和9月的帖子。卡方检验结果(表S3)多媒体附录2)显示,在Twitter和Reddit上发布的与健康相关的关键词在三个月内和整体上存在显著差异。然而,由于Twitter和Reddit上的帖子大小存在显著差异,因此总体效应大小很小。在百分比的基础上,Twitter上比Reddit上讨论更多与健康相关的关键词,Reddit和Twitter上都高度讨论了负面健康结果。

除了调查与健康相关的关键词的情绪,卡方检验与成瘾相关的关键词相关(表S4)多媒体附录2)在每个月和整个EVALI爆发期间,平台之间的差异显著且效应较小。在百分比的基础上,与上瘾相关的关键词在Twitter上被提及的次数比在Reddit上更显著。

在深度临床编码中,消极健康结果在两个平台(Twitter: 230/577, 39.9%, Reddit: 227/578, 39.3%)上的提及频率远高于积极健康结果(Twitter: 134/577, 23.2%, Reddit: 182/578, 31.5%)。这些负面健康结果中提到的其他话题包括EVALI/住院治疗,这在Twitter上更为普遍(Twitter: 176/577, 30.5%, Reddit: 146/578, 25.3%),而对电子烟产品的成瘾或依赖在Reddit上被提到得更多(Twitter: 57/577, 9.9%, Reddit: 123/578, 21.3%)。提到与电子烟有关的积极健康结果在Reddit上更常见,这与之前描述的关键词分析一致;此外,临床编码发现,在Reddit上提到电子烟作为戒烟手段的频率高于Twitter (Twitter: 118/577, 20.5%, Reddit: 177/578, 30.6%)。

表3。Twitter和Reddit上与健康相关的关键词的分布和百分比。
与健康有关的关键字 2019年7月n (%) 2019年8月n (%) 2019年9月,n (%) 总数,n (%)

推特 Reddit 推特 Reddit 推特 Reddit 推特 Reddit
死亡 343 (1.1) 70 (2) 2701 (5.67) 129 (3.5) 32971 (15.77) 493 (9.9) 36015 (12.56) 692 (5.7)
2305 (7.67) 281 (8.2) 11612 (24.39) 411 (11.2) 33394 (15.98) 870 (17.5) 47311 (16.5) 1562 (12.91)
疾病 235 (0.8) 56 (2) 4268 (8.96) 112 (3.0) 7969 (3.8) 297 (6.0) 12472 (4.35) 465 (3.8)
风险 708 (2.4) 147 (4.3) 1231 (2.59) 197 (5.4) 6012 (2.88) 280 (5.6) 7951 (2.77) 624 (5.2)
危机 81 (0.3) 9 (0.3) 216 (0.5) 10 (0.3) 6072 (2.90) 102 (2.1) 6369 (2.22) 121 (1)
生病的 415 (1.4) 148 (4.3) 1054 (2.21) 182 (4.9) 5467 (2.62) 370 (7.5) 6936 (2.42) 700 (5.8)
医生 682 (2.3) 183 (5.3) 2359 (4.95) 228 (6.2) 4623 (2.21) 323 (6.5) 7664 (2.67) 734 (6.1)
癌症 442 (1.5) 84 (2) 782 (1.64) 80 (2) 3691 (1.77) 139 (2.8) 4915 (1.71) 303 (2.5)
受伤 96 (0.3) 31日(1) 1256 (2.64) 45 (1) 3990 (1.91) 104 (2.1) 5342 (1.86) 180 (1.5)
疫情 1091 (3.63) 16 (0.5) 533 (1.12) 24 (0.7) 2920 (1.40) 139 (2.8) 4544 (1.58) 179 (1.5)
研究 523 (1.7) 159 (4.6) 712 (1.49) 178 (4.8) 3006 (1.44) 264 (5.3) 4241 (1.48) 601 (5.0)
损害 1315 (4.37) 78 (2) 882 (1.85) 119 (3.2) 2237 (1.07) 156 (3.1) 4434 (1.55) 353 (2.9)
伤害 1503 (5.00) 139 (4.0) 1888 (3.97) 180 (4.9) 8253 (3.95) 303 (6.1) 11644 (4.06) 622 (5.1)
有害的 492 (1.6) 40 (1) 643 (1.35) 49 (1) 2892 (1.38) 143 (2.9) 4027 (1.40) 232 (1.9)
病人 162 (0.5) 61 (2) 1103 (2.31) 82 (2) 1741 (0.83) 122 (2.5) 3006 (1.05) 265 (2.2)
咳嗽 262 (0.9) 141 (4.1) 415 (0.9) 163 (4.4) 1130 (0.54) 257 (5.2) 1807 (0.63) 561 (4.6)
胸部 105 (0.4) 108 (3.1) 127 (0.3) 133 (3.6) 431 (0.2) 227 (4.6) 663 (0.2) 468 (3.9)
预防 96 (0.3) 6 (0.2) 246 (0.5) 14 (0.4) 529 (0.3) 31日(1) 871 (0.3) 51 (0.4)
吸烟 3486 (11.60) 430 (12.5) 4145 (8.71) 435 (11.8) 15604 (7.47) 604 (12.2) 23235 (8.10) 1469 (12.15)
辞职 3017 (1036) 823 (23.9) 3567 (7.49) 853 (23.2) 17365 (8.31) 1160 (23.36) 23949 (8.35) 2836 (23.45)
图1所示。在电子烟和电子烟使用相关肺损伤(EVALI)爆发期间,Twitter (A)和Reddit (B)上定义健康问题的热门词汇。
查看此图
年龄相关关键词分析

2019年7月、8月和9月与年龄组相关的前6个单词分别呈现在图2推特和红迪网的频率。在与年龄相关的关键词中,孩子们是2019年8月之后推特和Reddit上使用最多的词。推特上其他常用词汇包括少年,少年,孩子,少年.Reddit上的帖子更常包含这样的词家长,学校,家庭

与年龄相关的关键词在我们的数据集中包括儿童、成人、儿童、年轻人、老人、青年、父母、学校、年龄、学生、家庭、青少年、未成年人、母亲、丈夫、妻子、青少年、父亲、阿姨分别于2019年7月、8月和9月举行。卡方检验结果(表5)多媒体附录2)显示Twitter和Reddit上的年龄相关关键词在3个月内和整体上存在显著差异和较小的效应量,并表明Twitter上的年龄相关关键词比Reddit上的提及频率更高。对帖子内容的临床审查只关注提到青年和年轻人,发现了不同的结果,显示Twitter有22.9%(132/577)的推文提到了年轻人,Reddit有28.5%(165/578)的帖子提到了这个群体。

图2。在电子烟和电子烟使用相关肺损伤(EVALI)爆发期间,Twitter (A)和Reddit (B)上各年龄组的热门词汇。
查看此图
营销相关关键字分析

Twitter和Reddit上关于电子烟营销的常用词汇非常相似,包括销售、商业、市场、黑市;促进.在EVALI爆发的3个月中,Twitter和Reddit上排名前5的营销相关词汇的趋势如图所示图3.提到的销售,黑市,商业从2019年7月到2019年9月,Twitter和Reddit上的人数有所增加。

我们的数据集中包括与市场营销相关的关键字黑市,黑市,市场,销售,新闻,推广,营销,商业,黑市,媒体2019年7月、8月和9月。卡方检验结果(表6)多媒体附录2)显示,在所有3个月内,Twitter和Reddit上发布的营销相关关键词之间存在显著差异,但效应较小,这表明Twitter上的讨论频率高于Reddit。临床分析侧重于市场监管和政策,结果不同,Twitter讨论政策的时间为8.3% (48/577),Reddit讨论政策的时间为20%(116/578)。

图3。在电子烟和电子烟使用相关肺损伤(EVALI)爆发期间,Twitter (A)和Reddit (B)上与营销相关的热门词汇。
查看此图
电子烟产品关键词分析

电子烟产品关键词的详细分布和百分比列于多媒体附录3,推特和红迪网上与电子烟相关的热门词汇见图图4.在这两个平台上,关于电子烟成分或产品的最常见词汇是香烟,以及提及与大麻有关的关键词(杂草生物多样性公约THC,大麻)和酒精也很普遍。在Reddit上,关于产品组件的特定关键词,比如汁,墨盒,液体,则稍微常见一些。Reddit上最常见的单词包括香烟产品,不同月份的数据有所不同。推特上最常见的单词包括香烟烟草,产品并在2019年8月至2019年9月期间保持一致。在TF-IDF得分的基础上,见多媒体附录3,我们发现推特帖子中最重要的词包括香烟,香烟,烟草,产品,等等;尼古丁,而Reddit帖子中最重要的单词包括尼古丁,香烟,果汁,杂草。在我们的数据集中与电子烟产品相关的关键字包括香烟、烟草、产品、thc、cigg、尼古丁、果汁、juul、药筒、液体、大麻、化学品、酒精、电子烟、大麻、cbd、香精、成分基于2019年7月、8月和9月的数据集。卡方检验结果(表S7)多媒体附录2)显示,在这3个月里,Twitter和Reddit上发布的电子烟产品相关关键词之间存在显著差异,但效应较小。从百分比来看,Twitter上提到的电子烟产品相关关键词更多。临床分析发现了不同的结果,显示与大麻相关的关键词在Reddit(208/578, 35.9%)上被提及的频率是Twitter(77/577, 13.3%)的两倍多。

图4。在电子烟和电子烟使用相关肺损伤(EVALI)爆发期间,Twitter (A)和Reddit (B)上定义电子烟成分的热门词汇。THC:四氢大麻酚。
查看此图
戒烟vap

此外,在我们的数据集中,与戒烟相关的关键词包括辞职戒烟、停止来比较Twitter和Reddit上的模式差异。卡方检验结果显示,在所有3个月和整体上,两个平台之间的发帖差异显著,但效应量较小,从百分比来看,Twitter上提到的戒烟相关词汇频率更高(表S8)多媒体附录2).临床分析显示了不同的结果,Reddit有21.8%(126/578)的帖子与戒烟有关,Twitter有6.4%(37/577)的帖子与戒烟有关。


主要研究结果及影响

随着近年来电子烟变得越来越流行,社交媒体平台上关于其方向、政策和健康内涵的讨论也越来越多,这项研究说明了2019年EVALI爆发期间Twitter和Reddit上的情绪和关键字内容的差异。根据这段时间内与电子烟相关的帖子频率的趋势,与电子烟相关的内容在7月至8月期间增长缓慢,在8月至9月期间急剧上升。此外,在EVALI爆发期间,参与这些讨论的Twitter和Reddit用户数量显著增加。与电子烟相关的社交媒体内容的频率日益增加的趋势与EVALI爆发同时达到顶峰,这一事实支持了社交媒体作为一种监测系统的效用,用于探索在公共卫生电子烟相关危机期间自然发生的实时反应和通信。

重要的是,根据我们的内容分析,Twitter和Reddit上有关电子烟的帖子内容主要包含对电子烟的积极情绪。然而,根据所识别的最流行的内容类型,这两个平台明显不同。具体来说,Reddit用户倾向于透露个人吸电子烟的经历以及对吸电子烟的好处、政策和产品的看法,包括潜在的限制性吸电子烟政策可能对吸电子烟的用户产生的负面影响(即,减少接触有助于戒烟的电子烟产品的机会)。Reddit上提到大麻的频率也比推特上高出两倍以上,而且经常包括向Reddit其他用户询问特定电子烟产品的安全性,以及哪些症状(如果有的话)应该引起关注或医疗护理。相比之下,Twitter上包含了更多关于电子烟的主流媒体内容,特别是与EVALI病例的增加有关。我们还观察到,推特消息包含吸引注意力的负面情绪和更多使用负面情绪表达,包括杀了坏的,危险的关注,严重的,同时增加了对电子烟可能产生的负面健康影响的内容,包括上瘾。虽然这两个平台都提到了青少年,但Twitter强调了青少年吸电子烟的流行和青少年中的EVALI,以及限制成年人使用电子烟作为戒烟辅助工具的方法,而在Reddit上,与青少年相关的提到大多是个人描述自己的吸电子烟行为,包括青少年开始吸电子烟的行为。

总之,我们观察到两种社交媒体上内容主题的频率有很多有意义的区别。这些差异可能是由于个人社交网络的方式以及他们在每个平台上讨论的动机。例如,Twitter上的信息被称为新闻报道的“社交媒体平台”,记者和主要新闻提供商最常使用Twitter来广播新闻,并在重要事件发生时实时向公众发布最新消息[69]。这也许可以解释为什么推特上与电子烟相关的负面帖子频率更高,因为在EVALI爆发的整个过程中,记者和他们的受众利用这个平台进行更新和互动,特别是当它演变成一场导致许多人住院和死亡的危机时。相比之下,Reddit与其他社交媒体平台的区别在于,它提供了更坦诚的讨论,包括关于药物使用行为的交流,因为它采用了假名用户系统和慷慨的字符限制;这可能就是为什么我们发现描述个人电子烟经历的内容更普遍的原因。

与以往工作的比较

我们发现的差异也可能是由于用户本身的差异。例如,Twitter的人口统计用户基础主要是白人成年人,他们受教育程度较高,比普通公众更有可能被认定为民主党人,10%的用户创造了80%的推文[70]。相比之下,Reddit用户往往跨越教育程度,居住在城市或郊区[71]。美国疾病控制与预防中心发现,在有色人种中,吸电子烟的比例高于白人。72],另一项研究表明,受教育程度越高,使用电子烟的几率越低[73]。这表明Reddit上的用户可能比Twitter上的用户更有可能吸电子烟,这解释了他们在个人吸电子烟相关经历的分享模式和对限制性政策的担忧。

限制

本文的研究结果应该在其局限性的背景下考虑。首先,我们只分析了这些平台上基于文本的帖子或消息。虽然这为我们提供了来自每个社交媒体网站的大量数据信息,但它不包括可用于进一步分析的大量多媒体内容,包括照片、视频和链接。其次,由于Twitter上的字符限制和Reddit帖子的无限长度,每篇帖子中单词数量的差异可能会影响本研究中的情绪和关键词分析。第三,由于我们收集数据的时间,我们没有收集与COVID-19及其对吸电子烟者和吸电子烟政策的影响相关的信息,这使我们无法辨别出更近期的影响。第四,我们用于从Twitter和Reddit中提取电子烟相关数据集的原始关键字列表可能包含更多与健康相关的负面关键字,这可能会影响情绪和健康结果的结果,从而导致我们关键字列表中的潜在选择偏差。由于这项研究的重点是在疫情爆发期间Twitter和Reddit上与电子烟相关的话题的健康问题,因此关键词列表中包含了多个与情绪相关的单词。它会给我们的情感分析结果带来偏差,但这些词是选择相关帖子和解决我们的研究问题的关键。此外,我们应用GetOldTweets和Pushshift api根据关键字列表提取数据。由于这些api的提取机制是找到与某个关键字具有相同字段的帖子,而无需进一步过滤匹配的帖子,因此提取的数据集可能包括来自机器人而不是真实用户的帖子,这可能会给我们的情感结果带来偏见。 We plan to apply different methods to clean the posts generated by bots in our future studies. However, the use of this data set was in line with the larger aims of this study, which were to better understand the content and sentiment surrounding vaping on Twitter and Reddit to inform the development of potential identification and outreach methods on social media to those at risk of negative health outcomes to improve public health. The fifth limitation was that we applied an existing tool VADER to analyze the sentiment of the posts, and thus, it could bias to our sentiment analysis results, which are common issues for any sentiment analysis tool owing to the complex dynamics of human expressions, emotions, and contexts. In the future, we will also consider creating a sentiment analysis model optimization with social media posts to overcome the current disadvantages of not effectively identifying sarcastic sentences.

未来的发展方向

总的来说,这项研究的结果揭示了Twitter和Reddit作为公共卫生危机发生和发展时公开可用的社交媒体数据源的优势。与那些吸电子烟的人或有兴趣戒烟的人一起工作的健康从业者应该意识到与电子烟有关的信息和可能的错误信息,并努力评估各种平台上的社交媒体参与是否会影响持续使用或成为戒烟的障碍。这份手稿中分享的结果也可以通知社交媒体公司和公共卫生官员,提醒他们注意这些网站上的电子烟产品营销,并鼓励对Reddit等旨在支持戒烟的社区进行保护。此外,为了提高公共卫生覆盖面,未来的研究可以探索利用每个平台的内容和这里确定的网络类型的自动检测机制,特别是研究识别正在吸电子烟并可能需要信息和支持戒烟的用户的潜力。这可能有助于制定有效、及时的社交媒体主动宣传策略,传播有关电子烟的健康教育,包括戒烟策略。

致谢

作者感谢美国南卡罗来纳州哥伦比亚市南卡罗来纳大学(USC)提供的资金支持(资助号80002838);USC大数据健康科学中心的部分支持,USC卓越倡议计划(授予BDHSC-2021-14和BDHSC-2022);并获得南加州大学通过研究与创新中心(ACORN-2022)和美国国立卫生研究院(授予K02 DA043657, UL1 TR002377和R34 DA054725)的研究资助。内容完全是作者的责任,并不一定代表资助机构的官方观点。

数据可用性

通过向通讯作者提出合理要求,研究人员可以访问本文中分析的数据集。

作者的贡献

DW和EK贡献相同,PAC-R担任资深作者。

利益冲突

没有宣布。

多媒体附录1

用于数据提取的关键字和术语。

DOCX文件,13 KB

多媒体附录2

统计分析结果。

DOCX文件,29 KB

多媒体附录3

Twitter和Reddit上电子烟产品相关关键词的分布和词频逆文档频率得分。

DOCX文件,22 KB

  1. Mirbolouk M, Charkhchi P, Kianoush S, Uddin SM, Orimoloye OA, Jaber R,等。美国成年人电子烟使用的流行和分布:行为风险因素监测系统,2016。实习医学2018年10月2日;169(7):429-438。[CrossRef] [Medline
  2. 在COVID-19大流行期间,青少年使用电子烟仍然是严重的公共卫生问题。疾病控制和预防中心。2021。URL:https://www.cdc.gov/media/releases/2021/p0930-e-cigarette.html[2021-12-07]访问
  3. 李建军,李建军,李建军,等。电子烟与青少年:使用模式、潜在危害和建议。预演2020年02月03日;133:106009。[CrossRef] [Medline
  4. El-Mahdy MA, mahgroup EM, eweeks MG, Eid MS, Abdelghany TM, Zweier JL。长期电子烟暴露诱发心血管功能障碍:尼古丁的作用和暴露时间。[J]中华医学会心内科杂志,2011;32 (5):391 - 391 [J]免费全文] [CrossRef] [Medline
  5. Park E, Kwon M, Gaughan MR, Livingston JA, Chang Y.倾听青少年:他们对电子烟的看法和信息来源。中华儿科杂志(英文版);2019;48(8):591 - 596。[CrossRef] [Medline
  6. Morean ME, Bold KW, Kong G, Gueorguieva R, Camenga DR, Simon P,等。青少年对JUUL电子烟尼古丁强度及电子烟现状的认知药物酒精依赖2019年11月01日;204:107512 [j]免费全文] [CrossRef] [Medline
  7. Strombotne K, Sindelar J, Buckell J,谁,我吗?对美国青少年戒烟能力的乐观偏见。成瘾2021年11月;116(11):3180-3187 [免费全文] [CrossRef] [Medline
  8. 与使用电子烟或电子烟产品相关的肺损伤爆发。美国疾病控制与预防中心。2020。URL:https://www.cdc.gov/tobacco/basic_information/e-cigarettes/severe-lung-disease.html#latest-information[2021-09-11]访问
  9. 电子烟疾病最新消息:FDA警告公众停止使用含有四氢大麻酚(THC)的电子烟产品和任何从街上获得的电子烟产品。美国食品和药物管理局。2021。URL:https://www.fda.gov/consumers/consumer-updates/vaping-illness-update-fda-warns-public-stop-using-tetrahydrocannabinol-thc-containing-vaping[2021-09-11]访问
  10. 李建军,李建军,李建军。基于社交媒体平台对非法药物使用监测的系统评价。公共卫生杂志,2017年12月1日;39(4):763-776 [J]免费全文] [CrossRef] [Medline
  11. 使用社交媒体进行心理健康监测:综述。ACM computing sur2021 11月30日;53(6):1-31。[CrossRef
  12. Amir S, Dredze M, Ayers JW。在社交媒体上进行心理健康监测。2019年第六届计算语言学与临床心理学研讨会论文集,发表于:CLPsych '19;2019年6月6日;明尼阿波利斯,明尼苏达州,美国第114-120页。[CrossRef
  13. Paul MJ, Sarker A, Brownstein JS, Nikfarjam A, Scotch M, Smith K,等。利用社交媒体进行公共健康监测和监督。参见:2016太平洋生物计算研讨会论文集。2016呈现于:PBS '16;2016年1月4日至8日;大岛,夏威夷,美国,第468-479页。[CrossRef
  14. Aiello AE, Renson A, Zivich PN。基于社会媒体和互联网的公共卫生疾病监测。公共卫生,2020年4月2日;41:101-118 [j]免费全文] [CrossRef] [Medline
  15. 姜凯,冯绍平,宋强,李建平,李建平。基于词嵌入和LSTM神经网络的个人健康体验推文识别。BMC Bioinformatics 2018 Jun 13;19(增刊8):210 [j]免费全文] [CrossRef] [Medline
  16. 关于美国人和推特的10个事实。皮尤研究中心,2022年5月5日。URL:https://www.pewresearch.org/fact-tank/2019/08/02/10-facts-about-americans-and-twitter/[2022-03-30]访问
  17. 华杰,金世伟,金俊杰。社交网站在连接和联结社会资本方面的使用和满足:Facebook、Twitter、Instagram和Snapchat的比较。计算机与人类行为学报,2017;72:115-122。[CrossRef
  18. Berry N, Lobban F, Belousov M, Emsley R, Nenadic G, Bucci S. # why wetweetmh:了解为什么人们使用Twitter来讨论心理健康问题。医学互联网研究,2017年04月05日;19(4):e107 [J]免费全文] [CrossRef] [Medline
  19. Makita M, Mas-Bleda A, Morris S, Thelwall M.心理健康意识周期间Twitter上的心理健康话语。问题与健康护理2021年5月;42(5):437-450。[CrossRef] [Medline
  20. 王晓东,何伟,冯志强,梁辉,傅光华,谢志涛。利用Twitter进行公共卫生监测,从监测和预测到公众反应。数据2019;4(1):6。[CrossRef
  21. 戴鑫,Bikdash M, Meyer B.从社交媒体到公共卫生监测:基于词嵌入的Twitter分类方法。见:2017东南大会论文集。2017年出席:SECON '17;2017年3月30日至4月2日;康科德,北卡罗来纳州,美国第1-7页。[CrossRef
  22. Allem JP, Majmundar A, Dharmapuri L, Cruz TB, Unger JB。2018年推特上与电子液体相关的帖子:主题分析。成瘾行为报告2019年12月10日:100 - 96 [j]免费全文] [CrossRef] [Medline
  23. McCausland K, Maycock B, Leaver T, Wolf K, Freeman B, Jancey J.推特上的电子烟倡导者:与电子烟相关推文的内容分析。JMIR公共卫生监测2020 Oct 14;6(4):e17543 [j]免费全文] [CrossRef] [Medline
  24. Valdez D, Ten Thij M, Bathina K, Rutter LA, Bollen J.社交媒体对COVID-19大流行期间美国心理健康的影响:Twitter数据的纵向分析。医学信息学报,2020,12;22(12):e21418 [J]免费全文] [CrossRef] [Medline
  25. Rhidenour KB, Blackburn K, Barrett AK, Taylor S.调解医用大麻:探索退伍军人如何在Reddit上讨论他们耻辱的物质使用。卫生通讯2022年9月;37(10):1305-1315。[CrossRef] [Medline
  26. Pestana J, Beccaria F, Petrilli E. Reddit精神世界社区的致幻剂使用情况。对动机和方式的定性研究。毒品与酒精今日2021;21(2):112-123。[CrossRef
  27. 张建军,李建军,李建军,张建军。药物使用轨迹:从Reddit招募的成年人中,处方兴奋剂的非医疗使用(NMU)是非口服给药途径。CNS spectre 2021 5月10日;26(2):166-167 [免费全文] [CrossRef
  28. [j]刘建军,刘建军,刘建军,等。从匿名性和寻求支持的角度分析社交媒体对性侵犯行为的影响。参见:2016年CHI计算系统中人因会议论文集。2016年5月发表于:CHI '16;2016年5月7-12日;圣何塞,加州,美国p. 3906-3918。[CrossRef
  29. 考夫曼先生,巴泽尔AT, Collaco A, Sedoc J。“这部剧在很多层面上都很切题”:分析Reddit上关于HBO《Euphoria》的评论,以了解观众对药物使用和精神疾病的经历和反应。药物与酒精的关系[j]; [c]; 2009免费全文] [CrossRef] [Medline
  30. Vosburg SK, Robbins RS, Antshel KM, Faraone SV, Green JL。从Reddit招募的成人中非口服处方兴奋剂非医疗使用途径的特征。前沿精神病学2021年1月25日;11:63 . 1792 [免费全文] [CrossRef] [Medline
  31. Lu J, Sridhar S, Pandey R, Al Hasan M, Mohler G.基于Reddit数据文本挖掘的药物成瘾研究。参见:第25届ACM SIGKDD知识发现与数据挖掘国际会议论文集。2019年7月发表于:KDD '19;2019年8月4日至8日;安克雷奇,AK, USA p. 2367-2375。[CrossRef
  32. Kwon M, Park E.社交媒体平台上对电子烟的看法和情绪:系统评价。中华医学会公共卫生监测2020年1月15日;6(1):e13673 [j]免费全文] [CrossRef] [Medline
  33. 徐亚,金海明,王毅,吴健,洪涛,McLaughlin M. Reddit上电子烟禁令的公众反应与关注:纵向主题建模方法。第13届社会计算和社会媒体国际会议论文集:体验设计和社会网络分析。2021提交于:SCSM '21;2021年7月24日至29日;虚拟p. 391-403。[CrossRef
  34. Reddit上的电子烟戒烟:用户如何讨论他们的戒烟经历、社会支持和戒烟建议。爱荷华大学公共卫生学院,2020。URL:https://www.public-health.uiowa.edu/wp-content/uploads/2020/12/Kamara-Shaw.pdf[2022-03-30]访问
  35. Allem JP, Majmundar A, Dharmapuri L, Unger JB, Cruz TB。来自Reddit论坛评论的电子烟产品见解。Tob previous Cessat 2019 Sep 12;5:29 [免费全文] [CrossRef] [Medline
  36. Iqbal M. Twitter收入和使用统计。应用商业。2022。URL:https://www.businessofapps.com/data/twitter-statistics/[2022-01-29]访问
  37. 推特如此有害的3个原因——以及你如何保护自己。通知》2021。URL:https://notifier.so/docs/3-reasons-why-twitter-is-so-toxic-and-how-you-can-protect-yourself/[2022-01-29]访问
  38. Reddit的人口统计数据:谁在使用这个网站?2021年4月6日URL:https://www.alphr.com/demographics-reddit/[2022-01-29]访问
  39. 改变我的想法:Reddit是一个社交网络,它是最好的。Android Authority: 2021年10月17日。URL:https://www.androidauthority.com/reddit-vs-facebook-vs-twitter-3037642/[2022-01-29]访问
  40. Myslín M,朱舒,查普曼W,康威M.利用twitter研究吸烟行为和对新兴烟草产品的认知。医学与互联网研究,2013年8月29日;15(8):e174 [J]免费全文] [CrossRef] [Medline
  41. 李建军,张建军,张建军,等。Twitter监控电子烟的机器学习分类器:比较机器学习研究。医学信息学报,2020,Aug 12;22(8):e17478 [J]免费全文] [CrossRef] [Medline
  42. Janmohamed K, Soale AN, Forastiere L,唐伟,shay, Demant J,等。基于网络的电子烟叙事与COVID-19的交集:主题建模研究。[J]医学互联网研究,2020 Oct 30;22(10):e21743 [J]免费全文] [CrossRef] [Medline
  43. 刘杰,刘建平,刘建平,刘建平,刘建平,刘建平,刘建平。吸烟者参与推特上有关电子烟使用相对危害的信息和错误信息的可能性:一项随机对照试验的结果。JMIR公共卫生监测2021 12月21日;7(12):e27183 [j]免费全文] [CrossRef] [Medline
  44. 陈丽,卢旭,袁军,罗军,罗军,谢志,等。一项关于调味电子烟与健康症状关联的社交媒体研究:观察性研究。[J]医学互联网研究,2020;22(6):e17496 [J]免费全文] [CrossRef] [Medline
  45. 杨勇,李建平,李建平。电子烟戒烟:Reddit戒烟社区的内容分析。[J]互联网研究与发展[J]; 2010;23(10): 888 - 888 [J]免费全文] [CrossRef] [Medline
  46. Priya S, Sequeira R, Chandra J, Dandapat SK。人们应该从哪里获得新闻更新:Twitter或Reddit。在线Soc网络媒体2019年1月;9:17-29。[CrossRef
  47. 杜兰RV, Murthy M,罗杰。透过烟雾透视:利用Reddit和Twitter数据对电子烟口味、品牌和市场的全球比较研究。arXiv 2020 Feb 4:1-7 [免费全文
  48. Kasson E, Singh AK, Huang M, Wu D, Cavazos-Rehg P.在2019年EVALI爆发期间,使用混合方法确定Twitter上公众对电子烟风险和整体健康结果的看法。中华医学杂志[J]; 2011; 33 (5): 391 - 391 [J]免费全文] [CrossRef] [Medline
  49. GetOldTweets3 0.0.11。Python包索引。2019。URL:https://pypi.org/project/GetOldTweets3/[2022-01-21]访问
  50. Chandrasekaran R, Mehta V, Valkunde T, Moustakas E.关于COVID-19大流行的推文主题、趋势和情绪:时间信息监测研究。[J]互联网研究,2020,10 (2):1 - 2 [J]免费全文] [CrossRef] [Medline
  51. Pushshift Reddit API v4.0文档。Pushshift》2018。URL:https://reddit-api.readthedocs.io/en/latest/#searching-submissions[2021-10-01]访问
  52. 李建军,李建军,李建军。情感分析方法的研究与应用。Cham,瑞士:Springer;2017.
  53. 黄梅,ElTayeby O, Zolnoori M,姚磊。公众对疾病的看法:基于新闻媒体数据的信息流行病学研究。医学互联网研究,2018年05月08日;20(5):e10047 [J]免费全文] [CrossRef] [Medline
  54. Hutto C, Gilbert E. Vader:社交媒体文本情感分析的精简规则模型。摘自:第八届AAAI网络日志和社交媒体国际会议论文集。2014年5月16日在:ICWSM '14;2015年5月27-29日;安娜堡,密歇根州,美国第216-225页。[CrossRef
  55. 王晓明,王晓明,王晓明。关于大麻二酚的个人和商业推文的信息流行病学研究。[J]互联网研究与发展[J]; 2013;23(12): 871 - 871 [J]免费全文] [CrossRef] [Medline
  56. Krawczyk K, Chelkowski T, Laydon DJ, Mishra S, Xifara D, Gibert B,等。量化在线新闻媒体对COVID-19大流行的报道:文本挖掘研究和资源。[J]医学互联网研究,2021;23(6):e28253 [J]免费全文] [CrossRef] [Medline
  57. 文本挖掘:使用TF-IDF检查词与文档的相关性。[J] .计算机应用学报,2018,31(1):25-29。[CrossRef
  58. Lienemann BA, Unger JB, Cruz TB, Chu K.烟草相关Twitter数据的编码方法:一个系统综述。医学互联网研究,2017年3月31日;19(3):e91 [J]免费全文] [CrossRef] [Medline
  59. Elo S, Kyngäs H.定性内容分析过程。中华护理杂志;2008;32(1):107-115。[CrossRef] [Medline
  60. van der Tempel J, Noormohamed A, Schwartz R, Norman C, Malas M, Zawertailo L. Vape,辞职,推特?推特上的电子烟和戒烟。国际公共卫生杂志2016;61(2):249-256。[CrossRef] [Medline
  61. Martinez LS, Hughes S, Walsh-Buhi ER, Tsou MH. "好的,我们明白了。You vape”:对Twitter上有关电子烟的地理编码内容、语境和情绪进行分析。中华卫生杂志,2018;23(6):550-562。[CrossRef] [Medline
  62. mcausland K, Maycock B, Leaver T, Jancey J.电子烟相关社交媒体促销和讨论中的信息呈现:范围审查。医学互联网研究,2019 Feb 05;21(2):e11953 [J]免费全文] [CrossRef] [Medline
  63. Miech R, Patrick ME, O'Malley PM, Johnston LD.孩子们在吸什么?这是一项针对美国青少年的全国性调查的结果。烟草控制2017年7月;26(4):386-391 [j]免费全文] [CrossRef] [Medline
  64. 布德尼AJ,萨金特JD,李DC。吸食大麻(大麻):与电子烟一样令人担忧?《成瘾》2015;11 (11):1699-1704 [免费全文] [CrossRef] [Medline
  65. 索尔斯SJ,克劳斯MJ,康诺利S, Cavazos-Rehg PA。2014年11月,Twitter上电子烟广告的内容分析。前瞻慢性病2016年9月29日;13:E139 [j]免费全文] [CrossRef] [Medline
  66. 引用本文:张建明。互译者信度:kappa统计。生物化学医学杂志(Zagreb) 2012;22(3):276-282 [j]免费全文] [CrossRef] [Medline
  67. 陈建军,陈建军。基于数据编码的可靠性研究。2015/5/26;3(6):375-387。[CrossRef
  68. 李金良,陈志强,陈志强,陈志强,陈志强。与健康相关的用户在推特上发什么?对Twitter上与健康相关的用户及其信息进行定性内容分析。医学互联网研究,2014;15;16(10):e237 [J]免费全文] [CrossRef] [Medline
  69. Orellana-Rodriguez C, Keane MT.新闻的关注及其在Twitter上的传播:一项调查。计算机科学,2018;29:74-94。[CrossRef
  70. 沃西克J,休斯A.评估推特用户。皮尤研究中心2019年4月24日发布。URL:https://www.pewresearch.org/internet/2019/04/24/sizing-up-twitter-users/[2022-03-22]访问
  71. 6%的在线成年人是reddit用户。皮尤研究中心,2013年7月3日。URL:https://www.pewresearch.org/internet/2013/07/03/6-of-online-adults-are-reddit-users/[2022-03-22]访问
  72. 初中和高中学生电子烟使用特征-美国,2015。美国疾病控制与预防中心,2016。URL:https://www.cdc.gov/tobacco/data_statistics/mmwrs/byyear/2016/mm655051a2/index.html[2022-03-22]访问
  73. Assari S, Mistry R, Bazargan M.种族、受教育程度和电子烟使用。中国生物医学工程学报,2010;33 (1):591 - 591 [J]免费全文] [CrossRef] [Medline


API:应用程序接口
CS:计算机科学
EVALI:电子烟和电子烟使用相关的肺损伤
TF-IDF:术语频率-逆文档频率
维德:价感知词典和情感推理器


编辑:梁涛;提交11.05.22;由邓t,张赫,R Chew, N Ezike, W Ceron同行评审;对作者10.08.22的评论;修订版本收到16.09.22;接受29.10.22;发表13.12.22

版权

©Dezhi Wu, Erin Kasson, Avineet Kumar Singh, Yang Ren, Nina Kaiser, Ming Huang, Patricia A Cavazos-Rehg。原载于医学互联网研究杂志(//www.mybigtv.com), 2022年12月13日。

这是一篇在知识共享署名许可(https://creativecommons.org/licenses/by/4.0/)下发布的开放获取文章,该许可允许在任何媒介上不受限制地使用、分发和复制,前提是原始作品首次发表在《医学互联网研究杂志》上,并适当引用。必须包括完整的书目信息,到//www.mybigtv.com/上原始出版物的链接,以及版权和许可信息。


Baidu
map