JMIR J医疗互联网服务 医学互联网研究杂志 1438 - 8871 卡塔尔世界杯8强波胆分析 加拿大多伦多 v20i11e11669 30455162 10.2196/11669 原始论文 原始论文 2017 - 2018年推特上与水烟相关的帖子:专题分析 Eysenbach 冈瑟 Laestadius Linnea 科迪兹 杰森 Allem Jon-Patrick 马博士, 1
南加州大学凯克医学院 索托北街2001号 洛杉矶,加州,90032 美国 1 8586030812 allem@usc.edu
http://orcid.org/0000-0001-9135-8689
Dharmapuri Likhit BTech 2 http://orcid.org/0000-0002-4879-2161 利文斯 亚当M 博士学位 1 http://orcid.org/0000-0002-1217-525X 昂格尔 詹妮弗·B 博士学位 1 http://orcid.org/0000-0001-9064-6603 博伊尔克鲁兹 苔丝 博士学位 1 http://orcid.org/0000-0002-5894-1802
南加州大学凯克医学院 洛杉矶,加州 美国 计算机科学系 南加州大学 洛杉矶,加州 美国 通讯作者:Jon-Patrick Allem allem@usc.edu 11 2018 19 11 2018 20. 11 e11669 23 7 2018 13 9 2018 5 10 2018 8 10 2018 ©Jon-Patrick Allem, Likhit Dharmapuri, Adam M Leventhal, Jennifer B Unger, Tess Boley Cruz。最初发表于《医疗互联网研究杂志》(//www.mybigtv.com), 2018年11月19日。 2018

这是一篇开放获取的文章,根据创作共用署名许可(https://creativecommons.org/licenses/by/4.0/)的条款发布,允许在任何媒介上无限制地使用、分发和复制,前提是正确引用最初发表在《医学互联网研究杂志》上的原创作品。必须包括完整的书目信息,//www.mybigtv.com/上的原始出版物的链接,以及此版权和许可信息。

背景

水烟(或烟草水烟)的使用最近在美国变得很普遍。与水烟使用相关的背景和经历尚不清楚,但通过公开的水烟用户在社交媒体上发布的帖子,此类信息非常丰富。

客观的

在这项研究中,我们利用Twitter数据来描述Twitter用户最近使用水烟的经历。

方法

包含“水烟”一词的推特帖子的时间为2017年4月1日至2018年3月29日。文本分类器用于识别倾向于在帖子中同时出现的主题集群(n=176,706)。

结果

最常见的话题群是个人标签(在帖子中使用@用户名标记另一个Twitter账户),占21.58%(38,137/176,706),其次是促销或社交活动(例如,提到女士之夜、派对等),占20.20%(35,771 /176,706),以及呼吁或滥用责任(例如,渴望、享受水烟),占18.12%(32,013/176,706)。其他主题包括水烟使用行为(例如,提到吸食水烟)占11.67%(20,603/176,706),多物质使用(例如,水烟和其他物质的使用)占10.95%(19,353/176,706),买卖(例如,购买,订购,购买,出售)占9.37%(16,552/176,706),香料(例如,薄荷,肉桂,西瓜)占1.66%(2927/176,706)。不喜欢水烟的话题(例如,讨厌,戒烟,不喜欢)是罕见的0.59%(1043/176,706)。

结论

2017-2018年,社交事件、吸引力或滥用责任、口味和多物质使用是推特上关于水烟的讨论的常见背景和经历。与水烟的传统数据来源一致考虑,这些结果表明,社会事件、上诉或滥用责任、口味和多物质使用值得考虑作为未来监测、政策制定和干预水烟的目标。

水烟 给水管 推特 社交媒体 尼古丁 口味 社会吸烟 infodemiology
简介

水烟(或烟草水烟)的使用最近在美国越来越受欢迎,特别是在年轻人和年轻成年人中[ 1 2].虽然接触水烟的危害与吸入可燃香烟的危害相似[ 3. 4],某些弱势群体认为它比香烟更安全[ 5]并受较少的规管[ 6].例如,水烟有很多种口味,而有香味的香烟在美国是被禁止的。

可有效利用在社交媒体网站(如Twitter、Instagram、YouTube)上发布信息的个人提供的可公开获取的数据,快速捕捉和描述烟草使用的背景[ 7- 9].之前对2017年社交媒体网站上与水烟相关的帖子的分析提供了一些与水烟相关的上下文信息,包括程式化水管的重要性和欣赏度[ 10 11]、在社交场合使用水烟[ 10],与酒精共同促进[ 10],主要是积极的用户体验[ 12- 16].然而,文化趋势、烟草制品消费市场和烟草制品卫生政策正在不断迅速发展。与水烟使用相关的背景和经验也在迅速变化,因此提供有关这些问题的最新信息,为监测、政策制定和针对水烟的干预提供信息非常重要。

在这项研究中,我们展示了从Twitter收集数据来记录和描述2017年至2018年与水烟相关的对话的实用性。我们的目标是确定公众最近使用水烟的经历,包括了解使用水烟的社会和环境背景。24%的美国成年人使用Twitter(男性23%,女性24%,白人24%,非洲裔26%,西班牙裔20%),46%的用户每天使用该平台。 17].这项研究的结果将为烟草控制政策和预防工作提供信息,并证明利用Twitter数据快速监测健康行为和水烟等烟草相关产品的实用性。

方法 数据收集

含有“水烟”(或“#水烟”)一词的推特帖子是从推特的流媒体应用程序接口(API;2017年4月1日至2018年3月29日,使用Twitter4J库收集推文的过滤流,收集时间没有空白)。在此期间,共有963,954个职位。

数据处理

我们删除了转发和非英语帖子,结果有348,834个独特的帖子被用于分析。虽然waterpipe这个词在学术论文和演讲中被用来指水烟,但个人在社交媒体上使用这个词并不常见,因此它没有被包括在这项研究中[ 18].为了清理数据,我们删除了被识别为社交机器人账户的推文[ 19 20.]使用测底仪(亦称Bot or Not) [ 21],最终的分析样本来自90718个独立用户的176706条推文。

准备最后的样本进行分析,其中包括基本规范化(例如,删除标点符号,小写文本),停止单词删除(例如,单词“a”和“The”),Twitter用户提及的规范化(例如,“@janedoe”被转换为“@username”),词元化(例如,“cat”,“cats”,“cat’s”都被转换为“cat”),以及不可打印字符删除(例如,表情符号)[ 13].所有分析都依赖于公开的匿名数据;遵守Twitter的条款和条件、使用条款和隐私政策;并且是在作者所在大学的机构审查委员会批准下进行的。为了保护隐私,本报告没有逐字逐句地报道推文。

主题识别方法

最初,我们使用词频(单个单词和双单词组合,也称为一克和二克)分析推文,并通过单词云将数据可视化,以确定共同的主题( 多媒体附件1).从这一评估中,作者在几个主题上达成了专家共识,包括 个人标签(例如,在一篇文章中使用@username标记另一个推特账户), 买卖(例如,表示购买、出售或购买水烟的词语), 上诉 滥用倾向(例如,表示渴望、想要、需要、享受和热爱水烟的词语), 水烟使用行为(例如,提到抽一口水烟或抽水烟), 促销或社交活动(例如,提到女士之夜、派对等), 多重药物使用(例如,表示酒精、大麻或其他与水烟一起使用的物质的词语),以及 口味(例如,使用“肉桂”、“蓝莓”和“西瓜”等词; 文本框1).根据先前的研究[ 22 23,我们就在寻找能说明这一点的单词和短语 讨厌水烟(例如,“不要水烟”和“戒水烟”)。

接下来,我们使用了Word2Vec,这是谷歌开发的一种语言建模技术,允许用户学习用于创建文本分类器的文本表示[ 24].Word2Vec通过使用语料库中的每个单词来预测通常围绕它的单词,从而为文本创建嵌入(例如,单词的数字表示,有助于捕获含义、语义关系和上下文)。换句话说,Word2Vec创建了单词嵌入,其中保留了单词之间的语义关系。这种技术的一个优点是同义词的单词将具有相似的嵌入,而反义词的单词将具有不同的嵌入。类似地,在Word2Vec词的表示中,“国王”和“王后”之间的关系等同于“男人”和“女人”之间的关系。

我们使用Word2Vec为我们在单词云阶段确定的每个主题的1g和biggram找到相似的单词。这个过程,加上视觉检查和手动编辑,允许我们通过识别帖子中出现在与原始关键字相似上下文中的单词来扩展每个主题的单词列表。例如,通过这个过程,我们发现单词“渴望”、“爱”、“享受”和“需要”出现在包含单词“想要”和“水烟”的帖子中。

分类是通过检查推文中是否存在任何一个关键字(一克和二字)来完成的。如果一条推文包含与某个主题相关的任何关键字,则该推文被归类为该主题的一部分。换句话说,我们使用了一个用Python编写的基于规则的分类脚本,其中检查每个推文是否存在代表主题的指定n-grams集。对于每个分析,我们在混淆矩阵中展示结果,其中对角线表示主题的流行度,非对角线表示主题重叠。例如,一个假设的帖子,如“我现在很渴望水烟和啤酒”,可以被归类为 上诉或滥用法律责任而且 多重药物使用.包含这两种内容的帖子的数量可以在这两个主题的矩阵的交集处找到,即2.14%(3824/176,706)。

与“水烟”一词一起出现在帖子中的主题和常用词;这些词是为了为每个主题提供进一步的背景,不是详尽的,并按字母顺序列出。

个人标签

@用户名

促销活动

酒吧

食物

星期五

休息室

晚上

聚会,派对

周六

上诉或滥用责任

渴望

享受

日常

得到

就像

需要

想要

水烟使用行为

打击

通过

泡芙

使用

多重药物使用

酒精

啤酒

香烟

鸡尾酒

饮料

尤尔的说法

玛格丽特

伏特加

杂草

Vape

买卖

买买

订单

支付

购买

出售

口味

口味

薄荷

肉桂

西瓜

蓝莓

番石榴

葡萄

苹果

水果

桃子

橙色

芒果

糖果

结果

我们确定的8个主题的总覆盖率占推文语料库中所有推文的65.45% (115,658/176,706) 图1).其余34.59%的推文(61,048/176,706)变化太大,无法划分为一个具有有意义的覆盖范围的单一主题(每个后续主题的覆盖率不到总推文的1%)。最流行的话题是 个人标签21.58%(38137 / 176706),其次是 促销或社交活动20.20% (35,701/176,706), 上诉或滥用法律责任18.12% (32,013/176,706) 水烟使用行为11.67%(20,603/176,706)。

话题的流行度。

约10.95%(19,353/176,706)的语料库是 多重药物使用,而 买卖占9.37%(16,552/176,706)和 口味包含1.66%(2927/176,706)的推文。最不常见的话题是 讨厌水烟0.59%(1043/176,706)。最常见的话题重叠是 个人标签而且 促销或社交活动4.34%(7666/176,706),其次是 买卖而且 上诉或滥用法律责任4.12%(7276/176,706)和 促销或社交活动而且 上诉或滥用法律责任3.52%(6225 - 176,706)。

讨论 主要研究结果

这项研究确定了2017年至2018年推特上与水烟相关的帖子的主题,为公众最近使用水烟的经历提供了一些见解。最流行的话题是 个人标签或者一个推特用户直接与另一个用户(粉丝或朋友)交流水烟,而最常见的重叠话题是 个人标签而且 促销或社交活动。这些研究结果表明,推特用户通过水烟传播共同的价值观和体验。换句话说,这些帖子可能会通知其他人与水烟相关的事件,并将人们纳入水烟社区。同样,最近对Twitter上juul相关帖子的研究发现了一些例子 个人标签帖子显示,人们在使用或购买juul相关产品时通知了他们的朋友[ 22].总的来说,这些人际交流表明,人们在推特上围绕烟草相关产品建立联系,许多人可能共同使用烟草,或者在社会影响下,一个人激励另一个人使用烟草。

水烟使用行为而且 多重药物使用被确定为讨论的话题,可能代表了特定推特用户中的一种风险行为综合征。这些发现与早期在Tumblr上发布的关于水烟帖子的研究一致。 18]和Instagram [ 10]以及基于调查的研究表明,与不使用水烟的人相比,使用水烟的人更有可能使用其他物质,包括酒精、香烟、大麻和可卡因[ 25].将水烟与其他物质结合使用的个人可能存在滥用药物的风险;例如,使用水烟会增加酒精的摄入量,反之亦然[ 26].

这项研究中的帖子反映了推特用户对口味的兴趣,这与之前关于推特上烟草相关帖子的研究相似[ 22 27].最近的一项研究发现,在全国具有代表性的年轻人样本(18-24岁)中,口味是使用水烟的常见原因[ 28].研究还证明,水烟等调味烟草产品被认为比香烟危害小[ 29].限制口味,如本研究中确定的口味(肉桂、西瓜、蓝莓等),以降低水烟的吸引力,可能是未来探索的政策考虑。

这项研究发现的许多帖子反映出Twitter用户渴望、享受或想要水烟;这一发现,再加上发现表明不喜欢水烟的帖子很少,表明目前需要有针对性的干预措施来阻止水烟使用的吸引力。关于水烟吸引力的共同讨论可能有助于水烟在推特上的使用正常化,这可能会对线下行为产生影响[ 30.].

限制

这项研究的重点是推特上的帖子,研究结果可能无法推广到其他社交媒体平台。本研究中分析的帖子收集自12个月的时间段,可能无法推广到其他时间段。虽然在数据收集中只使用了一个词根词“水烟”(或“#水烟”),但研究表明,这是社交媒体上指水烟使用的常用术语[ 10 13 18].数据收集依赖于Twitter的流式API,该API阻止了从Twitter私人账户收集推文。因此,调查结果可能不能代表拥有私人账户的个人的态度和行为。

结论

2017-2018年,社交事件、吸引力或滥用责任、口味和多物质使用是与推特上关于水烟的讨论相关的常见背景和经历。与水烟的传统数据来源相一致,这些结果表明,社会事件、吸引力或滥用责任、口味和多物质使用值得考虑作为未来监测、公共政策和针对水烟的干预措施的目标。这项研究还强调了在公共卫生监测中使用社交媒体数据的明显好处。来自社交媒体的数据可以作为一个持续的系统,向公共卫生研究人员提供有关烟草产品或公众使用这些产品的方式的近实时信息。

多媒体附件1

水烟字云。

缩写 API

应用程序接口

本出版物中报道的研究得到了国家癌症研究所和食品和药物管理局(FDA)烟草产品中心的Grant #P50CA180905的支持。美国国立卫生研究院(NIH)或FDA在研究设计、数据收集、分析和解释中没有任何作用;撰写报告;以及提交报告发表的决定。内容仅为作者的责任,并不代表NIH或FDA的官方观点。

JPA和LD构思了这项研究并分析了数据。JPA起草了最初的手稿。LD、AML、TBC、JBU对重要的智力内容进行了修改,并通过了最终稿。JBU和TBC获得了这项研究的资金。

没有宣布。

萨卢姆 RG 全面接触式 T Maziak W 迈向水管管理框架 公共卫生 2016 12 106 10 1773 7 10.2105 / AJPH.2016.303322 27552262 PMC5024375 Allem 摩根大通 昂格尔 简森-巴顿 南加州大学生中出现的成年主题和水烟使用 瘾君子Behav 2016 12 61 16 9 10.1016 / j.addbeh.2016.05.002 27208879 s0306 - 4603 (16) 30174 - 5 PMC4915989 El-Zaatari ZM评选 Chami Zaatari GS 水烟对健康的影响 钻头扭矩控制 2015 03 24补充1 i31 i43 10.1136 / tobaccocontrol - 2014 - 051908 25661414 tobaccocontrol - 2014 - 051908 PMC4345795 Maziak W 水烟在全球流行 瘾君子Behav 2011 36 1 - 2 1 5 10.1016 / j.addbeh.2010.08.030 20888700 s0306 - 4603 (10) 00266 - 2 PMC4135081 默罕默德 Geneus CJ Yadgir 年代 DS 伯勒斯 TE 美国成年人水烟管意识和感知危害的相关性 是J Prev Med吗 2017 04 52 4 513 518 10.1016 / j.amepre.2016.10.032 27989450 s0749 - 3797 (16) 30566 - 9 Primack 英航 霍普金斯 哈雷特 C 卡罗尔 MV 西 Dachille K KH 乔丹 •多诺休 JM 美国卫生政策与水烟吸烟有关 公共卫生 2012 09 102 9 e47 51 10.2105 / AJPH.2012.300838 22827447 PMC3482044 艾尔斯 JW 草原 电子商务 Allem 摩根大通 本顿 一个 Dredze Althouse BM 克鲁兹 结核病 昂格尔 简森-巴顿 为什么人们使用电子尼古丁输送系统(电子香烟)?2012-2015年Twitter的内容分析 《公共科学图书馆•综合》 2017 12 3. e0170702 10.1371 / journal.pone.0170702 28248987 玉米饼- d - 16 - 28731 PMC5331961 Allem 摩根大通 Escobedo P K 博伊尔 CT 昂格尔 简森-巴顿 Instagram上的小雪茄和小雪茄的图片被标签#swisher识别:主题分析 J医疗互联网服务 2017 07 14 19 7 e255 10.2196 / jmir.7634 28710057 v19i7e255 PMC5533944 Allem 摩根大通 Escobedo P 克鲁兹 结核病 昂格尔 简森-巴顿 在流行音乐视频中植入电子烟笔 瘾君子Behav 2017 11 03 10.1016 / j.addbeh.2017.10.027 29128149 s0306 - 4603 (17) 30398 - 2 Allem 摩根大通 K 克鲁兹 结核病 昂格尔 简森-巴顿 水烟在Instagram上的推广和使用:#水烟 尼古丁含量 2017 10 01 19 10 1248 1252 10.1093 /正常/ ntw329关系 28077449 ntw329 PMC5896508 古伯伯 J Y 哈达德 l Y 史密斯 J 如何在社交媒体上确定(或不确定)健康风险:Pinterest上水烟的描绘 健康Commun 2016 31 6 659 67 10.1080 / 10410236.2014.987468 26512916 本·塔勒布 Z Laestadius 全面接触式 T Primack 英航 Maziak W #Hookahlife:在Instagram上推广水管的兴起 健康教育行为 2018 06 01 1090198118779131 10.1177 / 1090198118779131 29952224 Allem 摩根大通 Ramanujam J Lerman K K 博伊尔 CT 昂格尔 简森-巴顿 识别Twitter上与hookah相关的帖子的情绪 JMIR公共卫生监测 2017 10 18 3. 4 e74 10.2196 / publichealth.8133 29046267 v3i4e74 PMC5667930 一个 年代 康威 结合文本挖掘和数据可视化技术了解在线论坛中电子烟和水烟的消费者体验 在线J公共卫生信息 2015 7 1 e117 10.5210 / ojphi.v7i1.5783 克劳斯 乔丹 Sowles SJ 莫雷诺 Zewdie K 格鲁扎 类风湿性关节炎 五角 LJ Cavazos-Rehg 巴勒斯坦权力机构 与水烟相关的Twitter聊天:内容分析 既往慢性疾病 2015 07 30. 12 E121 10.5888 / pcd12.150140 26226068 E121 PMC4523113 Myslin 年代 查普曼 W 康威 使用twitter调查吸烟行为和对新兴烟草产品的看法 J医疗互联网服务 2013 08 29 15 8 e174 10.2196 / jmir.2534 23989137 v15i8e174 PMC3758063 皮尤研究中心 皮尤研究中心 2017 2018-10-29 社交媒体概况 http://www.pewinternet.org/fact-sheet/social-media/ Primack 英航 卡罗尔 MV Shensa 一个 戴维斯 W 莱文 医学博士 Tumblr上发布的水烟相关图片的性别差异:内容分析 J健康社区 2016 21 3. 366 75 10.1080 / 10810730.2015.1095814 26890733 PMC4873310 Allem 摩根大通 费拉拉 E 消除社交媒体数据偏见对更好地理解电子烟相关态度和行为的重要性 J医疗互联网服务 2016 12 09 18 8 e219 10.2196 / jmir.6185 27507563 v18i8e219 PMC5037931 Allem 摩根大通 费拉拉 E 社交机器人会对公众健康构成威胁吗? 公共卫生 2018 08 108 8 1005 1006 10.2105 / AJPH.2018.304512 29995482 PMC6050826 戴维斯 CA Varol O 费拉拉 E Flammini 一个 Menczer F Botornot:一个评估社交机器人的系统 2016 第25届国际万维网会议。国际万维网会议指导委员会 2016年4月11日 加拿大蒙特利尔 273 274 Allem 摩根大通 Dharmapuri l 昂格尔 简森-巴顿 克鲁兹 结核病 在推特上描述juul相关的帖子 依赖毒品和酒精 2018 12 01 190 1 5 10.1016 / j.drugalcdep.2018.05.018 29958115 s0376 - 8716 (18) 30333 - 8 Allem 摩根大通 费拉拉 E Uppu SP 克鲁兹 结核病 昂格尔 简森-巴顿 使用社交媒体数据的电子烟监控:社交机器人,新兴话题和趋势 JMIR公共卫生监测 2017 12 20. 3. 4 e98 10.2196 / publichealth.8641 29263018 v3i4e98 PMC5752967 Mikolov T Sutskever K 柯拉 G 迪安 J 单词和短语及其组合的分布式表示 神经信息处理系统进展“, 2013 3111 3119 古德温 理查德·道金斯 格林贝格 一个 夏皮罗 J 基思 D 麦克尼尔公司 国会议员 塔哈 F B 哈特 CL 水烟在大学生中的使用:流行率、吸毒和心理健康 依赖毒品和酒精 2014 08 01 141 16 20. 10.1016 / j.drugalcdep.2014.04.024 24882367 s0376 - 8716 (14) 00864 - 3 杰克逊 公里 科尔比 SM 谢尔 KJ 大学生吸烟者同时吸烟和饮酒的日常模式 精神成瘾行为 2010 09 24 3. 424 35 10.1037 / a0019793 20853927 2010-19026-007 PMC2946201 Kavuluru R 年代 哈恩 EJ 关于u盘形状的电子烟Juul的流行 钻头扭矩控制 2018 04 13 - 10.1136 / tobaccocontrol - 2018 - 054259 29654121 tobaccocontrol - 2018 - 054259 PMC6186192 对峙 毫升 Hilmi 神经网络 康威 KP 烟草与健康研究人口评估第1波(2013-2014年)中年轻人使用水管的原因 是J Prev Med吗 2018 11 55 5 650 655 10.1016 / j.amepre.2018.06.004 30219210 s0749 - 3797 (18) 31949 - 4 Kowitt SD Meernik C 贝克 奥斯曼 一个 l 戈尔茨坦 AO 对加味非薄荷醇烟草制品的感知和体验:定性研究的系统回顾 国际环境与公共卫生 2017 12 23 14 4 - 10.3390 / ijerph14040338 28333107 ijerph14040338 PMC5409539 昂格尔 简森-巴顿 Urman R 克鲁兹 结核病 Majmundar 一个 Barrington-Trimis J Pentz 麦康奈尔 R 在推特上谈论烟草与烟草产品的使用有关 Prev地中海 2018 09 114 54 56 10.1016 / j.ypmed.2018.06.006 29898418 s0091 - 7435 (18) 30195 - 6
Baidu
map