JMIR公共卫生和监测-社交媒体作为风险行为分析的研究工具(SMaaRT):方法学审查

审查

¹德克萨斯大学健康科学中心生物医学信息学院，美国德克萨斯州休斯顿

²生物医学信息学与医学教育，华盛顿大学，西雅图，华盛顿州，美国

^3.乔治敦大学医学中心，华盛顿特区，美国

⁴美国德克萨斯州圣安东尼奥市德克萨斯大学健康科学中心护理学院

⁵德克萨斯大学健康科学中心公共卫生学院，美国德克萨斯州休斯顿

通讯作者:

Tavleen Singh, MS

生物医学信息学学院

德克萨斯大学健康科学中心

范宁街7000号

600套房

休斯顿，德克萨斯州，77030

美国

电话:1 713 500 3900

电子邮件:tavleen.kaur.ranjit.singh@uth.tmc.edu

背景:可改变的危险健康行为，如吸烟、过度饮酒、超重、缺乏体育活动和不健康的饮食习惯，是导致慢性健康状况的一些主要因素。社交媒体平台已经成为数字时代不可或缺的交流手段。它们为个人提供了一个机会来表达自己，并与同龄人和医疗保健提供者分享他们对危险行为的健康问题。这种同伴间的互动可以作为有价值的数据来源，以更好地理解个人之间和个人内部的心理社会中介以及驱动行为改变的社会影响机制。

摘要目的:本综述的目的是总结计算和定量技术，以促进分析通过社交媒体平台上与危险健康行为有关的同伴互动产生的数据。

方法:我们在2020年9月通过搜索三个数据库——pubmed、Web of Science和scopus——对文献进行了系统综述，使用相关关键词，如“社交媒体”、“在线健康社区”、“机器学习”、“数据挖掘”等。研究报告遵循PRISMA(系统评价和元分析首选报告项目)指南。两位审稿人根据纳入和排除标准独立评估了研究的合格性。我们从选定的研究中提取所需的信息。

结果:最初的检索总共返回了1554项研究，在仔细分析了标题、摘要和全文后，这篇综述总共包含了64项研究。我们从所有研究中提取了以下关键特征:进行研究使用的社交媒体平台、研究的危险健康行为、分析的帖子数量、研究重点、用于数据分析的关键方法功能和工具、使用的评估指标以及主要发现的摘要。最常用的社交媒体平台是Twitter，其次是Facebook、QuitNet和Reddit。最常被研究的危险健康行为是使用尼古丁，其次是滥用药物和酒精。各种有监督和无监督的机器学习方法被用于分析在线对等交互产生的文本数据。很少有研究使用深度学习方法来分析文本数据以及图像或视频数据。正如一些研究报道的那样，还进行了社会网络分析。

结论:我们的综述巩固了分析危险健康行为的方法学基础，并增强了我们对如何利用社交媒体进行细微差别的行为建模和表现的理解。从我们的审查中获得的知识可以作为发展有说服力的健康沟通和针对个人和人群水平的有效行为矫正技术的基本组成部分。

JMIR公共卫生监测2020;6(4):e21660

doi: 10.2196/21660

关键字

社交媒体； infodemiology； infoveillance；在线健康社区；危险的健康行为；数据挖掘；机器学习；自然语言处理；文本挖掘

可改变的危险健康行为，如吸烟、过度饮酒、超重、缺乏体育活动和不健康的饮食习惯，是导致慢性健康状况的一些主要因素[1］．慢性疾病，如癌症和心脏病，在美国每年导致大约150万人死亡[2］．这些慢性疾病与糖尿病一起每年造成近3.5万亿美元的经济损失;因此，预防和/或有效管理此类情况变得至关重要[2］．行为矫正是管理慢性健康状况的关键，一系列心理和社会过程已被证明会影响个人采取积极健康行为的参与[3.，4］．传统上，用于测量和研究人群健康相关行为的方法包括电话或基于互联网的调查[5]、励志访谈[6]、商业可穿戴设备和智能手机应用程序[7]、生态瞬时评估[8］．

最近，社交媒体已经成为研究和分析健康相关行为并促进行为改变的可行平台[9］．资讯病学研究[10]研究卫生信息在电子媒介(如社交媒体和互联网)中的决定因素和分布情况，用于公共卫生目的:通过预测模型预防疾病[11-13]，为政策规例提供资讯[14]，评估网站健康信息的质量[15]，并分析个人的健康相关行为[16-18］．最近的COVID-19大流行还表明，分析此类平台上的交流可以深入了解个人以及医疗保健提供者的态度和行为[19，20.］．

社交媒体通过其各种移动和基于网络的技术，为个人和社区提供互动平台，以想法、消息或信息的形式分享、创建、修改和讨论内容[21］．近年来，社交媒体平台的渗透在生活的各个领域都有所增加。根据《2019年全球数字报告》，全球约有35亿活跃的社交媒体用户，其中Facebook是最主要的社交网站。全球超过三分之二的人口使用移动设备，其中大部分是智能手机。在这些联网设备的推动下，许多老年人和青少年也开始将社交媒体融入他们的日常生活。22］．

因此，社交媒体已成为公共卫生领域的重要组成部分，因为医疗保健消费者越来越多地使用这些平台来获取各种与健康相关的主题的知识，以及与同龄人和医疗保健提供者互动以获得社会支持，主要是信息和情感方面的支持[23，24］．这些平台被医疗保健消费者广泛使用，以(1)满足他们的健康相关目标[25]和(2)采取积极的健康行为[26，27］．研究表明，如果一个人的社会关系也有类似的行为，他就更有可能遵守与健康有关的目标，并坚持采取预防措施[28，29］．与研究和分析健康促进和行为改变的标准方法相比，使用此类平台的主要优势包括:它们能够接触到更广泛和更不易接触的受众，具有成本效益地招募研究参与者，以及通过移动和基于网络的连接全天候访问它们[30.］．这些平台可以利用群体规范;因此，通过这些平台实施的行为改变干预措施有可能通过广泛传播预防方案来满足个人、社区和人群的需求，从而产生重大影响。

这些在线平台大致可分为两大类:(1)开放式社交媒体平台(如Facebook、Twitter和Reddit)，这是用于网络、信息共享和协作的通用平台;(2)有意设计的与健康相关的社交媒体平台(如QuitNet [31]和BecomeAnEX.org [32])，其重点是向其成员提供特定健康方面的支持。尽管开放的社交媒体平台提供了大规模推断个人行为的机会，但它们仍然缺乏提供特定情境的互动观察，为此我们需要转向有意设计的社交媒体平台[33］．根据社交媒体平台是否特别关注健康主题，影响个人试图维持积极健康变化的环境因素可能有很大差异，从而影响上下文粒度，从而影响计算和定量数据建模方法的准确性和可靠性。尽管存在这些差异，但这些平台的普遍存在已经导致以文本、图像或视频(例如Facebook和YouTube等传统论坛)形式的同伴互动的电子痕迹形式产生了宝贵的大型数据集。与传统环境相比，这些数据集捕捉了个人在接近实时和自然环境下的态度和行为，而传统环境涉及研究人员的存在，并且容易产生仪器偏差[34］．对这些数据集的分析为我们提供了一个了解行为改变背后的个人主义因素和环境因素的机会，这最终可以指导与健康相关的行为改变的网络干预的设计和开发[35-37］．

传统的定性数据分析方法不利于分析社交媒体平台产生的大量数据。自动化文本分析的最新进展为我们提供了分析社交媒体平台生成的数字内容的合适方法。最新综述强调了目前应用于医疗保健领域的数字化数据采集、机器学习(ML)技术和计算基础设施[38］．除了来自移动计算和互联网的预测分析和组合力量的进步之外，参与性社交媒体已经产生了丰富的即时数据，可以利用这些数据进行健康消费者参与风险健康行为自我管理的数字表型分析。

本综述的目的是总结计算和定量方法，强调使用社交媒体作为研究工具(SMaaRT)的潜力，以了解与危险健康行为的预防和管理相关的人际和个人心理社会因素的模式。这些方法可以全面了解最常见的做法、它们的效用、局限性和由此产生的推论，从而为卫生研究人员提供了更好地描述大规模卫生行为的能力。通过可扩展的技术，如量身定制的信息传递和有说服力的环境设计，将数据驱动的见解转化为实际的公共卫生解决方案，从这些二次分析中增强的理解最终可以融入有效行为干预的设计过程。

概述

我们对文献进行了系统回顾，总结了用于分析用于研究危险健康行为的社交媒体数据的计算和定量方法。我们遵循PRISMA(系统评价和元分析首选报告项目)概述的指导方针[39]检索相关研究。

文献检索策略

我们检索了2020年9月的文献，收集了2011年至2020年9月11日发表的研究。我们使用一组特定的关键字搜索了三个不同的数据库——pubmed、Web of Science和scopus。我们的搜索关键字位于两个关键集群的交汇处:社交媒体和ML。我们还为相关关键字添加了医学主题标题(MeSH)，以确保我们的搜索尽可能广泛。使用以下查询进行搜索:(“社交媒体”[MeSH]或“社交媒体”或“在线健康社区”或“在线健康社区”或“在线社交网络”或“在线社交网络”或“点对点”或“同伴影响”[MeSH])和(“机器学习”[MeSH]或“机器学习”或“文本挖掘”或“自然语言处理”或“数据挖掘”[MeSH]或“数据挖掘”或“网络模型”)。此外，我们还检查了符合我们纳入标准的研究的参考文献列表。

纳入和排除标准

纳入和排除标准，以确定研究的资格进行审查列于文本框1．

研究的资格标准。

入选标准:

研究人员进行了原创研究，并发表在同行评审的期刊上。
研究使用基于英语的社交媒体平台(即生成的内容使用英语语言)。
研究使用机器学习技术、网络建模和/或可视化技术等计算或定量方法进行大规模数据分析。
研究重点关注患者或健康消费者的危险健康行为或相关态度或信仰，如尼古丁使用、酒精使用、药物或药物滥用、体育活动或不活动模式，或与肥胖相关的行为。
研究主要集中在分析在线社交媒体平台的文本内容(例如，YouTube评论而不是YouTube视频)。

排除标准:

研究描述了将社交媒体平台用于其他目的(如招聘和数据收集)。
研究集中在卫生保健提供者，而不是病人或健康消费者。
研究集中在与健康无关的行为上。

文本框1。研究的资格标准。

数据提取

两名作者(TS和SM)根据纳入标准分别对检索到的研究进行了两个阶段的评估。在第一阶段，作者回顾了所有检索到的研究的标题和摘要，以便将其纳入全文筛选。在第二阶段，作者对第一阶段确定的相关研究进行全文筛选，以便最终纳入本综述。两位作者通过讨论解决了分歧。在这两个阶段都计算了评级者间的一致性Cohen κ。在筛选了符合我们纳入标准的研究后，我们从正文中提取了相关数据，包括以下内容:

研究的危险健康行为，如尼古丁使用、酒精使用、药物或药物滥用、体育活动或不活动模式、与肥胖相关的行为等。
研究使用的社交媒体平台，无论是开放的社交网络，如Twitter或Facebook，还是特定疾病的社交网络，如QuitNet(即戒烟)。
发文数:用于分析的总发文数和用于人工标注的发文数。
研究重点:分析危险健康行为的研究的潜在目的是什么?
主要方法功能和工具;例如，主题建模(即函数)使用潜狄利克雷分配(LDA)(即方法)进行。
本研究使用的评价指标(如，精密度、召回率和F1分数)。
该研究的主要发现:分析在线同伴互动产生的数据后获得的结果。

概述

最初的搜索结果共计1554项研究。由于重复，我们从这些研究中删除了203项研究。在第一阶段，我们回顾了其余研究的标题和摘要，以确保它们符合纳入和排除标准，以便进一步深入分析。第一阶段评分者间的一致性为81.37%。在讨论解决分歧后，我们初步排除了1246项不符合纳入标准的研究，并将剩余的105项研究纳入第二阶段进行全文筛查。第二阶段评分者间的一致性为83.50%。共有52项符合纳入标准的研究被纳入综述。我们进一步通过滚雪球技术确定了另外12项研究，这些研究也包括在本综述中。因此，共有64项研究[40-103]被纳入最终评审。在回顾的研究中，55项(86%)研究发表于2016年以后[40-61，68-95，97，98，One hundred.-102]，而2013年至2015年间仅发表了9篇(14%)研究[62-67，96，99，103］．这些研究都没有在2013年之前发表。图1显示了PRISMA图表，突出显示了为综述选择最终研究的整个过程。

我们的回顾结果显示，社交媒体分析的重点是各种危险的健康行为，包括尼古丁使用、酒精使用、药物滥用、体育活动模式和肥胖相关行为。社交媒体平台已广泛用于二次数据分析，以及对利用此类平台开展的积极干预或运动产生的数据进行后续分析。研究人员利用多种计算和定量功能和工具来分析社交媒体平台上在线同伴互动产生的数据。对我们的结果进行了详细的阐述多媒体附件1，它显示了所选研究的关键特征，这些研究按危险健康行为分组，然后按发表年份排序。

在以下部分中，我们汇总了我们的回顾结果，以突出各种社交媒体平台的使用模式，用于二次分析，在这些平台上研究的危险健康行为的流行程度，以及用于理解这些行为的方法工具和功能。

社交媒体平台

表1［40-103]强调了用于分析危险健康行为的社交媒体平台。Twitter(39/ 64,61%)似乎是用于分析关于危险健康行为的在线同伴互动的最广泛的社交媒体平台，其次是Facebook (6/ 64,9%)， QuitNet (5/ 64,8%)， Reddit (5/ 64,8%)， BecomeAnEx.org (3/ 64,5%)， Instagram(2/ 64,3%)，癌症幸存者网络(1/ 64,2%)，Hello Sunday Morning博客(1/ 64,2%)，patient.info/forums(1/ 64,2%)，以及一个点对点在线讨论论坛。这是一款名为上瘾-全面健康增强支持系统(a - chess)的智能手机应用程序的一部分(1/ 64,2%)。在64项研究中，有1项(2%)分析了来自三个在线论坛的数据:Vapor Talk, Hookah Forum和Stopsmoking subreddit [62］．共有80%(51/64)的研究使用了开放的社交媒体平台，如Twitter、Facebook、Instagram和Reddit [40-44，47-54，58-61，63，66-83，85，87，88，92-103]，而其余20%(13/64)的研究利用特定的健康相关在线社交网络，如QuitNet、BecomeAnEX.org、癌症幸存者网络、patient.info/forums、Hello Sunday Morning博客和A-CHESS在线讨论论坛[45，46，55-57，62，64，65，84，86，89-91］．

大多数使用Twitter作为数据源的研究都依赖于Twitter应用程序编程接口(api)来提取数据。这些研究中的大多数使用流api，它提供了近实时的数据子集的推送[47，50，51，59，61，70，74，78-81，92，94，95]，其中一些研究还使用了搜索api，这些api提供了对过去已经发生的推文组成的数据集的访问[68，76，82，98，99］．一些研究还使用了推特的数据提供商Gnip [54，59，60，63，92]，这保证了所有符合研究人员标准的推文都能被访问。一些研究并没有指出是哪一种API被用于访问Twitter的数据[40，41，48，66，73，77，88，One hundred.，102］．对于Reddit，数据是使用以下技术提取的:(1)使用Pushshift，这是一个公开的Reddit提交的存档[42]，(2)数据集是使用名为Wget的网络爬虫下载的[62]，(3)使用Python Reddit API Wrapper [97]，(4)数据集来自Reddit会员[101]，以及(5)使用Reddit的官方API [103］．来自Facebook的数据是通过Facebook的API和平台的Python软件开发工具包提取的。87]或使用NVivo的提取功能(QSR International) [71］．使用Instagram的API提取数据时使用了类似的方法[44，72］．

表1。各种研究使用的社交媒体平台。

社交媒体平台	研究数(N=64)， N (%)^一个	学习参考资料
推特	39 (61)	［40，41，43，47，48，50-52，54，58-61，63，66-70，73-83，88，92，94-96，98-One hundred.，102］
脸谱网	6 (9)	［49，53，71，85，87，93］
QuitNet	5 (8)	［45，55，56，64，65］
Reddit	5 (8)	［42，62，97，101，103］
BecomeAnEX.org	3 (5)	［46，86，91］
Instagram	2 (3)	［44，72］
Hello Sunday Morning博客	1 (2)	［90］
国际象棋^b(网上讨论区)	1 (2)	［89］
癌症幸存者网络	1 (2)	［57］
Patient.info /论坛	1 (2)	［84］
蒸汽谈话，水烟论坛，和停止吸烟reddit子	1 (2)	［62］

^一个由于四舍五入和一项使用多个社交媒体平台的研究，百分比加起来不等于100%。

^bA-CHESS:成瘾-全面健康增强支持系统。

危险的健康行为

表2［40-103]强调了所研究的危险健康行为以及用于进行研究的相关社交媒体平台。社交媒体平台上最常被研究的危险健康行为与尼古丁产品的使用有关，64项研究中共有28项(44%)[40-67]关注与吸烟、电子烟、小雪茄等有关的行为。Twitter(16/ 64,25%)被广泛用于分析此类行为，其次是QuitNet (5/ 64,8%)， Facebook (2/ 64,3%)， Reddit (1/ 64,2%)， Instagram(1/ 64,2%)，癌症幸存者网络(1/ 64,2%)，BecomeAnEX.org(1/ 64,2%)，以及Vapor Talk，水烟论坛和Reddit戒烟子版块(1/ 64,2%)。这些研究大多集中在分析会员对电子烟等吸烟产品的行为或情绪[42，49，50，52，54，58，59，61-63]、水烟制品[43，47，51，62]、JUUL或vaping [40，41，44]，以及雪茄[60]，或分析公众对吸烟的看法[67］．在64项研究中，2项(3%)主要侧重于社会网络分析:一项是了解社会网络结构如何影响社区成员的吸烟行为[53]，另一个是了解针对年轻人的禁烟运动的影响范围[48］．其他研究侧重于(1)分析会员生成的内容，以得出同行之间讨论的共同主题或话题[57，64-66]，(2)戒烟过程中的行为转变特征[45]，(3)研究同伴互动的时间趋势，以了解戒烟行为改变的潜在因素[55，56]，(4)预测吸烟状况[46］．

毒品或药物滥用是社交媒体平台上另一个经常讨论的危险健康行为，64项研究中有14项(22%)讨论了这一话题[68-81］．Twitter(12/ 64,19%)再次成为研究药物滥用行为的最受欢迎的平台，其次是Instagram(1/ 64,2%)和Facebook(1/ 64,2%)。这些研究的重点领域包括处方药滥用[68，70，78，81]、滥用阿片类药物[74-77]、大麻及合成大麻素的使用[80]，以及滥用物质或药物[69，71-73］．一项研究分析了与药物滥用有关的多种行为，包括酒精、吸烟和吸毒[79］．

在64项研究中，有12项(19%)探讨了在线健康社区成员的酒精使用模式和禁欲行为[82-93］．其中一些研究(1)对在线戒烟社区生成的与酒精相关的内容进行了专题分析[86，91]，(2)重点分析酒精使用行为阶段的趋势[92]，(3)分析酗酒行为[82，83，87]，(4)重点提取与饮酒相关的话题和情绪[84，85，93]，(5)侧重于预测未来的复发或恢复期酒精中毒[88，89］．一项研究分析了一个博客的内容，该博客鼓励其成员在一段特定的时间内戒酒，并与同龄人讨论他们的进展[90］．用于分析酒精使用行为的平台分布相当不稳定(见表2［40-103])。

在64项研究中，有3项(5%)探讨社区成员参与身体活动的模式及类型[94-96］．所有这些研究都使用Twitter作为数据来源。在64项研究中，3项(5%)分析了与肥胖相关行为相关的主题[97-99使用社交媒体平台，如推特和Reddit。64项研究中有4项(6%)[One hundred.-103]共同研究多种行为，如(1)分析肥胖和体育活动相关内容，以获得个人健康状况的信息[One hundred.]，(2)确定与电子烟和大麻使用有关的讨论主题[101]，以及(3)描述与烟草和酒精相关的行为模式[102，103］．在这4项研究中，2项(50%)使用Twitter [One hundred.，1022个(50%)使用Reddit [101，103]作为他们的数据来源。

表2。危险的健康行为及其相关社交媒体平台。

危险的健康行为	研究数(N=64)， N (%)^一个	社交媒体平台和研究参考文献
尼古丁使用	28 (44)	推特(40，41，43，47，48，50-52，54，58-61，63，66，67］ QuitNet [45，55，56，64，65］ Facebook (49，53］ Reddit [42］ Instagram [44］癌症幸存者网络[57］ BecomeAnEX.org [46］蒸汽谈话，水烟论坛，和停止吸烟subreddit [62］
毒品和药物滥用	14 (22)	推特(68-70，73-81］ Instagram [72］ Facebook (71］
使用酒精	12 (19)	推特(82，83，88，92］ Facebook (85，87，93］ Patient.info /论坛[84］ BecomeAnEX.org [86，91］国际象棋^b网上论坛[89］ Hello Sunday Morning博客[90］
体育活动	3 (5)	推特(94-96］
与肥胖相关的行为	3 (5)	Reddit [97］推特(98，99］
多种行为(即电子烟和大麻、吸烟和饮酒、体育活动和肥胖相关行为)	4 (6)	推特(One hundred.，102］ Reddit [101，103］

^一个由于四舍五入，百分比加起来不等于100。

^bA-CHESS:成瘾-全面健康增强支持系统。

方法细节和相关工具

以下部分将讨论在各种研究中使用的方法功能，以及用于执行这些功能的特定工具。

计算建模:特征提取

最常提取的特征是n-gram(例如，unigrams, biggram和trigrams) [40，44，46，47，58，59，63，66，67，70，74，75，80-82，86，91，92，96，99，One hundred.，102，103］．除此之外，一些研究还利用了其他特征，如计数向量[41]，术语频率逆文档频率向量[41，63，80，82，86，87，91，92，One hundred.]，基于语言的协变量[42]，标签数量[44]，包含特定字符串的标签数量[44]，用户名[44]，词性标签[59]，情绪评分[59，68]，在用户名中出现特定术语[59]、特定领域特征[46]， Doc2Vec特性[46]，基于作者的特征[46]，基于线程的特性[46]，用户元数据特性[54，82，86，92]，衍生的行为特征(例如，原始推文中唯一关键字的数量，原始推文中标签中唯一关键字的数量，等等)[54，人称名词[68]、非医疗用途术语[68]、医疗用途术语[68]、副作用术语[68]，显示网址[68]，滥用指示用语[73-75，81]，毒品俚语词汇[73，81]，使用WordNet的同义词扩展功能[73，81]，词聚类特征[73-75，81]，基于行为应对方式的特征[88]、社会因素[88]，年龄[88]，以及基于图像的特征[72］．一些研究使用了特征选择技术，如SelectKBest [40]，信息增益[66]，以及卡方检验[80］．一项研究使用SHAP (SHapley加性解释)技术对每个分类器的相关特征进行了评估[41］．

计算建模:分类技术

传统ML分类器

大多数研究使用监督ML分类器进行文本分析，以执行预测建模、行为阶段建模或内容分析。各种研究中使用的分类器包括支持向量机[51，54，66，67，70，73-75，80-82，92，94，One hundred.，102]， SVM(线性)[41，44，45，58，60，63，87，102]， SVM(径向核)[44，68，87]， SVM(多项式核)[46，87]， SVM (sigmoid) [87]，逻辑回归[40，41，44-46，54，58-60，72，80，89，92，94，One hundred.，102]， naïve贝叶斯[40，41，46，52，54，58，60，63，66，70，73-75，80，81，86，91，One hundred.]，随机森林(RF) [40，41，45，54，58，70，73-75，82，84，86，91，92，One hundred.，102]，基于决策树的分类器(DT)(例如，J48) [46，54，55，74，81，86，91]， k-最近邻(KNN) [54，63，66，74，84]， AdaBoost [46，54，86，91]，最大熵文本分类器[79，81，94，95]，顺序最小优化[84]，多层感知器[84]， REPTree [88]，前馈神经网络[94]，以及梯度增强[48，54，94］．一项研究使用了一种被称为标记LDA的监督版本的LDA来进行文本分类[87]，而另一种使用了一种基于监督学习的统计模型，称为岭回归统计模型来执行分类任务[103］．一项研究开发了一个文本挖掘框架，使用基于搜索查询的分类器和基于评估矩阵的分类器来评估数据质量[69］．一项研究使用R (R基金会)中的RtextTools通过监督学习进行自动文本分类[43］．

一项研究利用专门的软件来分析在线同伴互动产生的文本内容，即lexximancer [90］．很少有研究使用R中的包进行文本挖掘，例如RWeka [43]和tm [43，68，98，99］．

深度学习技术

在64项研究中，有6项(9%)使用深度学习模型进行文本分类，如卷积神经网络(cnn) [41，70，73-75，One hundred.]、长短期记忆[41，72]， lstm-cnn [41]，双向LSTM [41]，浅神经网络[One hundred.]，强化神经网络门控循环单元[One hundred.］．Hassanpour等[72]通过随机梯度下降优化算法优化了他们的深度学习模型。其中一项研究使用了集成深度学习模型，该模型由单词级CNN和字符级CNN组成[73］．其中一项研究还使用残差神经网络提取的图像特征进行图像分类[72]，这是一种用于计算机视觉任务的最先进的CNN架构。另一项研究[87]使用名为AlexNet的神经网络进行图像和视频分类，AlexNet是另一个用于计算机视觉问题的著名深度CNN。

词嵌入:预训练

以下研究使用词嵌入进行预训练，例如全局向量(GloVe)词向量(即通用域)[41]， word2vec在维基百科语料库上预训练[72]， word2vec使用领域特定语料库预训练[41，70，74，75］．一项使用ImageNet数据存储库的图像分类器模型预训练的研究[72]，在另一项研究中，词级CNN在药物颤振词嵌入(即400维)上进行了预训练[73］．

经验分配语义学

一些研究应用分布语义来识别术语之间的有意义的关系，例如，应用潜在语义分析(LSA)等技术在消息和已识别的主题之间[64，65]，随机索引[55]， SGNS (skip-gram with negative sampling)算法[56]使用语义向量包。其中一些研究使用了通用领域语料库的预训练:RI使用了Touchstone应用科学协会(TASA)语料库[55]，使用Wiki语料库的SGNS算法[56，和LSA的TASA语料库[64，65］．

主题建模

主题建模采用多种技术，如Quanteda软件[42]， lda [49，57，60，62，69，77，83，84，97-99，101， SAS文本挖掘器(SAS Institute) [61，76，85，93]，以及相关的主题建模，使用R中的topicmodels包[86］．在64项研究中，2项(3%)使用了word2vec模型:一项是在每个主题中识别与字母和字母相似的单词[47]和单词语义聚类[97］．一项研究通过计算频率向量来检测主题，以创建术语-推文频率表，并进行卡方检验来比较语料库中的术语[96］．

各种无监督ML模型也用于使用k-均值聚类识别电子烟社区[42]以及通过一种叫做biterm主题模型的技术来识别模式或主题[78］．一项研究通过聚类分层聚类技术进行聚类分析[102]将在线社区成员的酒精消费时间模式进行分组。

语言建模

在64项研究中，5项(8%)使用语言探究词计数(LIWC)进行语言文本分析，LIWC用于统计心理上有意义类别的单词[45，71，83，88，89］．辛格等人进行的语言分析[45]对戒烟行为的分析显示，如果询问信息形式的疑问句属于沉思行为改变阶段;然而，如果数字属于一个国家，则更多地用个人语言表达行动行为改变阶段。另一项研究表明，带有负面影响的词语往往与更严重的药物滥用联系在一起。71］．在一项研究中，LIWC被用来衡量每个社区中人称代词的使用情况，以了解个人在推特上是在谈论自己的饮酒行为，还是在引用他人的行为[83］．一项研究从社交媒体平台上使用的语言中提取心理语言学特征，以训练分类器来预测酒精中毒的康复[88］．同样，另一项研究表明，负面情绪或脏话、抑制性词语和情话与酒精使用障碍患者复发风险的增加显著相关。89］．

情感建模

在64项研究中，20项(31%)进行了情绪分析，以衡量个人对健康行为(如电子烟、水烟、药物滥用、电子烟和JUUL)的积极、消极或中性情绪[40，41，43，51，59，63，66-68，79，80，83，85，86，91，93-96，103］．用于执行情感分析的一些技术包括SentiWordNet 3.0 [59];SentiWords(情感词汇)词汇85];Sentiment140 [96];最大熵文本分类器[79，94，95];Mathematica 10.3 (Wolfram) [93];SVM在SemEval(语义评估)，ISEAR(国际情绪前因和反应调查)情绪数据集上进行训练，并在带有情绪标签的推文语料库上进行训练[51];以及各种监督ML算法[40，41，43，63，66，67，80，86，91］．一项研究计算了刘和胡观点词典的情感得分[68]，一项研究使用国家资源委员会标签情绪词汇来衡量与推文相关的积极情绪[83]，三个研究使用了VADER(价感词典和情感推理)，这是一种基于词汇和规则的情感分析工具[51，80，103］．

模型评估和度量

为了评估分类模型的性能，一些研究将其数据集分为训练集和测试集，进行n倍交叉验证，并计算精度、精密度、召回率、F1分数、特异性、马修相关系数和受试者工作特征(AUROC)曲线下面积等指标。我们使用各种研究报告的F1分数编制了“结果”部分。如果任何研究没有报告他们的F1分数，我们列出了他们在研究中报告的指标。大多数研究报告了分类任务的F1分数[40，41，43-46，48，51，54，55，59，60，66-70，72-74，80，81，84，87，88，91，92，94，95，102，103]，在各种研究中，它们的范围在0.42到0.99之间。使用不同的折叠方式进行交叉验证:59]， 5折[67，80，82，92]， 6倍[73]，以及10倍[40，44-46，54，58，60，63，66，68，74，75，81，86，88，91，102，103交叉验证。三项研究仅报告了用于评估分类器性能的准确性值[52，63，One hundred.］．一项研究只报告了信息检索系统的精确性[56]，而两项研究仅报道了从AUROC曲线获得的值[58，82］．一项研究使用两种方法评估了确定的主题的质量:监督评估，通过手动注释每个主题的推文并计算平均假阳性率，以及无监督评估，通过计算聚类纯度来量化主题的一致性[78］．

使用社会网络分析的定量建模

在64项研究中，9项(13%)进行了社会网络分析[42，48，50，53，64，65，86，91，103]:

一项研究生成了网络图，以便在不同的reddit子版块中可视化电子烟主题的存在和共存[42］．
一项研究创建了网络图，以了解一项旨在教育年轻人吸烟有害影响的运动的影响范围[48］．
一项研究通过创建一个推特标签共现网络来确定与电子烟相关的话题。50］．
一项研究通过分析网络指标与个体吸烟状况的关系，分析了吸烟者和非吸烟者社会网络的结构差异[53］．
一项研究通过构建双模网络图来进行关联网络分析，以了解戒烟社区成员在不同沟通主题下的关联[64］．
一项研究可视化了在线戒烟社区成员的社交网络拓扑和基于主题的差异[65］．
一项研究分析了一个人的社交网络连接如何影响他们的饮酒行为，该研究基于讨论的主题[86］．
一项研究表明，与社区其他成员相比，对饮酒持消极态度的人在社交网络中更处于中心位置。91］．
一项研究利用社会网络特征(例如，入度、出度、度、互惠性和聚类系数)量化了社区成员之间的同伴互动[103］．

用于执行此类分析的工具和软件程序包括Gephi平台[48，50，65];NetworkX，一个Python包(Python Software Foundation) [86];UCINET软件(Analytic Technologies) [42，64];和R中的iGraph包[53］．一项研究通过使用NodeXL(微软)创建一个社交图来可视化频繁出现的单词[42］．两项研究没有特别提到他们用于进行社交网络分析的工具[91，103］．不同的指标被用于社交网络分析，如度中心性[42，64]，模块化[48，65]，以及程度内中心和程度外中心[86，91］．一项研究使用多种指标来分析社会网络结构，如顶点、边缘、密度、隔离、直径、社区、中介中心性、亲密中心性、传递性、集群和模块化[53］．表3［40-46，48-55，57-89，91-103]强调了在各种研究中使用的方法学功能的总结，并列出了用于执行这些功能的具体工具。

表3。各种研究使用的方法和相关工具的总结。

方法	工具、平台和程序
语言分析	语言查询字数[45，71，83，88，89］
情绪分析	SentiWordNet 3.0 [59］情感词汇词汇[85］ Sentiment140 [96］最大熵文本分类器[79，94，95］ Mathematica 10.3 [93］各种监督机器学习算法[40，41，43，51，63，66，67，80，86，91］刘胡意见词典[68］ VADER(价感字典及情感推理)[51，80，103］国家资源委员会标签情绪词汇[83］
监督分类	支持向量机[41，44-46，51，54，58，60，63，66-68，70，73-75，80-82，87，92，94，One hundred.，102］ Logistic回归[40，41，44-46，54，58-60，72，80，89，92，94，One hundred.，102］ Naïve贝叶斯[40，41，46，52，54，58，60，63，66，70，73-75，80，81，86，91，One hundred.］随机森林[40，41，45，54，58，70，73-75，82，84，86，91，92，One hundred.，102］基于决策树的分类器[46，54，55，74，81，86，91］ k-最近邻[54，63，66，74，84］演算法(46，54，86，91］顺序最小优化[84］最大熵文本分类器[79，81，94，95］多层感知器[84］ REPTree [88］前馈神经网络[94］梯度提升[48，54，94］卷积神经网络[41，70，72-75，87，One hundred.］长短期记忆[41，72］ LSTM-CNN [41］双向LSTM [41］基于浅神经网络的文本分类[One hundred.］强化神经网络门控循环单元[One hundred.］
主题建模	广达软件[42］潜狄利克雷分配[49，57，60，62，69，77，83，84，97-99，101］ SAS文本挖掘器[61，76，85，93］相关主题建模[86］
社区识别和主题或模式识别	k-均值聚类[42］ Biterm主题模型[78］聚类分层聚类技术[102］
社会网络分析	Gephi平台[48，50，65］ NetworkX (Python包)[86］ UCINET软件[42，64］ R中的iGraph包[53］ NodeXL [42］

主要研究结果

本综述的目的是调查利用社交媒体平台上的在线同伴互动分析危险健康行为、信仰和态度的计算和定量技术的现状。从最初检索到的一组研究和滚雪球技术，64项符合我们纳入标准的研究被纳入本综述，其中75% (48/64)[40-57，68-79，82-94，97，98，One hundred.-102均于2017年开始出版。这表明，通过分析在线同伴互动产生的对话数据，利用计算方法来描述危险的健康行为是一种日益增长的趋势。

一些平台被用作分析危险健康行为的数据来源，其中最受欢迎的是开放的社交媒体平台，因为与有意设计的健康相关社交媒体平台相比，80%(51/64)的研究使用了这些平台。在数据收集方面，我们的结果显示Twitter是一个受欢迎的社交媒体数据来源，因为它提供了三种简单的访问数据的方法:Twitter搜索API、Twitter流媒体API和Twitter Firehose [104］．一些研究利用了平台(如Facebook、Instagram和Reddit)，这些平台也通过它们的api提供数据访问[105-107)，但不像推特那样广泛使用。一些研究利用了有意设计的与健康相关的社交媒体平台，如QuitNet、癌症幸存者网络、patient.info/forums、BecomeAnEx.org、Hello Sunday Morning博客和A- chess在线讨论论坛，但他们没有提供有关其数据收集技术的任何信息。就数据类型而言，本综述包括了主要集中于分析在线同伴互动产生的文本数据的研究。因此，我们在全文筛查中排除了两项仅通过图像分析分析危险健康行为的研究[108，109］．

人们对吸烟相关产品(如雪茄、电子烟、水烟、电子烟和JUUL)的看法，以及与此类产品讨论相关的各种主题的识别，通过在线社交媒体平台进行了广泛研究。处方药滥用、阿片类药物滥用和酗酒相关行为是另一组使用在线社交媒体平台被广泛分析的危险健康行为。这凸显了利用此类平台传播行为改变干预措施的潜力，这些干预措施针对的是未知和不断发展的领域(如电子烟)以及已明确的领域(如酒精使用)。除了成瘾行为外，还分析了摄取行为，如身体活动模式、情绪和行为类型(如跑步、散步和慢跑)与不同地理位置(如加拿大)和人口统计学(如性别)的关联。社交媒体平台被用来确定与减肥和肥胖相关行为相关的主题。没有一项研究关注于分析无保护措施的性相关行为，这是一个重要的公共卫生焦点和优先事项，这可能是未来研究的一个有趣途径。然而，考虑到耻辱、隐私问题和领域的不透明性质，访问这些数据集可能是有限的。

LIWC工具被广泛用于语言特征提取，因为它是一种易于访问的工具，可以从文本中提取风格词、情感词和词性等特征[110］．使用LIWC进行的语言建模显示了如何在成员之间使用语言来预测他们的复发或行为转变模式。对于主题建模，LDA是最常用的工具;它根据单词分布分析潜在的主题，然后将主题分布分配给每个文档[111］．讨论的主题从一种危险的健康行为到另一种，但主要强调从事这种行为的个人的态度和行为模式。很少有例子包括强调与电子烟和大麻使用相关的有争议的话题(例如，合法化，禁止等)[101]，确定与电子烟使用和酒精偏好的规范或文化背景相关的主题[60，83]，并了解个人的社会环境如何影响他们的减肥行为[98］．

广泛的监督ML算法用于在线对等交互生成的数据的内容和情感分析。大多数研究使用传统的ML模型(如SVM、LR、RF、DT和KNN)进行文本分类。只有少数研究[41，70，72-75，87，One hundred.]利用深度学习模型(如cnn和LSTMs)进行文本以及图像和视频分类任务。在绩效评价方面，观察到以下结果:

64项研究中有4项(6%)[41，72-74]，与传统的ML分类器相比，深度学习模型在分类任务上的性能更好(例如，深度学习模型的AUROC曲线为0.65，而基线LR模型的AUROC曲线为0.54 [72])。
64项研究中的1项(2%)[75]，深度学习模型略优于传统的ML分类器:RF(准确率70.1%)和深度CNN(准确率70.4%)。
64项研究中的另外2项(3%)[70，One hundred.]，与传统的ML分类器相比，深度学习模型在分类任务上的性能较低(例如，RF[准确率93.4%]优于CNN[准确率60.1%][One hundred.])。

本综述中包括的大多数研究只关注在线同伴互动的文本数据分析，而只有一项研究使用图像数据进行了额外的分析[72]，只有一个进行了文本、图像和视频数据分析[87］．很少有研究[41，55，56，64，65，70，72-75]使用预训练的词嵌入(例如GloVe, word2vec, drug chatter词嵌入，LSA, RI和SGNS)创建词向量。这些训练使用不同类型的语料库(例如，维基百科语料库[56，72]、TASA语料库[55，64，65]，或特定领域的语料库[41，70，72，74，75])。使用预训练词嵌入的分类器的性能在F1分数方面从0.99到0.55不等。

本综述中包括的一些研究也进行了网络分析[42，48，50，53，64，65，86，91，103］．Gephi平台[112]及UCINET软件[113是被广泛用于分析在线社会关系的工具。一项研究利用隶属关系暴露模型和网络自相关模型的双模版本，描述了对等通信基础上内容特定的社会影响模式的作用[64］．一项研究分析了吸烟者的社会网络结构，并将其与非吸烟者的网络结构进行比较，以了解可能影响烟草上瘾相关行为的社会影响相关因素[53］．这样的网络分析可以帮助我们理解通信的背景，这最终可以指导卫生研究人员和技术开发人员开发有形的技术特征[114，115］．

一项研究[85]基于一种称为动态事务模型的交流模型，分析了在线同伴互动[116]，适合于建模个体之间的双向交流。很少有研究[42，45，55，64，65，97]在分析社交媒体平台生成的内容时定义行为变化的关联理论结构，如社会认知理论[117]，变化的跨理论模型[118]，健康信念模型[119]，以及行为改变技术的分类[120］．应使用理论框架对在线同伴互动进行分析，从而开发基于经验的数字健康干预措施，以促进健康和积极的行为改变[121，122］．对社交媒体数据集的理论驱动的大规模分析将对同伴互动中表现出来的行为变化的具体过程产生深刻的见解。将这些数据集与理论结构结合起来进行分析，有助于增强我们对社会影响如何在传播健康信息和修改个人健康行为方面发挥主要作用的认识。这可能会对根据个人和人群的危险健康行为制定高收益干预措施产生影响，从而使个人能够积极改变生活方式，提高生活质量。

同样重要的是，要了解在线社交媒体平台也可能被用于传播与健康有关的错误信息[123］．COVID-19大流行为我们提供了大量证据，突出表明迫切需要解决公众对困扰社交媒体的错误信息的担忧，这些错误信息可能对个人的健康相关行为产生负面影响[124，125］．此外，从这些平台传播的信息中提取的聚合趋势的基本真相只能在一定程度上反映社区的看法，因为自动机器人推送了大量的内容[126］．研究表明，错误信息还会影响危险的健康行为(例如，关于电子烟的误导性营销宣传[127]和饮酒[128])。未来的工作应侧重于利用本综述中描述的技术来分析在线社交媒体平台上传播的错误信息，以提高这些平台的效用和积极影响。

限制

我们的审查并非没有局限性。首先，我们只纳入了与危险健康行为相关的研究;然而，专注于其他公共卫生领域的研究(如流行病学[129]及监察[130])或专注于慢性健康状况的研究(例如糖尿病[131，132]和癌症[133])，以及临床和健康结果[134，135]，可以让我们全面了解如何利用计算建模和高通量分析，为各种公共卫生应用分析社交媒体平台生成的数据。信息流行病学和信息监测的领域相当广泛，包括本综述未包括的各种其他方面的危险健康行为(例如，挖掘消费者对电子烟在线营销的意见[136，137]，或了解他们对媒体报道的反应[138，139]或政策规例[140，141)。其次，我们只关注主要进行文本数据分析的研究。尽管我们确实纳入了报告图像或视频数据分析以及文本数据分析的研究[72，87]，我们没有纳入仅描述图像或视频数据分析的研究[108，109］．这些研究可以为与不同数据密度、异构性和推断粒度相关的ML权衡和计算可伸缩性提供有用的见解。

最后，由于我们搜索策略的限制，我们可能错过了一些来自信息流行病学和信息监测领域的研究;例如，本领域文献检索的初步探索[142共纳入了397项研究，其中23项研究与本综述相关。其中，我们的搜索策略捕获了15项研究，并纳入了综述[40，41，43，50，51，54，61-63，66，68-70，80，95]，而作为滚雪球行动的一部分，又增加了一个[47］．然而，我们的搜索策略并没有识别出其余7个[143-149］．在这些研究中，广泛的方法描述或过度细粒度的术语使用在元数据、标题、摘要和关键字中捕获ML方法。为了一致性和限制与其他期刊研究的偏差，我们没有将这些研究纳入综述。未来进行类似回顾的研究人员应确保包括以下术语:捕捉研究的跨学科性质(例如，信息流行病学)、分析功能(例如，文本分类、内容分析和主题建模)和分析技术(例如，LDA)，以详尽地表示利用SMaaRT进行风险行为建模和分析的相关工作。

结论

我们的研究表明，社交媒体平台上与危险健康行为相关的在线话语可以跨越多个主题，包括尼古丁依赖、酒精使用、药物或药物滥用、体育活动模式和肥胖相关行为。这导致产生大量数字化归档数据，可以更深入地了解与健康相关的行为变化过程的有机表现和自然演变。

我们的综述强调了社交媒体平台的特征(例如，通用型与健康型平台的对比，以及用于二次分析的数据访问的便利性)，用于分析这些平台内同伴交互的方法的鲁棒性，以及可用于大规模分析社交媒体数据集的各种文本挖掘和网络建模工具的概述。我们的回顾使我们能够巩固方法学基础，并增强我们对如何利用社交媒体进行细微差别的行为建模和表现的理解。这最终可以告知并导致制定有说服力的健康沟通和有效的行为矫正技术，针对个人和人口层面分布的个人间和个人内部心理社会过程。同样重要的是，了解现有计算研究的优点和不足，以评估这种大规模分析产生的下游预测模型和数据驱动干预的可泛化性和强度。

致谢

本刊报道的研究得到了美国国家医学图书馆和美国国立卫生研究院国家癌症研究所的支持(奖励号为1R01LM012974-01A1和3R01LM012974-02S1)。内容仅为作者的责任，并不一定代表美国国立卫生研究院的官方观点。

利益冲突

没有宣布。

‎

多媒体附件1

综述中包含的研究的详细摘要。

PDF档案(adobepdf档案)，468 KB

国家慢性疾病预防和健康促进中心。关于慢性疾病。疾病控制和预防中心。URL:https://www.cdc.gov/chronicdisease/about/index.htm[2020-06-04]访问
国家慢性疾病预防和健康促进中心。慢性病的健康和经济成本。疾病控制和预防中心。URL:https://www.cdc.gov/chronicdisease/about/costs/index.htm[2020-06-05]访问
李文杰，李志强，李志强。慢性疾病患者自我管理方法的研究进展。中华医学杂志2002;48(2):177-187。［CrossRef] [Medline］
勇敢的议员。社会支持对慢性疾病自我管理的影响:综述及研究方向。卫生教育杂志2003年4月30日(2):170-195。［CrossRef] [Medline］
Mokdad A, Remington P.测量人群的健康行为。先前慢性疾病2010年7月;7(4):A75 [免费全文] [Medline］
动机性访谈与成人2型糖尿病患者的预后:一项系统综述。患者教育计数2016年6月;99(6):944-952。［CrossRef] [Medline］
李志强，李志强，王志强，等。从可穿戴设备和智能手机应用程序分析大规模健康数据的最佳实践。NPJ数字医学2019;2:45 [免费全文] [CrossRef] [Medline］
谢夫曼S，斯通AA，赫福德先生生态瞬时评价。临床精神病学2008;4:1-32。［CrossRef] [Medline］
拉兰乔L，阿格尔A，内维斯AL, Gallagher AM，卡普兰R，莫蒂默N，等。社交网站对健康行为改变的影响:系统回顾和元分析。美国医学信息学会2015年1月;22(1):243-256 [免费全文] [CrossRef] [Medline］
信息流行病学和信息监测:一套新兴的公共卫生信息学方法的框架，用于分析互联网上的搜索、传播和发布行为。J Med Internet Res 2009年3月27日;11(1):e11 [免费全文] [CrossRef] [Medline］
信息流行病学:在网上跟踪流感相关搜索以进行症状监测。AMIA年度诉讼程序2006:244-248 [免费全文] [Medline］
Ginsberg J, Mohebbi MH, Patel RS, Brammer L, Smolinski MS, Brilliant L.利用搜索引擎查询数据检测流感流行。自然杂志2009年2月19日;457(7232):1012-1014。［CrossRef] [Medline］
Schomberg JP, Haimson OL, Hayes GR, Anton-Culver H.通过社交媒体补充公共卫生检查。PLoS One 2016;11(3):e0152117 [免费全文] [CrossRef] [Medline］
杨D.社交媒体作为促进健康和福祉的政策行动和社会变革的催化剂:观点。J Med Internet Res 2018年3月19日;20(3):e94 [免费全文] [CrossRef] [Medline］
Zimmerman RK, Wolfe RM, Fox DE, Fox JR, Nowalk MP, Troy JA，等。万维网上对疫苗的批评。J medical Internet Res 2005 6月29日;7(2):e17。［CrossRef] [Medline］
李安，焦东，刘霞，朱涛。社交媒体上精神分裂症相关污名化与抑郁症相关污名化的心理语言学风格比较:内容分析。J Med Internet Res 2020 april 21;22(4):e16470 [免费全文] [CrossRef] [Medline］
Vargas Meza X, Yamanaka T.在YouTube上的本地和有机食品视频中的食品传播及其相关情绪。J Med Internet Res 2020 Aug 10;22(8):e16761 [免费全文] [CrossRef] [Medline］
Pawar AS, Nagpal S, Pawar N, Lerman LO, Eirin A.公众对肥胖相关话题的信息寻求模式:谷歌趋势分析。JMIR公共卫生监测2020年8月11日;6(3):e20923 [免费全文] [CrossRef] [Medline］
Abd-Alrazaq A, Alhuwail D, Househ M, Hamdi M, Shah Z.推特治愈COVID-19大流行的最大担忧:信息监视研究J Med Internet Res 2020 april 21;22(4):e19016 [免费全文] [CrossRef] [Medline］
Wahbeh A, Nasralah T, Al-Ramahi M, El-Gayar O.挖掘医生在社交媒体上的意见以获得对COVID-19的见解:混合方法分析。JMIR公共卫生监测2020年6月18日;6(2):e19276 [免费全文] [CrossRef] [Medline］
基兹曼JH，赫姆肯斯K，麦卡锡IP，西尔维斯特BS。社交媒体?认真!理解社交媒体的功能构建模块。Bus Horiz 2011 5月;54(3):241-251。［CrossRef］
2019年的数字时代。我们是社会性的。纽约，纽约州:We Are Social URL:https://wearesocial.com/global-digital-report-2019[2020-06-03]访问
周WS，亨特YM，贝克约德EB，莫泽RP，赫塞BW。社交媒体在美国的使用:对健康传播的影响J Med Internet Res 2009 11月27日;11(4):e48 [免费全文] [CrossRef] [Medline］
Fisher J, Clayton M.谁发了一条推特:评估患者对使用社交媒体进行医疗保健的兴趣。Worldviews Evid Based Nurs 2012 april;9(2):100-108。［CrossRef] [Medline］
Looyestyn J, Kernot J, Boshoff K, Maher C.一项基于网络的社交网络初学者跑步干预，通过Facebook小组提供:随机对照试验。J Med Internet Res 2018 Feb 26;20(2):e67 [免费全文] [CrossRef] [Medline］
张陈志明，陈志辉，赖志杰，陈伟富，王明民，李河川，等。使用WhatsApp和Facebook在线社交小组预防近期戒烟者吸烟复发:一项试点实用聚类随机对照试验。J Med Internet Res 2015 10月22日;17(10):e238 [免费全文] [CrossRef] [Medline］
van Woudenberg TJ, Bevelander KE, Burk WJ, Smit CR, Buijs L, Buijzen M.一项随机对照试验，测试社交网络干预促进青少年体育活动。BMC公共卫生2018年4月23日;18(1):542 [免费全文] [CrossRef] [Medline］
杨晓燕，王晓燕，王晓燕。社会关系与健康行为的关系研究。社会年度报告2010年8月1日;36:139-157。［CrossRef] [Medline］
克里斯塔基斯娜，福勒JH。在一个大的社会网络中吸烟的集体动态。N Engl J Med 2008 5月22日;358(21):2249-2258 [免费全文] [CrossRef] [Medline］
Korda H, Itani Z.利用社交媒体促进健康和行为改变。健康促进实践2013年1月;14(1):15-23。［CrossRef] [Medline］
Cobb NK, Graham AL, Bock BC, Papandonatos G, Abrams DB。一个真实世界的互联网戒烟系统的初步评估。尼古丁含量决议2005年4月;7(2):207-216 [免费全文] [CrossRef] [Medline］
无论你身在何处，我们都在你身边。BecomeAnEX社区。URL:https://excommunity.becomeanex.org/[2020-06-13]访问
Centola D.社交媒体和健康行为科学。循环2013年5月28日;127(21):2135-2144。［CrossRef] [Medline］
Ayers JW, Althouse BM, Dredze M.行为医学能引领网络数据革命吗?美国医学杂志2014年4月9日;311(14):1399-1400 [免费全文] [CrossRef] [Medline］
庄凯，杨晨。MedHelp酗酒社区信息支持交流的研究。见:第五届社会计算、行为文化建模和预测国际会议论文集。德国柏林:施普林格;2012年发表于:第五届社会计算、行为文化建模和预测国际会议;2012年4月3-5日;马里兰大学帕克分校，第9-17页。［CrossRef］
Hwang KO, Ottenbacher AJ, Green AP, Cannon-Diehl MR, Richardson O, Bernstam EV，等。网络减肥社区的社会支持。国际医学杂志2010年1月;79(1):5-13 [免费全文] [CrossRef] [Medline］
Myneni S, Cobb N, Cohen T.在行为改变支持系统的理论基础上的追求:在健康相关的在线社区中对等通信的分析。J Med Internet Res 2016 Feb 02;18(2):e28 [免费全文] [CrossRef] [Medline］
俞k, Beam AL, Kohane IS。医疗保健领域的人工智能。生物医学工程2018年10月;2(10):719-731。［CrossRef] [Medline］
Liberati A, Altman DG, Tetzlaff J, Mulrow C, Gøtzsche PC, Ioannidis JPA，等。PRISMA用于报告评估医疗保健干预研究的系统回顾和元分析的声明:解释和阐述。PLoS Med 2009 7月21日;6(7):e1000100 [免费全文] [CrossRef] [Medline］
Benson R, Hu M, Chen AT, Nag S, Zhu S, Conway M.调查青少年和年轻人对JUUL的态度:使用Twitter数据的计算研究。JMIR公共卫生监测2020年9月02日;6(3):e19975 [免费全文] [CrossRef] [Medline］
李志强，李志强，李志强，等。用于Twitter监视电子烟的机器学习分类器:比较机器学习研究。J Med Internet Res 2020 Aug 12;22(8):e17478 [免费全文] [CrossRef] [Medline］
巴克乔，罗德JA。Reddit社区中电子烟提交的主题聚类:一个网络视角。卫生教育杂志2019年12月;46(2增刊):59-68。［CrossRef] [Medline］
Chu K, Colditz J, Malik M, Yates T, Primack B.确定公共卫生运动的关键目标受众:在水烟吸烟的情况下利用机器学习。J Med Internet Res 2019 july 08;21(7):e12443 [免费全文] [CrossRef] [Medline］
Czaplicki L, Kostygina G, Kim Y, Perks SN, Szczypka G, Emery SL，等。在Instagram上描述juul相关的帖子。Tob Control 2020年11月29日(6):612-617。［CrossRef] [Medline］
Singh T, Perez C, Roberts K, Cobb N, Franklin A, Myneni S.通过社交媒体分析的行为转变特征:混合方法方法。种马健康技术通知2019年8月21日;264:1228-1232。［CrossRef] [Medline］
王旭，赵凯，查S, Amato MS, Cohn AM, Pearson JL，等。在在线戒烟社区中挖掘用户生成的内容以识别吸烟状态:一种机器学习方法。Decis支持系统2019年1月;116:26-34。［CrossRef] [Medline］
Allem J, Dharmapuri L, Leventhal A, Unger J, Boley Cruz T. hookah2017 - 2018年推特相关帖子:专题分析。J Med Internet Res 2018年11月19日;20(11):e11669 [免费全文] [CrossRef] [Medline］
Chew R, Kim A, Chen V, Ruddle P, Morgan-Lopez A.评估数字公共卫生运动的目标受众:计算方法。第11届国际社会计算会议论文集，行为文化建模和预测以及建模和仿真中的行为表示。瑞士占姆:施普林格;2018年发表于:第11届社会计算、行为文化建模与预测以及建模与仿真中的行为表示国际会议;2018年7月10-13日;华盛顿，第286-291页。［CrossRef］
周娟，张强，曾德东，徐建林。香精对电子烟相关信息传播的影响:社交媒体研究。JMIR公共卫生监测2018年3月23日;4(1):e27 [免费全文] [CrossRef] [Medline］
阿利姆J，费拉拉E，乌普SP，克鲁兹TB，昂格JB。利用社交媒体数据监测电子烟:社交机器人、新兴话题和趋势。JMIR公共卫生监测2017年12月20日;3(4):e98 [免费全文] [CrossRef] [Medline］
Allem J, Ramanujam J, Lerman K, Chu K, Boley Cruz T, Unger JB。识别推特上与水烟相关的帖子的情绪。JMIR公共卫生监测2017年10月18日;3(4):e74 [免费全文] [CrossRef] [Medline］
戴浩，郝杰。挖掘社交媒体数据对电子烟的意见极化。结核控制2017 3月26日(2):175-180。［CrossRef] [Medline］
傅林，雅各布斯MA, Brookover J，瓦伦特TW，科布NK, Graham AL.吸烟者和非吸烟者的Facebook社交网络的探索。PLoS One 2017;12(11):e0187332 [免费全文] [CrossRef] [Medline］
Kim A, Miano T, Chew R, Eggers M, Nonnemaker J.关于电子烟的推特用户分类。JMIR公共卫生监测2017年9月26日;3(3):e63 [免费全文] [CrossRef] [Medline］
Sridharan V, Cohen T, Cobb N, Myneni S.健康相关在线社区中对等通信的时间语义变化特征:数据驱动的健康促进的影响。2016:1977-1986出版2017年2月10日[免费全文] [Medline］
Sridharan V, Cohen T, Cobb N, Myneni S.烟草使用背后的心理社会行为因素的时间趋势:对健康相关在线社区中对等交流的半自动化探索性分析。Stud Health technology Inform 2017;237:123-129 [免费全文] [Medline］
Westmaas JL, McDonald BR, Portier KM。美国癌症协会癌症幸存者网络(CSN)吸烟和戒烟相关帖子的主题建模:对吸烟的癌症幸存者戒烟治疗的影响。尼古丁Tob Res 2017 Aug 01;19(8):952-959。［CrossRef] [Medline］
Aphinyanaphongs Y, Lulejian A, Brown D, Bonneau R, Krebs P.用于自动检测电子烟使用和戒烟的文本分类:可行性试点。Pac Symp Biocomput 2016;21:480-491 [免费全文] [CrossRef] [Medline］
Kavuluru R, Sabbir AKM。自动化电子烟监控:在Twitter上发现电子烟支持者。J Biomed Inform 2016 Jun;61:19-26 [免费全文] [CrossRef] [Medline］
郭志刚，陈华，史勇，金勇，刘志刚。“比小雪茄更甜”:推特上小雪茄内容的数量和主题。Tob Control 2016 Oct;25(增刊1):i75-i82 [免费全文] [CrossRef] [Medline］
Lazard AJ, Saffer AJ, Wilcox GB, Chung AD, Mackert MS, Bernhardt JM。电子烟社交媒体信息:推特上营销和消费者对话的文本挖掘分析。JMIR公共卫生监测2016年12月12日;2(2):e171 [免费全文] [CrossRef] [Medline］
Chen AT, Zhu S, Conway M.在线社区可以告诉我们关于电子烟和水烟的使用:一项使用文本挖掘和可视化技术的研究。J Med Internet Res 2015 9月29日;17(9):e220 [免费全文] [CrossRef] [Medline］
Cole-Lewis H, Varghese A, Sanders A, Schwarz M, Pugatch J, Augustson E.使用监督机器学习评估电子烟相关推文的情绪和内容。J Med Internet Res 2015 Aug 25;17(8):e208 [免费全文] [CrossRef] [Medline］
Myneni S, Fujimoto K, Cobb N, Cohen T.戒烟在线社区的内容驱动分析:定性技术、自动文本分析和隶属网络的集成。中华医学会公共卫生杂志2015年6月第1期，第6期。［CrossRef] [Medline］
Myneni S, Cobb NK, Cohen T.在社交媒体中寻找意义:基于内容的QuitNet社交网络分析，以确定健康促进的新机会。种马健康技术通报2013;192:807-811。［Medline］
Myslín M，朱S，查普曼W，康威M.使用Twitter检查吸烟行为和对新兴烟草产品的看法。J Med Internet Res 2013 Aug 29;15(8):e174 [免费全文] [CrossRef] [Medline］
苏芬，史密斯。社交网络中吸烟的情感分析。种马健康技术通报2013;192:1118。［Medline］
Kim MG, Kim J, Kim SC, Jeong J.哌甲酯的非医疗使用和副作用的Twitter分析:机器学习研究。J Med Internet Res 2020 Feb 24;22(2):e16466 [免费全文] [CrossRef] [Medline］
Nasralah T, El-Gayar O, Wang Y.药物滥用的社交媒体文本挖掘框架:开发和验证研究与阿片类药物危机案例分析。J Med Internet Res 2020 Aug 13;22(8):e18350 [免费全文] [CrossRef] [Medline］
O'Connor K, Sarker A, Perrone J, Gonzalez Hernandez G.通过数据注释促进非医疗用药特征的可重复研究:Twitter语料库和指南的描述。J Med Internet Res 2020 Feb 26;22(2):e15861 [免费全文] [CrossRef] [Medline］
Desrosiers A, Vine V, Kershaw T。“你疯了吗?”:社交媒体情感的计算机文本分析与少数民族新兴成年男性的压力和物质使用有关。焦虑压力应对2019年1月;32(1):109-123。［CrossRef] [Medline］
hasanpour S，富田N, DeLise T, Crosier B, Marsch LA。基于深度神经网络和Instagram社交媒体数据识别药物使用风险。神经精神药理学2019 Feb;44(3):487-494 [免费全文] [CrossRef] [Medline］
胡华，潘宁，郭志强，刘志强，等。稀疏推特域药物滥用检测的集成深度学习模型。种马健康技术通知2019年8月21日;264:163-167。［CrossRef] [Medline］
Sarker A, Gonzalez-Hernandez G, Ruan Y, Perrone J.机器学习和自然语言处理用于以地理位置为中心的阿片类药物相关社交媒体聊天的监测和表征。2019年美国医学会网络公开赛11月01日;2(11):e1914672 [免费全文] [CrossRef] [Medline］
Sarker A, Gonzalez-Hernandez G, Perrone J.通过数据科学方法实现来自Twitter的特定位置阿片类药物毒理学监测自动化。种马健康技术通知2019年8月21日;264:333-337 [免费全文] [CrossRef] [Medline］
Glowacki EM, Glowacki JB, Wilcox GB。对公众对阿片类药物危机反应的文本挖掘分析。导刊2018;39(2):129-133。［CrossRef] [Medline］
Graves RL, Tufts C, Meisel ZF, Polsky D, Ungar L, Merchant RM。推特上关于阿片类药物的讨论。Subst使用误用2018年11月10日;53(13):2132-2139 [免费全文] [CrossRef] [Medline］
Kalyanam J, Katsuki T, Lanckriet GRG, Mackey TK。使用无监督机器学习探索推特圈中处方药的非医疗使用和多种药物滥用的趋势。成瘾行为2017年2月;65:289-295。［CrossRef] [Medline］
孟H, Kath S, Li D, Nguyen QC。推特上的国家药物使用模式。PLoS One 2017;12(11):e0187691 [免费全文] [CrossRef] [Medline］
刘志刚，陈丽丽，陈志刚，陈志刚，陈志刚，陈志刚。“什么时候‘坏’就是‘好’”:识别与毒品相关的推文中的个人交流和情绪。JMIR公共卫生监测2016年10月24日;2(2):e162 [免费全文] [CrossRef] [Medline］
Sarker A, O'Connor K, Ginn R, Scotch M, Smith K, Malone D，等。社交媒体毒物警戒挖掘:从Twitter自动监测处方药滥用。药物saff 2016 Mar;39(3):231-240 [免费全文] [CrossRef] [Medline］
Crocamo C, Viviani M, Bartoli F, Carrà G, Pasi G.从Twitter用户中检测酗酒和酒精相关的风险行为:基于内容和拓扑的探索性分析。国际环境与公共卫生杂志2020年2月26日;17(5):1510 [免费全文] [CrossRef] [Medline］
Giorgi S, Yaden DB, Eichstaedt JC, Ashford RD, Buffone AE, Schwartz HA，等。美国各地在推特上谈论饮酒的文化差异。国际环境与公共卫生杂志2020年2月11日;17(4):1125 [免费全文] [CrossRef] [Medline］
王勇，赵睿。基于语义患者-行为分析和重点话题发现的酒精饮料在线医疗论坛协作框架。中国医学杂志2020年4月07;44(5):101。［CrossRef] [Medline］
Parackal M, Parackal S, Mather D, Eusebius S.动态事务模型:通过社交媒体传播公共卫生信息的框架。展望公共卫生2020年7月14日1。［CrossRef] [Medline］
Cohn AM, Amato MS，赵凯，王旭，Cha S, Pearson JL，等。在戒烟的在线社交网络中饮酒的讨论:主题、情绪和社交网络中心性的分析。酒精临床试验报告2019年1月;43(1):108-114 [免费全文] [CrossRef] [Medline］
ElTayeby O, Eaglin T, Abdullah M, Burlinson D, Dou W, Yao L.通过挖掘异构数据识别Facebook中饮酒相关内容的可行性研究。卫生信息学杂志2019年12月;25(4):1756-1767 [免费全文] [CrossRef] [Medline］
通过推特预测酗酒康复。第11届国际社会计算会议论文集，行为文化建模和预测以及建模和仿真中的行为表示。瑞士占姆:施普林格;2018年发表于:第11届社会计算、行为文化建模与预测以及建模与仿真中的行为表示国际会议;2018年7月10-13日;华盛顿特区，p. 243-252网址:https://doi.org/10.1007/978-3-319-93372-6_28［CrossRef］
Kornfield R, Toma CL, Shah DV, Moon TJ, Gustafson DH。你复发之前会说什么?点对点在线讨论论坛中的语言使用如何预测恢复期人群中的风险饮酒。卫生公报2018年9月;33(9):1184-1193 [免费全文] [CrossRef] [Medline］
Carah N, Meurk C, Angus D.作为“反思主义”的在线自我表达和实验:使用文本分析来研究参与性论坛“Hello Sunday Morning”。卫生(伦敦)2017年3月21日(2):119-135。［CrossRef] [Medline］
柯恩，赵凯，查思，王旭，Amato MS, Pearson JL，等。对在线戒烟社交网络中与酒精相关的帖子的患病率和类型的描述性研究。J Stud Alcohol Drugs 2017 Sep;78(5):665-673 [免费全文] [CrossRef] [Medline］
刘j, Weitzman E, Chunara R.从社交媒体数据评估行为阶段。见:2017年ACM计算机支持合作工作和社会计算会议记录。纽约州纽约:计算机协会;2017年发表于:2017年ACM计算机支持的协作工作和社会计算会议;2017年2月25日至3月1日;波特兰，OR p. 1320-1333网址:http://europepmc.org/abstract/MED/29034371［CrossRef］
Parackal M, Parackal S, Eusebius S, Mather D.使用Facebook广告传播公共卫生信息:新西兰反对怀孕期间饮酒的运动。JMIR公共卫生监测2017年8月10日;3(3):e49 [免费全文] [CrossRef] [Medline］
Cesare N, Nguyen QC, Grant C, Nsoesie EO。社交媒体捕捉了人口和地区的体育活动。BMJ Open Sport exercise Med 2019;5(1):e000567 [免费全文] [CrossRef] [Medline］
阮国强，李丹，孟H, Kath S, Nsoesie E，李飞，等。从推特上的地理标记数据中建立一个全国社区数据集，用于幸福、饮食和体育活动的指标。JMIR公共卫生监测2016年10月17日;2(2):e158 [免费全文] [CrossRef] [Medline］
尹志强，李志强。推文内容挖掘的一种实用方法。美国医学杂志2013年7月;45(1):122-129 [免费全文] [CrossRef] [Medline］
通过在线讨论了解减肥:使用主题建模和单词聚类技术对Reddit帖子进行内容分析。J Med Internet Res 2020 Jun 08;22(6):e13745 [免费全文] [CrossRef] [Medline］
Liang B, Wang Y, Tsou M.“健身”主题可能降低超重和肥胖的区域患病率:来自谷歌搜索和推文的证据。中华卫生杂志2019;24(9):683-692。［CrossRef] [Medline］
高希D，古哈R.我们在“推特”上关于肥胖的什么?基于主题建模和地理信息系统的推文映射。中国地质大学学报(自然科学版)，2013;40(2):90-102 [免费全文] [CrossRef] [Medline］
Shah N, Srivastava G, Savage DW, Mago V.通过社交媒体评估加拿大人的健康活动和营养习惯。正面公共卫生2020;7:400 [免费全文] [CrossRef] [Medline］
Park A, Conway M.追踪Reddit上公共卫生应用的健康相关讨论。AMIA年度会议Proc 2018;2017:1362-1371 [免费全文] [Medline］
黄涛，Elghafari A, Relia K, Chunara R.基于社交媒体数据的酒精和烟草行为的高分辨率时间表示。Proc ACM Hum Comput Interact 2017 11月1日(CSCW):54 [免费全文] [CrossRef] [Medline］
Tamersoy A, De Choudhury M, Chau D.从社交媒体戒烟和戒酒的特征。见:第26届ACM超文本和社交媒体会议论文集。纽约州纽约:计算机协会;2015年发表于:第26届ACM超文本与社交媒体会议;2015年9月1-4日;古泽里尤特，塞浦路斯p. 139-148网址:http://europepmc.org/abstract/MED/26640831［CrossRef］
Twitter API。Twitter开发者。URL:https://developer.twitter.com/en/docs/twitter-api[2020-10-02]访问
api和sdk。开发者的Facebook。URL:https://developers.facebook.com/docs/apis-and-sdks/[2020-10-02]访问
Instagram基本显示API。开发者的Facebook。URL:https://developers.facebook.com/docs/instagram-basic-display-api/[2020-10-02]访问
reddit API文档。reddit。URL:https://www.reddit.com/dev/api/[2020-10-02]访问
张颖，Allem J, Unger JB, Boley Cruz T. Instagram上水烟(水烟)的自动识别:基于卷积神经网络和支持向量机分类的特征提取应用。J Med Internet Res 2018年11月21日;20(11):e10513 [免费全文] [CrossRef] [Medline］
Ketonen V, Malik A.通过使用无监督机器学习来描述Instagram上的电子烟帖子。Int J Med Inform 2020年9月;141:104223 [免费全文] [CrossRef] [Medline］
Tausczik YR, Pennebaker JW。词汇的心理意义:LIWC和计算机文本分析方法。心理学报2009十二月08;29(1):24-54。［CrossRef］
李国强，李国强。潜狄利克雷分布。J Mach Learn Res 2003 march;3:993-1022 [免费全文］
Bastian M, Heymann S, Jacomy M. Gephi:用于探索和操作网络的开源软件。Icwsm 2009; 8(2009): 361 - 362。
Borgatti S, Everett M, Freeman L. UCINET for Windows:社交网络分析软件。谷歌网站。哈佛大学:分析技术;2002.URL:https://sites.google.com/site/ucinetsoftware/home[2020-11-21]访问
Myneni S, Iyengar S.对健康促进具有社会影响力的技术:将社交媒体分析转化为面向消费者的健康解决方案。见:第49届夏威夷系统科学国际会议论文集(HICSS)。纽约，纽约州:IEEE;2016发表于:第49届夏威夷系统科学国际会议(HICSS);2016年1月5-8日;Koloa, HI p 3084-3093。［CrossRef］
亚德利L, Spring BJ, Riper H, Morrison LG, Crane DH, Curtis K，等。理解并促进有效参与数字行为改变干预措施。2016年11月;51(5):833-842。［CrossRef] [Medline］
Barnlund直流。交流的交易模式。在:Sereno KK, Mortensen CD，编辑。《通信理论基础》。纽约州纽约:Harper and Row;1970:99。
思想与行动的社会基础:一个社会认知理论。恩格尔伍德悬崖，新泽西州:Prentice-Hall;1986.
Prochaska JO, Velicer WF。健康行为改变的跨理论模型。中华健康杂志1997;12(1):38-48。［CrossRef] [Medline］
希兰P，亚伯拉罕C.健康信念模型。在:Ayers S, Baum A, McManus C, Newman S, Wallston K, Weinman J，等编辑。剑桥心理学、健康和医学手册，第二版。英国剑桥:剑桥大学出版社;2007:97 - 102。
亚伯拉罕C，米基S.行为改变技术的分类学在干预中使用。《健康心理》2008年5月;27(3):379-387。［CrossRef] [Medline］
Michie S, Yardley L, West R, Patrick K, Greaves F.开发和评估促进健康和医疗保健行为改变的数字干预措施:国际研讨会得出的建议。J Med Internet Res 2017 Jun 29;19(6):e232 [免费全文] [CrossRef] [Medline］
Riley WT, Rivera DE, Atienza AA, Nilsen W, Allison SM, Mermelstein R.移动干预时代的健康行为模型:我们的理论能胜任这项任务吗?Transl Behav Med 2011 Mar;1(1):53-71 [免费全文] [CrossRef] [Medline］
周伟，吴A，克莱因WMP。解决社交媒体上有关健康的错误信息。JAMA 2018 12月18日;320(23):2417-2418。［CrossRef] [Medline］
阿林顿D，达菲B，威斯利S，达万N，鲁宾J.在COVID-19突发公共卫生事件期间的健康保护行为、社交媒体使用和阴谋论。精神医学2020年6月09:1-7 [免费全文] [CrossRef] [Medline］
Tasnim S, Hossain MM, Mazumder H.社交媒体上关于COVID-19的谣言和错误信息的影响。《预防医学公共卫生》2020年5月;53(3):171-174 [免费全文] [CrossRef] [Medline］
Allem J, Ferrara E.消除社交媒体数据偏见的重要性，以更好地理解电子烟相关的态度和行为。J Med Internet Res 2016 Aug 09;18(8):e219 [免费全文] [CrossRef] [Medline］
Albarracin D, Romer D, Jones C, Hall Jamieson K, Jamieson P. YouTube视频中关于烟草产品的误导性声明:错误信息对不健康态度的实验影响。J Med Internet Res 2018 Jun 29;20(6):e229 [免费全文] [CrossRef] [Medline］
Salimian PK, Chunara R, Weitzman ER。避免完美风暴:解决青少年使用社交媒体的物质使用风险。儿科安2014年10月;43(10):411。［CrossRef] [Medline］
Mamidi R, Miller M, Banerjee T, Romine W, Sheth A.在Twitter上识别负面情绪的关键话题:关于2015-2016年寨卡病毒流行的见解。JMIR公共卫生监测2019年6月04日;5(2):e11036 [免费全文] [CrossRef] [Medline］
史文文，李志强，李志强，等。在美国，与HIV相关的推文和HIV发病率之间的关联:信息流行病学研究。J Med Internet Res 2020 Jun 24;22(6):e17196 [免费全文] [CrossRef] [Medline］
马晓明，李志强，李志强，李志强，等。社交媒体时代的糖尿病自我管理:使用半自动方法对同伴互动进行大规模分析。JMIR Med Inform 2020年6月30日;8(6):e18441 [免费全文] [CrossRef] [Medline］
王俊杰，陈晓明，陈晓明。健康相关同伴互动中意图的揭示:优化患者自我健康管理参与的意义。在:AMIA 2020虚拟年度研讨会论文集。2020年11月14日至18日;虚拟的。
徐超，杨华，孙林，曹旭，侯勇，蔡强，等。利用现实世界和基于互联网的数据检测肺癌趋势:信息流行病学研究。J Med Internet Res 2020年3月12日;22(3):e16184 [免费全文] [CrossRef] [Medline］
陈琳，陆旭，袁健，罗健，罗健，谢震，等。一项关于调味电子烟与健康症状相关性的社交媒体研究:观察性研究J Med Internet Res 2020 Jun 22;22(6):e17496 [免费全文] [CrossRef] [Medline］
华明，萨达S，赫里斯提迪斯V, Talbot P.电子烟使用对健康的影响:在线论坛的自动挖掘。J Med Internet Res 2020 Jan 03;22(1):e15684 [免费全文] [CrossRef] [Medline］
Kim AE, Hopper T, Simpson S, Nonnemaker J, Lieberman AJ, Hansen H，等。利用Twitter数据深入了解电子烟营销和使用地点:一项信息监视研究。J Med Internet Res 2015 Nov 06;17(11):e251 [免费全文] [CrossRef] [Medline］
Struik LL, Dow-Fleisner S, Belliveau M, Thompson D, Janke R.吸引年轻人吸电子烟的策略:电子烟广告的内容分析。J Med Internet Res 2020 Aug 14;22(8):e18943 [免费全文] [CrossRef] [Medline］
Kim K, Gibson L, Williams S, Kim Y, Binns S, Emery SL，等。2014年至2017年媒体对电子烟和其他烟草产品报道的效价:来自自动内容分析的证据尼古丁Tob Res 2020 10月08日;22(10):1891-1900。［CrossRef] [Medline］
Ayers JW, Dredze M, Leas EC, Caputi TL, Allem J, Cohen JE。下一代媒体监测:2013-2018年Bing、谷歌和Twitter上电子尼古丁输送系统(电子烟)的全球覆盖情况。PLoS One 2018;13(11):e0205822 [免费全文] [CrossRef] [Medline］
Lazard AJ, Wilcox GB, Tuttle HM, Glowacki EM, Pikowski J.推特上电子烟法规的公众反应:文本挖掘分析。Tob Control 2017 12月26日(e2):e112-e116。［CrossRef] [Medline］
Harris JK, moland - russell S, Choucair B, Mansour R, Staub M, Simmons K.支持和反对公共卫生政策的推特:对芝加哥公共卫生部电子烟推特运动的回应。J Med Internet Res 2014 10月16日;16(10):e238 [免费全文] [CrossRef] [Medline］
电子收藏“资讯流行病学与资讯监察”。JMIR。URL://www.mybigtv.com/themes/69[2020-11-22]访问
陆旭，陈琳，袁健，罗健，罗健，谢震，等。用户在社交媒体上对不同电子烟口味的感知:观察性研究。J Med Internet Res 2020 Jun 24;22(6):e17280 [免费全文] [CrossRef] [Medline］
阿利姆J，乌普SP，波利克鲁兹T，昂格JB。2018年推特上斯威舍小雪茄相关帖子的特征:文本分析。J Med Internet Res 2019 7月19日;21(7):e14398 [免费全文] [CrossRef] [Medline］
刘森，陈波，郭安。使用推特数据监测身体活动水平:信息流行病学研究。J Med Internet Res 2019 Jun 03;21(6):e12394 [免费全文] [CrossRef] [Medline］
李强，王超，刘睿，王玲，曾德东，雷士杰。从社交媒体了解用户的电子烟体验:使用情感意见总结技术的初步研究。J Med Internet Res 2018年8月15日;20(8):e252 [免费全文] [CrossRef] [Medline］
Rose SW, Jo CL, Binns S, Buenger M, Emery S, Ribisl KM。推特用户对薄荷香烟的看法:内容和情绪分析。J Med Internet Res 2017 Feb 27;19(2):e56 [免费全文] [CrossRef] [Medline］
詹艳，刘锐，李强，李瑞松，曾德东。电子烟用户生成内容的主题识别:来自多个社交媒体平台的案例研究。J Med Internet Res 2017 Jan 20;19(1):e24 [免费全文] [CrossRef] [Medline］
Hanson CL, Cannon B, Burton S, girau - carrier C.通过Twitter探索社交圈和处方药滥用。J Med Internet Res 2013 9月06日;15(9):e189 [免费全文] [CrossRef] [Medline］

‎

国际象棋:成瘾-全面健康促进支援系统

API:应用程序编程接口

AUROC:面积下接收机的工作特性

有线电视新闻网:卷积神经网络

DT:决策树

手套:全球向量

ISEAR:情绪前因与反应国际调查

资讯:再邻居

LDA:潜在狄利克雷分配

LIWC:语言探究字数

LR:逻辑回归

文理学院:潜在语义分析

LSTM:长短期记忆

网:医学学科标题

ML:机器学习

棱镜:系统评价和元分析的首选报告项目

射频:随机森林

国际扶轮:随机的索引

SemEval:语义评价

SentiWords:情绪词

胡志明市:带负抽样的跳过格

世鹏科技电子:SHapley加法解释

SMaaRT:社交媒体作为研究工具

支持向量机:支持向量机

TASA:试金石应用科学协会

维德:情感推理的价感字典

T·桑切斯编辑;提交20.06.20;O El-Gayar, JP Allem同行评审;对作者11.07.20的评论;修订版本收到05.10.20;接受06.11.20;发表30.11.20

©Tavleen Singh, Kirk Roberts, Trevor Cohen, Nathan Cobb, Jing Wang, Kayo Fujimoto, Sahiti Myneni。原载于JMIR公共卫生与监测(http://publichealth.www.mybigtv.com)， 2020年11月30日。

这是一篇根据创作共用署名许可协议(https://creativecommons.org/licenses/by/4.0/)发布的开放获取文章，允许在任何媒介上不受限制地使用、分发和复制，前提是正确引用了首次发表在JMIR公共卫生和监测上的原创作品。必须包括完整的书目信息，http://publichealth.www.mybigtv.com上的原始出版物的链接，以及此版权和许可信息。

本文内容如下e-collection /主题问题:

社交媒体作为风险行为分析的研究工具(SMaaRT):方法回顾