卡塔尔世界杯8强波胆分析|卡塔尔世界杯4强波胆分析

JPH

JMIR公共卫生监测

JMIR公共卫生和监测

2369 - 2960

卡塔尔世界杯8强波胆分析

加拿大多伦多

v6i4e21660

33252345

10.2196/21660

审查

社交媒体作为风险行为分析的研究工具(smarart):方法论综述

桑切斯

特拉维斯

El-Gayar

奥马尔

Allem

Jon-Patrick

辛格

Tavleen

女士 1

生物医学信息学院德克萨斯大学健康科学中心

后者街7000号

600套房

休斯顿,德克萨斯州,77030

美国 1 713 500 3900 tavleen.kaur.ranjit.singh@uth.tmc.edu

https://orcid.org/0000-0002-1721-4780

罗伯茨

柯克

博士学位 1

https://orcid.org/0000-0001-6525-5213

科恩

特雷弗

MBChB博士 2

https://orcid.org/0000-0003-0159-6697

科布

内森

医学博士 3.

https://orcid.org/0000-0003-4210-226X

王

京

RNC, MPH, PhD, FAAN 4

https://orcid.org/0000-0002-4012-0977

藤本

击倒

博士学位 5

https://orcid.org/0000-0002-8445-2711

Myneni

Sahiti

MSE博士 1

https://orcid.org/0000-0002-9211-1626

1 生物医学信息学院德克萨斯大学健康科学中心

休斯顿,德克萨斯州

美国 2 生物医学信息学与医学教育华盛顿大学

西雅图,华盛顿州

美国 3. 乔治城大学医学中心

华盛顿特区

美国 4 护理学院德克萨斯大学健康科学中心

圣安东尼奥,德克萨斯州

美国 5 公共卫生学院德克萨斯大学健康科学中心

休斯顿,德克萨斯州

美国

通讯作者:Tavleen Singh tavleen.kaur.ranjit.singh@uth.tmc.edu

Oct-Dec 2020

30. 11 2020

6 4

e21660

20. 6 2020 11 7 2020 5 10 2020 6 11 2020

©Tavleen Singh, Kirk Roberts, Trevor Cohen, Nathan Cobb, Jing Wang, Kayo Fujimoto, Sahiti Myneni。最初发表于JMIR公共卫生和监测(http://publichealth.www.mybigtv.com)， 2020年11月30日。

2020

这是一篇开放获取的文章，根据创作共用署名许可协议(https://creativecommons.org/licenses/by/4.0/)发布，该协议允许在任何媒体上不受限制地使用、分发和复制，但必须适当引用首次发表在《JMIR公共卫生与监测》上的原文。必须包括完整的书目信息，http://publichealth.www.mybigtv.com上的原始出版物链接，以及版权和许可信息。

背景

可改变的危险健康行为，如吸烟、过度饮酒、超重、缺乏体育活动和不健康的饮食习惯，是发展成慢性健康疾病的一些主要因素。社交媒体平台已经成为数字时代不可或缺的交流手段。它们为个人提供了一个机会，让他们表达自己的看法，并与同龄人和卫生保健提供者分享他们对危险行为的健康方面的关切。这种同伴间的互动可以作为有价值的数据来源，以更好地理解个人之间和个人内部的社会心理媒介以及驱动行为改变的社会影响机制。

客观的

本综述的目的是总结计算和定量技术，以促进分析通过社交媒体平台上与风险健康行为相关的同伴交互产生的数据。

方法

我们在2020年9月通过搜索pubmed、Web of Science和scopus三个数据库，使用相关关键词，如“社交媒体”、“在线健康社区”、“机器学习”、“数据挖掘”等，对文献进行了系统回顾。研究报告遵循PRISMA(系统回顾和荟萃分析首选报告项目)指南。两名审稿人根据纳入和排除标准独立评估了研究的合格性。我们从选定的研究中提取了所需的信息。

结果

最初的搜索总共返回了1554篇研究，在仔细分析标题、摘要和全文之后，总共有64篇研究被纳入了这篇综述。我们从所有研究中提取了以下关键特征:用于进行研究的社交媒体平台、研究的风险健康行为、分析的帖子数量、研究重点、用于数据分析的关键方法功能和工具、使用的评价指标，以及主要发现的总结。最常用的社交媒体平台是Twitter，其次是Facebook、QuitNet和Reddit。研究中最常见的危险健康行为是尼古丁使用，其次是药物或物质滥用和酒精使用。各种有监督和无监督机器学习方法被用于分析在线同伴交互生成的文本数据。很少有研究使用深度学习方法来分析文本数据以及图像或视频数据。在一些研究中，也进行了社会网络分析。

结论

我们的综述巩固了分析风险健康行为的方法论基础，并增强了我们对如何利用社交媒体进行细微差别的行为建模和表示的理解。从我们的审查中获得的知识可以作为发展有说服力的健康沟通和针对个人和人群层面的有效行为修正技术的基础组成部分。

社交媒体 infodemiology infoveillance 在线健康社区危险的健康行为数据挖掘机器学习自然语言处理文本挖掘

简介

可改变的危险健康行为，如吸烟、过度饮酒、超重、缺乏体育活动和不健康的饮食习惯，是导致慢性健康状况的一些主要因素[ 1］．在美国，癌症和心脏病等慢性疾病每年导致约150万人死亡[ 2］．这些慢性疾病加上糖尿病每年造成近3.5万亿美元的经济损失;因此，预防和/或有效管理此类情况变得至关重要[ 2］．行为修正对于管理慢性健康状况至关重要，一系列心理和社会过程已被证明会影响个人采取积极健康行为的参与度[ 3.， 4］．传统上，用于测量和研究人群中与健康相关行为的方法包括电话或基于互联网的调查[ 5]、动机性访谈[ 6，商业可穿戴设备和智能手机应用程序[ 7]、生态瞬时评价[ 8］．

最近，社交媒体已成为研究和分析健康相关行为并促进行为改变的可行平台[ 9］．资讯流行病学[ 10]审查为公共卫生目的在电子媒介(如社交媒体和互联网)中卫生信息的决定因素和分布:通过预测模型预防疾病[ 11- 13]，告知政策规例[ 14]，评估网站上健康资讯的质素[ 15，并分析个人的健康相关行为[ 16- 18］．最近的COVID-19大流行也表明，通过分析此类平台上的传播，可以洞察个人和卫生保健提供者的态度和行为[ 19， 20.］．

社交媒体通过其各种移动和基于网络的技术，为个人和社区提供了交互式平台，以想法、消息或信息的形式分享、创建、修改和讨论内容[ 21］．近年来，社交媒体平台在生活各个领域的渗透程度不断提高。根据《2019年全球数字报告》，全球约有35亿活跃社交媒体用户，其中Facebook是最主要的社交网站。全球超过三分之二的人口使用移动设备，其中大部分是智能手机。在这些互联设备的支持下，许多老年人和青少年也开始将社交媒体融入他们的日常生活。 22］．

因此，社交媒体已成为公共卫生领域的一个重要组成部分，因为医疗保健消费者越来越多地使用这些平台来获取各种与健康相关的主题的知识，并与同龄人和医疗保健提供者互动，以获得社会支持，主要是信息和情感方面的支持[ 23， 24］．这些平台被医疗保健消费者广泛使用，以(1)实现其与健康相关的目标[ 25(2)采取积极的健康行为[ 26， 27］．研究表明，如果一个人的社会关系也参与类似的行为，他就更有可能遵守与健康有关的目标并坚持预防措施。[ 28， 29］．与研究和分析健康促进和行为改变的标准方法相比，使用此类平台的主要优势包括:它们能够接触到更广泛、更不易接触到的受众、以低成本的方式招募参与研究的参与者以及通过移动和基于网络的连接全天候可访问性[ 30.］．这些平台可以利用群体规范;因此，通过这些平台实施的行为改变干预措施有可能通过广泛传播预防方案来满足个人、社区和人群的需求，从而产生重大影响。

这些在线平台可以大致分为两大类:(1)开放的社交媒体平台(如Facebook、Twitter和Reddit)，这是用于社交、信息共享和协作的通用平台;(2)有意设计的与健康相关的社交媒体平台(如QuitNet [ 31和BecomeAnEX.org [ 32)，其重点是向其成员提供专门的保健支助。尽管开放的社交媒体平台提供了对个人行为进行大规模推断的机会，但它们仍然缺乏针对特定情境的互动观察，为此我们需要转向有意设计的社交媒体平台[ 33］．根据社交媒体平台是否专门关注健康主题，影响个人试图维持积极健康变化的环境因素可能有很大差异，从而影响影响计算和定量数据建模方法准确性和可靠性的上下文粒度。尽管存在这些差异，但这些平台的普遍存在已经导致以文本、图像或视频(如Facebook和YouTube等传统论坛)形式的同伴交互的电子痕迹形式生成了宝贵的大型数据集。与传统环境相比，这些数据集在接近实时和自然环境中捕捉了个人的态度和行为，而传统环境中有研究人员在场，容易产生工具偏差[ 34］．对这些数据集的分析为我们提供了一个机会来理解行为改变背后的个人因素和环境因素，这最终可以指导健康相关行为改变的网络干预的设计和开发[ 35- 37］．

传统的定性数据分析方法不利于分析社交媒体平台产生的大量数据。自动化文本分析的最新进展为我们提供了分析社交媒体平台生成的数字内容的合适方法。最新的综述强调了目前应用于医疗保健领域的计算技术的突破，包括数字化数据采集、机器学习(ML)技术和计算基础设施[ 38］．除了来自移动计算和互联网的预测分析和组合力量的进步之外，参与式社交媒体已经产生了丰富的即时数据，可以利用这些数据对健康消费者参与风险健康行为自我管理的数字表型进行分析。

本综述的目的是总结计算和定量方法，强调使用社交媒体作为研究工具(smarart)的潜力，以了解与危险健康行为的预防和管理相关的个人间和个人内部心理社会因素的模式。这些方法可以全面了解最常见的做法、它们的效用、局限性和由此产生的推论，从而为卫生研究人员提供更好地大规模描述卫生行为的能力。通过可扩展的技术，如量身定制的信息传递和有说服力的环境设计，将数据驱动的见解转化为实际的公共卫生解决方案，从这些次级分析中获得的更深刻的理解最终可注入有效行为干预措施的设计过程。

方法概述

我们对相关文献进行了系统回顾，总结了分析用于研究危险健康行为的社交媒体数据的计算和定量方法。我们遵循PRISMA(系统评审和荟萃分析首选报告项目)概述的指南[ 39]查阅相关资料。

文献检索策略

我们搜索了2020年9月的文献，收集了2011年至2020年9月11日发表的研究。我们使用一组特定的关键词搜索了三个不同的数据库——pubmed、Web of Science和scopus。我们的搜索关键词位于两个关键集群的交叉点:社交媒体和ML。我们还为相关关键词添加了医学主题标题(MeSH)，以确保我们的搜索尽可能具有包容性。使用以下查询进行搜索:(“社交媒体”[MeSH]或“社交媒体”或“在线健康社区”或“在线社交网络”或“在线社交网络”或“点对点”或“同伴影响”[MeSH])和(“机器学习”[MeSH]或“机器学习”或“文本挖掘”或“自然语言处理”[MeSH]或“自然语言处理”或“数据挖掘”[MeSH]或“数据挖掘”或“网络模型”)。此外，我们还检查了符合我们的纳入标准的研究参考列表，以寻找任何其他来源。

纳入和排除标准

确定研究是否有资格接受评审的纳入和排除标准列于文本框1．

参与研究的资格标准。

入选标准:

研究人员进行了原创研究，并发表在同行评审期刊上。

研究使用了基于英语的社交媒体平台(即生成的内容的语言是英语)。

研究使用计算或定量方法进行了大规模的数据分析，如机器学习技术、网络建模和/或可视化技术。

研究集中在患者或健康消费者的危险健康行为或相关态度或信念，如尼古丁使用、酒精使用、药物或药物滥用、体育活动或不活动模式，或与肥胖相关的行为。

研究主要集中在分析来自在线社交媒体平台的文本内容(例如，YouTube评论而不是YouTube视频)。

排除标准:

研究描述了社交媒体平台的其他用途(如招聘和数据收集)。

研究的重点是卫生保健提供者，而不是患者或健康消费者。

研究集中在与健康无关的行为上。

数据提取

两位作者(TS和SM)在两个阶段根据纳入标准独立评估检索的研究。在第一阶段，作者回顾了所有检索到的研究的标题和摘要，以纳入全文筛选。在第二阶段，作者对第一阶段确定的相关研究进行了全文筛选，以最终纳入本综述。分歧通过两位作者的讨论得到了解决。在两个阶段都计算了评价者之间的一致性，Cohen κ。在筛选了符合纳入标准的研究之后，我们从正文中提取了相关数据，包括以下内容:

所研究的危险健康行为，如尼古丁使用、酒精使用、药物或药物滥用、身体活动或不活动模式、与肥胖有关的行为等。

该研究使用的社交媒体平台，无论是一个开放的社交网络，如Twitter或Facebook，还是一个特定疾病的社交网络，如QuitNet(即戒烟)。

员额数:用于分析的员额总数和用于手工注释的员额数。

研究重点:分析危险健康行为的研究潜在目标是什么?

主要方法功能和工具;例如，使用潜狄利克雷分配(LDA)(即方法)进行主题建模(即函数)。

本研究使用的评价指标(如，精度、回忆率和F1分)。

该研究的主要发现:分析在线同伴互动产生的数据后得到的结果。

结果概述

最初的搜索总共产生了1554项研究。从这些研究中，我们删除了203项因为重复的研究。在第一阶段，我们审查了剩余研究的标题和摘要，以确保它们满足进一步深入分析的纳入和排除标准。第一阶段评分者之间的一致性为81.37%。通过讨论解决分歧后，我们初步排除了1246篇不符合纳入标准的研究，将剩余105篇研究纳入第二阶段全文筛选。第二阶段评分者之间的一致性为83.50%。该综述共纳入了52项符合纳入标准的研究。我们进一步通过滚雪球技术确定了另外12项研究，这些研究也包括在本综述中。因此，共有64项研究[ 40- 103]被纳入最终检讨。在审查的研究中，55项(86%)研究发表于2016年以后[ 40- 61， 68- 95， 97， 98， One hundred.- 102]，而在2013年至2015年间，只有9项(14%)研究发表[ 62- 67， 96， 99， 103］．这些研究都是在2013年之前发表的。图1显示了PRISMA图表，突出显示了为审查选择最终研究的整个过程。

图1

用于研究选择的PRISMA(系统回顾和荟萃分析首选报告项目)图表。

我们的研究结果表明，社交媒体分析的重点一直是各种危险的健康行为，包括尼古丁使用、酒精使用、药物滥用、体育活动模式和与肥胖相关的行为。社交媒体平台被广泛用于二次数据分析，以及对利用此类平台进行的积极干预或活动产生的数据进行后续分析。利用多种计算和定量函数和工具来分析社交媒体平台上在线同伴互动产生的数据。我们的研究结果的详细说明包括在多媒体附录1它显示了所选研究的关键特征，这些研究按危险的健康行为分组，然后按发表的年份排序。

在接下来的章节中，我们将汇总我们的研究结果，以强调各种社交媒体平台的使用模式，用于二次分析目的，在这些平台上研究的危险健康行为的流行率，以及用于理解这些行为的方法工具和功能。

社交媒体平台

表1［ 40- 103强调了用于分析危险健康行为的社交媒体平台。Twitter(39/ 64,61%)似乎是用于分析关于危险健康行为的在线同伴互动的最广泛使用的社交媒体平台，其次是Facebook(6/ 64,9%)、QuitNet(5/ 64,8%)、Reddit(5/ 64,8%)、BecomeAnEx.org(3/ 64,5%)、Instagram(2/ 64,3%)、癌症幸存者网络(1/ 64,2%)、Hello Sunday Morning博客(1/ 64,2%)、patient.info/forums(1/ 64,2%)和点对点在线讨论论坛。这是一款名为上瘾-全面健康增强支持系统(a - chess)的智能手机应用的一部分(1/ 64,2%)。在64项研究中，1项(2%)分析了来自三个在线论坛的数据:蒸汽对话、水烟论坛和停止吸烟版块[ 62］．共有80%(51/64)的研究使用开放的社交媒体平台，如Twitter、Facebook、Instagram和Reddit [ 40- 44， 47- 54， 58- 61， 63， 66- 83， 85， 87， 88， 92- 103]，而其余20%(13/64)的研究利用特定的与健康相关的在线社交网络，如QuitNet、BecomeAnEX.org、癌症幸存者网络、patient.info/forums、Hello Sunday Morning博客和A-CHESS在线讨论论坛[ 45， 46， 55- 57， 62， 64， 65， 84， 86， 89- 91］．

大多数使用Twitter作为数据源的研究都依赖于Twitter应用程序编程接口(api)来提取数据。这些研究中的大多数使用了流api，它提供了近乎实时的数据子集推送[ 47， 50， 51， 59， 61， 70， 74， 78- 81， 92， 94， 95]，其中一些研究还使用了搜索api，它提供了对过去已经发生的推文组成的数据集的访问[ 68， 76， 82， 98， 99］．一些研究还使用了推特的数据提供商Gnip [ 54， 59， 60， 63， 92，它保证可以访问所有符合研究人员标准的推文。一些研究并没有指明使用哪种API访问Twitter的数据[ 40， 41， 48， 66， 73， 77， 88， One hundred.， 102］．对于Reddit，使用以下技术提取数据:(1)使用Pushshift，这是一个公开的Reddit提交的存档[ 42]，(2)使用名为Wget的网络爬虫下载数据集[ 62，(3)使用Python Reddit API Wrapper [ 97]，(4)数据集从Reddit成员[ 101)，(5)使用Reddit的官方API [ 103］．来自Facebook的数据是使用Facebook的API和Facebook平台的Python软件开发工具包提取的[ 87]或使用NVivo (QSR International)的提取功能[ 71］．使用Instagram的API提取数据时使用了类似的方法[ 44， 72］．

表1

各种研究使用的社交媒体平台。

社交媒体平台	研究数(N=64)， N (%)^一个	学习参考资料
推特	39 (61)	［ 40， 41， 43， 47， 48， 50- 52， 54， 58- 61， 63， 66- 70， 73- 83， 88， 92， 94- 96， 98- One hundred.， 102］
脸谱网	6 (9)	［ 49， 53， 71， 85， 87， 93］
QuitNet	5 (8)	［ 45， 55， 56， 64， 65］
Reddit	5 (8)	［ 42， 62， 97， 101， 103］
BecomeAnEX.org	3 (5)	［ 46， 86， 91］
Instagram	2 (3)	［ 44， 72］
Hello Sunday Morning博客	1 (2)	［ 90］
国际象棋^b(在线讨论论坛)	1 (2)	［ 89］
癌症幸存者网络	1 (2)	［ 57］
Patient.info /论坛	1 (2)	［ 84］
蒸汽谈话，水烟论坛，和停止吸烟reddit的子版块	1 (2)	［ 62］

^一个由于四舍五入和一项使用多个社交媒体平台的研究，这些百分比加起来不等于100%。

^bA-CHESS:成瘾-综合健康增强支持系统。

危险的健康行为

表2［ 40- 103强调所研究的危险健康行为和用于进行研究的相关社交媒体平台。社交媒体平台上最常被研究的危险健康行为与尼古丁产品的使用有关，64项研究中共有28项(44%)[ 40- 67主要关注与吸烟、电子烟、小雪茄等相关的行为。Twitter(16/64, 25%)被广泛用于分析此类行为，其次是QuitNet (5/64, 8%)， Facebook (2/64, 3%)， Reddit (1/64, 2%)， Instagram(1/64, 2%)，癌症幸存者网络(1/64,2%)，BecomeAnEX.org(1/64, 2%)，以及Vapor Talk，水烟论坛和停止吸烟的Reddit子版块(1/64,2%)。这些研究大多集中在分析成员对吸烟产品(如电子烟)的行为或情绪[ 42， 49， 50， 52， 54， 58， 59， 61- 63]、水烟产品[ 43， 47， 51， 62， JUUL或vaping [ 40， 41， 44]和雪茄[ 60，或分析人们对吸烟的普遍看法[ 67］．在64项研究中，2项(3%)主要关注社会网络分析:一项是了解社会网络结构如何影响社区成员的吸烟行为[ 53]，另一个是了解针对年轻人的反吸烟运动的影响范围[ 48］．其他研究集中在(1)分析成员生成的内容，以得出共同主题或同伴之间讨论的主题[ 57， 64- 66，(2)描述戒烟过程中的行为转变[ 45]，(3)研究同伴互动的时间趋势，以洞察戒烟行为改变的潜在因素[ 55， 56]和(4)预测吸烟状况[ 46］．

吸毒或药物滥用是社交媒体平台上另一个经常被讨论的危险健康行为，64项(22%)研究中共有14项研究讨论了这个话题[ 68- 81］．Twitter(12/ 64,19%)再次成为研究药物或药物滥用行为最受欢迎的平台，其次是Instagram(1/ 64,2%)和Facebook(1/ 64,2%)。这些研究的重点领域包括处方药物滥用[ 68， 70， 78， 81]，滥用阿片类药物[ 74- 77]、大麻和合成大麻素的使用[ 80]，以及滥用药物或药物[ 69， 71- 73］．一项研究分析了与药物滥用有关的多种行为，包括酒精、吸烟和吸毒[ 79］．

在64项研究中，12项(19%)探讨了在线健康社区成员的酒精使用模式和禁欲行为[ 82- 93］．其中一些研究(1)对在线戒烟社区产生的与酒精有关的内容进行了专题分析[ 86， 91，(2)重点分析酒精使用行为阶段的趋势[ 92，(3)分析了酗酒行为[ 82， 83， 87，(4)着重提取与酒精使用相关的话题和情绪[ 84， 85， 93，(5)专注于预测未来酗酒复发或康复[ 88， 89］．一项研究分析了一个博客的内容，该博客鼓励其成员在一段特定的时间内戒酒，并与同伴讨论他们的进展[ 90］．用于分析酒精使用行为的平台分布差异很大表2［ 40- 103])。

在64项研究中，有3项(5%)探讨社区成员参与体育活动的模式和类型[ 94- 96］．所有这些研究都使用Twitter作为数据来源。在64项研究中，3项(5%)分析了与肥胖相关行为相关的主题[ 97- 99使用社交媒体平台，如Twitter和Reddit。64项(6%)研究中有4项[ One hundred.- 103研究了多种行为，例如(1)分析肥胖和体育活动相关内容，以获得个人健康状况的信息[ One hundred.，(2)确定与电子烟和大麻使用相关的讨论主题[ 101和(3)描述与烟草和酒精相关的行为模式[ 102， 103］．在这4项研究中，2项(50%)利用Twitter [ One hundred.， 1022人(50%)使用Reddit [ 101， 103]作为数据来源。

表2

危险的健康行为及其相关的社交媒体平台。

危险的健康行为	研究数(N=64)， N (%)^一个	社交媒体平台和研究参考资料
尼古丁使用	28 (44)	推特( 40， 41， 43， 47， 48， 50- 52， 54， 58- 61， 63， 66， 67］QuitNet [ 45， 55， 56， 64， 65］Facebook ( 49， 53］Reddit [ 42］Instagram [ 44］癌症幸存者网络[ 57］BecomeAnEX.org [ 46］蒸汽对话，水烟论坛和戒烟版块[ 62］
药物和物质滥用	14 (22)	推特( 68- 70， 73- 81］Instagram [ 72］Facebook ( 71］
使用酒精	12 (19)	推特( 82， 83， 88， 92］Facebook ( 85， 87， 93］Patient.info /论坛[ 84］BecomeAnEX.org [ 86， 91］国际象棋^b网上论坛[ 89］Hello Sunday Morning博客[ 90］
体育活动	3 (5)	推特( 94- 96］
与肥胖相关的行为	3 (5)	Reddit [ 97］推特( 98， 99］
多种行为(例如，电子烟和大麻，吸烟和饮酒，体育活动和肥胖相关行为)	4 (6)	推特( One hundred.， 102］Reddit [ 101， 103］

^一个由于四舍五入的关系，百分数加起来不等于100。

^bA-CHESS:成瘾-综合健康增强支持系统。

方法细节和相关工具

以下部分将讨论各种研究中使用的方法功能，以及执行这些功能所使用的具体工具。

计算建模:特征提取

最常提取的特征是n格(例如，未字母、双字母和三字母)[ 40， 44， 46， 47， 58， 59， 63， 66， 67， 70， 74， 75， 80- 82， 86， 91， 92， 96， 99， One hundred.， 102， 103］．除此之外，一些研究还利用了计数向量等附加特征[ 41，项频逆文档频率向量[ 41， 63， 80， 82， 86， 87， 91， 92， One hundred.，基于语言的协变量[ 42，标签数量[ 44，包含特定字符串的标签数量[ 44),用户名( 44]，词性标签[ 59，情绪评分[ 59， 68]，用户名中是否存在特定术语[ 59，领域特定的特征[ 46， Doc2Vec特性[ 46，基于作者的特性[ 46，基于线程的功能[ 46，用户元数据特性[ 54， 82， 86， 92，派生的行为特征(例如，原始推文的唯一关键字计数，原始推文的标签的唯一关键字计数，等等)[ 54，人称名词[ 68，非医疗使用术语[ 68，医疗使用术语[ 68]、副作用术语[ 68]，存在网址[ 68，滥用指示术语[ 73- 75， 81，毒品俚语词汇[ 73， 81]，使用WordNet的同义词扩展功能[ 73， 81，词聚类特征[ 73- 75， 81，基于行为应对方式的特征[ 88]、社会因素[ 88)、年龄( 88]，以及基于图像的特征[ 72］．一些研究使用了特征选择技术，如SelectKBest [ 40]，信息获取[ 66和卡方检验[ 80］．一项研究使用一种称为SHapley相加解释的技术对每个分类器的相关特征进行了评估[ 41］．

计算建模:分类技术传统ML分类器

大多数研究使用有监督的ML分类器进行文本分析，以执行预测建模、行为阶段建模或内容分析。各种研究中使用的分类器包括支持向量机(SVM) [ 51， 54， 66， 67， 70， 73- 75， 80- 82， 92， 94， One hundred.， 102]，支持向量机(线性)[ 41， 44， 45， 58， 60， 63， 87， 102]， SVM(径向核)[ 44， 68， 87]，支持向量机(多项式核)[ 46， 87]， SVM (sigmoid) [ 87]，逻辑回归(LR) [ 40， 41， 44- 46， 54， 58- 60， 72， 80， 89， 92， 94， One hundred.， 102， naïve贝叶斯[ 40， 41， 46， 52， 54， 58， 60， 63， 66， 70， 73- 75， 80， 81， 86， 91， One hundred.，随机森林(RF) [ 40， 41， 45， 54， 58， 70， 73- 75， 82， 84， 86， 91， 92， One hundred.， 102]，基于决策树的分类器(DT)(如J48) [ 46， 54， 55， 74， 81， 86， 91， k-nearest neighbors (KNN) [ 54， 63， 66， 74， 84),演算法( 46， 54， 86， 91，最大熵文本分类器[ 79， 81， 94， 95，顺序最小优化[ 84，多层感知器[ 84], REPTree [ 88，前馈神经网络[ 94，以及梯度增强[ 48， 54， 94］．一项研究使用LDA的监督版本，称为标签LDA，用于文本分类[ 87]，而另一个则使用一种基于监督学习的统计模型，称为岭回归统计模型来执行分类任务[ 103］．一项研究开发了一个文本挖掘框架，使用基于搜索查询的分类器和基于评估矩阵的分类器来评估数据质量[ 69］．一项研究使用R (R基金会)中的RtextTools通过监督学习进行自动文本分类[ 43］．

一项研究利用专门的软件来分析在线同伴互动产生的文本内容，即Leximancer [ 90］．很少有研究使用R中的包进行文本挖掘，如RWeka [ 43和tm [ 43， 68， 98， 99］．

深度学习技术

在64项研究中，6项(9%)使用深度学习模型进行文本分类，如卷积神经网络(CNNs) [ 41， 70， 73- 75， One hundred.，长短时记忆[ 41， 72], LSTM-CNN [ 41，双向LSTM [ 41，浅神经网络[ One hundred.]，强化神经网络门控循环单元[ One hundred.］．哈桑普尔等人[ 72]通过随机梯度下降优化算法优化了他们的深度学习模型。一项研究使用了一个集成深度学习模型，该模型由单词级CNN和字符级CNN组成[ 73］．其中一项研究还使用残差神经网络提取的图像特征进行图像分类[ 72]，这是用于计算机视觉任务的最先进的CNN架构。另一项研究[ 87]使用一个名为AlexNet的神经网络进行图像和视频分类，AlexNet是另一个著名的用于计算机视觉问题的深度CNN。

字嵌入:Pretraining

以下研究使用了词嵌入的预训练，如全局向量(GloVe)词向量(即通用域)[ 41]， word2vec在维基百科语料库上预训练[ 72]， word2vec使用特定领域的语料库进行预训练[ 41， 70， 74， 75］．一项研究使用ImageNet数据存储库对图像分类器模型进行预训练[ 72]，在另一项研究中，一个词级CNN被预先训练了药物颤振词嵌入(即400维)[ 73］．

经验分布语义

一些研究应用分布语义来识别术语之间的有意义的关系，例如，应用潜在语义分析(LSA)等技术，在消息和识别的主题之间识别有意义的关系[ 64， 65，随机索引(RI) [ 55]，以及负采样跳过图(SGNS)算法[ 56使用语义向量包。其中一些研究使用了对通用领域语料库的预训练:RI与Touchstone应用科学协会(TASA)语料库[ 55]，使用Wiki语料库的SGNS算法[ 56和LSA，使用TASA语料库[ 64， 65］．

主题建模

主题建模采用多种技术，如Quanteda软件[ 42], LDA [ 49， 57， 60， 62， 69， 77， 83， 84， 97- 99， 101， SAS文本矿工(SAS研究所)[ 61， 76， 85， 93，以及相关的主题建模，使用R中的topicmodels包[ 86］．在64项研究中，有2项(3%)使用了word2vec模型:一项是识别与每个主题的字母和字母相似的单词[ 47]和另一个词的语义聚类[ 97］．一项研究通过计算频率向量来检测主题，以创建一个术语- tweet频率表，并执行卡方检验来比较整个语料库中的术语[ 96］．

各种无监督ML模型也被用于使用k-means聚类来识别电子烟社区[ 42以及通过一种称为biterm主题模型的技术进行模式或主题识别[ 78］．一项研究通过聚类分层聚类技术进行聚类分析[ 102]将在线社区成员的酒精消费时间模式进行分组。

语言建模

在64项研究中，有5项(8%)使用语言查询字数(LIWC)进行语言文本分析，LIWC用于统计心理意义类别的字数[ 45， 71， 83， 88， 89］．Singh等人的语言分析[ 45]的研究结果表明，以寻求信息的形式出现的疑问句，如果属于沉思行为改变阶段;然而，如果数字属于某一民族，则更常用该民族的语言表示行动行为改变阶段。另一项研究表明，带有负面影响的词汇往往与更严重的药物滥用有关。 71］．在一项研究中，LIWC被用来测量每个社区中人称代词的使用情况，以了解这个人是在推特上谈论自己的饮酒行为，还是在引用他人的行为[ 83］．一项研究从社交媒体平台上使用的语言中提取心理语言学特征，以训练分类器预测酒精中毒的康复[ 88］．同样，另一项研究表明，对于酒精使用障碍患者来说，负面情绪或脏话、抑制性词汇和情话与复发风险的增加显著相关[ 89］．

情感建模

在64项研究中，20项(31%)进行了情绪分析，以衡量个人对健康行为(如电子烟、水烟、药物滥用、电子烟和JUUL)的积极、消极或中立情绪[ 40， 41， 43， 51， 59， 63， 66- 68， 79， 80， 83， 85， 86， 91， 93- 96， 103］．一些用于执行情绪分析的技术包括SentiWordNet 3.0 [ 59];SentiWords(情感词汇)词典[ 85];Sentiment140 [ 96];最大熵文本分类器[ 79， 94， 95];Mathematica 10.3 (Wolfram) [ 93];支持向量机在SemEval(语义评估)、ISEAR(情感前因和反应国际调查)情感数据集和带有情感标签的推文语料库上进行训练[ 51];和各种监督ML算法[ 40， 41， 43， 63， 66， 67， 80， 86， 91］．一项研究计算了刘氏和胡氏意见词典的情感分数[ 68，一项研究使用国家资源委员会标签情绪词汇来衡量与推特相关的积极情绪[ 83]，三项研究使用了基于词典和规则的情感分析工具VADER(价感字典和情感推理)[ 51， 80， 103］．

模型评估与度量

为了评估分类模型的性能，几项研究将数据集分为训练集和测试集，进行n倍交叉验证，并计算精度、精密度、召回率、F1得分、特异性、马修相关系数和受试者工作特征(AUROC)曲线下的面积等指标。我们使用各种研究报告的F1分数汇编了我们的结果部分。如果任何研究没有报告他们的F1成绩，我们列出他们在研究中报告的指标。大多数研究报告了分类任务的F1分数[ 40， 41， 43- 46， 48， 51， 54， 55， 59， 60， 66- 70， 72- 74， 80， 81， 84， 87， 88， 91， 92， 94， 95， 102， 103，在不同的研究中，它们的范围在0.42到0.99之间。交叉验证使用不同的折叠:4倍[ 59), 5倍 67， 80， 82， 923年来[], 73]和10倍[ 40， 44- 46， 54， 58， 60， 63， 66， 68， 74， 75， 81， 86， 88， 91， 102， 103交叉验证。三项研究仅报告了用于评估分类器性能的准确性值[ 52， 63， One hundred.］．一项研究只报告了信息检索系统的精度[ 56]，而两项研究仅报道了从AUROC曲线获得的值[ 58， 82］．一项研究使用两种方法来评估确定的主题的质量:有监督的评估，通过手动为每个主题注释推文并计算平均假阳性率;无监督的评估，通过计算聚类纯度来量化主题的连贯性[ 78］．

利用社会网络分析进行定量建模

在64项研究中，9项(13%)进行了社会网络分析[ 42， 48， 50， 53， 64， 65， 86， 91， 103]:

一项研究生成了网络图，以可视化电子烟主题在不同reddit子版块中的存在和共同出现[ 42］．

一项研究创建了网络图，以了解一项旨在教育年轻人吸烟有害影响的运动的影响范围[ 48］．

一项研究通过创建推特标签共现网络确定了电子烟相关对话的主题[ 50］．

一项研究通过分析网络指标与个人吸烟状况的关系，分析了吸烟者和非吸烟者社会网络的结构差异[ 53］．

一项研究通过构建双模网络图来进行隶属网络分析，以了解具有不同交流主题的戒烟社区成员之间的关联[ 64］．

一项研究可视化了在线戒烟社区成员的社交网络拓扑和基于主题的差异[ 65］．

一项研究基于讨论的主题分析了个人的社交网络连接如何影响他们的饮酒行为[ 86］．

一项研究表明，那些对饮酒表达消极情绪的人在社交网络中比其他社区成员更集中。 91］．

一项研究用社会网络特征(如入度、出度、程度、互惠和聚类系数)量化了社区成员之间的同伴互动[ 103］．

用于执行此类分析的工具和软件程序包括Gephi平台[ 48， 50， 65];NetworkX，一个Python包(Python软件基础)[ 86];UCINET软件(Analytic Technologies) [ 42， 64];和R[中的iGraph包 53］．一项研究通过使用NodeXL(微软)创建社交图来可视化频繁出现的单词[ 42］．有两项研究没有特别提到他们用来进行社交网络分析的工具[ 91， 103］．社交网络分析使用了不同的度量标准，如度中心性[ 42， 64),模块化 48， 65，以及度内和度外中心性[ 86， 91］．一项研究使用多种指标来分析社交网络结构，如顶点、边缘、密度、隔离、直径、社区、中介中心性、亲密中心性、传递性、集群和模块化[ 53］．表3［ 40- 46， 48- 55， 57- 89， 91- 103]强调了各种研究中使用的方法功能的总结，并列出了执行这些功能所使用的具体工具。

表3

各种研究使用的方法和相关工具的总结。

方法	工具、平台和程序
语言分析	语言查询字数[ 45， 71， 83， 88， 89］
情绪分析	SentiWordNet 3.0 [ 59］伤感的词性词汇[ 85］Sentiment140 [ 96］最大熵文本分类器[ 79， 94， 95］Mathematica 10.3 [ 93］各种监督机器学习算法[ 40， 41， 43， 51， 63， 66， 67， 80， 86， 91］刘胡意见辞典[ 68］价感词典与情感推理[ 51， 80， 103］国家资源委员会标签情感词汇[ 83］
监督分类	支持向量机[ 41， 44- 46， 51， 54， 58， 60， 63， 66- 68， 70， 73- 75， 80- 82， 87， 92， 94， One hundred.， 102］逻辑回归( 40， 41， 44- 46， 54， 58- 60， 72， 80， 89， 92， 94， One hundred.， 102］朴素贝叶斯( 40， 41， 46， 52， 54， 58， 60， 63， 66， 70， 73- 75， 80， 81， 86， 91， One hundred.］随机森林( 40， 41， 45， 54， 58， 70， 73- 75， 82， 84， 86， 91， 92， One hundred.， 102］基于决策树的分类器[ 46， 54， 55， 74， 81， 86， 91］再邻居( 54， 63， 66， 74， 84］演算法( 46， 54， 86， 91］顺序最小优化[ 84］最大熵文本分类器[ 79， 81， 94， 95］多层感知器( 84］REPTree [ 88］前馈神经网络[ 94］梯度增加( 48， 54， 94］卷积神经网络[ 41， 70， 72- 75， 87， One hundred.］长时间短期记忆[ 41， 72］LSTM-CNN [ 41］双向LSTM [ 41］文本分类的浅神经网络[ One hundred.］强化神经网络门控循环单元[ One hundred.］
主题建模	Quanteda软件( 42］潜在狄利克雷分配[ 49， 57， 60， 62， 69， 77， 83， 84， 97- 99， 101］SAS文本挖掘器[ 61， 76， 85， 93］相关主题建模[ 86］
社区识别和主题或模式识别	k - means聚类( 42］Biterm主题模型[ 78］聚类分层聚类技术[ 102］
社会网络分析	Gephi平台( 48， 50， 65］NetworkX (Python包)[ 86］UCINET软件( 42， 64］在R [ 53］NodeXL [ 42］

讨论主要研究结果

本综述的目的是调查利用社交媒体平台上的在线同伴互动分析风险健康行为、信仰和态度的计算和定量技术的现状。从最初的研究检索和滚雪球技术中，有64项研究符合我们的纳入标准，其中75% (48/64)[ 40- 57， 68- 79， 82- 94， 97， 98， One hundred.- 102]在2017年之后出版。这表明，通过分析在线同伴交互产生的对话数据，利用计算方法来描述危险的健康行为是一个日益增长的趋势。

多个平台被用作分析危险健康行为的数据来源，其中最受欢迎的是开放的社交媒体平台，因为80%(51/64)的研究使用了这些平台，而不是有意设计的与健康相关的社交媒体平台。在数据收集方面，我们的结果显示Twitter是一个很受欢迎的社交媒体数据来源，因为它提供了三种访问数据的简单方式:Twitter搜索API、Twitter流媒体API和Twitter Firehose [ 104］．一些研究利用的平台(如Facebook、Instagram和Reddit)也通过其api提供数据访问[ 105- 107，但没有Twitter那么广泛使用。一些研究利用了有意设计的与健康相关的社交媒体平台，如QuitNet、癌症幸存者网络、patient.info/forums、BecomeAnEx.org、Hello Sunday Morning博客和A- chess在线讨论论坛，但它们没有提供任何关于数据收集技术的信息。在数据类型方面，这篇综述包括了主要关注于分析在线同伴交互生成的文本数据的研究。因此，我们在全文筛选中排除了两项仅通过图像分析分析危险健康行为的研究[ 108， 109］．

人们对吸烟相关产品(如雪茄、电子烟、水烟、电子烟和JUUL)的情绪，以及与此类产品讨论相关的各种主题的识别，通过在线社交媒体平台进行了广泛研究。处方药滥用、阿片类药物滥用和酗酒相关的行为是另一组使用在线社交媒体平台被广泛分析的危险健康行为。这凸显了利用此类平台传播行为改变干预措施的潜力，这些干预措施针对的是未知的和不断发展的领域(如电子烟)以及明确的领域(如酒精使用)。除了成瘾行为，还分析了摄取行为，如身体活动模式、情绪和行为类型(如跑步、散步和慢跑)与不同地理位置(如加拿大)和人口统计学(如性别)的关联。社交媒体平台被用来确定与减肥和肥胖相关行为相关的主题。这些研究都没有集中分析无保护措施的性行为，这是一个重要的公共卫生重点和优先事项，可能是未来研究的一个有趣途径。然而，考虑到该领域的耻辱、隐私问题和不透明的性质，对这些数据集的访问可能是有限的。

LIWC工具被广泛用于语言特征提取，因为它是一种易于访问的工具，可以从文本中提取风格词、情感词和词性等特征[ 110］．使用LIWC进行的语言建模展示了如何使用成员之间的语言使用来预测他们的复发或行为转变模式。对于主题建模，LDA是最常用的工具;它基于单词分布分析潜在主题，然后为每个文档分配主题分布[ 111］．讨论的主题从一种危险的健康行为到另一种，但大多强调参与这些行为的个人的态度和行为模式。很少有例子包括强调与电子烟和大麻使用相关的有争议的话题(如合法化、禁止等)[ 101]，确定与电子烟使用和酒精偏好相关的规范或文化背景的主题[ 60， 83]，并了解个人的社会环境如何影响他们的减肥行为[ 98］．

广泛的有监督ML算法被用于在线同伴交互生成的数据的内容和情感分析。大多数研究使用传统的ML模型(如SVM、LR、RF、DT和KNN)进行文本分类。只有少数研究[ 41， 70， 72- 75， 87， One hundred.]利用深度学习模型(如cnn和LSTMs)进行文本、图像和视频分类任务。在业绩评价方面，观察到下列结果:

64项研究中有4项(6%)[ 41， 72- 74]，深度学习模型在分类任务上的性能优于传统的ML分类器(例如，与基线LR模型相比，深度学习模型的AUROC曲线为0.65，而基线LR模型的AUROC曲线为0.54 [ 72])。

64项研究中有一项(2%)[ 75]，深度学习模型略优于传统的ML分类器:RF(准确率70.1%)和深度CNN(准确率70.4%)。

64项研究中的另外两项(3%)[ 70， One hundred.]，深度学习模型在分类任务上的性能低于传统的ML分类器(例如，RF[准确率93.4%]优于CNN[准确率60.1%][ One hundred.])。

本综述中包括的大多数研究只关注在线同伴互动的文本数据分析，而只有一项研究使用图像数据进行了额外的分析[ 72]，只有一个进行了文本、图像和视频数据分析[ 87］．一些研究[ 41， 55， 56， 64， 65， 70， 72- 75使用预先训练的词嵌入创建词向量(例如，GloVe、word2vec、药物颤振词嵌入、LSA、RI和SGNS)。他们使用不同类型的语料库(如维基百科语料库[ 56， 72]， TASA语料库[ 55， 64， 65]，或特定于领域的语料库[ 41， 70， 72， 74， 75])。使用预先训练的单词嵌入的分类器的性能在F1分数方面从0.99到0.55不等。

本综述中包括的一些研究也进行了网络分析[ 42， 48， 50， 53， 64， 65， 86， 91， 103］．Gephi平台[ 112和UCINET软件[ 113，被广泛用于分析在线社交关系的工具。一项研究利用从属暴露模型和网络自相关模型的双模式版本，描述了基于内容的社会影响模式在对等通信中的作用[ 64］．一项研究分析了吸烟者的社会网络结构，并将其与非吸烟者的网络结构进行比较，以了解可能影响吸烟成瘾相关行为的社会影响相关因素[ 53］．这样的网络分析可以帮助我们理解传播的环境，最终可以指导健康研究人员和技术开发人员开发有形的技术特性[ 114， 115］．

一项研究[ 85]基于一种被称为动态事务模型的通信模型分析了在线同伴互动[ 116]，适合建模个体之间的双向交流。很少有研究[ 42， 45， 55， 64， 65， 97在分析社交媒体平台生成的内容时定义行为变化的关联理论构建，如社会认知理论[ 117]，变化的跨理论模型[ 118，健康信念模型[ 119，以及行为改变技术的分类[ 120］．应使用理论框架对在线同伴互动进行分析，该理论框架可导致开发基于经验的数字卫生干预措施，以促进健康和积极的行为改变[ 121， 122］．对社交媒体数据集的理论驱动的大规模分析将对同伴互动中表现出来的行为变化的具体过程产生深刻的见解。将这些数据集与理论构建结合起来进行分析，有助于提高我们对社会影响如何在传播健康信息和改变个人健康行为方面发挥重要作用的认识。这可能对根据个人和人群的危险健康行为制定高收益干预措施产生影响，从而使个人能够改变积极的生活方式，提高生活质量。

还必须了解，在线社交媒体平台也可能被用于传播与健康有关的错误信息[ 123］．COVID-19大流行为我们提供了大量证据，突显了解决公众对困扰社交媒体的错误信息的担忧的紧迫性，这些错误信息可能对个人的健康相关行为产生负面影响[ 124， 125］．此外，从这些平台传播的信息中提取的聚合趋势的基本真相只是在一定程度上反映了社区的看法，因为自动机器人推送了大量内容[ 126］．研究表明，错误信息也会影响危险的健康行为(例如，关于电子烟的误导性营销声明[ 127和饮酒[ 128])。未来的工作应侧重于利用本综述中描述的技术，分析在在线社交媒体平台中扩散的错误信息，以增强这些平台的效用和积极影响。

限制

我们的审查并非没有局限性。首先，我们只纳入了与危险健康行为相关的研究;然而，侧重于其他公共卫生领域的研究(如流行病学[ 129]和监视[ 130)或专注于慢性健康疾病(如糖尿病)的研究[ 131， 132和癌症[ 133])，以及临床和健康结果[ 134， 135]，可以让我们全面了解如何利用计算建模和高通量分析，为各种公共卫生应用程序分析从社交媒体平台生成的数据。信息流行病学和信息监测的领域相当广泛，包括本综述未包括的各种风险健康行为的其他方面(例如，挖掘消费者对电子烟在线营销的意见[ 136， 137，或者理解他们对媒体报道的反应[ 138， 139]或政策规例[ 140， 141关于此类产品)。其次，我们只关注主要执行文本数据分析的研究。尽管我们确实包括了报告图像或视频数据分析以及文本数据分析的研究[ 72， 87]，我们没有包括仅描述图像或视频数据分析的研究[ 108， 109］．这些研究可以为与变化的数据密度、异构性和推理粒度相关的ML权衡和计算可伸缩性提供有用的见解。

最后，由于我们的搜索策略的限制，我们可能会错过一些来自信息流行病学和信息监控领域的研究;例如，对该领域文献检索的初步探索[ 142]共产生了397项研究，其中23项研究与纳入本综述有关。在这些研究中，我们的搜索策略捕获了15项研究，并纳入了该综述[ 40， 41， 43， 50， 51， 54， 61- 63， 66， 68- 70， 80， 95]，作为滚雪球般的努力的一部分，又增加了一个[ 47］．然而，我们的搜索策略并未识别出其余7家公司[ 143- 149］．在这些研究中，人们注意到在元数据、标题、摘要和关键字中使用宽泛的方法描述或过度细粒度的术语捕获ML方法。为了一致性和限制与其他期刊研究的偏差，我们没有将这些研究纳入综述。未来进行类似评审的研究人员应确保包含捕获研究的跨学科性质(如信息流行病学)、分析功能(如文本分类、内容分析和主题建模)和分析技术(如LDA)的术语，以详尽地表示利用smarart进行风险行为建模和分析的相关工作。

结论

我们的研究表明，社交媒体平台上与危险健康行为相关的在线讨论可以跨越多个主题，包括尼古丁依赖、酒精使用、药物或药物滥用、体育活动模式和肥胖相关行为。这就产生了大量的数字化归档数据，可以对健康相关行为变化过程的有机表现和自然演变提供更深入的理解。

我们的综述强调了社交媒体平台的特点(例如，通用vs关注健康的平台和用于二次分析的数据访问的便利性)，用于分析这些平台内同行交互的方法的稳健性，以及可用于大规模分析社交媒体数据集的各种文本挖掘和网络建模工具的概述。我们的回顾让我们巩固了方法论基础，并增强了我们对如何利用社交媒体进行细微差别的行为建模和表示的理解。这最终可以为制定有说服力的健康沟通和有效的行为修正技术提供信息和指导，这些技术针对分布在个人和人群层面的个人间和个人内部心理社会过程。理解现有计算研究的优点和不足，以评估下游预测模型和由此类大规模分析产生的数据驱动干预措施的普遍性和强度，也是很重要的。

多媒体附录1

综述中所包含的研究的详细摘要。

缩写

国际象棋

成瘾-综合健康增强支持系统

API

应用程序编程接口

AUROC

区域下接收器的工作特性

美国有线电视新闻网

卷积神经网络

决策树

手套

全球向量

ISEAR

情感前因与反应国际调查

然而,

再邻居

乔治。

潜在狄利克雷分配

LIWC

语言查询字数

逻辑回归

文理学院

潜在语义分析

LSTM

长时间的短期记忆

网

医学主题词

毫升

机器学习

棱镜

系统回顾和荟萃分析的首选报告项目

射频

随机森林

国际扶轮

随机的索引

SemEval

语义评价

SentiWords

情绪词

胡志明市

负采样的跳过图

世鹏科技电子

沙普利加解释

SMaaRT

社交媒体作为研究工具

支持向量机

TASA

试金石应用科学协会

维德

情感推理的价感词典

本杂志报道的研究得到了国家医学图书馆和国家卫生研究院国家癌症研究所的支持(奖励号为1R01LM012974-01A1和3R01LM012974-02S1)。本文内容仅由作者负责，并不代表美国国立卫生研究院的官方观点。

没有宣布。

国家慢性疾病预防和健康促进中心

关于慢性疾病

疾病控制和预防中心 2020-06-04

https://www.cdc.gov/chronicdisease/about/index.htm

国家慢性疾病预防和健康促进中心

慢性疾病的健康和经济成本

疾病控制和预防中心 2020-06-05

https://www.cdc.gov/chronicdisease/about/costs/index.htm

巴洛

莱特

集团

特纳

一个

Hainsworth

慢性疾病患者的自我管理方法:综述

病人建造清纯甜美 2002 48 2 177 187

10.1016 / s0738 - 3991 (02) 00032 - 0

12401421

S0738399102000320

勇敢的

国会议员

社会支持对慢性疾病自我管理的影响:综述及研究方向

健康建造Behav 2003 04 30. 2 170 195

10.1177 / 1090198102251030

12693522

默克德

一个

雷明顿

测量人群的健康行为

Prev慢性说 2010 07 7 4 A75

20550833

A75

PMC2901573

Ekong

Kavookjian

成人2型糖尿病的动机性访谈和结果:一项系统综述

病人建造清纯甜美 2016 06 99 6 944 952

10.1016 / j.pec.2015.11.022

26699083

s0738 - 3991 (15) 30137 - 3

希克斯

莱托

Althoff

Sosic

Kuhar

Bostjancic

王

交流

Leskovec

Delp

分析可穿戴设备和智能手机应用程序的大规模健康数据的最佳实践

地中海NPJ数字 2019 2 45

10.1038 / s41746 - 019 - 0121 - 1

31304391

121

PMC6550237

Shiffman

年代

石头

高度

先生

生态的评估

安奴Rev精神病诊所 2008 4 1 32

10.1146 / annurev.clinpsy.3.022806.091415

18509902

Laranjo

Arguel

一个

七巧板

艾尔

加拉格尔

我

卡普兰

莫蒂默

NgydF4y2Ba

门德斯

遗传算法

刘

投赞成票者

社交网站对健康行为改变的影响:一项系统综述和元分析

美国医学信息协会 2015 01 22 1 243 256

10.1136 / amiajnl - 2014 - 002841

25005606

amiajnl - 2014 - 002841

PMC4433372

Eysenbach

信息流行病学和信息监测:一套新兴的公共卫生信息学方法的框架，用于分析互联网上的搜索、通信和发布行为

J医学网络杂志 2009 03 27 11 1 e11

10.2196 / jmir.1157

19329408

v11i1e11

PMC2762766

Eysenbach

信息流行病学:在网上追踪与流感相关的搜索以进行症状监测

AMIA Annu Symp Proc 2006 244 248

17238340

86095

PMC1839505

金斯堡

Mohebbi

帕特尔

布拉姆

Smolinski

女士

才华横溢的

使用搜索引擎查询数据检测流感流行

自然 2009 02 19 457 7232 1012 1014

10.1038 / nature07634

19020500

nature07634

Schomberg

摩根大通

Haimson

海斯

Anton-Culver

加强社会媒体卫生监督

《公共科学图书馆•综合》 2016 11 3. e0152117

10.1371 / journal.pone.0152117

27023681

玉米饼- d - 15 - 08705

PMC4811425

杨

社交媒体作为促进健康和福祉的政策行动和社会变革的催化剂:观点

J医学网络杂志 2018 03 19 20. 3. e94

10.2196 / jmir.8508

29555624

v20i3e94

PMC5881041

齐默尔曼

乌尔夫

狐狸

德

狐狸

小

Nowalk

国会议员

特洛伊

晶澳

锋利的

路

在万维网上批评疫苗

J医学网络杂志 2005 06 29 7 2 e17

10.2196 / jmir.7.2.e17

15998608

v7i2e17

PMC1550643

李

一个

焦

刘

朱

社交媒体上精神分裂症相关污名化与抑郁相关污名化的心理语言学风格比较:内容分析

J医学网络杂志 2020 04 21 22 4 e16470

10.2196/16470

32314969

v22i4e16470

PMC7201321

巴尔加斯就

实验:

YouTube上本地和有机食品视频中的食物传播及其相关情绪

J医学网络杂志 2020 08 10 22 8 e16761

10.2196/16761

32773370

v22i8e16761

PMC7445618

帕瓦尔

作为

Nagpal

年代

帕瓦尔

NgydF4y2Ba

Lerman

罗

Eirin

一个

公众对肥胖相关话题的信息寻求模式:谷歌趋势分析

JMIR公共卫生监测 2020 08 11 6 3. e20923

10.2196/20923

32633725

v6i3e20923

PMC7448178

Abd-Alrazaq

一个

Alhuwail

Househ

米

哈姆迪

米

沙阿

信息监测研究:推特用户最关心的是治愈COVID-19大流行

J医学网络杂志 2020 04 21 22 4 e19016

10.2196/19016

32287039

v22i4e19016

PMC7175788

20.

恩-瓦贝

一个

Nasralah

Al-Ramahi

米

El-Gayar

挖掘医生在社交媒体上的意见以获得对COVID-19的洞察:混合方法分析

JMIR公共卫生监测 2020 06 18 6 2 e19276

10.2196/19276

32421686

v6i2e19276

PMC7304257

Kietzmann

Hermkens

麦卡锡

知识产权

西尔维斯特

废话

社交媒体?认真!理解社交媒体的功能模块

公共汽车水平的 2011 5 54 3. 241 251

10.1016 / j.bushor.2011.01.005

2019年的数字

我们是社会性的 2020-06-03

纽约,纽约

我们是社会性的

https://wearesocial.com/global-digital-report-2019

周

亨特

Beckjord

海尔哥哥

莫泽

海塞

美国的社交媒体使用:对健康传播的影响

J医学网络杂志 2009 11 27 11 4 e48

10.2196 / jmir.1249

19945947

v11i4e48

PMC2802563

费雪

克莱顿

米

谁发了一条推特:评估患者对使用社交媒体进行医疗保健的兴趣

基于Evid的Nurs 2012 04 9 2 One hundred. 108

10.1111 / j.1741-6787.2012.00243.x

22432730

Looyestyn

Kernot

Boshoff

马赫

一个基于网络的，社交网络初学者跑步干预18到50岁的成年人通过Facebook小组交付:随机对照试验

J医学网络杂志 2018 02 26 20. 2 e67

10.2196 / jmir.7862

29483065

v20i2e67

PMC5847819

张

年初至今

陈

CHH

赖

陈

WFV

王

国会议员

李

HCW

陈

SSC

林

使用WhatsApp和Facebook在线社交群预防近期戒烟者吸烟复发:一项实验性实用聚类随机对照试验

J医学网络杂志 2015 10 22 17 10 e238

10.2196 / jmir.4829

26494159

v17i10e238

PMC4642789

van Woudenberg

Bevelander

柯

伯克

Smit

Buijs

Buijzen

米

一项随机对照试验，测试社会网络干预促进青少年身体活动

BMC公共卫生 2018 04 23 18 1 542

10.1186 / s12889 - 018 - 5451 - 4

29685112

10.1186 / s12889 - 018 - 5451 - 4

PMC5913789

Umberson

Crosnoe

Reczek

整个生命过程中的社会关系和健康行为

为Sociol 2010 08 01 36 139 157

10.1146 / annurev - soc - 070308 - 120011

21921974

PMC3171805

克里斯塔基斯

福勒

在一个庞大的社会网络中吸烟的集体动态

N英语J医学 2008 05 22 358 21 2249 2258

10.1056 / NEJMsa0706154

18499567

358/21/2249

PMC2822344

30.

科达

Itani想知道

利用社交媒体促进健康和改变行为

健康促进Pract 2013 01 14 1 15 23

10.1177 / 1524839911405850

21558472

1524839911405850

科布

格雷厄姆

艾尔

一杯啤酒

公元前

Papandonatos

艾布拉姆斯

一个真实世界的网络戒烟系统的初步评估

尼古丁Tob Res 2005 04 7 2 207 216

10.1080 / 14622200500055319

16036277

M751036L54TH3674

PMC2885701

无论你身在何处，我们都支持你!

BecomeAnEX社区 2020-06-13

https://excommunity.becomeanex.org/

沈多纳

社交媒体和健康行为科学

循环 2013 05 28 127 21 2135 2144

10.1161 / CIRCULATIONAHA.112.101816

23716382

127/21/2135

艾尔斯

Althouse

Dredze

米

行为医学能引领网络数据革命吗?

《美国医学会杂志》 2014 04 09 311 14 1399 1400

10.1001 / jama.2014.1505

24577162

1838433

PMC4670613

壮族

杨

MedHelp酗酒社区信息支持交流的研究

第五届社会计算、行为-文化建模与预测国际会议论文集 2012

第五届社会计算、行为-文化建模和预测国际会议

2012年4月3 - 5日

马里兰州大学公园

柏林,德国

施普林格

9 17

10.1007 / 978 - 3 - 642 - 29047 - 3 - _2

黄

Ottenbacher

绿色

美联社

Cannon-Diehl

先生

理查森

Bernstam

电动汽车

托马斯。

网络减肥社区的社会支持

国际医学资讯 2010 01 79 1 5 13

10.1016 / j.ijmedinf.2009.10.003

19945338

s1386 - 5056 (09) 00172 - 5

PMC3060773

Myneni

年代

科布

NgydF4y2Ba

科恩

追求行为改变支持系统的理论基础:健康相关在线社区的点对点交流分析

J医学网络杂志 2016 02 02 18 2 e28

10.2196 / jmir.4671

26839162

v18i2e28

PMC4756252

余

梁

艾尔

小羽

是

医疗保健中的人工智能

Nat生物医学中 2018 10 2 10 719 731

10.1038 / s41551 - 018 - 0305 - z

31015651

10.1038 / s41551 - 018 - 0305 - z

Liberati

一个

奥特曼

Tetzlaff

Mulrow

Gøtzsche

个人电脑

埃尼迪斯

JPA

克拉克

米

审视中国

Kleijnen

莫赫

PRISMA用于报告评估卫生保健干预研究的系统综述和元分析的声明:解释和阐述

科学硕士 2009 07 21 6 7 e1000100

10.1371 / journal.pmed.1000100

19621070

PMC2707010

本森

胡

米

陈

在

唠叨

年代

朱

年代

康威

米

调查青少年和年轻人对JUUL的态度:使用Twitter数据的计算研究

JMIR公共卫生监测 2020 09 02 6 3. e19975

10.2196/19975

32876579

v6i3e19975

PMC7495253

Visweswaran

年代

科迪兹

简森-巴顿

O ' halloran

汉

NgydF4y2Ba

希夫

某人

威林

楚

Sidani

我

Primack

英航

用于推特监控电子烟的机器学习分类器:比较机器学习研究

J医学网络杂志 2020 08 12 22 8 e17478

10.2196/17478

32784184

v22i8e17478

PMC7450367

巴克

乔

罗德

晶澳

Reddit社区中电子烟提交的主题聚类:网络视角

健康建造Behav 2019 12 46 2 _suppl 59 68

10.1177 / 1090198119863770

31742448

楚

科迪兹

马利克

米

耶茨

Primack

确定公共卫生运动的主要目标受众:在水烟吸烟的情况下利用机器学习

J医学网络杂志 2019 07 08 21 7 e12443

10.2196/12443

31287063

v21i7e12443

PMC6643764

Czaplicki

Kostygina

金

津贴

Szczypka

金刚砂

Vallone

头发

电子商务

在Instagram上发布与juul相关的帖子

钻头扭矩控制 2020 11 29 6 612 617

10.1136 / tobaccocontrol - 2018 - 054824

31266903

tobaccocontrol - 2018 - 054824

辛格

佩雷斯

罗伯茨

科布

NgydF4y2Ba

富兰克林

一个

Myneni

年代

通过社会媒体分析描述行为转变:一种混合方法方法

种马健康技术通知 2019 08 21 264 1228 1232

10.3233 / SHTI190422

31438121

SHTI190422

PMC7656970

王

赵

查

年代

阿玛托

女士

科恩

我

皮尔森

莱托

Papandonatos

格雷厄姆

艾尔

在在线戒烟社区中挖掘用户生成的内容以识别吸烟状态:一种机器学习方法

决策支持系统 2019 01 116 26 34

10.1016 / j.dss.2018.10.005

31885411

PMC6934371

Allem

Dharmapuri

利文斯

一个

昂格尔

博伊尔克鲁兹

2017 - 2018年推特上的hookah相关帖子:专题分析

J医学网络杂志 2018 11 19 20. 11 e11669

10.2196/11669

30455162

v20i11e11669

PMC6277830

咀嚼

金

一个

陈

使发红

Morgan-Lopez

一个

评估数字公共卫生运动的目标受众:一种计算方法

第11届社会计算，行为-文化建模和预测与建模与仿真中的行为表征国际会议论文集 2018

第11届社会计算，行为-文化建模和预测以及建模和仿真中的行为表示国际会议

2018年7月10号至13号,

华盛顿特区

可汗、瑞士

施普林格

286 291

10.1007 / 978 - 3 - 319 - 93372 - 6 _32

周

张

问

曾

徐

吉隆坡

口味对电子烟相关信息传播的影响:社交媒体研究

JMIR公共卫生监测 2018 03 23 4 1 e27

10.2196 / publichealth.7998

29572202

v4i1e27

PMC5889495

Allem

费拉拉

Uppu

克鲁兹

结核病

昂格尔

简森-巴顿

用社交媒体数据监测电子烟:社交机器人、新兴话题和趋势

JMIR公共卫生监测 2017 12 20. 3. 4 e98

10.2196 / publichealth.8641

29263018

v3i4e98

PMC5752967

Allem

Ramanujam

Lerman

楚

博伊尔克鲁兹

昂格尔

简森-巴顿

识别Twitter上与水烟相关帖子的情绪

JMIR公共卫生监测 2017 10 18 3. 4 e74

10.2196 / publichealth.8133

29046267

v3i4e74

PMC5667930

戴

郝

挖掘社交媒体数据，寻找关于电子烟的意见分歧

钻头扭矩控制 2017 03 26 2 175 180

10.1136 / tobaccocontrol - 2015 - 052818

26980151

tobaccocontrol - 2015 - 052818

傅

雅可布

妈

Brookover

瓦伦特

太瓦

科布

格雷厄姆

艾尔

对吸烟者和非吸烟者的Facebook社交网络的探索

《公共科学图书馆•综合》 2017 12 11 e0187332

10.1371 / journal.pone.0187332

29095958

玉米饼- d - 16 - 34262

PMC5667804

金

一个

Miano

咀嚼

艾格斯

米

Nonnemaker

关于电子烟的推特用户分类

JMIR公共卫生监测 2017 09 26 3. 3. e63

10.2196 / publichealth.8060

28951381

v3i3e63

PMC5635233

曾经

科恩

科布

NgydF4y2Ba

Myneni

年代

卫生相关在线社区中点对点通信的时态语义变化特征:数据驱动的健康促进的意义

AMIA Annu Symp Proc。 2017 2016 1977 1986 2017年2月10日出版

28269957

PMC5333293

曾经

科恩

科布

NgydF4y2Ba

Myneni

年代

吸烟背后的心理社会行为因素的时间趋势:一个与健康相关的在线社区中对等交流的半自动化探索性分析

种马健康技术通知 2017 237 123 129

28479554

PMC6020071

Westmaas

莱托

麦当劳

口感

公里

美国癌症协会癌症幸存者网络(CSN)的吸烟和戒烟相关帖子的主题建模:对吸烟的癌症幸存者的戒烟治疗的影响

尼古丁Tob Res 2017 08 01 19 8 952 959

10.1093 /正常/ ntx064关系

28340059

3071802

Aphinyanaphongs

Lulejian

一个

棕色（的）

邦

克雷布斯

自动检测电子烟使用和使用Twitter戒烟的文本分类:可行性试点

Pac协会Biocomput 2016 21 480 491

10.1142 / 9789814749411 _0044

26776211

9789814749411 _0044

PMC4721250

Kavuluru

Sabbir

AKM

电子烟自动监控:在Twitter上发现电子烟支持者

J生物医学通知 2016 06 61 19 26

10.1016 / j.jbi.2016.03.006

26975599

s1532 00046 - 0 - 0464 (16)

PMC4893981

Kostygina

Tran

史

金

金刚砂

年代

“比口水还甜”:推特上的小雪茄和小雪茄内容的数量和主题

钻头扭矩控制 2016 10 25 增刊1 i75 i82

10.1136 / tobaccocontrol - 2016 - 053094

27697951

tobaccocontrol - 2016 - 053094

PMC5099210

Lazard

Saffer

威尔科克斯

钟

Mackert

女士

伯恩哈特

电子烟社交媒体信息:Twitter上营销和消费者对话的文本挖掘分析

JMIR公共卫生监测 2016 12 12 2 2 e171

10.2196 / publichealth.6551

27956376

v2i2e171

PMC5187450

陈

在

朱

年代

康威

米

关于电子烟和水烟的使用，网络社区可以告诉我们什么:一项使用文本挖掘和可视化技术的研究

J医学网络杂志 2015 09 29 17 9 e220

10.2196 / jmir.4517

26420469

v17i9e220

PMC4642380

Cole-Lewis

Varghese

一个

桑德斯

一个

施瓦兹

米

Pugatch

Augustson

使用监督机器学习评估与电子烟相关的推文的情绪和内容

J医学网络杂志 2015 08 25 17 8 e208

10.2196 / jmir.4392

26307512

v17i8e208

PMC4642404

Myneni

年代

藤本

科布

NgydF4y2Ba

科恩

在线戒烟社区的内容驱动分析:定性技术、自动文本分析和从属网络的集成

公共卫生杂志 2015 06 105 6 1206 1212

10.2105 / AJPH.2014.302464

25880942

PMC4431114

Myneni

年代

科布

科恩

在社交媒体中寻找意义:QuitNet基于内容的社交网络分析，以确定健康促进的新机会

种马健康技术通知 2013 192 807 811

23920669

Myslin

米

朱

年代

查普曼

康威

米

使用Twitter调查吸烟行为和对新兴烟草产品的认知

J医学网络杂志 2013 08 29 15 8 e174

10.2196 / jmir.2534

23989137

v15i8e174

PMC3758063

Sofean

米

史密斯

米

社交网络中吸烟的情感分析

种马健康技术通知 2013 192 1118

23920892

金

毫克

金

宋

哌醋甲酯的非医疗使用和副作用的Twitter分析:机器学习研究

J医学网络杂志 2020 02 24 22 2 e16466

10.2196/16466

32130160

v22i2e16466

PMC7063527

Nasralah

El-Gayar

王

药物滥用的社交媒体文本挖掘框架:基于阿片类药物危机案例分析的开发和验证研究

J医学网络杂志 2020 08 13 22 8 e18350

10.2196/18350

32788147

v22i8e18350

PMC7446758

奥康纳

衬衣

一个

Perrone

冈萨雷斯埃尔南德斯

通过数据注释促进对药物非医疗使用特征的可重复研究:对Twitter语料库和指南的描述

J医学网络杂志 2020 02 26 22 2 e15861

10.2196/15861

32130117

v22i2e15861

PMC7066507

Desrosiers

一个

葡萄树

Kershaw

“你疯了吗?”:社交媒体情感的计算机文本分析与少数民族新兴成年男性的压力和物质使用有关

焦虑压力应对 2019 01 32 1 109 123

10.1080 / 10615806.2018.1539964

30373396

娜斯

年代

获利,

NgydF4y2Ba

可以直接

权杖

Marsch

拉

基于深度神经网络和Instagram社交媒体数据识别药物使用风险

神经精神药理学 2019 02 44 3. 487 494

10.1038 / s41386 - 018 - 0247 - x

30356094

10.1038 / s41386 - 018 - 0247 - x

PMC6333814

胡

显象

NgydF4y2Ba

盖勒

Iezzi

年代

签证官

窦

钟ydF4y2Ba

稀疏推特环境下药物滥用检测的集成深度学习模型

种马健康技术通知 2019 08 21 264 163 167

10.3233 / SHTI190204

31437906

SHTI190204

衬衣

一个

Gonzalez-Hernandez

阮

Perrone

机器学习和自然语言处理用于以地理位置为中心的阿片类药物相关社交媒体聊天的监测和描述

JAMA Netw开放 2019 11 01 2 11 e1914672

10.1001 / jamanetworkopen.2019.14672

31693125

2753983

PMC6865282

衬衣

一个

Gonzalez-Hernandez

Perrone

通过数据科学方法实现推特针对特定位置的阿片类药物毒性监测自动化

种马健康技术通知 2019 08 21 264 333 337

10.3233 / SHTI190238

31437940

SHTI190238

PMC6774610

Glowacki

新兴市场

Glowacki

简森-巴顿

威尔科克斯

对公众对阿片类药物危机反应的文本挖掘分析

路径替换离合器 2018 39 2 129 133

10.1080 / 08897077.2017.1356795

28723265

格雷夫斯

塔夫茨大学

刘振前

Polsky

杉

商人

推特上的阿片类药物讨论

路径替换使用误用 2018 11 10 53 13 2132 2139

10.1080 / 10826084.2018.1458319

29659320

PMC6314840

Kalyanam

Katsuki

Lanckriet

GRG

麦基

利用无监督机器学习在twitter领域探索处方药和多种药物滥用的非医疗使用趋势

瘾君子Behav 2017 02 65 289 295

10.1016 / j.addbeh.2016.08.019

27568339

s0306 - 4603 (16) 30299 - 4

孟

凯丝

年代

李

阮

质量控制

推特上的国家物质使用模式

《公共科学图书馆•综合》 2017 12 11 e0187691

10.1371 / journal.pone.0187691

29107961

玉米饼- d - 16 - 20338

PMC5673183

Daniulaityte

陈

拉米

卡尔森

Thirunarayan

Sheth

一个

“当‘坏’就是‘好’”:识别与毒品相关的推文中的个人沟通和情感

JMIR公共卫生监测 2016 10 24 2 2 e162

10.2196 / publichealth.6327

27777215

v2i2e162

PMC5099500

衬衣

一个

奥康纳

Ginn

苏格兰威士忌

米

史密斯

马龙

冈萨雷斯

社交媒体毒物警戒挖掘:从Twitter自动监测处方药物滥用

药物Saf 2016 03 39 3. 231 240

10.1007 / s40264 - 015 - 0379 - 4

26748505

10.1007 / s40264 - 015 - 0379 - 4

PMC4749656

Crocamo

Viviani

米

莎娃

卡拉

帕斯

从Twitter用户中检测酗酒和酒精相关的风险行为:基于内容和拓扑的探索性分析

国际环境保留区公共卫生 2020 02 26 17 5 1510

10.3390 / ijerph17051510

32111047

ijerph17051510

PMC7084454

Giorgi

年代

美国

Eichstaedt

阿什福德

理查德·道金斯

Buffone

施瓦兹

哈

杉

韩

柯蒂斯

美国各地在推特上谈论饮酒的文化差异

国际环境保留区公共卫生 2020 02 11 17 4 1125

10.3390 / ijerph17041125

32053866

ijerph17041125

PMC7068559

Jelodar

王

举行的

米

肖

赵

基于语义患者行为分析的协作框架，以及在线医疗论坛中酒精饮料的突出主题发现

J医疗系统 2020 04 07 44 5 101

10.1007 / s10916 - 020 - 01547 - 0

32266484

10.1007 / s10916 - 020 - 01547 - 0

Parackal

米

Parackal

年代

马瑟

优西比乌

年代

动态事务模型:通过社交媒体传播公共卫生信息的框架

教谕公共卫生 2020 07 14 1

10.1177 / 1757913920935910

32660353

科恩

我

阿玛托

女士

赵

王

查

年代

皮尔森

莱托

Papandonatos

格雷厄姆

艾尔

讨论在在线社交网络中使用酒精戒烟:主题、情绪和社交网络中心性分析

酒精临床试验 2019 01 43 1 108 114

10.1111 / acer.13906

30326140

PMC6348464

ElTayeby

Eaglin

阿卜杜拉

米

Burlinson

窦

姚

通过挖掘异构数据识别Facebook中与饮酒相关内容的可行性研究

卫生信息学J 2019 12 25 4 1756 1767

10.1177 / 1460458218798084

30230403

Golbeck

通过推特预测酒精中毒的恢复

第11届社会计算，行为-文化建模和预测与建模与仿真中的行为表征国际会议论文集 2018

第11届社会计算，行为-文化建模和预测以及建模和仿真中的行为表示国际会议

2018年7月10号至13号,

华盛顿特区

可汗、瑞士

施普林格

243 252

10.1007 / 978 - 3 - 319 - 93372 - 6 _28

本非常优秀

生田斗真

沙阿

月亮

Gustafson

复发前你会说些什么?点对点在线讨论论坛中的语言使用如何预测恢复期患者的风险饮酒

健康Commun 2018 09 33 9 1184 1193

10.1080 / 10410236.2017.1350906

28792228

PMC6059378

Carah

NgydF4y2Ba

Meurk

安格斯

作为“反思主义”的在线自我表达和实验:使用文本分析来检查参与性论坛“你好，星期天早上”

卫生(伦敦) 2017 03 21 2 119 135

10.1177 / 1363459315596799

26216897

1363459315596799

科恩

我

赵

查

年代

王

阿玛托

女士

皮尔森

莱托

Papandonatos

格雷厄姆

艾尔

关于在线戒烟社交网络中与酒精相关帖子的患病率和类型学的描述性研究

酒精药物 2017 09 78 5 665 673

10.15288 / jsad.2017.78.665

28930053

PMC5675418

刘

Weitzman

Chunara

从社交媒体数据评估行为阶段

2017年ACM计算机支持的协作工作和社会计算会议论文集 2017

2017 ACM计算机支持的协作工作和社会计算会议

2017年2月25日- 3月1日

波特兰,或

纽约,纽约

计算机协会

1320 1333

10.1145/2998181.2998336

Parackal

米

Parackal

年代

优西比乌

年代

马瑟

利用Facebook广告传播公共健康信息:新西兰反对怀孕期间饮酒的运动

JMIR公共卫生监测 2017 08 10 3. 3. e49

10.2196 / publichealth.7032

28798011

v3i3e49

PMC5571231

凯撒

NgydF4y2Ba

阮

质量控制

格兰特

Nsoesie

社交媒体捕捉了人口和地区的体育活动

英国医学公开赛运动锻炼医学 2019 5 1 e000567

10.1136 / bmjsem - 2019 - 000567

31423323

bmjsem - 2019 - 000567

PMC6678033

阮

质量控制

李

孟

凯丝

年代

Nsoesie

李

温

米

从带有地理标记的Twitter数据中建立一个全国性的社区数据集，用于幸福感、饮食和体育活动的指标

JMIR公共卫生监测 2016 10 17 2 2 e158

10.2196 / publichealth.5869

27751984

v2i2e158

PMC5088343

尹

年代

Elhadad

NgydF4y2Ba

巴肯

年代

一种实用的推文内容挖掘方法

我是医学预科 2013 07 45 1 122 129

10.1016 / j.amepre.2013.02.025

23790998

s0749 - 3797 (13) 00243 - 2

PMC3694275

刘

阴

通过在线讨论了解减肥:使用主题建模和单词聚类技术对Reddit帖子进行内容分析

J医学网络杂志 2020 06 08 22 6 e13745

10.2196/13745

32510460

v22i6e13745

PMC7308899

梁

王

祖文萃

米

来自谷歌搜索和推特的证据表明，“健身”主题可能会减轻地区性超重和肥胖的流行

J健康Commun 2019 24 9 683 692

10.1080 / 10810730.2019.1657526

31469057

戈什

古哈

关于肥胖，我们在推特上发了什么?用主题建模和地理信息系统映射推文

制图工程师 2013 40 2 90 102

10.1080 / 15230406.2013.776210

25126022

PMC4128420

One hundred.

沙阿

NgydF4y2Ba

斯利瓦斯塔瓦

野蛮人

Mago

通过社交媒体评估加拿大人的健康活动和营养习惯

前面的公共卫生 2020 7 400

10.3389 / fpubh.2019.00400

31993412

PMC6970971

101

公园

一个

康威

米

追踪Reddit上与公共健康相关的讨论

AMIA Annu Symp Proc 2018 2017 1362 1371

29854205

PMC5977623

102

黄

Elghafari

一个

Relia

Chunara

社交媒体数据中酒精和烟草行为的高分辨率时间表示

Proc ACM Hum计算交互 2017 11 1 对CSCW 54

10.1145 / 3134689

29264592

PMC5734092

103

Tamersoy

一个

De Choudhury

米

洲

对社交媒体的戒烟和戒酒

第26届ACM超文本和社交媒体会议论文集 2015

第26届ACM超文本和社交媒体会议

2015年9月1 - 4日

Guzelyurt、塞浦路斯

纽约,纽约

计算机协会

139 148

10.1145/2700171.2791247

104

Twitter API

Twitter开发者 2020-10-02

https://developer.twitter.com/en/docs/twitter-api

105

api和sdk

Facebook为开发人员 2020-10-02

https://developers.facebook.com/docs/apis-and-sdks/

106

Instagram基本显示API

Facebook为开发人员 2020-10-02

https://developers.facebook.com/docs/instagram-basic-display-api/

107

reddit API文档

reddit 2020-10-02

https://www.reddit.com/dev/api/

108

张

Allem

昂格尔

简森-巴顿

博伊尔克鲁兹

Instagram上水烟(水管)的自动识别:卷积神经网络和支持向量机分类的特征提取应用

J医学网络杂志 2018 11 21 20. 11 e10513

10.2196/10513

30452385

v20i11e10513

PMC6282010

109

Ketonen

马利克

一个

通过使用无监督机器学习来描述Instagram上的电子烟帖子

国际医学资讯 2020 09 141 104223

10.1016 / j.ijmedinf.2020.104223

32623330

s1386 - 5056 (20) 30488 - 3

110

Tausczik

年

Pennebaker

词汇的心理意义:LIWC和计算机文本分析方法

J Lang社会精神 2009 12 08 29 1 24 54

10.1177 / 0261927 x09351676

111

布莱

一个

约旦

米

潜在狄利克雷分配

J马赫学习保留区 2003 03 3. 993 1022

112

巴斯蒂安·

米

海曼

年代

Jacomy

米

Gephi:一个用于探索和操作网络的开源软件

Icwsm 2009 8 2009 361 362

113

Borgatti

年代

埃弗雷特

米

弗里曼

UCINET for Windows:用于社交网络分析的软件

谷歌网站 2002

2020-11-21

哈佛大学,马

分析技术

https://sites.google.com/site/ucinetsoftware/home

114

Myneni

年代

Iyengar

年代

促进健康的社会影响技术:将社交媒体分析转化为面向消费者的健康解决方案

第49届夏威夷系统科学国际会议论文集 2016

第49届夏威夷系统科学国际会议(HICSS)

2016年1月5 - 8,

Koloa,嗨

纽约,纽约

IEEE

3084 3093

10.1109 / HICSS.2016.388

115

亚德利

春天

成熟

莫里森

起重机

柯蒂斯

商人

诺顿

布兰德福德

一个

理解并促进有效参与数字行为改变干预

我是医学预科 2016 11 51 5 833 842

10.1016 / j.amepre.2016.06.015

27745683

s0749 - 3797 (16) 30243 - 4

116

Barnlund

直流

塞里诺

乐

莫滕森

一种交流的交易模式

传播理论基础 1970

纽约,纽约

哈珀和行

117

班杜拉

一个

思想与行动的社会基础:一种社会认知理论 1986

恩格尔伍德悬崖,新泽西

新世纪

118

Prochaska

乔

软颚顶的

健康行为改变的跨理论模型

我是健康促进者吗 1997 12 1 38 48

10.4278 / 0890 - 1171 12.1.38

10170434

119

施林

亚伯拉罕

艾尔斯

年代

鲍姆

一个

麦克马纳斯

纽曼

年代

Wallston

Weinman

西

健康信念模型

《剑桥心理学、健康和医学手册》第二版 2007

英国剑桥

剑桥大学出版社

97 102

120

亚伯拉罕

米奇

年代

干预中使用的行为改变技术的分类

健康Psychol 2008 05 27 3. 379 387

10.1037 / 0278 - 6133.27.3.379

18624603

2008-08834-010

121

米奇

年代

亚德利

西

帕特里克

格里夫斯

制定和评估数字干预措施，以促进卫生和保健方面的行为改变:国际讲习班提出的建议

J医学网络杂志 2017 06 29 19 6 e232

10.2196 / jmir.7126

28663162

v19i6e232

PMC5509948

122

莱利

里维拉

德

Atienza

流行病学

埃里森

Mermelstein

移动干预时代的健康行为模型:我们的理论能胜任这项任务吗?

Transl Behav地中海 2011 03 1 1 53 71

10.1007 / s13142 - 011 - 0021 - 7

21796270

PMC3142960

123

周

哦

一个

克莱因

买理财产品买

解决社交媒体上与健康相关的错误信息

《美国医学会杂志》 2018 12 18 320 23 2417 2418

10.1001 / jama.2018.16865

30428002

2715795

124

Allington

达菲

Wessely

年代

Dhavan

NgydF4y2Ba

鲁宾

COVID-19突发公共卫生事件期间的健康保护行为、社交媒体使用和阴谋信念

Psychol地中海 2020 06 09 1 7

10.1017 / S003329172000224X

32513320

S003329172000224X

PMC7298098

125

斯拉姆

年代

侯赛因

毫米

Mazumder

社交媒体上的谣言和错误信息对COVID-19的影响

预防医学公共卫生 2020 05 53 3. 171 174

10.3961 / jpmph.20.094

32498140

jpmph.20.094

PMC7280809

126

Allem

费拉拉

消除社交媒体数据的偏见，以更好地理解电子烟相关的态度和行为的重要性

J医学网络杂志 2016 08 09 18 8 e219

10.2196 / jmir.6185

27507563

v18i8e219

PMC5037931

127

阿尔芭瑞熙

罗默

琼斯

杰米逊大厅

杰米逊

YouTube视频中关于烟草产品的误导性声明:错误信息对不健康态度的实验影响

J医学网络杂志 2018 06 29 20. 6 e229

10.2196 / jmir.9959

29959113

v20i6e229

PMC6045787

128

Salimian

Chunara

Weitzman

呃

避免完美风暴:解决青少年使用社交媒体带来的物质使用风险

Pediatr安 2014 10 43 10 411

10.3928 / 00904481-20140924-08

25290130

129

Mamidi

米勒

米

巴纳吉

Romine

Sheth

一个

找出推特上负面情绪的关键话题:关于2015-2016年寨卡病毒流行的见解

JMIR公共卫生监测 2019 06 04 5 2 e11036

10.2196/11036

31165711

v5i2e11036

PMC6682293

130

史蒂文斯

Bonett

年代

班农

Chittamuru

Slaff

布朗

黄

年代

Bauermeister

晶澳

美国HIV相关推文与HIV发病率之间的关联:信息流行病学研究

J医学网络杂志 2020 06 24 22 6 e17196

10.2196/17196

32579119

v22i6e17196

PMC7380998

131

Myneni

年代

刘易斯

辛格

Paiva

金

Cebula

维拉纽瓦

王

社交媒体时代的糖尿病自我管理:使用半自动方法对同伴互动进行大规模分析

地中海JMIR通知 2020 06 30. 8 6 e18441

10.2196/18441

32602843

v8i6e18441

PMC7367515

132

辛格

王

Myneni

年代

揭示与健康相关的同伴互动的意图:优化患者参与自我健康管理的启示

AMIA 2020虚拟年会论文集 2020

AMIA 2020虚拟年度研讨会

2020年11月14 - 18,

虚拟

133

徐

杨

太阳

曹

侯

蔡

问

贾

王

利用现实世界和基于互联网的数据检测肺癌趋势:信息流行病学研究

J医学网络杂志 2020 03 12 22 3. e16184

10.2196/16184

32163035

v22i3e16184

PMC7099398

134

陈

陆

元

罗

谢

李

关于加味电子烟与健康症状关联的社交媒体研究:观察性研究

J医学网络杂志 2020 06 22 22 6 e17496

10.2196/17496

32568093

v22i6e17496

PMC7338924

135

华

米

萨达

年代

Hristidis

托尔伯特

使用电子烟对健康的影响:在线论坛的自动挖掘

J医学网络杂志 2020 01 03 22 1 e15684

10.2196/15684

31899452

v22i1e15684

PMC6969389

136

金

料斗

辛普森

年代

Nonnemaker

利伯曼

汉森

Guillory

行李搬运工人

利用Twitter数据洞察电子烟营销和使用地点:一项信息监控研究

J医学网络杂志 2015 11 06 17 11 e251

10.2196 / jmir.4466

26545927

v17i11e251

PMC4642798

137

Struik

噢

Dow-Fleisner

年代

Belliveau

米

汤普森

Janke

吸引年轻人吸电子烟的策略:电子烟广告内容分析

J医学网络杂志 2020 08 14 22 8 e18943

10.2196/18943

32663163

v22i8e18943

PMC7455879

138

金

吉布森

威廉姆斯

年代

金

宾斯

年代

金刚砂

Hornik

钢筋混凝土

2014 - 2017年电子烟和其他烟草制品媒体报道的效价:来自自动内容分析的证据

尼古丁Tob Res 2020 10 08 22 10 1891 1900

10.1093 /正常/ ntaa090关系

32428214

5840722

PMC7542653

139

艾尔斯

Dredze

米

草原

电子商务

Caputi

Allem

科恩

我

下一代媒体监测:2013-2018年Bing、谷歌和Twitter上电子尼古丁输送系统(电子烟)的全球覆盖情况

《公共科学图书馆•综合》 2018 13 11 e0205822

10.1371 / journal.pone.0205822

30388126

玉米饼- d - 18 - 02753

PMC6214510

140

Lazard

威尔科克斯

塔特尔

嗯

Glowacki

新兴市场

Pikowski

推特上公众对电子烟法规的反应:文本挖掘分析

钻头扭矩控制 2017 12 26 e2 e112 e116

10.1136 / tobaccocontrol - 2016 - 053295

28341768

tobaccocontrol - 2016 - 053295

141

哈里斯

Moreland-Russell

年代

Choucair

曼苏尔

斯桃波

米

席梦思床品公司

支持和反对公共卫生政策的推特:对芝加哥公共卫生部电子烟推特运动的回应

J医学网络杂志 2014 10 16 16 10 e238

10.2196 / jmir.3622

25320863

v16i10e238

PMC4210950

142

电子收藏“资讯流行病学与资讯监察”

JMIR 2020-11-22

//www.mybigtv.com/themes/69

143

陆

陈

元

罗

谢

李

用户在社交媒体上对不同电子烟口味的感知:观察性研究

J医学网络杂志 2020 06 24 22 6 e17280

10.2196/17280

32579123

v22i6e17280

PMC7380993

144

Allem

Uppu

博伊尔克鲁兹

昂格尔

简森-巴顿

2018年推特上与雪茄相关的小帖子的特征:文本分析

J医学网络杂志 2019 07 19 21 7 e14398

10.2196/14398

31325291

v21i7e14398

PMC6676793

145

刘

年代

陈

郭

一个

使用Twitter数据监测身体活动水平:信息流行病学研究

J医学网络杂志 2019 06 03 21 6 e12394

10.2196/12394

31162126

v21i6e12394

PMC6682305

146

李

问

王

刘

王

曾

Leischow

了解用户从社交媒体吸电子烟的体验:使用情感意见总结技术的初步研究

J医学网络杂志 2018 08 15 20. 8 e252

10.2196 / jmir.9373

30111530

v20i8e252

PMC6115599

147

玫瑰

西南

乔

宾斯

年代

Buenger

米

金刚砂

年代

Ribisl

公里

推特用户对薄荷烟的认知:内容和情绪分析

J医学网络杂志 2017 02 27 19 2 e56

10.2196 / jmir.5694

28242592

v19i2e56

PMC5348619

148

张ydF4y2Ba

刘

李

问

Leischow

曾

识别电子烟用户生成内容的主题:来自多个社交媒体平台的案例研究

J医学网络杂志 2017 01 20. 19 1 e24

10.2196 / jmir.5780

28108428

v19i1e24

PMC5291865

149

汉森

大炮

伯顿

年代

Giraud-Carrier

通过推特探索社交圈和处方药滥用

J医学网络杂志 2013 09 06 15 9 e189

10.2196 / jmir.2741

24014109

v15i9e189

PMC3785991