发表在第21卷第6期(2019):6月

本文的预印本(早期版本)可在https://preprints.www.mybigtv.com/preprint/12394,首次出版
使用推特数据监测身体活动水平:信息流行病学研究

使用推特数据监测身体活动水平:信息流行病学研究

使用推特数据监测身体活动水平:信息流行病学研究

原始论文

1加拿大卑诗省维多利亚州维多利亚大学体育与健康教育运动科学学院

2加拿大不列颠哥伦比亚省维多利亚维多利亚大学健康信息科学系

通讯作者:

Sam Liu博士

运动科学,体育与健康教育学院

维多利亚大学

麦金农大厦124号

维多利亚,BC, v8w2y2

加拿大

电话:1 250 721 8392

电子邮件:samliu@uvic.ca


背景:Twitter等社交媒体技术允许用户在线分享他们的想法、感受和观点。越来越多的社交媒体数据正在成为信息流行病学研究的核心部分,因为这些数据可以与其他公共卫生数据集(例如,身体活动水平)相结合,以提供心理和行为结果的实时监测,为健康行为提供信息。目前,尚不清楚推特数据能否用于监测身体活动水平。

摘要目的:这项研究的目的是通过评估与体育活动相关的推文的频率和情绪是否与美国各地的体育活动水平相关,建立使用推特数据监测体育活动水平的可行性。

方法:推文收集自2017年1月10日至2018年1月2日期间推特的应用程序编程接口(API)。我们使用Twitter的橡胶软管这是一种收集推文的方法,它提供了大约1%的推文的随机样本,其中位置元数据位于美国境内。带有地理位置标记的推文被过滤掉了。研究人员收集了一份与体育活动相关的标签列表,并用于进一步对这些地理定位的推文进行分类。推特数据与作为行为风险因素监测系统一部分收集的身体活动数据合并。在控制人口和社会经济地位指标的情况下,拟合多元线性回归模型来评估各县与体育活动相关的推文与体育活动水平之间的关系。

结果:在研究期间,共收集了442,959,789条独特的推文,其中64,005,336条(14.44%)带有经纬度坐标的地理标记。收集了美国3138个县的汇总数据。经年龄调整后,县级体力活动个体的平均百分比为74.05% (SD 5.2)和75.30% (SD 4.96)。该模型显示,与体育活动相关的推文的百分比与体育活动水平显著相关(beta=.11;SE 0.2;P<.001)和年龄调整的体育活动(beta=.10;SE 0.20;P在调整了基尼系数和教育水平后,在县一级的平均水平为<.001)。然而,模型的整体被解释方差较低(R2=厚)。在模型中纳入基尼指数和教育水平后,与体育活动相关的推文的情绪并不是体育活动水平和县级年龄调整体育活动的重要预测因素(P> . 05)。

结论:社交媒体数据可能是公共卫生组织监测身体活动水平的宝贵工具,因为它可以克服传统研究方法(如调查和观察性研究)在报告身体活动流行病学数据时面临的时间滞后问题。因此,这一工具可能有可能帮助公共卫生组织更好地动员和针对性地进行体育活动干预。

中国医学网络杂志2019;21(6):e12394

doi: 10.2196/12394

关键字



背景

缺乏运动是一个可改变的危险因素,可导致多种慢性疾病,包括心血管疾病、高血压、2型糖尿病、结肠癌、骨质疏松症和抑郁症[1-5].目前,美国许多成年人缺乏体育锻炼,没有达到推荐的体育活动量(每周150分钟中等强度的有氧运动)[6].此外,在美国不同的地理区域,体育活动的流行程度各不相同[7].在不同地理区域缺乏统一的体育活动率已经成为公共卫生机构的首要任务之一——收集人口水平的体育活动数据。这种流行病学数据可以帮助确定不经常进行体育活动的群体和人群,以及这些人居住的地点[8-10].当地公共卫生机构可以利用这些信息部署适当的资源,针对健康促进工作,提高缺乏体育活动地区的体育活动水平。事实上,一些研究已经证明了使用社交媒体和基于互联网的干预措施在人口水平上促进身体活动的可行性[11-15].不经常进行体育活动的人群和个人地点的实时流行病学数据可能进一步增强公共卫生机构进行个性化和有针对性干预的能力。

使用基于人群的调查研究来监测身体活动的现有方法需要改进。目前收集体育活动数据的方法存在一些局限性[1016].首先,在美国,报告体育活动调查数据的滞后时间长达2至3年,而调查本身可能是耗时和资源密集型的。对于许多调查来说,数据的稀疏性可能是一个挑战,因为回复率可能不会因地点、人口统计或人口而一致变化。因此,需要创新的研究方法来补充和完善体育活动监测的现状。

社交媒体的使用在过去十年中迅速增长,[17研究人员一直在研究使用方法社交数据更好地了解及监察香港的公共卫生问题实时1618].这个不断发展的研究领域被称为infodemiologyinfoveillance研究[1920.].社交媒体技术,如Twitter,允许用户通过分享短信息相互交流。用户可以在这些社交媒体平台上分享他们的想法、感受和观点,因此,社交媒体数据可能被用于提供行为结果的实时监测,从而为健康行为提供信息[21].来自Twitter的社交媒体数据的一个独特之处在于,这些帖子是公开的,并带有地理标记,因此,包括健康研究人员在内的所有互联网用户都可以随时访问这些数据。此外,Twitter特有的是使用标签(),允许用户突出显示感兴趣的相关主题,并允许其他用户关注相关主题。鉴于它们的高使用率,这些网站收集了大量的数据(例如,推特上每天超过5亿条推文)[21].

最近的信息流行病学研究报告称,来自社交媒体技术的数据可以与其他生物医学数据集相结合,以帮助预测健康结果[1622-25].分析Twitter非结构化文本数据的主要方法包括关键词出现频率(信息流行度和信息出现率分析)和推文的情绪[1019].这些方法并不相互排斥,因此可以一起用于监测身体活动。信息流行率和信息发生率衡量的是绝对的或相对的频率某个关键字的出现次数。社交数据的数量在不断增加;因此,标准化指标(如信息出现率)可能比信息流行的绝对数字更有意义[19].最后,情绪分析可以确定一个人对一个话题的态度或看法是积极的,消极的,还是中性的。通过应用这些方法,研究人员已经证明,社会数据可以用来识别与心理困扰、焦虑和抑郁相关的症状[22]和确定传染病爆发,如流感传播[2627]和艾滋病毒爆发[24].之前的研究也报道了与体育活动相关的推文的频率和推文的情绪与肥胖率有关[28]、美国大都市统计区(MSAs)的社会差距和健康指标[2930.].目前,尚不清楚这些分析体育活动相关推文的方法是否可以在控制社会经济不平等和教育水平的同时,应用于监测美国县级的体育活动水平。

目标

本研究的目的是通过评估与体育活动相关的推文的频率和情绪是否与美国各个县的体育活动水平相关,建立使用推特数据监测体育活动水平的可行性。


概述

使用Twitter的应用程序编程接口(API)收集了2017年1月10日至2018年1月2日的推文(n=442,959,789)。捕获的推文表示在选定的时间范围内发布的所有推文中随机选择的约1%。只有定位保留坐标为-162.354635,18.756125,-53.755999,73.893030定义的边界框内的推文进行分析。额外的处理被用来过滤掉坐标不是来自美国的推文,最终的样本是64,005,336条推文。为了在县一级对推文进行分类,使用美国人口普查局的地图边界形状文件创建了一个反向地理编码管道,为每条推文分配联邦信息处理标准代码。

分类与体育活动相关的推文

一份与体育活动相关的标签列表被编译(见多媒体附件1)来识别可能与锻炼或体育活动有关的推文。这些标签结合了最流行的体育活动相关标签和美国运动医学学院(ACSM)发布的运动测试指南[31].使用ACSM指南是因为它提供了一个广泛的与体育活动相关的关键字列表,这些关键字已经得到了很好的建立,并且这种方法已经在以前的研究中使用过[2831].如果一条推文的标签中包含一个或多个与体育活动相关的关键字,就会被归类为与体育活动相关的推文。尽管之前的研究依赖于与运动相关的关键词字典(例如,来自体育活动纲要和ACSM运动测试指南)来对推文进行分类,但使用标签有几个重要的优势:它们可以被解析为与推文不同的实体,并且可以代表更具体的多词短语[2829].因此,使用标签比使用字典或关键字列表(例如,而且冲浪可能在身体活动之外有多种含义,然而# 30 daysoffitness不太可能)。以前的研究也讨论了这种分类任务的难度,要么选择通过施加额外的规则来提高精度(例如,要求对通常模糊的术语,如运行),或选择不应用任何额外的过滤,以避免在抽样方法中引入额外的偏差[29].虽然使用标签并不能纠正管理偏差的问题,但它确实允许对文本进行比常规单词更具体的匹配,同时还保持了简单项目列表的简单性。这本质上是在损失回忆或敏感性的情况下增加精度,但确保更少不相关的推文传递给情绪分析管道。

情绪分析

使用情感分析技术来研究微博服务(如Twitter)是一个丰富而活跃的研究领域。情感分析分配文本文档的极性,标签,如积极的,中性描述了作者的写作态度。当应用于一个主题时,情绪分析可用于预测或推断这些主要基于文档集合的态度。这项研究利用了Baziotis, Pelekis和Doulkeridis为2017年语义评估国际研讨会(SemEval)创建的情感分析模型[3233].该模型在Task 4的Subtask A中排名第一(推特的情感分析),并采用带有注意机制的双向长短期记忆神经网络[34].

身体活动数据集

身体活动水平和年龄调整后的身体活动水平是从行为风险因素监测系统(BRFSS)调查中提取的,该调查提供了2014年以来县级身体活动水平的数据。BRFSS由疾病控制和预防中心管理。作为调查的一部分,参与者被要求自我报告业余时间的体育活动(例如,在过去的一个月里,除了你的正常工作,你是否参加过任何体育活动或锻炼,如跑步、健美操、高尔夫球、园艺或散步?)自我报告的闲暇时间体育活动不确定的答案没有回答这些问题。BRFSS收集了18岁及以上成年人的身体活动数据,因此BRFSS还报告了基于美国标准人群的年龄调整的身体活动数据。基尼系数(Gini index)等社会经济地位指标来自美国社区调查(American Community Survey)。

统计分析

研究人员统计了每个县体育活动推文的频率,并将其与BRFSS数据中的体育活动水平、基尼指数数据以及接受过大学教育的县的比例相结合。基尼系数提供了收入不平等的标准化估计,可用于县与县之间的比较。在体育活动的背景下,基尼系数和教育水平是相关的;这些变量与身体活动水平有关。35].

使用双变量斯皮尔曼相关来确定与体育活动相关的推文数量(包括积极的、消极的和中性的推文数量)、基尼指数、教育和体育活动数据之间的关联。然后应用多元线性回归模型来寻找与体育活动相关的推文的比例、推文的情绪(与体育活动相关的推文的正面与负面的比例)与体育活动数据之间的关联水平,同时控制基尼指数和县级的教育水平。比较了这些模型的相对性能。所有分析均使用IBM SPSS 24.0 (IBM Corporation)进行。


在收集到的442,959,789条独特的推文中,有64,005,336条(14.44%)带有地理标签。其中,234,678人(0.37%)根据标签被确定与体育活动有关。洛杉矶县(n=20,589;8.77%),纽约县(n=12,601;5.37%),迈阿密-戴德县(n=7055;3.01%),哈里斯县(n=6148;2.62%),库克县(n=5738;2.45%)是发送地理标记体育活动相关推文最多的5个县(图1).

在3146个县或县当量中,总共有3138个县获得了汇总数据。省略分析的县缺乏相关的推特数据、体育活动数据或社会经济指标数据。经年龄调整后,平均县级体力活动个体百分比为74.05% (SD 5.2)和75.30% (SD 4.96) (图2).基尼系数与受教育程度的地图显示在图3而且4

我们的情绪分析显示,7.31% (n=17,155)的体育活动相关推文是积极的,42.67% (n=100,137)是消极的,50.02% (n=117,386)是中立的。平均阳性与阴性之比为0.20 (SD 0.336)。文本框1显示示例推文。在相关分析的基础上,县级体育活动和年龄调整体育活动水平与体育活动相关推文的百分比和体育活动相关推文的情绪呈显著的弱至中度正相关(表1).

图1。美国人身体活动水平的地图。
查看此图
图2。美国与体育活动相关的地理定位推文地图。
查看此图
图3。美国基尼系数分布图。
查看此图
图4。美国教育水平的地图。
查看此图

推文的例子分为积极情绪、消极情绪和中性情绪。

分类积极:

  • “身体上、心理上、精神上、经济上的成长。这将是我的2017年....#instafit…”
  • “我想我们失去了一个完整的人!# fitgoals……”
  • “今天的提醒:重要的是练习,而不是完美!# yogajournal……”

分类-:

  • “我讨厌星期二。额外的。#有氧运动”
  • “大声喊出#混合健身……我说得对吗,伙计们!@俄勒冈州波特兰”
  • “回到工作中来……#有氧运动”

中性分类:

  • “我看到它的肚子了!”#很少,但以一种好的方式#健身#目标继续……”
  • “我每天2次健身的第二天#gymlife #planetfitness…”
  • “我的腿日剪辑#蹲和死#健美#力量举重#强人#奥运#健身……”
文本框1。推文的例子分为积极情绪、消极情绪和中性情绪。
表1。县级体育活动、与活动相关的推文和基尼指数的摘要。
变量 身体活跃,% 身体活动,%(年龄调整) 基尼系数 教育 体育活动推文 积极和消极体育活动推文之间的比例
身体活跃,% 1 0.99一个 -0.16一个 0.26一个 0.38一个 0.13一个
身体活动,%(年龄调整) - - - - - -b 1 -1.77一个 0.24一个 0.34一个 0.10一个
基尼系数 - - - - - - - - - - - - 1 0.04c 0.05c 0.09一个
教育 - - - - - - - - - - - - - - - - - - 1 0.22一个 0.16一个
体育活动推文 - - - - - - - - - - - - - - - - - - - - - - - - 1 0.20一个
积极/消极的体育活动推文比例 - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - 1

一个P<措施。

b不适用。

cP< .02点。

回归模型显示,与体育活动相关的推文的百分比与体育活动水平显著相关(表2)和按年龄调整的体力活动(表3),同时根据基尼系数和受教育程度进行调整。然而,在模型中包括基尼指数和教育水平后,与体育活动相关的推文的情绪并不是县级体育活动水平和年龄调整体育活动的重要预测因素。预测县级体育活动的最佳模型包括体育活动相关推文的百分比、基尼指数和大学教育的普及程度。然而,模型的整体被解释方差较低(R2=.11)同样,预测县级体育活动的最适合模型(R2=.09)在调整了年龄后,使用了与体育活动相关的推文的百分比、基尼指数和教育水平。

表2。体育活动相关推文与县级体育活动水平的回归分析。
变量 β SE P价值
模型1一个

基尼系数 −0.16 2.54 <措施

教育 0.26 . 01 <措施

与体育活动相关的推文的百分比 0.11 .20 <措施
模型2b

基尼系数 −0.12 3.78 <措施

教育 2.95 . 01 <措施

体育活动相关推文的情绪(正负比) −0.01 .37点 56
模型3c

基尼系数 −0.12 3.79 <措施

教育 0.30 0.01 <措施

与体育活动相关的推文的百分比 0.05 .37点 02

体育活动相关推文的情绪(正负比) −0.01 53

一个F3, 3137= 116.30;P<措施;R2=厚。

bF3, 1704= 55.99;P<措施;R2= .09点。

cF3, 1704= 43.517;P<措施;R2= .09点。

表3。体育活动相关推文与年龄调整后的县级体育活动水平的回归分析。
变量 β SE P价值
模型1一个

基尼系数 −0.18 2.44 <措施

教育 0.23 . 01 <措施

与体育活动相关的推文的百分比 0.10 0.20 <措施
模型2b

基尼系数 −0.13 3.63 <措施

教育 0.25 . 01 <措施

体育活动相关推文的情绪(正负比) −0.02 .35点 无误
模型3c

基尼系数 −0.13 3.64 <措施

教育 0.26 . 01 <措施

与体育活动相关的推文的百分比 0.05 23) 03

体育活动相关推文的情绪(正负比) −0.02 .35点 .41点

一个F3, 3137= 102.93;P<措施;R2= 10。

bF3, 1704= 43.09;P<措施;R2=。

cF3, 1704= 33.52;P<措施;R2=。


主要研究结果

这项研究评估了使用Twitter数据监测身体活动水平的可行性,评估了是否可以从Twitter中提取关于身体活动行为的带有地理标记的对话,以及是否可以使用与身体活动相关的推文来监测身体活动水平。结果表明,从Twitter中提取与体育活动相关的地理标记对话是可行的。此外,研究结果表明,在考虑到美国县级收入不平等、人口和教育的基尼指数时,与体育活动相关的推文和体育活动水平之间存在着显著的关联。然而,与体育活动相关的推文和县级体育活动水平之间的总体联系很弱。

研究的意义

探索与体育活动相关的推文和县级体育活动水平之间的关系具有几个重要的研究意义。首先,这些发现支持了使用非传统数据源(如社交媒体数据)来监测体育活动相关行为的持续研究。其次,我们的研究结果展示了使用社交媒体数据作为补充工具的潜在应用,以帮助历史和实时跟踪人口水平的身体活动。本研究的一个优势是在我们的模型中控制了相关的人口因素,如收入不平等和不同地理位置的教育。最后,体育活动研究人员可以在本研究中使用的方法的基础上,找到使用社交媒体数据来监测体育活动结果的新方法。体育活动研究人员可以利用这些社交媒体分析技术来建立模型,实时预测体育活动水平。本研究中使用的分析方法可以在未来帮助公共卫生机构确定特定的体育活动相关趋势或关注的地理区域,并将其重点放在健康和健康计划上。

这项研究的发现验证并扩展了之前发表的工作,即推文的内容可以潜在地用于监测和预测行为和健康结果[101622].值得注意的是,即使我们没有显示出与体育活动相关的推文的情绪与县一级年龄调整的体育活动之间的显著关联,但之前的研究已经表明,推文的情绪可以用来预测健康结果。具体来说,之前的一项研究报告称,在190个美国msa中,积极情绪推文与较低的肥胖率有一定的相关性[28].这些发现表明,情绪分析可能不是一个县水平的体育活动水平的适当估计,但仍可能是一个适当的估计,在其他健康相关的结果在MSA水平。

尽管像这样的信息监测或信息流行病学研究对流行病学来说是重要的,要避免生态谬误19],在个人层面上研究社交媒体数据和身体活动水平之间的关系对于未来的研究至关重要。研究体育活动的流行程度是一个复杂而微妙的话题,可能会受到个人周围环境的强烈影响。通过纳入每个县关于收入不平等和教育水平的基尼指数数据,我们能够获得更好的模型性能。然而,未来的研究将需要调查其他已知的指标或指标(例如,建筑环境)是否可以纳入Twitter数据,以创建预测身体活动的准确性更高的模型。

限制

这项研究有几个局限性。推特数据和身体活动数据之间存在滞后时间和时间框架差异。作为BRFSS年度调查的一部分,最近的县级体育活动数据是从2014年开始收集的。此外,任何带有地理标记的Twitter数据取样都存在固有的偏见。对该平台人口统计数据的研究发现,总体而言,该平台倾向于更年轻、更富有的人群[21],以及少数群体和城市人口在查看带有地理标签的推文时所占比例的增加[30.].这意味着观察到的与体育活动相关的推文和体育活动之间的关系需要谨慎解释,因为某些人口或地区群体可能倾向于某种体育活动水平。尽管如此,这项研究是一项可行性研究,主要是为了评估表明与体育活动相关的行为的社交媒体对话是否可以提取出来,并用于监测人口水平的体育活动。其次,我们只使用了一个社交媒体数据来源(Twitter),因此限制了我们发现的普遍性。使用Twitter API橡胶软管使用地理过滤的方法还将数据收集限制在任何给定时间框架内发布的所有推文的1%以下的随机样本。未来的研究将需要探索是否可以使用多个数据源(例如Twitter、Facebook和Instagram)来提高模型的准确性,以利用某些社交媒体平台之间的用户重叠以及更长的数据收集周期。最后,这种性质的研究在很大程度上依赖于分类器的准确性,以标记与体育活动相关的推文并进行情绪分析。特别是,情绪分析提供的细粒度过滤似乎并没有在拟合或分类精度方面提供显著改善。应该注意的是,这种复杂或合成特征无法改善模型质量的现象早前已经观察到[28].后续研究可能会用机器学习分类方法取代我们的标签列表分类器,以潜在地发现关键字、文本结构或其他可用于提高精度和召回率的特征,并尝试使用最先进的情感分析技术来构建和训练更适合这一特定Twitter数据子集的自定义分类器。

展望未来,还有其他可能的特征可以从Twitter数据中提取出来,这些特征可能会被测试与身体活动水平的关联。虽然这项研究专注于通过关键词过滤Twitter数据并进行情感分析,但可能还有其他自然语言处理技术可以应用于数据集[1636].未来的研究可能会研究在更大的推文和身体活动数据纵向数据集上训练预测模型。如果成功,这样的模型可以利用社交媒体数据有效地预测身体活动和不活动的水平。

结论

这项研究评估了使用社交媒体数据来监测每个县的体育活动水平的可行性。这项研究的结果表明,从Twitter数据中识别带有地理标记的体育活动相关对话,并将其与基于人群的体育活动结果数据联系起来进行分析是可行的。我们发现,推特上的对话与美国县级体育活动水平之间的联系很弱。未来的研究可以在本研究中使用的方法的基础上,进一步完善使用实时社交媒体数据来监测身体活动水平的模型。

致谢

这项工作得到了维多利亚大学内部研究创意项目的资助。

利益冲突

没有宣布。

多媒体附件1

用于识别与体育活动相关的推文的标签。

DOCX文件,14KB

  1. Warburton DE, Nicol CW, Bredin SS.体育活动的健康益处:证据。CMAJ 2006 Mar 14;174(6):801-809 [免费全文] [CrossRef] [Medline
  2. 刘珊珊,古德曼,诺兰R, Lacombe S,托马斯SG。高血压前期患者对急性和慢性运动的血压反应是相关的。医学体育杂志2012 9月44(9):1644-1652。[CrossRef] [Medline
  3. 拉孔布SP,古德曼JM,斯普拉格CM,刘S,托马斯SG。间歇运动和持续运动在高血压前期男性中引起等效的运动后低血压,尽管在调节方面存在差异。应用物理学报;2011年12月;36(6):881-891。[CrossRef] [Medline
  4. Umpierre D, Ribeiro P, Kramer C, Leitão CB, Zucatti A, Azevedo M,等。仅提供体育活动建议或结构化运动训练与2型糖尿病糖化血红蛋白水平的关系:系统综述和荟萃分析美国医学杂志2011年5月4日;305(17):1790-1799。[CrossRef] [Medline
  5. 体育活动与癌症预防:病因学证据和生物学机制。中国化学杂志2002 12月;132(11增刊):3456S-3454S。[CrossRef] [Medline
  6. PAGA。体育活动指南咨询委员会报告。华盛顿特区:美国卫生与公众服务部;2008.
  7. 疾病控制和预防中心。关于体育活动的事实https://www.cdc.gov/physicalactivity/data/facts.htm[访问2019-05-15][WebCite缓存
  8. Caspersen CJ, Pereira MA, Curran KM。美国人身体活动模式的变化,按性别和横截面年龄划分。医学体育运动2000 9月32(9):1601-1609。[Medline
  9. Trost SG, Owen N, Bauman AE, Sallis JF, Brown W.成人参与体育活动的相关性:综述和更新。医学体育演习2002 Dec;34(12):1996-2001。[CrossRef] [Medline
  10. 刘s, Young S.体育活动监测的社交媒体数据分析调查。J法医腿部医学2018年7月;57:33-36。[CrossRef] [Medline
  11. 刘s, Dunford SD, Leung YW, Brooks D, Thomas SG, Eysenbach G,等。通过基于互联网的干预降低血压:一项荟萃分析。Can Cardiol 2013 5月;29(5):613-621。[CrossRef] [Medline
  12. 刘s, Brooks D, Thomas SG, Eysenbach G, Nolan RP。用户和专家驱动的基于网络的高血压项目的有效性:一项随机对照试验。美国预防医学杂志2018年12月;54(4):576-583。[CrossRef] [Medline
  13. 刘S,霍奇森C,兹比布AM,佩恩AY,诺兰RP。忠诚度奖励的有效性,以促进使用基于互联网的心脏健康计划。J Med Internet Res 2014 7月;16(7):e163 [免费全文] [CrossRef] [Medline
  14. Nolan RP, Liu S, Shoemaker JK, Hachinski V, Lynn H, Mikulis DJ,等。基于互联网的高血压生活方式咨询的治疗益处。中华心血管杂志2012 5月;28(3):390-396。[CrossRef] [Medline
  15. Valle C, Tate D, Mayer D, Allicock M, Cai J.一项针对年轻成年癌症幸存者的基于facebook的身体活动干预的随机试验。中华癌症杂志2013年9月;7(3):355-368 [免费全文] [CrossRef] [Medline
  16. Salathé M.数字流行病学:它是什么,它将走向何方?生命科学社会政策2018年1月4日;14(1):1 [免费全文] [CrossRef] [Medline
  17. 皮尤研究中心,2015。社交媒体使用网址:https://www.pewinternet.org/2015/10/08/social-networking-usage-2005-2015/[访问2019-05-15][WebCite缓存
  18. 年轻的记忆。建议使用社交网络技术进行艾滋病预防研究的指南。艾滋病行为研究2012 Oct;16(7):1743-1745 [免费全文] [CrossRef] [Medline
  19. 信息流行病学和信息监测:一套新兴的公共卫生信息学方法的框架,用于分析互联网上的搜索、传播和发布行为。J Med Internet Res 2009年3月27日;11(1):e11 [免费全文] [CrossRef] [Medline
  20. 信息流行病学和信息监测跟踪在线卫生信息和网络行为,为公共卫生服务。Am J Prev Med 2011 5月;40(5增刊2):S154-S158。[CrossRef] [Medline
  21. 张晓东,李志强,李志强。2017。社交媒体更新2016网址:https://www.pewinternet.org/2016/11/11/social-media-update-2016/[访问2019-05-15][WebCite缓存
  22. 刘珊珊,朱敏,于德杰,Rasin A, Young SD。使用实时社交媒体技术监测大学生感知压力和情绪状态的水平:一项基于网络的问卷调查研究。JMIR医疗卫生2017年1月10日;4(1):e2 [免费全文] [CrossRef] [Medline
  23. 刘松,朱敏,杨sd。通过推文内容分析监测新生大学经历:观察性研究。JMIR公共卫生监测2018年1月11日;4(1):e5 [免费全文] [CrossRef] [Medline
  24. Young SD, Rivers C, Lewis B.使用实时社交媒体技术检测和远程监测艾滋病毒结果的方法。Prev Med 2014 6月;63:112-115 [免费全文] [CrossRef] [Medline
  25. 使用推特验证疾病检测模型。2013年5月出席:WWW'13 Companion;2013年5月13-17日;里约热内卢里约热内卢,巴西p. 699-702网址:http://dl.acm.org/citation.cfm?id=2487788.2488027
  26. Broniatowski DA, Paul MJ, Dredze M.通过Twitter进行国家和地方流感监测:2012-2013年流感流行的分析。PLoS One 2013;8(12):e83672 [免费全文] [CrossRef] [Medline
  27. Chew C, Eysenbach G.推特时代的流行病:2009年H1N1爆发期间推特的内容分析。PLoS One 2010;5(11):e14118 [免费全文] [CrossRef] [Medline
  28. Gore RJ, Diallo S, Padilla J. You are what You tweet:将美国肥胖率的地理差异与Twitter内容联系起来。科学通报,2015;10(9):e0133505 [免费全文] [CrossRef] [Medline
  29. 阮强,李东,孟H, Kath S, Nsoesie E,李飞,等。从推特上的地理标记数据中建立一个全国社区数据集,用于幸福、饮食和体育活动的指标。JMIR公共卫生监测2016年10月17日;2(2):e158 [免费全文] [CrossRef] [Medline
  30. Paul M, Dredze M.你就是你的推特:为公共卫生分析推特。2011年发表于:第五届国际AAAI网络日志和社交媒体会议;2011年7月17-21日;巴塞罗那,加泰罗尼亚,西班牙。
  31. 体育活动与健康:外科医生的报告。达比,PA: Diane Pub Co;2019.
  32. Baziotis C, Pelekis N, Doulkeridis C. semeval2017任务4:关注消息级和基于主题的情感分析的深度LSTM。2017发表于:语义评估国际研讨会2011;2017年8月3-4日;加拿大温哥华,p. 747。
  33. 贝瑟德,M Carpuat, Cer D, Jurgens D, Nakov P, Zesch T.计算语言学协会。2016。第十届语义评估国际研讨会论文集(SemEval-2016)https://www.aclweb.org/anthology/S16-1000[访问2019-05-17][WebCite缓存
  34. Rocktäschel T, Grefenstette E, Hermann K, Kočiský T, Blunsom P. arXiv.;2015.关于神经注意力蕴涵的推理https://arxiv.org/abs/1509.06664[访问2019-05-17][WebCite缓存
  35. Giles-Corti B, Donovan RJ。娱乐体育活动水平的社会经济地位差异以及对支持性物理环境的实际和感知获取。预防医学2002 12月;35(6):601-611。[Medline
  36. Kumar S. Twitter数据分析。纽约:施普林格;2014.


ACSM:美国运动医学学院
API:应用程序编程接口
BRFSS:行为风险因素监测系统
MSA:都市统计区
SemEval:语义评价


G·艾森巴赫(G Eysenbach)编辑;提交16.10.18;N Stetten, R Gore的同行评议;对作者03.02.19的评论;修订本于12.04.19收到;接受14.04.19;发表03.06.19

版权

©Sam Liu, Brian Chen, Alex Kuo。最初发表于《医疗互联网研究杂志》(//www.mybigtv.com), 2019年6月3日。

这是一篇开放获取的文章,根据创作共用署名许可(https://creativecommons.org/licenses/by/4.0/)的条款发布,允许在任何媒介上无限制地使用、分发和复制,前提是正确引用最初发表在《医学互联网研究杂志》上的原创作品。必须包括完整的书目信息,//www.mybigtv.com/上的原始出版物的链接,以及此版权和许可信息。


Baidu
map