发表在17卷第四名(2015): 4月

公共卫生监测的新数据来源:Facebook点赞

公共卫生监测的新数据来源:Facebook点赞

公共卫生监测的新数据来源:Facebook点赞

原始论文

1Mktg, Inc,东艾斯利普,纽约,美国

2美国农业部国家农业统计局,研究和发展部,华盛顿特区,美国

3.美国佐治亚州亚特兰大疾病控制和预防中心人口健康司国家慢性病和健康促进中心

4定制决策支持,洛杉矶,CA,美国

5诺斯罗普·格鲁曼公司,亚特兰大,美国

通讯作者:

Steven Gittelman博士

Mktg公司

卡尔顿大道200号

东艾斯利普,纽约,11730

美国

电话:1 6314666604

传真:1 6312777601

电子邮件:Steve@Mktginc.com


背景:对个人健康状况的调查越来越集中于地方一级的情况,而回复率有所下降,并使个人一级的数据收集过程复杂化。与此同时,社交媒体数据的可用性呈爆炸式增长,并已被证明与某些健康状况的流行有关。

摘要目的:Facebook点赞可能是数字数据的来源,可以补充传统的公共卫生监测系统,并在地方层面提供数据。我们探索了使用Facebook点赞作为健康结果及其行为决定因素的潜在预测指标。

方法:我们在全美214个县和佛罗里达州67个县中的61个县进行了主成分和回归分析,以检验Facebook点赞对死亡率、疾病和生活方式行为的预测质量。这些结果与从人口统计模型中得到的结果进行了比较。健康数据来自2010年和2011年的行为风险因素监测系统(BRFSS),死亡率数据来自国家生命统计系统。

结果:即使在控制年龄、种族和社会经济地位的情况下,Facebook点赞在预测大多数被检查的健康结果和行为方面也增加了显著价值R2)在13个不同的健康相关指标的模型中,平均比基本的社会人口模型高58%。在人口较少的市场中,没有足够多的小区域数据来测试模型在估计健康状况方面的准确性,但使用佛罗里达州数据的初步分析表明,模型非常适合肥胖数据(调整后)R2= .77点)。

结论:Facebook上的点赞提供了对健康结果和健康行为的评估,这些评估与BRFSS得到的结果相当。与传统公共卫生监测系统相比,在线资源可以提供更可靠、及时和更具成本效益的县级数据,并可作为这些系统的辅助手段。

中国医学医学杂志,2015;17(4):e98

doi: 10.2196 / jmir.3970

关键字



互联网的发展和社交媒体的爆发为卫生监测提供了许多新的机会。互联网在个人健康和参与式健康研究方面的使用呈爆炸式增长,这主要是由于在线资源和医疗保健信息技术应用的可用性[1-8].这些在线发展,加上对更及时、更广泛和更具成本效益的数据的需求,导致了收集流行病学数据的新方法,如数字疾病监测和互联网调查[8-25].在过去20年里,互联网技术已被用于确定疾病暴发、跟踪传染病传播、监测慢性病患者的自我保健做法,以及在人口层面评估、应对和评估自然和人为灾害[6811121415172226-28].事实证明,使用这些现代通信工具进行公共卫生监测比传统的人口监测方式(如邮件调查、电话调查和面对面的住户调查)成本更低,更及时。

互联网催生了几个大数据来源,比如Facebook [29],推特[30.]、Instagram [31],汤博乐[32],谷歌[33],以及亚马逊[34].这些在线交流渠道和市场提供了大量被动收集的数据,可用于公共卫生目的,如社会人口特征、生活方式行为以及社会和文化结构。此外,研究人员已经证明,这些数字数据源可以用来预测其他情况下无法获得的信息,例如匿名互联网用户的社会人口特征[35-38].例如,Goel等人[36调查发现,社交媒体和电子邮件的使用在人口统计学特征上没有差异。然而,个人访问新闻、医疗保健和研究网站的频率是性别、种族/民族和教育程度的一个预测因素,可能提供基于种族和收入的有用的目标信息[36].将这些大数据源整合到公共卫生监测实践中,对于推动流行病学领域进入21世纪至关重要,正如2012年美国“大数据研究与发展倡议”所呼吁的那样[1939].

了解大数据如何用于预测生活方式行为和健康相关数据,是将这些电子数据源用于流行病学需求的一步[3640].Facebook已被个人和公共卫生研究人员用于新型监控应用[13373841-44].例如,Chunara等人[13)通过脸书调查了与活动和久坐相关的点赞与肥胖患病率之间的关系。研究人员发现,Facebook上与活动相关的点赞比例较高的人群超重和/或肥胖的患病率较低。“Facebook点赞”是Facebook用户识别自己喜欢的网站和兴趣的一种方式。虽然Facebook上的点赞并不明确与健康相关,但研究人员已经表明,综合来看,个人点赞的“网络”可以预测社会人口统计学特征、健康行为、肥胖和健康结果。13374244].Timian等[44]调查了Facebook上对医院的点赞是否可以快速而廉价地用于评估两项质量指标(即30天死亡率和患者建议)。Facebook上的“赞”也被证明是多种用户属性的预测指标,比如智商、幸福感、种族、宗教和政治观点、性取向,以及一系列的人格特征。37].研究人员提出,Facebook上的点赞可以作为一种新的行为测量方法,类似于传统的问卷调查。37].

在这项研究中,我们专注于利用Facebook点赞的预测能力来加强人口健康监测。为此,我们将Facebook点赞视为一类大数据,可以帮助我们在当地层面了解人口健康状况。鉴于危险因素和相关的健康结果在地理上往往集中在人口中[104546],在社区层面存在识别、监测和干预的能力。虽然过去的研究使用特定类别的点赞来针对理论上相关的条件(例如,[13]),有可能整个Facebook数据集可以用来形成一个完整的个人档案,可以广泛应用于许多领域的预测模型。如果一个地区的Facebook特征可以预测体育活动、吸烟和慢性疾病的自我管理,那么就有一个强有力的理由支持使用这些数据来针对、监测和干预不良的生活方式行为。

在本文中,我们研究了如何使用大数据来补充传统的监控系统。我们探索了使用Facebook点赞作为县级健康结果的潜在预测因素和不良健康结果的行为决定因素。具体来说,我们假设:(1)Facebook点赞提供了一种预测县级死亡率的手段,(2)Facebook点赞可以用作导致死亡率增加的慢性疾病结局(肥胖、糖尿病和心脏病)的指标,(3)Facebook点赞可以用作影响疾病的不良生活方式行为的指标。如果这些假设成立,那么Facebook点赞最终可以用于加强人口健康监测。


数据源

用于分析的数据来自4个来源。2011年主要健康指标(如预期寿命、死亡率和低出生体重)的客观报告收集自美国国家生命统计系统(NVSS),该系统提供了美国死亡和出生的人口数据。根据其网站,“这些数据是通过[国家卫生统计中心]国家卫生统计中心与在不同司法管辖区运作的生命登记系统之间的合同提供的,这些系统在法律上负责登记生命事件-出生,死亡,婚姻,离婚和胎儿死亡”[47].

自我报告健康结果和风险行为数据来自行为风险因素监测系统(BRFSS) [48].BRFSS是一项正在进行的随机数字电话调查,由国家卫生机构在疾病控制和预防中心(CDC)的协助下进行。监测系统收集了许多使18岁以上成年人面临慢性疾病、残疾和死亡风险的行为和状况的数据。2011年BRFSS的大样本量(N=506,467)便于对214个有500名或更多受访者的县计算可靠估计值。此外,2010年BRFSS促进了佛罗里达州91%县的可靠估计的计算,其中67个县中的61个县有500或更多的受访者。县级风险因素数据来自2011年精选大都会/微大都市地区风险趋势BRFSS [49].

Facebook点赞数据是通过Facebook广告应用程序接口(API)收集的。50),该网站汇总了按邮政编码对特定类别商品表示积极倾向(“喜欢”)的用户数量。这些邮政编码数据被汇总到县一级,以便与健康数据进行直接比较,跨越边界的邮政编码被分配给它们主要所在的县。这些数据反映了在他们被抽取时Facebook用户的累计点赞总数。在Facebook上可用的8个“赞”超类别(即事件、家庭状况、工作状况、活动、移动设备所有者、兴趣、西班牙裔、零售和购物)中,有3个被认为与健康潜在相关,并被选为模型。被选中的点赞分别是活动、兴趣、零售和购物。选择这些超类别是因为它们包含与健康有明确理论关系的项目。例如,"兴趣"包含"健康与幸福"范畴,健康与健康的关系不言自明。选择“活动”类别是因为它包括“户外健身和活动”,这似乎直接适用于身体活动的测量,而选择“零售和购物”是因为它与社会经济地位明显相关,而社会经济地位是健康结果的强大驱动力(多媒体附件1) [5152].

这些超级类别的所有组成元素都被使用了,而不考虑它们与健康的明确关系,因为Facebook没有报告这些数据的确切内容和构建方法。其他超类别缺乏这些明确的联系,尽管我们承认可能存在潜在的强大间接关系。由于API自动进行四舍五入,通常会导致高估,因此总体轮廓小于1000个的县被排除在分析之外。Facebook上每个类别的点赞数都是按该地区已完成个人资料的百分比来评分的。最后,为了减少由各县Facebook使用水平变化引起的多重共线性,数值除以所有类别的平均点赞百分比。由此产生的变量可以被描述为每个类别相对于其他类别的受欢迎程度的度量。虽然由这种转换产生的单个变量有时与原始变量完全不相关,但使用原始变量和转换后的变量进行的估计在R=。9。因此,我们得出结论,进行分析的结果不是这种转换的产物。

人口数据,如平均收入、年龄中位数和性别比例,均采用2010年美国人口普查[53并以县为单位进行划分。与健康无关的县级辅助统计数据采用人口普查局提供的"美国县信息"收集[54].总的来说,美国大陆的214个县包含了分析中所有变量的足够数据。

兴趣变量

选择了几个社会人口学、健康结果和危险因素变量进行分析。这些因素包括收入、年龄、教育程度、就业、非白人人口、肥胖、糖尿病、体育活动和吸烟,以及一般健康状况等其他指标。一个全面的清单,以及数据来源和评估的每个感兴趣的变量可在多媒体附件2

数据分析

我们首先使用主成分分析在3个选定的超级类别中的37个Facebook点赞类别作为数据缩减技术。然后,我们用普通最小二乘(OLS)回归分析这些因素,来确定Facebook点赞是否可以预测一些健康结果、状况和相关行为。最后,通过将我们的分析限制在可用数据更全面的佛罗里达州,我们通过自举回归形成了一个预测模型[55,以视觉形式展示了Facebook的预测准确性。


分析的第一阶段是确定健康结果确实可以由Facebook上的“赞”决定。通过主成分分析,37个类别被简化为9个因素(变量旋转),纯粹是为了简化建模工作,将这些类别减少到我们认为它们所代表的潜在社会行为维度。这个数字是通过应用卡特尔碎石试验得出的(见多媒体) [56],计算特征值分布中的“弯头”;也就是说,在这个点上,额外的因素似乎不能提供解释方差的实质性增益。每个因子都按照其解释的方差量编号(多媒体附件4).任何试图解释这些因素的实际性质的尝试都可能在解释Facebook广告数据时出现错误;因此,我们避免了这样做的冲动。然而,每个类别的因素负荷可以在多媒体

为了验证我们的假设,即Facebook点赞可以用来预测死亡率,我们使用了OLS回归。我们使用Facebook的9个因素来预测预期寿命,在初始模型中没有包括其他控制因素。结果,如“仅限Facebook”一栏所示表1(模型调整后)R2 =i)。尽管存在这种关系,但Facebook的价值仅在于它提供的预测价值超过了通过人口普查或其他方式已经获得的可靠数据。预测人口统计信息(平均年龄和非白人人口)和社会经济地位(SES;(以平均家庭收入、失业率及拥有学士学位的百分比表示),列于“仅限SES”一栏表1.这两者之间也存在很强的联系,尽管这种联系不如单独的Facebook因素那么强烈。最后,将两组变量组合在的最后一列中表1,表明尽管Facebook和SES变量共享了预期寿命的大量方差,但Facebook的加入提高了模型的拟合性,超过了现有的社会经济指标。由此产生的调整R2=。81一个lso indicates that a considerable amount of the variation in county-level life expectancy can be explained by SES and Facebook likes.

表1。预期寿命的普通最小二乘回归系数(β)(所有自变量均为标准化)。

Facebook只有 SES只 Facebook和SES

β P β P β P
Facebook的因素






1 -0.14 <措施 - - - - - - - - - - - - 0.20 <措施

2 0.79 <措施 - - - - - - - - - - - - 0.43 <措施

3. -0.96 <措施 - - - - - - - - - - - - -0.30 <措施

4 0.60 <措施 - - - - - - - - - - - - 0.42 <措施

5 0.69 <措施 - - - - - - - - - - - - 0.41 <措施

6 0.21 <措施 - - - - - - - - - - - - -0.04 0。

7 -0.08 <措施 - - - - - - - - - - - - -0.04 .04点

8 -0.61 <措施 - - - - - - - - - - - - -0.49 <措施

9 0.12 <措施 - - - - - - - - - - - - 0.10 2
年龄 - - - - - - - - - - - - 0.16 <措施 0.01 .87点
收入 - - - - - - - - - - - - 0.62 <措施 0.59 <措施
教育 - - - - - - - - - - - - 0.88 <措施 0.61 <措施
失业 - - - - - - - - - - - - -0.05 0.07 0.01 2
非白人人口 - - - - - - - - - - - - -0.85 <措施 -0.47 <措施
常数 77.08 <措施 77.06 <措施 77.06 <措施
调整R2 i =
.64点
结果
RMSE 1.28
1.29
1.01

表2总结了使用同一组预测因子在一系列健康相关因变量上运行的回归,并指出与单独SES相比,将Facebook点赞添加到SES时解释的方差改善百分比。从这个模型中我们可以得出两个结论。首先,Facebook点赞和SES被证明是所有测试疾病结果的有效预测指标。其次,除了SES带来的好处,Facebook点赞还有一个持久的好处,尽管这种好处的大小差别很大。

我们的第三个假设是,作为行为的衡量标准,Facebook点赞应该能够确定推动健康结果的行为。结果是表2这清楚地表明,Facebook点赞对所有测试的健康相关行为的预测模型都有相当大的影响,在某些情况下,比如健康保险和锻炼,模型的总体拟合性相当强。

表2。Facebook喜欢对214个县模型拟合的影响。
因变量 一个 Facebook,R2 SES,R2 SES + Facebook,R2 改善与Facebook, %
预期寿命 的神 i = .64点 结果 27%
死亡率 的神 .57 .60 22%
低出生体重 的神 53 .57 235%
肥胖 BRFSS .46 56 .60 7%
糖尿病 BRFSS 36 55 41%
心脏病 BRFSS .46 .46 0%
中风 BRFSS 低位 .30 .41点 46%
锻炼 BRFSS .57 .51 .76 49%
被保险人 BRFSS 的相关性 .37点 主板市场 76%
自我报告健康 BRFSS .51 .20 55 175%
吸烟者 BRFSS .40 54 29%
最后的检查 BRFSS i = .30 开市 140%
拒绝治疗 BRFSS .35点 40%

一个BRFSS:行为风险因素监测系统国家生命统计系统。

预测健康状况

这些发现的自然延伸将是在数据缺乏的县绘制出健康状况的预测流行率。尽管有214个县的样本足以让BRFSS提供特定县的估计,但剩下的2895个县却没有。一个额外的数据来源,如Facebook,将是一个具有成本效益的方式来增加现有的用于产生县级估计的州级数据源,如BRFSS。

然而,试图在全国范围内应用2011年SMART数据的预测会产生一个问题。虽然预测与非smart数据的实际水平有很好的相关性,但平均水平始终有向上的偏差。我们假设,根据SMART计划对县进行加权的选择方法创建了一个非代表性的样本,其总体健康水平高于我们在美国看到的总体水平,特别是在农村地区。作为一个没有这种问题的选择问题的替代方案,我们将我们的预测模型限制在2010年佛罗里达州的数据。佛罗里达州每三年在其67个县中的61个县收集超过500次访谈,导致数据集既没有样本量短缺,也没有相对于整个州的选择偏差。

仅使用一个州的数据会给预测模型带来问题。虽然数据的完整性非常好,但佛罗里达和其他州之间的各种文化差异并没有简单的方法来纠正。试图将佛罗里达州的模型应用于SMART县的全部集合,结果只有公平的相关性水平(R=点)。尽管它表明存在关系,但这还不足以作为决策的基础。相反,我们只对佛罗里达州进行了分析,以证明一旦对县级数据进行了更具代表性的选择,我们认为可以在全国范围内实现的准确性水平。

预测模型的结果显示在表3.这些是自举回归过程的结果,其中50个观察结果被绘制超过100个重复。由于样本量有限,标准误差很高,但我们的Facebook点赞类别中有2个类别在模型中保留了它们的重要性。虽然我们期望人口统计数据和社会经济数据能够非常有效地预测“健康”社区和“不健康”社区,但我们认为,Facebook点赞提供的额外信息应该有助于澄清总体健康水平相似的社区之间的更细微区别。

表3。普通最小二乘回归(β)结果预测肥胖。
Facebook只有 SES只 Facebook和SES
β P β P β P
Facebook的因素






1 0.04 0。 - - - - - - - - - - - - -0.03 <措施

2 -0.02 06 - - - - - - - - - - - - -0.01 .14点

3. 0.03 <措施 - - - - - - - - - - - - -0.01 07

4 -0.02 06 - - - - - - - - - - - - -0.01 .74点

5 -0.02 .04点 - - - - - - - - - - - - 0.03 . 01

6 -0.02 07 - - - - - - - - - - - - -0.02 13。

7 -0.05 .30 - - - - - - - - - - - - 0.02 .04点

8 0.01 - - - - - - - - - - - - 0.01 .90

9 0.02 36 - - - - - - - - - - - - -0.01
年龄 - - - - - - - - - - - - -0.01 . 01 -0.01 . 01
收入 - - - - - - - - - - - - -0.01 .37点 -0.01 .59
教育 - - - - - - - - - - - - -0.03 <措施 0.01 .35点
失业 - - - - - - - - - - - - -0.01 .04点 0.01 算下来
非白人人口

0.02 .04点

常数 0.29 <措施 0.30 <措施 0.30 <措施
调整R2 .77点 开市 .8
RMSE 0.03
0.03
0.03

图1显示了佛罗里达州自举回归程序预测值与源数据的图形比较,其中几乎所有县都有足够的样本进行可靠的估计。这些地图根据肥胖程度动态地从亮到暗进行阴影处理,数据被划分为流行度的分块。从视觉上可以明显看出,拟合总体上是良好的——模型中90%的误差与佛罗里达州2010年BRFSS的估计值相差在±2.1%(0.4个标准差)以内。

图1。肥胖的实际统计数据与预测值的比较,2010 BRFSS。颜色越深代表患病率越高。浅灰色表示数据缺失。
查看此图

当我们第一次进行这项研究计划时,我们预计,影响我们结果的大部分测量误差将来自于Facebook数据的不精确分类和地理聚合。然而,尽管有一些例外,但我们发现的一致性和拟合强度似乎很明显。我们的模型在预测数据丰富的县的健康变量水平方面做得非常好,而在数据不丰富的县,我们的模型往往与BRFSS的估计不同。这表明,来自Facebook和生命统计数据的数据可能比目前汇总数年数据的方法更准确地反映了小县城的情况。

因此,我们认为Facebook可以在社区层面上发挥中介作用,增强稀疏数据。我们已经证明它可以做到这一点,但额外的健康调查数据,特别是在不太广泛测量的地区(如农村),只能有所帮助。尽管完全的测量是不可行的,并且会使Facebook模型变得毫无意义,但在估计模型时,确保所有类型的社区都有足够的数量,这是避免预测中出现系统性错误风险的必要步骤。

我们分析Facebook点赞的最终目标是建立大数据对直接影响政府支出和公共政策的研究的潜在贡献,最重要的是,有助于改善人口健康。这些数据表面上看起来与健康没有什么关系,但却可以预测糖尿病和肥胖等流行病级别的健康问题,成本仅为传统研究的一小部分。由于需要利用现成的、具有成本效益的和地理相关的卫生数据来增强传统的公共卫生监测系统,“大流行病学数据”的使用恰逢其时。

Facebook数据源的性质使其在某些情况下无法成为有用的工具。在非常小的县(约占总数的9%)和较小地理区域的情况下,舍入误差变得非常大,以至于无法可靠地使用估计,即使它们可能由Facebook提供。此外,Facebook档案作为追踪传染病流行的工具还未经测试。它们可能更适合于预测不太可能在短时间内波动的地方性和持续性疾病。

此外,有些人可能会发现,Facebook的数据被用来“预测”健康数据,这些数据不仅早于它,而且与任何理论机制都没有因果关系,这是违反直觉的。某一特定地理区域的点赞数据应被视为该区域内社会行为条件的产物,与健康结果一样。因此,点赞数据可以被视为这些条件的工具,这些条件是有因果联系的。尽管暂时的担忧并不理想,但它们并不是特别有问题,因为本研究中使用的健康指标在短时间内并不特别容易波动。

最后,如果不清楚Facebook上的“赞”类别是如何构建的,以及个人是如何被标记为对特定类别感兴趣的,就很难对社交网络行为和健康结果之间的关系有更细致的了解。除非Facebook对这些数据的汇编方式变得更加透明,否则它们将仍然是一个“黑匣子”,我们必须相信,被测量的兴趣和活动确实是它声称要测量的。

这里研究的关系表明,社交媒体可能有望被用作当地情况的指标,即使是那些与Facebook上发生的活动几乎没有关系的地方。正如我们预测的那样,在一个地区的总体Facebook行为和疾病发病率以及不良生活方式行为之间存在着超越当地人口统计预测能力的重要关系,这些行为很可能导致这些疾病。

我们还指出,美国大多数县都严重缺乏健康数据。虽然Facebook的数据可能无法覆盖美国的每个角落,但它似乎是一个足够有效的工具,可以增强大多数县的现有县级数据。随着对当地卫生数据的需求不断增长,这类工具似乎比增加调查监测更具成本效益,而不管可能采用何种方式进行。

这些数据最终是否来自Facebook并不重要。在线环境可能会改变,它可能会提供不同的数据来源,在未来被证明更可行。只要信息源反映的是人们日常生活中的活动,同样的关系就可能成立。然而,即使Facebook作为一个社会机构能够持续下去,在本文所介绍的模式上仍有很大的改进空间。有了社交媒体的合作,我们也许能够在更符合我们需求的类别中获得更好的估计。最后,我们的数据可能不会因为研究成本的上升而受到影响。相反,探索新开放的在线数据收集渠道可能比从传统公共卫生监测系统获得的县级数据更可靠、及时和具有成本效益,并可作为这些系统的辅助手段。

致谢

我们感谢国家BRFSS协调员在收集本分析中使用的数据方面的帮助,感谢人口健康监测处成员在开发数据库方面的协助。作者也想表达他们的感谢黄友杰,医学博士,公共卫生硕士,DrPH,佛罗里达州代理BRFSS协调员,为2010年县级分析使用的数据。

利益冲突

没有宣布。

多媒体附件1

Facebook类别结构。

PDF档案(adobepdf档案),56KB

多媒体附件2

人口变量描述。

PDF档案(adobepdf档案),70KB

多媒体

主成分分析的碎石图。

PDF档案(adobepdf档案),47KB

多媒体附件4

旋转(正交变矩)因子。

PDF档案(adobepdf档案),50KB

多媒体

因子载荷。

PDF档案(adobepdf档案),54KB

  1. 公民科学:人民的力量。《自然》2010年8月5日;466(7307):685-687。[CrossRef] [Medline]
  2. 布朗斯坦CA,布朗斯坦JS,威廉姆斯DS,威克斯P,海伍德JA。社交网络在医学领域的力量。中国生物科技,2009年10月27日(10):888-890。[CrossRef] [Medline]
  3. 社交媒体的创新:MappyHealth体验。护理管理2013 Mar;44(3):10-11。[CrossRef] [Medline]
  4. 于波,王娟,孙萍,王娟。基于Amazon Mechanical Turk的医疗象形图众包参与性评价。中国医学杂志,2013;15(6):e108 [免费全文] [CrossRef] [Medline]
  5. Chawla NV, Davis DA。将大数据引入个性化医疗:以患者为中心的框架。J Gen实习医学2013年9月28日增刊3:S660-S665 [免费全文] [CrossRef] [Medline]
  6. Rogstadius J, Vukovic M, Teixeira C, Kostakos V, Karapanos E, Laredo J. CrisisTracker:众包社会媒体策划灾害意识。IBM J Res & Dev 2013 9月57(5):4:1-4:13。[CrossRef]
  7. 医学2.0:社交网络、协作、参与、调解和开放。中国医学杂志,2008;10(3):e22 [免费全文] [CrossRef] [Medline]
  8. 魏茨曼,柯门,曼德尔。监测在线社交网络,以评估人群水平的糖尿病健康状况和医疗保健质量。《公共卫生信息》2011;3(3):1-1 [免费全文] [CrossRef] [Medline]
  9. 布朗斯坦JS,弗雷菲尔德CC,麦道夫LC。数字化疾病检测——利用网络进行公共卫生监测。N Engl J Med 2009 5月21日;360(21):2153- 5,2157 [免费全文] [CrossRef] [Medline]
  10. 王志强,王志强,王志强。数码流行病学。中国生物医学工程学报(自然科学版),2012;29 (3):344 - 344 [j]免费全文] [CrossRef]
  11. 公共卫生监测和传染病检测。生物安全生物恐怖2012 3月10日(1):6-16。[CrossRef] [Medline]
  12. 丘纳拉R,安德鲁斯JR,布朗斯坦JS。社会媒体和新闻媒体能够在2010年海地霍乱爆发早期估计流行病学模式。中国热带医学杂志2012年1月;86(1):39-45 [免费全文] [CrossRef] [Medline]
  13. 朱娜娜,鲍顿,艾尔斯JW,布朗斯坦JS。评估在线社会环境以监测肥胖流行。公共科学学报,2013;26 (4):379 - 379 [免费全文] [CrossRef] [Medline]
  14. Ayers JW, Althouse BM, Allem JP, Childers MA, Zafar W, Latkin C,等。对大萧条时期心理困扰的新监测。《情感失调》杂志2012年12月15日;[CrossRef] [Medline]
  15. 施密特连续波。现在的趋势是:使用社交媒体预测和跟踪疾病爆发。环境卫生展望2012年1月;120(1):30-33。
  16. 剖析花生恐慌:有争议的食物过敏流行病的社会生活。2013年8月;90:49-55 [免费全文] [CrossRef] [Medline]
  17. Chary M, Genes N, McKenzie A, Manini AF.利用社会网络进行毒物警戒。《医学毒理学》2013年6月;9(2):184-191 [免费全文] [CrossRef] [Medline]
  18. 是时候对美国流行病学进行创造性变革了。中国医学杂志2012 11月7日;308(17):1804-1805。[CrossRef] [Medline]
  19. Khoury MJ, Lam TK, Ioannidis JPA, Hartge P, Spitz MR, Buring JE,等。为21世纪的医学和公共卫生转变流行病学。癌症流行病学生物标志物2013 april;22(4):508-516 [免费全文] [CrossRef] [Medline]
  20. 克劳福德CAG, Okoro CA, Akcin HM, Dhingra S.一项使用选择参与网络小组调查进行行为健康监测的实验研究。《公共卫生信息》2012;5(1):e24-e24。
  21. 刘华,Cella D, Gershon R, Shen J, Morales LS, Riley W,等。患者报告的结果测量信息系统互联网小组的代表性。中国临床流行病学杂志2010 11月;63(11):1169-1178 [免费全文] [CrossRef] [Medline]
  22. Minniear TD, McIntosh EB, Alexander N, Weidle PJ, Fulton J.使用电子调查来收集在罗德岛应对当地流行病期间的医生实践信息。年度流行病学2011;2013:1-3。
  23. 信息流行病学和信息监测:一套新兴的公共卫生信息学方法的框架,用于分析互联网上的搜索、传播和发布行为。中国医学杂志,2009;11(1):e11 [免费全文] [CrossRef] [Medline]
  24. Lyon A, Nunn M, Grossel G, Burgman M.基于网络的生物安全情报系统的比较:BioCaster, EpiSPIDER和HealthMap。Transbound emerging Dis 2012 Jun;59(3):223-232。[CrossRef] [Medline]
  25. Hay SI, George DB, Moyes CL, Brownstein JS。全球传染病监测的大数据机遇。公共科学图书馆,2013;10(4):1-4 [免费全文]
  26. 张志强,张志强,张志强,等。使用Twitter收集和可视化饮食行为和饮食原因。中国医学杂志,2013;15(6):e125 [免费全文] [CrossRef] [Medline]
  27. 尹志强,李志强。推文内容挖掘的一种实用方法。美国医学杂志2013年7月;45(1):122-129 [免费全文] [CrossRef] [Medline]
  28. Merolli M, Gray K, Martin-Sanchez F.在慢性疾病管理中使用社交媒体的健康结果和相关影响:文献综述和可见性分析。生物医学杂志2013年5月:957-969。
  29. Facebook。2013。URL:https://www.facebook.com/unsupportedbrowser[访问时间:2015-03-22][WebCite缓存]
  30. Twitter。URL:https://twitter.com/[访问时间:2015-03-22][WebCite缓存]
  31. Instagram。URL:https://instagram.com/[访问时间:2015-03-22][WebCite缓存]
  32. tumblr。URL:https://www.tumblr.com/[访问时间:2015-03-22][WebCite缓存]
  33. 谷歌。URL:http://www.google.com/[访问时间:2015-03-22][WebCite缓存]
  34. 亚马逊。URL:http://www.amazon.com/[访问时间:2015-03-22][WebCite缓存]
  35. 穆雷D,杜雷尔K.推断匿名互联网用户的人口统计属性。入职:Masand B, Spiliopoulou M,编辑。网络使用分析和人口统计分析。柏林:施普林格;2000:7-20。
  36. Goel S, Hofman JM, Sirer MI.谁在网上做什么:一项关于浏览行为的大规模研究。2012年发表于:ICWSM;2012年6月4-7日;多伦多。
  37. Kosinski M, stilwell D, Graepel T.私人特征和属性可以从人类行为的数字记录中预测。美国国家科学研究院2013年4月9日;110(15):5802-5805 [免费全文] [CrossRef] [Medline]
  38. 终止关系时使用Facebook:减少不确定性和监视。网络心理学报2013;20:1-6。
  39. Mervis J.美国科学政策:各机构联合起来应对大数据。科学通报2012年4月6日;336(6077):22。[CrossRef] [Medline]
  40. Bond RM, Fariss CJ, Jones JJ, Kramer ADI, Marlow C, Settle JE,等。这是一个有6100万人参与的社会影响和政治动员实验。自然杂志2012 9月13日;489(7415):295-298 [免费全文] [CrossRef] [Medline]
  41. Chang A, Anderson EE, Turner HT, Shoham D, Hou SH, Grams M.利用社交网站识别潜在的肾脏捐赠者。临床移植2013;27(3):E320-E326 [免费全文] [CrossRef] [Medline]
  42. Lewis K, Kaufman J, Gonzalez M, Wimmer A, Christakis N.品味,领带和时间:一个新的社交网络数据集使用Facebook.com。社交网络2008;30:33 -342。
  43. Jernigan C, Mistree BF。Firstmonday.org。2009年9月25日。同性恋雷达:Facebook友谊暴露性取向http://firstmonday.org/article/view/2611/2302[访问时间:2015-03-22][WebCite缓存]
  44. Timian A, Rupcic S, Kachnowski S, Luisi P.病人“喜欢”好的护理吗?通过Facebook衡量医院质量。Am J医学合格2013:374-382。
  45. 莫布里LR,芬克尔斯坦EA,哈夫茹OA,威尔JC。WISEWOMAN参与者体重指数和吸烟行为的空间分析。《妇女健康》(Larchmt) 2004年6月;13(5):519-528。[Medline]
  46. Schuit AJ, van Loon AJM, Tijhuis M, Ocké M.一般成人人群中生活方式危险因素的聚类。2002年9月35日(3):219-224。[Medline]
  47. 疾病控制和预防中心,2015。国家生命统计系统网址:http://www.cdc.gov/nchs/nvss.htm[访问时间:2015-03-22][WebCite缓存]
  48. 疾病控制和预防中心,2015。行为风险因素监测系统网址:http://http://www.cdc.gov/brfss/[访问时间:2015-03-22][WebCite缓存]
  49. 美国疾病控制和预防中心,2013年。智能:BRFSS市、县数据和文件网址:http://www.cdc.gov/brfss/smart/smart_data.htm[访问时间:2015-03-22][WebCite缓存]
  50. Facebook。Facebook广告API URL:https://www.facebook.com/unsupportedbrowser[访问时间:2015-03-22][WebCite缓存]
  51. Adler NE, Boyce WT, Chesney MA, Folkman S, Syme SL.健康方面的社会经济不平等。没有简单的解决办法。《美国医学会杂志》1993;269(24):3140 - 3145。[Medline]
  52. 穆雷CJ,亚伯拉罕J,阿里MK.美国健康状况,1990-2010:疾病、伤害和风险因素的负担。美国医学杂志2013 7月;310(6):591-608。
  53. 2010年美国人口普查。2010年人口普查网址:http://www.census.gov/2010census/[访问时间:2015-03-22][WebCite缓存]
  54. 美国人口调查局。美国县信息网址:http://www.census.gov/support/USACdata.html[访问时间:2015-03-22][WebCite缓存]
  55. Efron B, Tibshirani R. Bootstrap介绍。伦敦:CRC出版社;1993.
  56. 卡特尔RB。进行了碎石试验的数量因素。中国科学(d辑),1999;


API:应用程序接口
BRFSS:行为风险因素监测系统
神:国家生命统计系统
OLS:普通最小二乘
SES:社会经济地位
智能:选定的大都会/微大都会地区风险趋势


G·艾森巴赫(G Eysenbach)编辑;提交03.11.14;S Goel, G Khalil, R Bright同行评审;对作者24.11.14的评论;修订版本收到23.02.15;接受02.03.15;发表20.04.15

版权

©Steven Gittelman, Victor Lange, Carol A Gotway Crawford, Catherine A Okoro, Eugene Lieb, Satvinder S Dhingra, Elaine Trimarchi。最初发表于《医疗互联网研究杂志》(//www.mybigtv.com), 2015年4月20日。

这是一篇开放获取的文章,根据创作共用署名许可(http://creativecommons.org/licenses/by/2.0/)的条款发布,允许在任何媒介上无限制地使用、分发和复制,前提是正确引用最初发表在《医学互联网研究杂志》上的原创作品。必须包括完整的书目信息,//www.mybigtv.com/上的原始出版物的链接,以及此版权和许可信息。


Baidu
map