原始论文gydF4y2Ba
摘要gydF4y2Ba
背景:gydF4y2Ba抑郁症是一种常见的、繁重的、经常复发的心理健康障碍,经常不被发现和治疗。移动电话无处不在,并且有越来越多的传感器,这些传感器可能有助于监测可能指示抑郁症状的行为模式。gydF4y2Ba
摘要目的:gydF4y2Ba本研究的目的是探索使用手机全球定位系统(GPS)和使用传感器检测日常生活行为标记,及其在识别抑郁症状严重程度中的应用。gydF4y2Ba
方法:gydF4y2Ba从普通社区招募了40名成年参与者,携带带有传感器数据采集应用程序(Purple Robot)的手机2周。在这些参与者中,28人收到了足够的传感器数据进行分析。在为期两周的研究开始时,参与者完成了一份自我报告抑郁调查(PHQ-9)。研究人员从GPS定位和手机使用数据中开发并提取了行为特征。gydF4y2Ba
结果:gydF4y2BaGPS数据中的一些特征与抑郁症状的严重程度有关,包括昼夜节律运动(24小时节律的规律性;gydF4y2BargydF4y2Ba=点,gydF4y2BaPgydF4y2Ba=.005),归一化熵(最喜欢的位置之间的移动性;gydF4y2BargydF4y2Ba=算下来,gydF4y2BaPgydF4y2Ba=.012),位置方差(GPS移动与位置无关;gydF4y2BargydF4y2Ba=算下来,gydF4y2BaPgydF4y2Ba= .012)。手机使用特征、使用时长和使用频率也有相关性(gydF4y2BargydF4y2Ba= 54,gydF4y2BaPgydF4y2Ba=。011,而且gydF4y2BargydF4y2Ba=点,gydF4y2BaPgydF4y2Ba=。015,respectively). Using the normalized entropy feature and a classifier that distinguished participants with depressive symptoms (PHQ-9 score ≥5) from those without (PHQ-9 score <5), we achieved an accuracy of 86.5%. Furthermore, a regression model that used the same feature to estimate the participants’ PHQ-9 scores obtained an average error of 23.5%.
结论:gydF4y2Ba从手机传感器数据中提取的特征,包括GPS和手机使用情况,提供了与抑郁症状严重程度密切相关的行为标记。虽然这些发现必须在有确诊临床症状的参与者中进行更大规模的研究,但它们表明,手机传感器提供了大量的临床机会,包括在患者负担很小的情况下持续监测高危人群,以及可以及时提供外展服务的干预措施。gydF4y2Ba
doi: 10.2196 / jmir.4273gydF4y2Ba
关键字gydF4y2Ba
简介gydF4y2Ba
抑郁症是一种常见的精神障碍。重性抑郁障碍的12个月患病率估计为6.6-10.3%,而终生风险估计为16.6-17.1% [gydF4y2Ba
-gydF4y2Ba ].阈下抑郁症状更为常见[gydF4y2Ba ],对人们的生活造成严重损害,并使他们面临未来精神健康问题的风险[gydF4y2Ba ].抑郁症,无论是可诊断的还是阈值以下的水平,在成本、生产力损失、发病率、痛苦和死亡率方面都造成了非常高的社会负担[gydF4y2Ba -gydF4y2Ba ]是造成全世界残疾和疾病负担的主要原因[gydF4y2Ba ].世界卫生组织估计,到2020年,抑郁症将成为全球"健康寿命缩短"的第二大原因[gydF4y2Ba ].gydF4y2Ba抑郁症可以用多种方法治疗,包括抗抑郁药和心理治疗;然而,只有极少数需要治疗的人接受了治疗。gydF4y2Ba
].在我们的医疗保健系统中,抑郁症通常需要几个月或几年的时间才能被识别和治疗,而它完全可以治疗。gydF4y2Ba ].治疗抑郁症最常见的方法之一是初级保健[gydF4y2Ba ,gydF4y2Ba ];然而,初级保健医生可能无法识别大多数有抑郁症状的患者[gydF4y2Ba ,gydF4y2Ba ].因此,更有效的监测方法可以大大改善向有需要的人提供服务的情况。gydF4y2Ba手机正在成为我们这个世界上最普遍的消费设备。移动电话,特别是智能手机,具有强大的传感、计算和通信能力,可以持续监测个人的环境,包括身体活动、位置和环境。抑郁症与一些行为成分(如活动减少、精神运动障碍、睡眠改变)和动机状态(如快感缺乏)有关,其中一些可以用手机传感器检测到[gydF4y2Ba
,gydF4y2Ba ].因此,移动电话作为监测行为和环境风险和恢复力指标的平台,并改善抑郁症患者的长期管理和治疗,具有重要的前景。gydF4y2Ba事实上,在这方面的一些工作已经显示出了希望。我们小组的第一项研究发现,手机传感器数据可以检测抑郁症患者的社交模式,但这是一项只有8名参与者的小型研究[gydF4y2Ba
].其他研究小组发现,手机传感器在检测抑郁症患者的社交和睡眠行为方面很有效。gydF4y2Ba ,gydF4y2Ba ],而这些特征与抑郁症状的严重程度显著相关[gydF4y2Ba ].gydF4y2Ba这项研究的目的是通过专门关注与地理空间运动相关的行为标记来扩展之前的工作,我们假设这与抑郁症状的严重程度有关,因为抑郁症会导致动机、退缩和活动的下降。此外,过度使用手机被认为是强迫性行为,并与抑郁症的一些症状有关。gydF4y2Ba
,gydF4y2Ba ].因此,我们还探讨了抑郁症症状严重程度与使用用于收集传感器数据的手机的关系。为了实现这些目标,我们使用了我们的手机应用程序Purple Robot [gydF4y2Ba ,gydF4y2Ba ],以收集抑郁症严重程度不同的参与者的全球定位系统(GPS)位置和手机使用数据。我们根据这些数据定义了一些行为特征,并建立了分类和回归模型来研究它们与抑郁症症状严重程度的关系。gydF4y2Ba方法gydF4y2Ba
参与者gydF4y2Ba
我们从2013年4月到7月通过craigslist广告招募了40名成年参与者。如果参与者有电子邮件账户、电脑和宽带接入互联网,每天大部分时间都在蜂窝网络范围内,能够说和读英语,年龄至少19岁,并且居住在美国境内,他们就有资格参加。参与者签署了一份在线同意书,研究人员通过电话审查了同意书。这项研究得到了西北大学机构审查委员会的批准。gydF4y2Ba
在研究开始时,参与者被要求完成一份由人口统计问卷和患者健康问卷-9 (PHQ-9)组成的在线评估,这是一种常用的自我报告抑郁症状严重程度的测量方法[gydF4y2Ba
],其得分范围为0-27。得分低于5分表示无抑郁,5-9分为轻度抑郁,10-14分为中度抑郁,15-19分为中度重度抑郁,20分以上为重度抑郁[gydF4y2Ba ].gydF4y2Ba如果参与者拥有并使用操作系统为2.3 (Gingerbread)或更高版本的Android设备,研究人员将协助下载、安装和配置Purple Robot(参见下面的Purple Robot部分)。没有兼容手机的参与者获得了安装并配置了紫色机器人的安卓Nexus 4。电话要么从研究办公室领取,要么直接邮寄给参与者。gydF4y2Ba
参与者被要求随身携带手机,并在两周内全天充电。此外,研究人员解释说,紫色机器人将收集GPS位置和手机使用数据。这项研究的一部分目的是测试紫色机器人在该领域的功能,研究人员定期通过电话和电子邮件与参与者进行检查,以确保应用程序正常工作,并回答问题。gydF4y2Ba
紫色的机器人gydF4y2Ba
Purple Robot是我们开发的一款开源Android应用程序,用于收集手机传感器数据。gydF4y2Ba
,gydF4y2Ba ].该应用程序实现了存储和转发架构,其中传感器数据被收集,存储在设备上,并在网络连接可用时传输。这使我们能够在各种无线连接场景中收集数据,并且确信断断续续的网络访问不会影响收集数据的性质、质量或数量。gydF4y2BaPurple Robot使用标准MD5哈希和高级加密标准,在存储和传输之前匿名化个人身份信息和其他敏感信息[gydF4y2Ba
)算法。一旦数据被匿名化,它们就会被存储起来,然后传输到数据收集服务器,然后从设备上删除。只有在参与者使用的唯一标识符和用于加密数据的特定于研究的密钥已知的情况下,驻留在服务器上的传感器数据才能与研究期间收集的其他信息链接起来。gydF4y2Ba紫色机器人移动应用程序和支持的服务器基础设施能够收集有关用户的物理环境(如动作)、社交设置(如Facebook好友数量)和手机使用行为(如屏幕状态)的信息。它还使我们能够制定一个完整的数据收集策略,用于分析抑郁症和日常生活行为数据特征之间的关系。gydF4y2Ba
在本研究中,我们配置了紫色机器人来收集GPS位置和手机使用数据,因为本研究的目的是关注与空间移动和手机使用行为相关的行为标记。在我们的下一个研究中,我们计划使用紫色机器人从各种手机传感器收集数据。gydF4y2Ba
紫色机器人每5分钟对GPS位置传感器进行一次采样,并通过检测屏幕打开和关闭事件来收集手机使用数据。gydF4y2Ba
数据预处理gydF4y2Ba
数据预处理阶段的目标是便于从GPS位置和手机使用数据中提取特征。gydF4y2Ba
有关位置数据(gydF4y2Ba
),我们使用了两个过程。第一个过程确定每个GPS定位数据样本是来自静止状态(例如,在办公室工作)还是过渡状态(例如,走在街上)。为此,我们通过计算每个位置数据样本的时间导数来估计其移动速度,然后使用一个阈值速度来定义这两种状态之间的边界。在本研究中,我们将这个阈值设置为1 km/h。gydF4y2Ba第二步是聚类。我们只对处于平稳状态的数据样本进行聚类。目标是确定参与者花最多时间的地方,如家、工作场所、公园等。我们使用了一种基于距离的聚类算法gydF4y2BaKgydF4y2Ba——(gydF4y2Ba
],其中数据被划分为gydF4y2BaKgydF4y2Ba使数据点到其聚类中心的总体距离最小化的聚类。由于群集的数量未知,我们从一个群集开始,然后增加群集的数量,直到每个群集中最远点到其群集中心的距离低于阈值。这个阈值决定了星团的最大半径,在我们的研究中设置为500米。gydF4y2Ba研究人员通过观察手机屏幕亮着的时间段来收集手机使用数据。gydF4y2Ba
).考虑到手机屏幕在接收来自应用程序(如短信)的通知时会继续显示,我们排除了非参与者发起的持续时间小于30秒的短暂屏幕打开事件。gydF4y2Ba特征提取gydF4y2Ba
位置偏差gydF4y2Ba
我们定义了位置方差来测量参与者GPS位置的可变性。为了计算位置方差,我们只使用了平稳状态的位置数据(参见数据预处理)。具体而言,位置方差计算为位置数据的纬度分量和经度分量统计方差之和的对数:gydF4y2Ba
位置偏差gydF4y2Ba=日志(gydF4y2BaσgydF4y2Ba纬度gydF4y2Ba2gydF4y2Ba+gydF4y2BaσgydF4y2Ba长gydF4y2Ba2gydF4y2Ba) (1)gydF4y2Ba
我们应用对数来补偿参与者位置方差分布的偏态。gydF4y2Ba
集群数量gydF4y2Ba
类找到的位置集群的数量gydF4y2BaKgydF4y2Ba-means算法在预处理阶段。gydF4y2Ba
熵gydF4y2Ba
我们定义了熵来衡量参与者在位置集群上花费的时间的可变性。该特性是基于信息论中的熵的概念而开发的[gydF4y2Ba
].计算方法如下:gydF4y2Ba熵gydF4y2Ba=−∑gydF4y2Ba我gydF4y2BapgydF4y2Ba我gydF4y2Ba日志gydF4y2BapgydF4y2Ba我gydF4y2Ba(2)gydF4y2Ba
其中每个gydF4y2Ba我gydF4y2Ba=1, 2,…gydF4y2BaNgydF4y2Ba表示一个位置集群,gydF4y2BaNgydF4y2Ba表示位置集群的总数,和gydF4y2BapgydF4y2Ba我gydF4y2Ba参与者在位置集群上花费的时间百分比是多少gydF4y2Ba我gydF4y2Ba.高熵值表明参与者在不同位置集群上花费的时间更一致,而低熵值表明在不同集群上花费的时间更不平等。例如,如果一个参与者80%的时间在家里,20%的时间在工作,那么得到的熵将是−(0.8log0.8 + 0.2log0.2)≈0.500,而如果他们50%的时间在家里,50%的时间在工作,得到的熵将是−(0.5log0.5 + 0.5log0.5)≈0.693。gydF4y2Ba
归一化熵gydF4y2Ba
我们通过将熵除以其最大值来定义归一化熵,最大值是聚类总数的对数:gydF4y2Ba
归一化熵gydF4y2Ba=gydF4y2Ba熵gydF4y2Ba∕日志gydF4y2BaNgydF4y2Ba(3)gydF4y2Ba
与熵不同,归一化熵与聚类数量不变,因此仅依赖于所访问的位置聚类的分布。归一化熵的取值范围为0-1,其中0表示所有位置数据点都属于同一个聚类,1表示它们在所有聚类中均匀分布。gydF4y2Ba
寄宿家庭gydF4y2Ba
民宿衡量的是参与者在家中花费的时间相对于其他地点集群的百分比。为了获得这个度量,我们首先需要知道哪个集群代表参与者的家。我们基于两个启发式方法确定了家庭集群:(1)家庭集群是第一到第三个访问最多的集群,(2)家庭集群是上午12点到6点期间访问最多的集群。在我们的数据集中,其中不包含夜班工作的参与者,这两个启发式导致每个参与者有且只有一个位置集群。gydF4y2Ba
生理运动gydF4y2Ba
我们定义了昼夜运动来捕捉位置数据的时间信息。这一特征测量了参与者的位置序列在多大程度上遵循了24小时或昼夜节律。例如,如果一名参与者每天在同一时间离开家上班和下班回家,那么昼夜节律运动就会很高。相反,在不同地点之间移动的不规则模式的参与者有较低的昼夜节律运动。gydF4y2Ba
为了计算昼夜运动,我们首先使用了最小二乘光谱分析,也称为Lomb-Scargle方法[gydF4y2Ba
],以获得GPS位置数据的频谱。然后,我们计算了在24±0.5小时内落入频率箱的能量量,如下所示:gydF4y2BaEgydF4y2Ba=∑gydF4y2Ba我gydF4y2Bapsd (gydF4y2BafgydF4y2Ba我gydF4y2Ba)∕(gydF4y2Ba我gydF4y2Ba1gydF4y2Ba−gydF4y2Ba我gydF4y2Ba2gydF4y2Ba) (4)gydF4y2Ba
在哪里gydF4y2Ba我gydF4y2Ba=gydF4y2Ba我gydF4y2Ba1gydF4y2Ba,gydF4y2Ba我gydF4y2Ba1gydF4y2Ba+ 1,gydF4y2Ba我gydF4y2Ba1gydF4y2Ba+ 2,…,gydF4y2Ba我gydF4y2Ba2gydF4y2Ba,gydF4y2Ba我gydF4y2Ba1gydF4y2Ba而且gydF4y2Ba我gydF4y2Ba2gydF4y2Ba表示对应24.5和23.5小时周期的频率箱。psd (gydF4y2BafgydF4y2Ba我gydF4y2Ba)表示各频率仓的功率谱密度gydF4y2BafgydF4y2Ba我gydF4y2Ba.我们计算gydF4y2BaEgydF4y2Ba分别为经度和纬度,得到总的昼夜运动为:gydF4y2Ba
厘米gydF4y2Ba=日志(gydF4y2BaEgydF4y2Ba纬度gydF4y2Ba+gydF4y2BaEgydF4y2Ba长gydF4y2Ba) (5)gydF4y2Ba
我们用对数来解释分布中的偏态。gydF4y2Ba
过渡时间gydF4y2Ba
过渡时间表示参与者处于非平稳状态的时间百分比(参见数据预处理)。这是通过将处于过渡状态的GPS位置样本数除以样本总数来计算的。gydF4y2Ba
总距离gydF4y2Ba
总距离以公里为单位测量参与者所走的总距离。它是通过累积位置样本之间的距离来计算的。gydF4y2Ba
电话使用频率gydF4y2Ba
手机使用频率指的是参与者平均每天使用手机的次数。gydF4y2Ba
电话使用时长gydF4y2Ba
手机使用时长平均衡量的是参与者每天使用手机的总时间(以秒为单位)。gydF4y2Ba
特征与抑郁程度的关系gydF4y2Ba
我们进行了初步的统计分析,以找出每个特征如何对应抑郁症状的水平,以及它是否能够区分患有任何程度的抑郁症的人。前者通过将每个特征与研究开始时获得的PHQ-9评分相关联来进行调查。后者首先通过将参与者分为有抑郁症状的(PHQ-9≥5)和没有抑郁症状的(PHQ-9 <5)来探索。之所以使用PHQ-9评分的5分,是因为在这个范围内的分数表明抑郁症“没有症状”,而那些在治疗后达到这个范围的人被认为处于完全缓解状态。gydF4y2Ba
从特征估计抑郁状态gydF4y2Ba
分数估计模型gydF4y2Ba
我们使用一个线性回归模型来估计每个参与者的PHQ-9分数,这些分数是从他们手机传感器数据中提取的特征。模型定义如下:gydF4y2Ba
抑郁得分=gydF4y2Ba0gydF4y2Ba+一个gydF4y2Ba我gydF4y2BaFgydF4y2Ba我gydF4y2Ba+一个gydF4y2Ba2gydF4y2BaFgydF4y2Ba2gydF4y2Ba+……+一个gydF4y2BangydF4y2BaFgydF4y2BangydF4y2Ba(6)gydF4y2Ba
在哪里gydF4y2BangydF4y2Ba是特征的数量。系数gydF4y2Ba一个gydF4y2Ba0gydF4y2Ba,一个gydF4y2Ba1,gydF4y2Ba…gydF4y2BangydF4y2Ba通过最小化PHQ-9估计值与真实分数之间的平方误差获得(见模型优化)。gydF4y2Ba
分类模型gydF4y2Ba
我们使用逻辑回归分类器来识别有抑郁症状(PHQ-9≥5)的参与者和没有症状(PHQ-9 <5)的参与者。该分类器由一个线性模型和一个逻辑sigmoid函数组成,gydF4y2Bag (x)gydF4y2Ba= 1∕1+exp(−.gydF4y2BaxgydF4y2Ba)),生成0至1之间的值,表示参与者出现抑郁症状的概率:gydF4y2Ba
P (gydF4y2Ba抑郁症状gydF4y2Ba) =gydF4y2BaggydF4y2Ba(gydF4y2BabgydF4y2Ba0gydF4y2Ba+gydF4y2BabgydF4y2Ba1gydF4y2BaFgydF4y2Ba1gydF4y2Ba+gydF4y2BabgydF4y2Ba2gydF4y2BaFgydF4y2Ba2gydF4y2Ba+…+gydF4y2BabgydF4y2BangydF4y2BaFgydF4y2BangydF4y2Ba) (7)gydF4y2Ba
当P (gydF4y2Ba抑郁症状gydF4y2Ba)高于0.5,我们认为被试有抑郁症状。否则,我们认为没有抑郁的迹象。gydF4y2Ba
我们使用优化程序来调整参数gydF4y2BabgydF4y2Ba0gydF4y2Ba,gydF4y2BabgydF4y2Ba1gydF4y2Ba,…,gydF4y2BabgydF4y2BangydF4y2Ba(参见模型优化)。gydF4y2Ba
模型优化gydF4y2Ba
我们使用最小二乘方法来调整评分估计和分类模型的参数。这种方法在特征相对于样本数量较低的情况下表现良好。否则,模型会过度拟合数据。为了最小化过拟合问题,我们在特征数量较多时使用弹性网正则化方法。gydF4y2Ba
弹性网正则化通过在代价函数中添加以下惩罚项来防止系数变得过大:gydF4y2Ba
H (K,λgydF4y2Ba1gydF4y2Ba,λgydF4y2Ba2gydF4y2Ba) =λgydF4y2Ba1gydF4y2BaK | | | |gydF4y2Ba1gydF4y2Ba+λgydF4y2Ba1gydF4y2BaK | | | |gydF4y2Ba2gydF4y2Ba(8)gydF4y2Ba
在哪里gydF4y2BaKgydF4y2Ba=gydF4y2BakgydF4y2Ba0gydF4y2Ba,gydF4y2BakgydF4y2Ba1gydF4y2Ba,…,gydF4y2BakgydF4y2BangydF4y2Ba向量是否包含回归或分类模型参数,以及gydF4y2BaKgydF4y2Ba为gydF4y2Ba1gydF4y2Ba=∑gydF4y2Ba我gydF4y2Ba|gydF4y2BakgydF4y2Ba我gydF4y2Ba|和‖gydF4y2BaKgydF4y2Ba为gydF4y2Ba2gydF4y2Ba=√∑gydF4y2Ba我gydF4y2BakgydF4y2Ba我gydF4y2Ba2gydF4y2Ba为其第一(L1)和第二(L2)范数(gydF4y2Ba我gydF4y2Ba= 1,2,…,gydF4y2BangydF4y2Ba).系数gydF4y2BaλgydF4y2Ba1gydF4y2Ba而且gydF4y2BaλgydF4y2Ba2gydF4y2Ba通过交叉验证训练数据进行优化。弹性网正则化已被证明优于其他正则化方法,特别是在某些特征强相关的情况下[gydF4y2Ba
].gydF4y2Ba模型评价gydF4y2Ba
为了评估回归和分类模型,我们创建了1000个自举特征集及其相应的PHQ-9分数。然后我们在每个集合上训练和交叉验证模型,使用一个参与者缺席的方法。gydF4y2Ba
为了评估每个分数估计模型的性能,我们计算了归一化均方根偏差(NRMSD),它测量了由模型估计的测试参与者的PHQ-9分数与他们的真实分数之间的百分比差异。我们使用PHQ-9评分的观察范围(0-17)来归一化nrmsd。为了评估每个分类模型的性能,我们评估了其在识别有抑郁症状的参与者时的准确性、敏感性和特异性。gydF4y2Ba
结果gydF4y2Ba
参与者特征和坚持gydF4y2Ba
所有40名参与者都完成了为期2周的研究。然而,由于一些参与者的传感器数据不足,我们考虑了其中的28个进行数据分析。其中18项用于GPS定位,21项用于手机使用数据分析。这两项分析是独立进行的。gydF4y2Ba
被排除在外的12名参与者没有为我们的分析提供足够的GPS定位和/或手机使用数据,这意味着他们的数据在50%以上的时间内不可用。数据无法使用的原因包括早期版本的Purple Robot与数据服务器之间的连接存在问题,患者没有给手机充电,某些位置的网络连接长时间无法使用。gydF4y2Ba
纳入分析的28名参与者中有20名女性和8名男性。年龄19 ~ 58岁,平均28.9岁(SD 10.1)。他们的PHQ-9评分范围为0-17,平均值为5.57 (SD 4.9)。28名参与者中,14名(50%)无抑郁症状(PHQ-9 <5), PHQ-9平均得分1.5 (SD 1.34),另外14名(50%)处于轻度至重度范围(PHQ-9≥5),PHQ-9平均得分9.64 (SD=3.54)。由于数据不充分而未纳入任何分析的参与者在年龄、性别或PHQ-9评分方面与这28名参与者没有统计学差异。gydF4y2Ba
在考虑进行位置数据分析的参与者中,9人有抑郁症状,9人没有。对于用于手机使用数据分析的数据,这些数字分别为10和11。gydF4y2Ba
特征与抑郁程度的关系gydF4y2Ba
GPS定位和手机使用传感器特征的计算,如特征提取所述。控件找到的位置集群的数目gydF4y2BaKgydF4y2Ba-means算法范围为1-9,均值为4.06。参与者平均每天使用手机的时间约为41分钟(SD 57分钟),平均每天使用手机的频率为14.2次(SD 8.69)。gydF4y2Ba
特征与PHQ-9评分之间的相关分析显示,10个特征中有6个与PHQ-9评分显著相关(gydF4y2Ba
).具体而言,昼夜运动、归一化熵和位置方差与Pearson的-相关系数有很强的相关性。63年-。58,-.58, respectively. Both phone usage features, usage duration and usage frequency, were also significantly correlated withrgydF4y2Ba= -。54而且0.52, respectively.的gydF4y2BatgydF4y2Ba有抑郁症状和没有抑郁症状的参与者之间的测试(gydF4y2Ba
)也揭示了相同的六个特征(昼夜节律运动、归一化熵、位置方差、家庭住宿、电话使用时长和电话使用频率)的值在无抑郁迹象的参与者(PHQ-9 <5)和其余参与者(PHQ-9≥5)之间有显著差异。gydF4y2Ba通过对特征进行相关分析,发现其中一些特征是高度相关的(gydF4y2Ba
).值得注意的是,归一化熵、位置方差和家庭住宿之间存在显著相关。这并不奇怪,因为所有这些变量都以不同的方式测量空间中的移动量。然而,昼夜节律运动和位置差异之间的显著相关性是有趣的,这表明活动能力更强的参与者也有更规律的运动模式。手机使用时长和使用频率之间的相关性也很高(gydF4y2BargydF4y2Ba= .89)。gydF4y2Ba从位置特征估计抑郁状态gydF4y2Ba
早期统计分析的结果表明,我们可以利用我们的某些特征来估计一个看不见的对象的抑郁状态。为了验证这一假设,我们使用模型评估中描述的程序训练并交叉验证分数预测和分类模型(公式6-7)。gydF4y2Ba
我们首先在每个单独的特征上训练模型,然后将所有特征组合在一起。结果是(gydF4y2Ba
)显示,在与PHQ-9分数相关性更强的特征上训练的模型,能够更好地区分有抑郁症状的参与者和没有抑郁症状的参与者。列2-4显示了每个分类模型(公式7)在将参与者分为有抑郁症状和没有抑郁症状时的交叉验证的准确性、敏感性和特异性。第5列显示了交叉验证的PHQ-9评分估计模型的nrmsd(公式6)。具体而言,归一化熵、位置方差、家庭住宿和昼夜节律运动四个特征的nrmsd最低,准确性最高。然而,结合这些特性并没有提高这些性能。随着输入变量数量的增加,这可能是一些不可避免的过拟合的结果,这会导致糟糕的泛化。gydF4y2Ba分类(PHQ9<5 vs PHQ9≥5)gydF4y2Ba | PHQ-9评分估计gydF4y2Ba | |||
培训功能gydF4y2Ba | 平均准确度(SD)gydF4y2Ba | 平均灵敏度%gydF4y2Ba | 平均特异性%gydF4y2Ba | 平均NRMSD (SD)gydF4y2Ba |
熵gydF4y2Ba | 69.7 (3.5)gydF4y2Ba | 66.8gydF4y2Ba | 72.7gydF4y2Ba | 0.262 (0.017)gydF4y2Ba |
归一化熵gydF4y2Ba | 86.5 (3.4)gydF4y2Ba | 88.4gydF4y2Ba | 84.9gydF4y2Ba | 0.235 (0.016)gydF4y2Ba |
位置偏差gydF4y2Ba | 75.7 (4.6)gydF4y2Ba | 80.2gydF4y2Ba | 71.5gydF4y2Ba | 0.229 (0.014)gydF4y2Ba |
寄宿家庭gydF4y2Ba | 75.9 (4.9)gydF4y2Ba | 80.5gydF4y2Ba | 71.7gydF4y2Ba | 0.253 (0.015)gydF4y2Ba |
过渡时间gydF4y2Ba | 41.1 (9.2)gydF4y2Ba | 43.4gydF4y2Ba | 38.7gydF4y2Ba | 0.303 (0.020)gydF4y2Ba |
总距离gydF4y2Ba | 56.4 (6.6)gydF4y2Ba | 69.6gydF4y2Ba | 43.4gydF4y2Ba | 0.343 (0.041)gydF4y2Ba |
生理运动gydF4y2Ba | 78.6 (4.1)gydF4y2Ba | 80.1gydF4y2Ba | 77.5gydF4y2Ba | 0.222 (0.014)gydF4y2Ba |
集群数量gydF4y2Ba | 41.5 (8.9)gydF4y2Ba | 47.4gydF4y2Ba | 35.5gydF4y2Ba | 0.305 (0.022)gydF4y2Ba |
所有gydF4y2Ba | 78.8 (6.2)gydF4y2Ba | 83.6gydF4y2Ba | 74.5gydF4y2Ba | 0.251 (0.023)gydF4y2Ba |
从手机使用特征评估抑郁状态gydF4y2Ba
我们对手机使用特性进行了同样的分析。由于这些特征的数量(n=2)远小于样本数量(n=21),得分预测和分类模型都可以直接应用于组合特征空间,而不需要使用弹性网正则化。结果(gydF4y2Ba
)显示,每个使用频率和使用持续时间特征都可以提供可接受的准确度和nrmsd,而无需通过聚合它们来进一步改进。列2-4显示了每个分类模型(公式7)在将参与者分为有抑郁症状和没有抑郁症状时的交叉验证的准确性、敏感性和特异性。第5列是交叉验证的PHQ-9评分估计模型的nrmsd(式6)。gydF4y2Ba分类(PHQ9<5 vs PHQ9≥5)gydF4y2Ba | PHQ9评分估计gydF4y2Ba | |||
培训功能gydF4y2Ba | 平均准确度(SD)gydF4y2Ba | 平均灵敏度%gydF4y2Ba | 平均特异性%gydF4y2Ba | 平均NRMSD (SD)gydF4y2Ba |
使用时间gydF4y2Ba | 74.2 (3.4)gydF4y2Ba | 64.0gydF4y2Ba | 83.9gydF4y2Ba | 0.268 (0.018)gydF4y2Ba |
使用频率gydF4y2Ba | 68.6 (4.1)gydF4y2Ba | 56.4gydF4y2Ba | 79.6gydF4y2Ba | 0.249 (0.013)gydF4y2Ba |
所有gydF4y2Ba | 65.7 (4.9)gydF4y2Ba | 55.7gydF4y2Ba | 74.9gydF4y2Ba | 0.273 (0.019)gydF4y2Ba |
讨论gydF4y2Ba
主要研究结果gydF4y2Ba
这项研究报告了使用普遍可用的手机传感器数据(包括GPS和手机使用情况)来识别抑郁症状严重程度的潜力。我们从这些数据中提取了一些语义上有意义的特征,并发现其中一些特征与PHQ-9分数之间存在很强的相关性。这些特征包括归一化熵、位置方差、家庭停留时间、昼夜运动、手机使用时长和频率。通过对这六个特征中的每一个训练得分估计模型,我们可以以相对较低的误差(NRMSD)估计未见过的参与者的PHQ-9分数。此外,在这些特征上训练的分类器能够区分那些有症状和没有症状的人,具有高度的准确性、良好的敏感性和特异性。gydF4y2Ba
归一化熵特征测量了一个人访问不同地点的频率以及该频率在不同地点的分布。在这一特征与PHQ-9分数之间发现的高度负相关表明,抑郁症状严重程度越高的人去的地方越少,而且更有可能喜欢一些地方而不是其他地方。部分原因可能是由于有抑郁症状的人在家呆的时间增加了,这是由家庭住宿功能衡量的。另一方面,位置差异特征的发现表明,有抑郁症状的人倾向于在地理空间中移动得更少。这些发现与抑郁症的典型特征——丧失动力、活动减少和社交退缩的模式是一致的。gydF4y2Ba
,gydF4y2Ba ].gydF4y2Ba这一关于空间运动昼夜节律的发现,与研究与抑郁症相关的觉醒-睡眠模式改变的成熟文献相吻合。gydF4y2Ba
,gydF4y2Ba ].这些数据表明,清醒时行为模式的中断不仅包括活动量,还可能延伸到行为模式。这些模式的改变可能是由于遗传和激素因素[gydF4y2Ba ],这与抑郁症相关的昼夜节律变化有关,也可能是动机低和组织能力下降的结果。gydF4y2Ba手机使用数据也与抑郁症状严重程度密切相关。抑郁症状严重程度越高,使用手机的时间和频率越高。这一观察结果得到了先前一些研究的支持,这些研究发现手机使用与某些抑郁症状之间存在相关性[gydF4y2Ba
,gydF4y2Ba ].然而,我们应该注意到,在这种情况下,手机的使用被定义为与手机的任何交互,我们无法隔离特定类型的交互(例如,使用应用程序,发短信)。因此,很难确定哪些具体行为与症状严重程度相关。gydF4y2Ba限制gydF4y2Ba
虽然我们相信我们的研究揭示了抑郁症的一些日常生活相关因素,这些因素可以被手机捕捉到,但结果是非常初步的,必须提到一些注意事项。首先,这项研究只检查了自我报告的抑郁症状与位置和手机使用数据得出的特征之间的联系。因此,我们不能在这里推断出任何因果关系。事实上,虽然PHQ-9是一种经过充分验证的抑郁症测量方法,但我们不能排除除抑郁症状之外的其他因素导致这些关系的可能性。例如,结果可能是由于其他未测量的因素,如慢性疾病或性格因素,这些因素导致抑郁症状和行为模式的差异。gydF4y2Ba
其次,虽然一些参与者表现出的抑郁症状水平与临床抑郁症水平一致,但这只是一个小样本,并不一定能代表抑郁症患者的典型趋势。未来的研究可能会招募更多具有代表性的抑郁症患者,并根据地理位置可能影响一个人的运动模式的特征(例如,职业地位、社交网络的规模或慢性健康问题)对他们进行匹配。gydF4y2Ba
最后,我们没有试图修正多重比较可能产生的影响。然而,鉴于我们对探索抑郁症状的潜在指标的兴趣,这种纠正所带来的II型错误的可能性增加可能会破坏重要的特征。这种修正的主要目标是增加对研究结果的信心,鉴于我们结果的初步性质,我们敦促未来在更大规模的调查中交叉验证这些关系。尽管如此,我们相信,在本研究中发现的有行为意义的特征(如归一化熵、昼夜节律运动)的计算以及这些特征与抑郁症的关系,可能为后续使用传感器数据监测和检测抑郁症的研究提供了一个有价值的起点。gydF4y2Ba
结论gydF4y2Ba
不管这些局限性如何,被动检测与抑郁症相关的行为因素(如活动水平及其模式)的能力,为新一代行为干预技术打开了可能性,这些技术可以被动检测并积极强化可能改善抑郁症的行为(例如,参与提供快乐、成就感或涉及社会参与的活动),并在检测到风险状态时提供支持(如:戒断,待在家里)。这可以提高抑郁症的识别和卫生保健机构向有需要的人分配资源的能力,并克服传统心理治疗的个人和系统障碍[gydF4y2Ba
].gydF4y2Ba使用手机传感器可以捕捉可能表明抑郁症状的信息,而无需使用问卷调查或要求患者使用特殊设备。手机已经融入了人们的生活。人们倾向于把手机一直或大部分时间都带在身边,而且手机可以不引人注目地提供数据,用户无需付出任何努力。这种能力为识别与抑郁症或其他健康和精神健康障碍相关的人类行为模式提供了新的机会。此外,行为特征可能对一个人日常生活中的变化更敏感,这些变化表明早期从治疗中获益或突出潜在的改善领域。因此,随着这些特征及其与抑郁症之间的联系得到更好的理解,它们可能在理解抑郁症的进展及其对治疗的反应方面发挥重要作用。gydF4y2Ba
致谢gydF4y2Ba
这项研究由美国国家精神卫生研究所的P20 MH090318研究基金资助。作者SMS得到了国家精神卫生研究所K08 MH 102336的资助。gydF4y2Ba
利益冲突gydF4y2Ba
没有宣布。gydF4y2Ba
参考文献gydF4y2Ba
- Kessler RC, Berglund P, Demler O, Jin R, Koretz D, Merikangas KR,国家共病调查复制。重性抑郁症的流行病学:来自国家共病调查复制(NCS-R)的结果。中国医学杂志2003年6月18日;289(23):3095-3105。[gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
- Kessler RC, McGonagle KA, Zhao S, Nelson CB, Hughes M, Eshleman S,等。美国DSM-III-R精神障碍的终身和12个月患病率。国家共病调查结果。Arch Gen Psychiatry 1994 Jan;51(1):8-19。[gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
- Kessler RC, Berglund P, Demler O, Jin R, Merikangas KR, Walters EE。全国共病调查复制的DSM-IV疾病的终生患病率和发病年龄分布。Arch Gen Psychiatry 2005 Jun;62(6):593-602。[gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
- 贾志强,李志强,李志强,等。精神病史和阈下症状是2年内抑郁或焦虑障碍发生的预测因素。中华精神病学杂志2011年3月;198(3):206-212 [gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
- Lewinsohn PM, Solomon A, Seeley JR, Zeiss A.“阈下”抑郁症状的临床意义。中华精神病学杂志,2000年5月;39(2):345-351。[gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
- 韦文凯,马兰兰,马文杰,李文杰,等。克服障碍,减轻情感障碍的负担。生物精神病学2002年9月15日;52(6):655-675。[gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
- 王ps, Simon G, Kessler RC。抑郁症的经济负担和治疗的成本效益。中华精神病学杂志2003;12(1):22-33。[gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
- Martin JK, Blum TC, Beach SR, Roman PM。亚临床抑郁症与工作表现。社会精神病学与精神病学流行病学1996年1月31日(1):3-9。[gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
- Ferrari AJ, Charlson FJ, Norman RE, Patten SB, Freedman G, Murray CJL,等。按国家、性别、年龄和年份划分的抑郁症负担:来自2010年全球疾病负担研究的结果。PLoS Med 2013 11月;10(11):e1001547 [gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
- 世界卫生组织(日内瓦)。《精神健康:世界卫生部长行动呼吁》,2001年。URL:gydF4y2Bahttp://www.who.int/mental_health/media/en/249.pdfgydF4y2Ba[访问2015-07-09][gydF4y2BaWebCite缓存gydF4y2Ba]gydF4y2Ba
- Kessler RC, Chiu WT, Demler O, Merikangas KR, Walters EE。国家共病调查复制12个月DSM-IV疾病的患病率、严重程度和共病。Arch Gen Psychiatry 2005 Jun;62(6):617-627 [gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
- 王ps, Berglund P, Olfson M, Pincus HA, Wells KB, Kessler RC。在国家共病调查复制中,首次精神障碍发作后初次治疗接触的失败和延迟。Arch Gen Psychiatry 2005 Jun;62(6):603-613。[gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
- Simon GE, VonKorff M.初级保健中抑郁症的识别、管理和结果。Arch Fam Med 1995 Feb;4(2):99-105。[gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
- van Weel C, van Weel- baumgarten E, van Rijswijk E.初级保健中的抑郁症治疗。BMJ 2009; 338: b934。[gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
- Schulberg HC, Saul M, McClelland M, Ganguli M, Christy W, Frank R.在初级医学和精神病学实践中评估抑郁症。Arch Gen Psychiatry 1985 Dec;42(12):1164-1170。[gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
- Wells KB, Hays RD, Burnam MA, Rogers W, Greenfield S, Ware JE。对接受预付费或服务付费护理的患者进行抑郁症的检测。来自医疗结果研究的结果中国医学杂志1989年12月15日;262(23):3298-3302。[gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
- Prigerson HG, Monk TH, Reynolds CF, Begley A, Houck PR, Bierhals AJ,等。生活方式的规律性和活动水平是预防老年丧亲相关抑郁症的保护因素。1995年萧条;3(6):297 - 302。[gydF4y2BaCrossRefgydF4y2Ba]gydF4y2Ba
- Vallée J, Cadot E, Roustit C, Parizot I, Chauvin P.日常流动在心理健康不平等中的作用:活动空间和居住社区对抑郁症的互动影响。科学通报2011年10月;73(8):1133-1144。[gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
- Burns MN, Begale M, Duffecy J, Gergle D, Karr CJ, Giangrande E,等。利用情境感知来开发抑郁症的移动干预。中国医学杂志,2011;13(3):e55 [gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
- 李志刚,李志刚,李志刚。抑郁症患者行为变化的检测。: AAAI;2014年发表于:AAAI现代人工智能健康分析研讨会;2014;Québec市,Québec,加拿大。gydF4y2Ba
- 拉比M,阿里S, Choudhury T, Berke E.心理和身体健康的被动和现场评估使用移动传感器。: ACM;2011年发表于:普适计算国际会议(UbiComp);2011;中国北京,页385-394。gydF4y2Ba
- 王锐,陈峰,陈智,李涛,Harari G, Tignor S.大学生智能手机使用的心理健康、学习成绩和行为趋势。: ACM;2014年发表于:普适与普适计算国际联合会议(UbiComp);2014;美国华盛顿州西雅图,第3-14页。gydF4y2Ba
- Thomée S, Härenstam A, Hagberg M.年轻人中手机使用与压力、睡眠障碍和抑郁症状——一项前瞻性队列研究。BMC公共卫生2011;11:66。gydF4y2Ba
- 李玉凯,张婷婷,林勇,程志华。智能手机使用的阴暗面:心理特征、强迫行为和技术压力。计算机在人类行为2014年2月;31:373-383。[gydF4y2BaCrossRefgydF4y2Ba]gydF4y2Ba
- CBITs科技网站,PurpleRobot。URL:gydF4y2Bahttp://tech.cbits.northwestern.edu/purple-robot/gydF4y2Ba[访问时间:2015-01-20][gydF4y2BaWebCite缓存gydF4y2Ba]gydF4y2Ba
- 舒勒M,贝加尔M,佩尼多FJ,莫尔DC。紫色:开发和部署行为干预技术的模块化系统。中国医学杂志,2014;16(7):e181 [gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
- 克伦克K,斯皮策RL,威廉姆斯JB。PHQ-9:一个简短的抑郁症严重程度测量的有效性。J Gen Intern Med 2001 9月;16(9):606-613 [gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
- 美国精神病协会。精神疾病诊断与统计手册(DSM-5)。华盛顿特区:美国精神病学协会;2013.gydF4y2Ba
- 高级加密标准(AES)。网络安全2009年12月;2009(12):8-12。[gydF4y2BaCrossRefgydF4y2Ba]gydF4y2Ba
- Arthur D, Vassilvitskii S. k -means++:仔细播种的优势。2007年发表于:ACM-SIAM离散算法年度研讨会;2007;美国宾夕法尼亚州费城,p. 1027-1035。gydF4y2Ba
- 沈建平,李志强,李志强。信息理论熵对序列可变性的度量。蛋白质1991;11(4):297 - 313。[gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
- 按WH。数字食谱第三版:科学计算的艺术。纽约,美国:剑桥大学出版社;2007.gydF4y2Ba
- 邹海涛,王晓明,王晓明。基于弹性网的正则化和变量选择方法。中国统计杂志,2005年4月;67(2):301-320。[gydF4y2BaCrossRefgydF4y2Ba]gydF4y2Ba
- kronfeld schor N, Einat H.昼夜节律与抑郁症:人类精神病理学和动物模型。神经药理学2012 1月;62(1):101-114。[gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
- 李志强,李志强,李志强,等。接受抗抑郁治疗的抑郁症患者运动活动的昼夜节律模式:活动描记仪测量与临床病程的关系。精神病学Res 1994 Apr;52(1):85-98。[gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
- 情绪障碍中的生物节律紊乱。Int clinin Psychopharmacol 2006 Feb;21增刊1:S11-S15。[gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
- 何杰,陈志强,张志强,等。心理治疗的认知障碍及其与抑郁症的关系。中华临床精神病学杂志2010 04;66(4):394-409 [gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
gydF4y2Ba
缩写gydF4y2Ba
全球定位系统(GPS):gydF4y2Ba全球定位系统gydF4y2Ba |
NRMSD:gydF4y2Ba归一化均方根偏差gydF4y2Ba |
phq - 9:gydF4y2Ba患者健康问卷-9gydF4y2Ba |
G·艾森巴赫(G Eysenbach)编辑;提交21.01.15;同行评议:J Ruwaard, J Bardram;对作者26.03.15的评论;修订本收到12.05.15;接受21.06.15;发表15.07.15gydF4y2Ba
版权gydF4y2Ba©Sohrab Saeb, Mi Zhang, Christopher J Karr, Stephen M Schueller, maria E Corden, Konrad P Kording, David C Mohr。最初发表于《医疗互联网研究杂志》(//www.mybigtv.com), 2015年7月15日。gydF4y2Ba
这是一篇开放获取的文章,根据创作共用署名许可(http://creativecommons.org/licenses/by/2.0/)的条款发布,允许在任何媒介上无限制地使用、分发和复制,前提是正确引用最初发表在《医学互联网研究杂志》上的原创作品。必须包括完整的书目信息,//www.mybigtv.com/上的原始出版物的链接,以及此版权和许可信息。gydF4y2Ba