发表在9卷第三名(2021): 3月

本文的预印本(早期版本)可在https://preprints.www.mybigtv.com/preprint/24365,首次出版
使用被动数字数据的机器学习模型跟踪和监测重度抑郁症患者的情绪稳定性:前瞻性自然主义多中心研究

使用被动数字数据的机器学习模型跟踪和监测重度抑郁症患者的情绪稳定性:前瞻性自然主义多中心研究

使用被动数字数据的机器学习模型跟踪和监测重度抑郁症患者的情绪稳定性:前瞻性自然主义多中心研究

原始论文

1首都医科大学人脑保护先进创新中心,中国北京

2风险感知与防范国家工程实验室,北京,中国

3.国家精神障碍临床研究中心,首都医科大学附属安定医院,中国北京

4北京邮电大学,中国北京

5首都医科大学附属北京天坛医院神经精神科和临床神经内科

6首都医科大学附属北京朝阳医院心理医学系

7首都医科大学附属北京友谊医院医疗保健中心神经内科

*这些作者贡献相同

通讯作者:

王刚,博士,医学博士

国家精神障碍临床研究中心

北京安定医院

首都医科大学

西城区安康巷5号

北京,100088

中国

电话:86 13466604224

传真:86 1058303289

电子邮件:gangwangdoc@ccmu.edu.cn


相关的文章这是更正后的版本。更正声明见:https://mhealth.www.mybigtv.com/2021/6/e30540

背景:重度抑郁症(MDD)是一种常见的精神疾病,其特征是持续的悲伤和对活动失去兴趣。使用智能手机和可穿戴设备来监测重度抑郁症患者的精神状况已经在几项研究中得到了检验。然而,很少有研究使用被动收集的数据来监测情绪随时间的变化。

摘要目的:这项研究的目的是检验使用机器学习模型监测重度抑郁症患者情绪状态和稳定性的可行性,这些模型是由被动收集的数据训练的,包括手机使用数据、睡眠数据和步数数据。

方法:我们构建了950个数据样本,代表三次连续患者健康问卷-9评估的时间跨度。每个数据样本都被标记为稳定或情绪波动,根据患者三次就诊的患者健康问卷-9得分,分为稳定-缓解、稳定-抑郁、情绪波动-剧烈和情绪波动-中等亚组。共提取252个特征,应用4个特征选择模型;使用6种不同的机器学习模型对6种不同类型的数据组合进行了实验。

结果:共有334名重度抑郁症患者参与了这项研究。稳定和情绪波动的平均分类正确率最高,分别为76.67% (SD 8.47%)和90.44% (SD 6.93%),使用了所有类型数据的特征。在我们实验的6种数据类型的组合中,总体上最好的组合是使用通话记录、睡眠数据、步数数据和心率数据。稳定-缓解-情绪波动-剧烈、稳定-缓解-情绪波动-中度、稳定-抑郁-情绪波动-剧烈之间的预测准确率均在80%以上,稳定-抑郁-情绪波动-中度之间的预测准确率和总体稳定-情绪波动分类准确率均在75%以上。比较上述6种组合,我们发现稳定-缓解和情绪波动(剧烈和中度)之间的总体预测准确性优于稳定-抑郁和情绪波动(剧烈和中度)之间的整体预测准确性。

结论:我们提出的方法可以通过使用被动收集的数据来监测重度抑郁症患者的情绪变化,并具有很好的准确性,这些数据可以作为医生调整治疗计划或警告患者及其监护人复发的参考。

试验注册:中国临床试验注册中心ChiCTR1900021461;http://www.chictr.org.cn/showprojen.aspx?proj=36173

JMIR移动健康Uhealth 2021;9(3):e24365

doi: 10.2196/24365

关键字



抑郁症是一种常见的精神疾病,其特征是持续的悲伤和对人们通常喜欢的活动失去兴趣,并伴有14天或更长时间无法进行日常活动[1].世界卫生组织的最新估计显示,目前有超过3亿人患有抑郁症,从2005年到2015年,这一数字增加了18%以上。重度抑郁症(MDD)的治疗通常需要很长时间(不少于6个月)。接受持续和长期的维持治疗可以减少甚至防止复发。医生必须监测病人的病情和症状,以提供适当的治疗。但是,理想的情况下,患者一个月去看两次医生,因此医生不可能每天都能掌握患者的病情。此外,患者不容易准确地描述自己过去几周的情况;有时,答案可能像一个模糊的好吧

这项研究分析了重度抑郁症患者的日常手机使用数据、睡眠数据和步数数据以及他们的自我评估情绪评分。一项针对各国智能手机拥有率的研究显示,在排名前20的国家中,平均有73.45% (SD值10.79%)的成年人拥有智能手机。2].根据中国网络直播服务协会[3.],在中国,人们每天使用智能手机上网的平均时间为341.2分钟。随着智能手机和可穿戴设备技术的快速发展,出现了许多基于互联网的心理健康服务。许多研究人员正致力于利用智能手机的使用数据来推断情绪。4-8].研究人员还将移动传感器收集的睡眠和运动数据作为情绪的推断[9-13].雅各布森等[14使用运动和光线数据来评估抑郁症的严重程度。曹等[15]利用智能手机被动收集的数据,预测重度抑郁症患者未来3天的情绪状态。梅利康加斯等[16]研究了患有精神障碍的成年人的运动活动、能量、情绪和睡眠之间的关系。曹等[17]使用基于智能手机的自我报告、父母评估和被动手机传感器数据来监测青少年重度抑郁症患者的抑郁症状。Canzian等[18]利用从智能手机收集的GPS数据,研究了人类活动模式与抑郁症患者情绪状态之间的相关性。

在回顾精神状态监测和预测方面的工作时,我们发现有两种主要方法:(1)使用收集的所有数据训练一个通用模型;(2)为每个患者建立一个个性化模型。在数据预处理过程中,我们观察到患者之间手机使用习惯的差异。由于患者健康问卷-9 (PHQ-9)反映了患者过去一周的精神状态,因此每个患者的数据样本有限,无法建立个性化模型。为了消除患者之间的个体差异,我们检查了手机使用习惯、睡眠数据和步数的变化与患者抑郁水平变化之间的相关性。

这项研究的主要目的是研究基于智能手机使用数据、睡眠数据和步数数据的变化量,在一段时间内监测重度抑郁症患者抑郁水平变化的可行性和技术基础。然后,我们分析了由数据训练的不同模型,以确定哪种类型的行为受抑郁水平变化的影响最大。


基于智能手机的抑郁症应用设计

我们设计了一个名为Mood Mirror的应用程序来跟踪和记录患者的日常活动和情绪(图1而且2).目标是通过最少的人为操作被动地收集手机使用数据和物理数据。由于iOS平台的应用使用限制,我们的Mood Mirror应用只支持Android平台。该应用程序要求用户佩戴我们提供的腕带来收集睡眠、心率和步数数据。

情绪镜子应用程序包括两个主要部分:情绪状况的自我评估和数据收集。该应用程序每天晚上8点向用户发送通知,让用户使用视觉模拟量表(VAS)来评估他们当天的情绪,评分范围为−3至3,−3表示悲伤,3表示快乐(图3).该应用程序还提供多种自我评估工具,如PHQ-9和广泛性焦虑障碍-7 (图4).用户可以随时使用这些工具来评估他们的精神状态。同时,在用户同意的情况下,Mood Mirror应用程序在后台运行,收集手机使用数据,包括通话记录、短信日志、应用程序使用日志、GPS和屏幕开关状态。这些电话使用数据会立即上传到我们的服务器上。此外,该应用程序还可以通过蓝牙连接腕带。当用户使用Mood Mirror应用程序连接腕带时,腕带收集的数据将首先存储在本地,并上传到我们的服务器上。Mood Mirror应用程序还允许用户记录他们的药物处方和副作用,以跟踪他们的病情。所有患者都提供了参与研究的书面知情同意。用户可以通过mood Mirror应用程序跟踪自己的情绪变化历史、睡眠数据和步数。如果用户超过3天没有使用该应用程序,mood Mirror应用程序将发送通知,提醒用户继续记录自己的情绪。

在这项研究中,我们选择了小米手环2(小米Corporation),这是一款最畅销的手环型号,当时在中国的销量达到了数百万。根据产品描述,收集的数据在他们的研发实验室进行校准,他们的睡眠和运动算法已被广泛接受。

为了收集反映受试者真实日常生活的手机使用数据,研究人员要求受试者在自己的手机上安装Mood Mirror应用程序。当时,这款应用在华为、小米和OPPO等最畅销品牌的20多种不同型号上进行了测试,并在不同的安卓操作系统上进行了兼容性测试。

图1。Mood Mirror应用程序的主屏幕。
查看此图
图2。菜单页面截图。
查看此图
图3。填写可视化模拟量表的截图。
查看此图
图4。填写患者健康问卷-9的截图。
查看此图

研究设计

这是一项多地点、非介入性的前瞻性研究。该研究在中国北京的4家精神病医院或综合医院进行。该方案得到了北京安定医院独立医学伦理委员会委员会和其他3个站点(伦理批准号为:037537531)的批准。2018 - 119 - 201917 - fs - 2)。所有患者都提供了参与研究的书面知情同意书。

该研究旨在建立临床医生评分量表、自我评分量表和抑郁症患者被动收集的手机使用测量之间的相关性。收集了4类数据:

  1. 医生评分量表,包括汉密尔顿抑郁评分量表,由精神科医生在每次访问时执行。
  2. 参与者每两周通过Mood Mirror应用程序进行一次自我评定量表,包括PHQ-9。
  3. 参与者使用VAS通过mood Mirror应用程序记录每日即时情绪。
  4. 研究人员分析了电话使用数据,包括通话日志、短信日志、应用程序使用日志、GPS和屏幕开关状态。
  5. 研究人员分析了腕带数据,包括睡眠数据、步数和心率。

这项研究持续了12周,所有参与者都被要求在第0周、第2周、第4周、第8周和第12周与他们的医生进行检查,并完成自评量表。他们的治疗没有限制。

所有参与者都被解释了这项研究,应用程序的设计,以及它收集的数据类型。然后,每位参与者都被要求在自己的智能手机上安装情绪镜子应用程序,并获得一个手环。参与者将手环连接到应用程序上,并允许应用程序在研究助理的帮助下访问某些数据,并完成自评量表。

在随访期间,所有参与者被要求每天记录他们的情绪状态,并每两周通过mood Mirror应用程序完成PHQ-9。

参与者

所有参与者于2019年2月至2020年4月从北京4个地点的门诊招募。参与者是18至60岁的门诊患者,根据诊断患有重度抑郁症精神疾病诊断与统计手册第四版标准。如果参与者有轴I的主要精神诊断而不是重度抑郁症,或者有药物滥用诊断,那么他们就被排除在外。临床医生在门诊向符合研究标准的患者介绍了这项研究。如果拥有安卓手机的患者感兴趣,临床医生会将患者介绍到研究中心,研究助理会详细解释这项研究。如果患者同意参与这项研究,研究助理会要求他们签署一份知情同意书,并帮助他们设置应用程序和腕带。参与者每次随访获得100元(15.5美元)。

数据预处理与特征提取

数据预处理

这项研究的重点是监测抑郁症患者的情绪变化。为此,需要对数据进行重新采样和标记。

对于每位患者,每连续3次PHQ-9结果,以及PHQ-9评价日第一天至最后一天收集的数据作为1个数据样本。然后将数据分为2部分:(1)PHQ-9第一天到第二个评估日之间的数据;(2)PHQ-9第二次评估日到第三个评估日之间的数据。这两部分称为PHQ-9期(图5).由于参与者可以随时完成PHQ-9测试并提交分数,如果任何一段时间持续不到一周,样本将被丢弃,因为PHQ-9测试主要反映患者过去一周的精神状态。如果在任何一个时间段内有效数据少于3天,样本也将被丢弃。根据该标准,手机使用、通话记录、手环数据的合规率分别为65.3%、71.1%、58.11%。

根据所示标准,将每个数据样本的3个PHQ-9结果标记为2组和4个亚组表1

图5。生成数据示例的示例。PHQ-9:患者健康问卷-9。
查看此图
表1。数据标签和标准。
标签 标准
稳定的

缓解 都是PHQ-9一个结果≤5

抑郁 三种PHQ-9结果均≥11,PHQ-9马克斯−phq - 9最小值< 5
摇摆不定的

激烈的 phq - 9马克斯−phq - 9最小值≥10

温和的 phq - 9马克斯−phq - 9最小值≥5

一个PHQ-9:患者健康问卷-9。

特征提取

由于智能手机和腕带收集的数据形式不同,所以提取的特征也不同。但是,根据常识判断和收集数据的质量,有某些类型的数据没有用于接下来的研究。例如,由于即时通讯应用程序微信的流行,短信数据没有被使用。人们很少使用SMS发送短信,而且商家和服务提供商发送的垃圾短信大量存在。音乐数据也没有被使用;由于技术问题,歌曲名称与歌词混在一起,在没有人工参与的情况下很难清理数据。下面将详细说明所使用的每个数据类型和提取的特性。

通话记录

人们普遍认为电话是反映一个人社会生活地位的重要特征。对于每个电话,都记录了呼叫类型(呼入、呼出或拒绝)、时长和电话号码。拨打电话的时间(按小时),每个电话的持续时间,拨打电话的不同人的数量,以及从每种类型的呼叫(传入,传出和拒绝)中提取呼叫者的熵,以及每个期间的所有电话。

熵H(X)计算如下:

H (X) = -ΣP (X)日志2[P (X)]

其中P(X)是事件X发生的概率。

每个呼叫者都被视为一个事件,概率是根据他或她呼叫、被呼叫或被拒绝的次数来计算的。

然后为每个数据样本计算两个PHQ-9周期的每个特征的差值、平均值和SD。

电话的使用

总体的手机使用情况是根据手机屏幕的打开和关闭状态计算的。Mood Mirror应用程序会记录用户自动或手动激活或锁定智能手机的时间戳。使用智能手机的次数和持续时间根据屏幕开关数据计算。计算每个时间段的电话使用时长的平均值和中位数,以及电话使用次数的平均值和中位数。此外,还计算了每个激活期间的平均手机使用时长。计算了上午(上午6点到中午)手机使用时长与全天手机使用时长的比例,以及下午(中午到下午6点)和晚上(下午6点到午夜)手机使用时长的比例。

然后为每个数据样本计算两个PHQ-9周期的每个特征的差值、平均值和SD。

应用程序使用

应用程序被分为以下8类(表2).

对于每一组,计算以下特征:

  1. 应用程序使用时长的平均值、SD和熵。
  2. 应用程序在以下时间段的使用时长:午夜至凌晨3点,凌晨3点至6点,早上6点至9点,上午9点至中午,中午至下午3点,下午3点至6点,下午6点至9点,晚上9点至午夜。
  3. 应用程序使用次数的平均值、标准差和熵。
  4. 在以下时间段内使用应用程序的次数:午夜至凌晨3点,凌晨3点至6点,早上6点至9点,上午9点至中午,中午至下午3点,下午3点至下午6点,下午6点至晚上9点,晚上9点至午夜。

熵H(X)计算如下:

H (X) = -ΣP (X)日志2[P (X)]

其中P(X)是事件X发生的概率。

表2。应用程序类别和示例。
类别 例子
即时消息 微信,QQ
社交网络 微博,知乎,小红书
购物 淘宝,京东,拼多多
娱乐 抖音,哔哩哔哩,优酷,爱奇艺
音乐 网易音乐,QQ音乐,虾米音乐
食品外卖 Meituan, Ele.me
其他人 百度浏览器,有道字典
所有应用程序 正在使用的所有应用程序

每个应用类别都被视为一个事件,概率根据该类别应用的使用次数和持续时间来计算。

由于即时通讯是人们最近最常用的交流方式之一,使用即时通讯软件的时间与使用所有应用程序的时间之比被作为一个特征来计算,以部分代表一个人的社交生活。

然后为每个数据样本计算来自2个PHQ-9周期的每个特征的差值、平均值和SD。

睡眠和步数

使用腕带收集睡眠和步数数据。腕带数据有4种类型:活动、轻度睡眠、深度睡眠和未佩戴。

腕带每分钟上传一个数据包,包括时间戳、数据类型、活动强度、步数和心率。

对于睡眠数据,计算轻度睡眠、深度睡眠和总睡眠时间的平均值、中位数和SD。计算浅睡眠时间与总睡眠时间的比值和深睡眠时间与总睡眠时间的比值作为睡眠质量的参考。入睡时间和起床时间也被作为特征来估计用户的日常生活。

对于步数数据,计算每个周期的总步数。每日步数的平均值、中位数和SD以及以下时间段也被计算出来:午夜到凌晨3点,凌晨3点到早上6点,早上6点到上午9点,上午9点到中午,中午到下午3点,下午3点到下午6点,晚上9点到午夜。

然后为每个数据样本计算两个PHQ-9周期的每个特征的差值、平均值和SD。

心率

使用腕带收集心率数据,采样率为每分钟一条数据。只有当腕带检测到用户处于浅睡眠模式或深度睡眠模式时,才会收集心率数据。

对每晚心率数据进行余弦曲线拟合。然后从余弦曲线生成振幅、顶端相位(峰值)、mesor(平均值)和r平方值(强度),并计算平均值、中位数和SD。

然后为每个数据样本计算两个PHQ-9周期的每个特征的差值、平均值和SD。

特征选择与机器学习模型

特征选择

有了所有计算出来的特征,确定哪些特征子集可以最好地描述处于稳定情绪和情绪波动的参与者之间的差异是很重要的。在本研究中,我们尝试了2种不同的特征选择模型,以找到一个更好的特征子集,以提供最好的分类准确性和查全率,并避免数据过拟合。

基于l1的特征选择

基于L1的特征选择方法利用了使用L1正则化的线性模型具有稀疏解的事实。L1正则化将系数的绝对值相加作为惩罚项。由于对模型参数固有的线性依赖,L1正则化会禁用不相关的特征,并产生稀疏的特征集[19].

基于树的特征选择

基于树的特征选择方法利用了树模型的可解释性。计算每个特征的重要性分数,每个特征对最终决策都有贡献。通过对所有的重要性得分进行排序,得分较低的特征对最终决策的贡献较小,可以被删除。

机器学习模型

在这项研究中,部署了一些最经典的机器学习(ML)模型来从之前提取的特征中学习并进行预测。为了获得更准确的结果,对每个模型的每个特征子集进行了10次交叉验证。

通过计算所有10次折叠的平均准确率和召回率来评估模型的性能。

使用的ML模型是支持向量机(svm)、k -最近邻、决策树、naïve贝叶斯、随机森林和逻辑回归。

支持向量机

SVM是一种有监督的ML模型,可用于分类。SVM算法创建一条直线、一个超平面或一组超平面,并最大化其周围的裕度,以将数据分离到不同的类别。

决策树

决策树是一种类似树的预测模型。在决策树中,每个内部节点表示一个输入特征,叶节点表示类标签,分支表示从节点到叶的决策进度。

随机森林

随机森林,如图所示图6,是树预测器的组合,这样每棵树都依赖于独立采样的随机向量的值,并且对森林中的所有树具有相同的分布[20.].它是一种分类的集成学习方法。随机森林会长出许多决策树。分类时,输入被放到每棵决策树,每棵树返回一个分类结果投票最后的结果。然后森林返回投票最多的最终分类结果[21].

图6。随机森林的机制。
查看此图

共有334名参与者参与了这项研究。由于技术的限制和参与者参与程度的不同,可用的数据样本数量有限。在334名参与者中,261人提供了950个适合分析的数据样本。由于Mood Mirror应用程序和腕带之间的数据收集机制不同,手机使用数据样本数量和睡眠数据样本数量之间存在差异。每个模型使用的数据样本数量显示在表3-8

表3。使用选定的手机数据特征进行分类的结果。
预测两个类或子类(数据样本数量) 所选特征,n 最好的毫升一个模型 平均准确率(SD) 平均召回率(SD)
稳定(144人)和摇摆(234人) 4 随机森林 66.76 (4.94) 80.93 (7.72)
稳定缓解(n=25)和剧烈摆动(n=75) 36 随机森林 70.74 (6.62) 77.58 (7.12)
稳定缓解(n=25)和摇摆中度(n=159) 7 随机森林 80.92 (5.34) 95.50 (2.30)
稳定抑郁型(119例)和剧烈摆动型(75例) 10 决策树 66.18 (6.31) 65.71 (6.99)
稳定抑郁型(119例)和中度摇摆型(159例) 34 随机森林 75.23 (3.75) 88.99 (6.00)

一个ML:机器学习。

表4。使用睡眠数据的选定特征分类结果。
预测两个类或子类(数据样本数量) 所选特征,n 最好的毫升一个模型 平均准确率(SD) 平均召回率(SD)
稳定(230人)和摇摆(382人) 48 随机森林 72.70 (4.74) 90.80 (3.92)
稳定缓解型(88例)和剧烈摆动型(124例) 44 随机森林 77.34 (7.50) 90.61 (6.23)
稳定缓解(n=88)和摇摆中度(n=258) 17 随机森林 84.46 (5.94) 97.38 (2.95)
稳定抑郁型(142人)和剧烈摆动型(124人) 48 随机森林 68.87 (9.34) 67.09 (9.19)
稳定抑郁(n=142)和适度摇摆(n=258) 5 随机森林 74.75 (5.96) 90.37 (5.18)

一个ML:机器学习。

表5所示。使用步数数据的选定特征进行分类结果。
预测两个类或子类(数据样本数量) 所选特征,n 最好的毫升一个模型 平均准确率(SD) 平均召回率(SD)
稳定(138人)和摇摆(246人) 11 随机森林 69.24 (8.54) 86.97 (7.35)
稳定缓解(n=31)和剧烈摆动(n=78) 10 然而,b 76.09 (8.49) 96.53 (5.32)
稳定缓解(n=31)和摇摆中度(n=168) 9 随机森林 85.42 (5.69) 99.41 (1.76)
稳定抑郁型(n=107)和剧烈摆动型(n=78) 8 逻辑回归 70.35 (8.57) 84.16 (11.82)
稳定抑郁(n=107)和适度摇摆(n=168) 12 随机森林 72.33 (7.55) 84.57 (8.41)

一个ML:机器学习。

bKNN:最近的邻居。

表6所示。使用选定的心率数据特征进行分类结果。
预测两个类或子类(数据样本数量) 所选特征,n 最好的毫升一个模型 平均准确率(SD) 平均召回率(SD)
稳定(n=80)和摇摆(n=122) 20. 随机森林 75.19 (8.38) 91.92 (6.71)
稳定缓解(n=18)和剧烈摆动(n=48) 9 然而,b 75.48 (16.53) 85.17 (15.10)
稳定缓解(n=18)和摇摆中度(n=74) 13 然而, 82.67 (10.03) 97.64 (4.73)
稳定抑郁型(62人)和剧烈摇摆型(48人) 8 决策树 74.55 (13.97) 73.79 (16.04)
稳定抑郁(n=62)和适度摇摆(n=74) 18 随机森林 69.29 (13.21) 75.16 (13.96)

一个ML:机器学习。

bKNN:最近的邻居。

表7所示。使用收集到的所有数据的选定特征进行分类。
预测两个类或子类(数据样本数量) 所选特征,n 最好的毫升一个模型 平均准确率(SD) 平均召回率(SD)
稳定(79人)和摇摆(122人) 75 然而,b 76.67 (8.47) 90.44 (6.93)
稳定缓解(n=18)和剧烈摆动(n=48) 7 朴素贝叶斯 74.29 (9.27) 84.31 (10.89)
稳定缓解(n=18)和摇摆中度(n=74) 8 然而, 80.56 (15.28) 97.08 (5.91)
稳定抑郁型(n=61)和剧烈摇摆型(n=48) 7 逻辑回归 75.91 (13.18) 89.83 (10.34)
稳定抑郁(n=61)和适度摇摆(n=74) 12 支持向量机c 74.73 (8.44) 83.95 (12.27)

一个ML:机器学习。

bKNN:最近的邻居。

c支持向量机:支持向量机。

表8所示。使用呼叫日志、睡眠数据、步数数据和心率数据的选定特征进行分类结果。
预测两个类或子类(数据样本数量) 所选特征,n 最好的毫升一个模型 平均准确率(SD) 平均召回率(SD)
稳定(79人)和摇摆(122人) 37 随机森林 75.64 (5.09) 89.93 (7.26)
稳定缓解(n=18)和剧烈摆动(n=48) 8 朴素贝叶斯 81.67 (15.32) 93.33 (10.41)
稳定缓解(n=18)和摇摆中度(n=74) 7 决策树 80.56 (10.49) 92.88 (10.43)
稳定抑郁型(n=61)和剧烈摇摆型(n=48) 35 随机森林 84.27 (14.36) 85.33 (15.72)
稳定抑郁(n=61)和适度摇摆(n=74) 25 支持向量机b 77.86 (8.90) 88.99 (9.76)

一个ML:机器学习。

b支持向量机:支持向量机。

表3介绍了使用选定的手机数据特征(包括应用程序使用数据和通话日志)预测情绪变化的分类结果。结果表明,平稳缓解型与摇摆中度型分类准确率最高,为80.92%,召回率为95.50%。平稳抑郁和剧烈波动分类准确率最低,为66.18%,召回率为65.71%。所有Steady状态样本与所有Swing数据样本的分类准确率为66.76%,召回率为80.93%。

表4描述使用睡眠数据的选定特征预测情绪变化的分类结果。稳定-缓解型与摇摆-中度型的分类准确率最高(84.46%),召回率最高(97.38%)。稳态抑郁和剧烈波动分类准确率最低,为68.87%,召回率为67.09%。所有Steady数据样本与所有Swing数据样本的分类准确率为72.70%,召回率为90.80%。

采用所选步数数据特征预测情绪变化的分类结果表明,稳定-缓解型和摇摆-中度型的分类准确率最高,分别为85.42%和99.41%。所有Steady数据样本与所有Swing数据样本的分类准确率最低,为69.24%,召回率为86.97% (表5).

表6提出了利用选定的心率数据特征预测情绪变化的分类结果。稳定-缓解型与摇摆-中度型分类准确率最高,为82.67%,召回率为97.64%。稳定-抑郁和摇摆-适度分类准确率最低,为69.29%,召回率为75.16%。所有Steady数据样本与所有Swing数据样本的分类准确率为75.19%,召回率为91.92%。

表7比较使用收集到的所有数据的选定特征预测情绪变化的分类结果。稳定-缓解与摇摆-中度分类准确率最高,为80.56%,召回率为97.08%。Steady-remission与Swing-drastic分类准确率最低,为74.29%,召回率为84.31%。所有Steady数据样本与所有Swing数据样本的分类准确率为76.67%,召回率为90.44%。

使用通话记录、睡眠数据、步数数据和心率数据的精选特征预测情绪变化的分类结果表明,“稳定抑郁”和“剧烈波动”的分类准确率最高,分别为84.27%和85.33%。所有Steady数据样本与所有Swing数据样本的分类准确率最低,为75.64%,召回率为89.93% (表8).


主要研究结果

据我们所知,这项研究是第一个通过在一段时间内使用手机数据、睡眠数据和步数数据的变化量来预测重度抑郁症患者情绪波动的研究。

在这项研究中,我们从手机数据、睡眠数据和步数数据中计算了数百个特征,并使用不同的特征选择模型来找到最能代表数据的特征。应用了多个ML模型,并检查了不同类型的数据组合,以选择为未来应用收集的数据类型。

大多数模型的准确率超过70%,显示出使用被动收集的手机和腕带数据来预测重度抑郁症患者是否有情绪波动的良好结果。

在我们实验的6种数据类型的组合中,总体上最好的组合是使用通话记录、睡眠数据、步数数据和心率数据。稳定-缓解-情绪波动-剧烈、稳定-缓解-情绪波动-中度、稳定-抑郁-情绪波动-剧烈之间的预测准确率均在80%以上,稳定-抑郁-情绪波动-中度之间的预测准确率和总体稳定-情绪波动分类准确率均在75%以上。该模型中使用的特征包括以下参数的平均值、标准差和中位数:睡眠时长、深度睡眠时长、浅睡眠时长、深度睡眠时长与通宵睡眠时长的比值、浅睡眠时长与通宵睡眠时长的比值、每天每3小时的步数、呼叫人数(呼入和呼出电话)、拒绝的电话数量、接听的电话数量以及心率拟合曲线的r平方。我们认为模型所选择的特征反映了MDD患者的一些抑郁症状(PHQ-9):睡眠质量低,社交互动减少,体力活动减少。这些特征与睡眠障碍、兴趣丧失、社会孤立和疲劳等临床表型一致。

比较上述6种组合,我们发现稳定-缓解和情绪波动(剧烈和中度)之间的总体预测准确性优于稳定-抑郁和情绪波动(剧烈和中度)之间的整体预测准确性。我们认为持续表现出抑郁症状的患者可能与有情绪波动的患者有相似的行为模式。另一方面,处于缓解期的患者和有情绪波动的患者在日常行为模式上的差异可能更为显著。这可以解释为什么所有Steady数据样本和所有Mood Swing数据样本之间的分类准确性较低,有时甚至是所有分类中最低的,即使使用最大的数据训练集。

我们发现,使用所有收集数据特征的模型的准确性低于使用所有收集数据特征的模型(应用程序使用数据除外)(表7而且8).这可能表明,处于稳定状态的患者和有情绪波动的患者在应用程序使用行为上的差异不显著。同时,在6种数据类型的组合中,使用手机数据(包括应用程序使用情况和通话记录)的模型的整体准确性最低。

局限性和未来工作

我们观察到在我们的数据集中存在数据不平衡,稳定缓解类的患病率较低。由于在医院门诊部进行招募,患者抑郁症状的严重程度不同,缓解患者的数据样本有限。数据的不平衡导致前面提到的大多数模型的召回率比准确率高得多。

总体数据大小也受到限制。有了更大的数据集,预测模型就会更加稳健。我们招募了334名参与者,所有人都被要求尽可能频繁地使用这款应用程序,在12周内记录他们的情绪和抑郁水平。由于Android系统的某些限制,很难让我们的应用程序在后台运行24×7收集数据。

这项研究显示了使用数字表型数据检测重度抑郁症患者情绪稳定性的可能性。我们目前正在开发Mood Mirror应用的新版本;通过提供更多的实用功能和交互设计,患者可以获得更多关于其当前状况的信息,这可以提高患者的依从率,并增强数据的规模和质量。当前的预测模型将安装在这个版本上,并将提供患者情绪稳定性的预测。该应用程序将询问患者对预测结果的反馈。模型的性能可以通过更大、更平衡的数据集以及预测结果反馈来提高。

结论

这项研究验证了利用智能手机数据、睡眠数据和步数数据的变化量来预测重度抑郁症患者是否有情绪波动的可行性,这应该引起他或她的监护人和医生的注意。这项研究的关键新颖之处在于,我们没有预测某一点的情绪状态,而是利用被动数字数据的变化量来关注一段时间内情绪的变化。由于数据样本的不平衡以及应用程序只能在Android平台上运行的技术限制,这项研究受到了限制。

致谢

本研究由北京市健康促进研究基金(2018-1-2121)、国家科技重大专项(2018ZX09201-014)、北京市医院管理局临床医学发展专项资助(XMLX201848)、北京市医院管理局青年计划(QML20181902、QML20181904)资助。

利益冲突

没有宣布。

  1. 抑郁:让我们谈谈?谁说的。世界卫生组织,2017。URL:https://www.who.int/news-room/detail/30-03-2017--depression-let-s-talk-says-who-as-depression-tops-list-of-causes-of-ill-health[2017-03-30]访问
  2. 全球智能手机拥有量正在迅速增长,但并不总是平等的。URL:https://tinyurl.com/3tzy3467
  3. 2019年中国网络直播发展研究报告。URL:http://www.cnsa.cn/home/industry/download/id/692.html
  4. 张敏,张志刚,张志刚,张志刚,张志刚。手机传感器与日常生活行为中抑郁症状严重程度相关:一项探索性研究。J Med Internet Res 2015 july 15;17(7):e175 [免费全文] [CrossRef] [Medline
  5. 阿瑟伯格J,鲁华德J,艾迪M,施拉德N, Sijbrandij M, Riper H.基于手机的日常情绪非突发性生态瞬间评估:一项探索性研究。J Med Internet Res 2016年3月29日;18(3):e72 [免费全文] [CrossRef] [Medline
  6. Rachuri KK, Musolesi M, Mascolo C, Rentfrow PJ, Longworth C, Aucinas A. EmotionSense:基于手机的实验社会心理学自适应研究平台。2010年9月,Ubicomp'10;2010年9月1日至9日;丹麦哥本哈根,第281-290页。[CrossRef
  7. 马勇,徐波,白勇,孙刚,朱瑞。基于手机感知的日常情绪评估。在:第九届国际会议上,可穿戴和植入式身体传感器网络。2012年5月17日:BSN'12;2012年5月9日至12日;伦敦,英国。[CrossRef
  8. 邦哥莫洛夫A,莱普里B,费龙M,皮亚内西F,彭特兰AS。可持续生活的普遍压力识别。在:普适计算和通信研讨会国际会议2014年5月15日发表:IEEE'14;2014年3月24-28日;布达佩斯,匈牙利。[CrossRef
  9. Muaremi A, Arnrich B, Tröster G.在工作和睡眠期间使用智能手机和可穿戴设备测量压力。生物纳米科学2013年5月;3:172-183 [免费全文] [CrossRef] [Medline
  10. 拉比M,阿里S, Choudhury T, Berke E.心理和身体健康的被动和现场评估使用移动传感器。见:第13届普适计算国际会议论文集。2011年9月出席:Ubicomp'11;2011年9月;中国北京,页385-394http://europepmc.org/abstract/MED/25285324CrossRef
  11. Moturu ST, Khayal I, Aharony N, Pan W, Pentland A.使用社会感知来理解睡眠,情绪和社交之间的联系。在:第三届隐私、安全、风险和信任国际会议和2011 IEEE第三届社会计算国际会议。2011年10月9日至11日;波士顿,马萨诸塞州,美国。[CrossRef
  12. 萨诺A,皮卡德RW。利用可穿戴传感器和移动电话进行压力识别。在:人类情感计算与智能交互协会会议2013年12月12日发表于:ACII'13;2013年9月2-5日;瑞士日内瓦。[CrossRef
  13. 王锐,陈峰,陈震,李涛,Harari G, Tignor S,等。学生生活:评估大学生使用智能手机的心理健康、学习成绩和行为趋势。在:2014年ACM会议上的普适计算2014年发表在:UbiComp'14;2014年9月;西雅图的华盛顿。[CrossRef
  14. Jacobson NC, Weingarden H, Wilhelm S.使用数字表型准确检测抑郁症严重程度。神经科学杂志2019年10月27(10):893-896。[CrossRef] [Medline
  15. 赵c, Lee T, Kim M, In HP, Kim L, Lee H.使用基于昼夜节律的被动数字表型的机器学习对情绪障碍患者的情绪预测:前瞻性观察队列研究。J Med Internet Res 2019 april 17;21(4):e11029 [免费全文] [CrossRef] [Medline
  16. Merikangas KR, Swendsen J, Hickie IB,崔玲,Shou H, Merikangas AK,等。双相情感障碍成人患者运动活动、能量、情绪和睡眠之间动态关联的实时移动监测。JAMA Psychiatry 2019年3月1日;76(2):190-198。[CrossRef] [Medline
  17. 曹娟,张勇,张晓明,王晓明,王晓明。基于智能手机自我报告、父母评估和被动手机传感器数据的青少年抑郁症状跟踪与预测:开发与可用性研究。JMIR Ment Health 2020年1月24日;7(1):e14045 [免费全文] [CrossRef] [Medline
  18. 抑郁轨迹:通过智能手机移动轨迹分析对抑郁状态的不显眼监测。在:普适和普适计算国际联合会议。2015年发表于:ACM'15;2015年9月;日本大阪。[CrossRef
  19. Demir-Kavuk O, Kamada M, Akutsu T, Knapp E.对具有大量特征的小数据集使用逐步L1, L2正则化和特征选择的预测。生物信息学2011;12(1):412。[CrossRef
  20. 布雷曼·l·随机森林。马赫学习2001 [免费全文] [CrossRef
  21. 布雷曼,卡特勒,随机森林。统计数据。URL:https://www.stat.berkeley.edu/~breiman/RandomForests/cc_home.htm#giniimp[2020-12-01]访问


MDD:重度抑郁症
ML:机器学习
phq - 9:患者健康问卷-9
支持向量机:支持向量机
血管:视觉模拟量表


L Buis编辑;提交16.09.20;J Zhang, M Asgari Mehrabadi同行评审;对作者30.10.20的评论;修订本收到27.11.20;接受05.01.21;发表08.03.21

版权

©白然,肖乐,郭宇,朱学泉,李楠溪,王亚申,陈勤勤,冯磊,王英华,余湘义,王春学,胡永东,刘占东,谢海勇,王刚。最初发表于JMIR mHealth和uHealth (https://mhealth.www.mybigtv.com), 2021年3月8日。

这是一篇开放获取的文章,根据创作共用署名许可协议(https://creativecommons.org/licenses/by/4.0/)的条款发布,允许在任何媒介上不受限制地使用、分发和复制,前提是正确引用了首次发表在JMIR mHealth和uHealth上的原创作品。必须包括完整的书目信息,http://mhealth.www.mybigtv.com/上的原始出版物的链接,以及此版权和许可信息。


Baidu
map