发表在6卷第12名(2019): 12月

本文的预印本(早期版本)可在https://preprints.www.mybigtv.com/preprint/13076,首次出版
识别睡眠不足的推文作者:前瞻性研究

识别睡眠不足的推文作者:前瞻性研究

识别睡眠不足的推文作者:前瞻性研究

原始论文

1加州大学预测技术研究所,美国加州洛杉矶

2加州大学洛杉矶分校医学系,美国加州洛杉矶

3.纽约大学温斯洛普医院,纽约米尼奥拉,美国

4加州大学洛杉矶分校计算机系,美国加州洛杉矶

5美国加州大学欧文分校医学系

6加州大学预测技术研究所,加州欧文,美国

通讯作者:

Sean D Young博士

医学系

加州大学欧文分校

城市大道西333号,640室

橙色,

美国

电话:1 310 456 5239

电子邮件:syoung5@uci.edu


背景:社交媒体数据可以作为检测睡眠不足的工具。第一学期的一年级本科生被邀请佩戴睡眠追踪设备(基础;英特尔),让我们在Twitter上关注他们,并完成关于他们睡眠的每周调查。

摘要目的:这项研究旨在确定社交媒体数据是否可以用于监测睡眠剥夺。

方法:从该设备获得的睡眠数据被用于创建一个疲劳模型,该模型有助于在发布时将推文标记为睡眠不足或没有。标记数据用于训练和测试门控循环单元(GRU)神经网络,以确定研究参与者在发布时是否睡眠不足。

结果:GRU神经网络的结果表明,可以将推文作者的睡眠剥夺状态分类为曲线下的平均面积为0.68。

结论:利用社交媒体来识别学生睡眠不足是可行的。该研究结果进一步表明,应进一步探索社交媒体数据作为监测健康的潜在来源。

中国医药卫生杂志2019;6(12):e13076

doi: 10.2196/13076

关键字



背景

每晚睡眠不足7小时(即睡眠不足)与许多公共健康问题有关,包括血压升高、体重增加、糖耐量受损、2型糖尿病、焦虑水平增加和心血管疾病[1-6].睡眠质量差还会导致认知和运动能力不足,从而导致车祸。7],飞机失事[89],以及医疗差错[10].不幸的是,从1985年到2012年,睡眠剥夺的患病率增加了31% (31/100)[11].2014年,34.8%(348/1000)的美国成年人在24小时内平均睡眠时间不超过6小时[12].

由于测量工具有限,睡眠剥夺很难测量。由于很难招募参与者在睡眠实验室长时间睡眠以进行客观研究,大多数睡眠研究通常使用带有主观偏见的自我报告项目[1314].例如,根据行为风险因素监测系统,在2009-2010年期间,估计每25名成年司机(18岁或以上)中就有一人报告在过去30天内驾驶时睡着,这表明自我疲劳报告的局限性,因为人们没有意识到自己的疲劳状态或疲劳对其表现的影响[1516].虽然活动记录仪和家庭多导睡眠记录仪等更客观的技术进步可用于研究,但在大型流行病学和现实环境中应用这些研究级设备存在局限性。因此,需要新的方法和工具来帮助确定一个人是否睡眠不足以及何时睡眠不足。

消费者可穿戴智能手表和社交媒体或许可以作为一种易于整合、更客观的衡量标准,来监测人们是否睡眠不足。17].与研究级的睡眠跟踪设备不同,消费者可穿戴设备有潜力以一种不引人注目的方式监测睡眠,因为消费者在日常生活中自然会佩戴它们。然而,可穿戴设备的一个局限性是,人们经常选择不戴它们,从而降低了获取睡眠跟踪数据的能力。

此外,人们可以使用手机来跟踪他们的睡眠;然而,许多手机睡眠应用程序要想成功工作,手机必须整晚都躺在床上进行测量,床上只能有一个人,而且手机必须有足够的电量来运行应用程序一整晚。因此,社交媒体被发现是一种有用的远程监控行为的工具,它可能能够解决这一限制,并被用作额外的睡眠监控工具。例如,研究人员已经证明,可以在Facebook和Twitter等社交媒体网站上挖掘文本数据,以监测和预测健康结果,如食源性疾病、流感爆发和艾滋病毒[18-20.],并监察健康行为[21-25].社交媒体文本也可以被类似地挖掘和研究,以监测睡眠不足。

此外,研究表明,语言技能似乎受到睡眠不足的影响,这进一步支持了我们的假设,即社交媒体文本数据可以用来识别睡眠不足。26].例如,哈里森和霍恩表明,睡眠不足的人在执行单词联想任务时产生的单词更少,使用的新奇单词联想也更少[27].因此,有人假设语言特征可以被动地、非直接地表征作者在创作文本时的疲劳状态。

客观的

这项研究旨在确定整合可穿戴智能手表和社交媒体来监测和验证大学一年级学生睡眠不足的可行性。我们进一步探索了可穿戴设备数据和社交媒体数据是否可以用作远程监控的工具疲劳.我们假设,学生在睡眠不足时和没有睡眠不足时发推文的方式不同,因此推文数据可以用作识别学生睡眠不足的方法。我们的方法利用了机器学习在睡眠剥夺中的使用,以及数字通信中的语言特征[27].机器学习算法已应用于多个健康领域[20.];然而,这些方法此前尚未应用于睡眠研究。


研究和参与者

2015年10月至12月,加州大学洛杉矶分校(UCLA)的197名一年级本科生报名参加了一项旨在分析大学本科生睡眠和压力模式的研究。这项研究的目标是学生,因为他们是一个方便的样本,并将提供必要的数据;94.1%(941/1000)大学生使用社交网站[28],大学生平均每天花在各种手机活动上的时间为94.6分钟,如查看社交媒体网络、发短信、收发电子邮件[29].

为了符合这项研究的资格,学生必须满足以下标准:年龄在18岁或以上,年龄在21岁以下,是加州大学洛杉矶分校的一年级或一年级转校生,在加州大学洛杉矶分校的第一学期,每周至少在Twitter上发布3条帖子。学生们自我报告这些标准,然后研究助理通过他们的学生证验证他们的学生身份,并通过访问他们的Twitter资料验证他们使用Twitter的情况。在研究过程中,参与者允许我们在推特上关注他们,收集他们的推文。受试者每完成一项调查可获得5美元,如果所有调查都在一个月内完成,则可额外获得5美元。研究结束后,这笔钱以亚马逊礼品卡的形式发放给了学生。加州大学洛杉矶分校的机构审查委员会批准了这项研究方案。

学生们被要求佩戴英特尔基础睡眠监测设备,允许我们在推特上关注他们,每周完成基于网络的自我评估心理和睡眠健康的调查,包括睡眠质量、那一周的压力源、处理这些压力源的能力以及他们的情绪。由于睡眠不足的主观性质[30.,临床和科学界已经使用了几种量表来澄清睡眠剥夺的定义。这些调查通过对前一周和前一晚的睡眠质量进行李克特5分制评估,分为非常差、很差、一般、良好和非常好。在最初报名参加这项研究的197名学生中,有86名学生至少发过一次推特,至少做过一次调查,并在他们的智能腕带上至少读过一次。然而,在整个研究过程中,只有64名学生每周都在推特上发帖。所有86条学生推文都有17,889个独特单词,其中平均单词(包括url、标签和提及)长度为10.023 (SD 6.416)。

最后,使用Twitter代表性状态转移应用程序接口收集参与者参与研究时的推文。

数据分类

这项研究的目的是利用推特数据创建一个模型,以分类一条推文是否由一个在发布推文时睡眠不足的人发出。为了实现这一目标,我们首先必须开发一种数据处理方法,以适当地标记每条推文,以确定作者在发布推文时是否处于睡眠状态。然后,必须训练一个模型将这些推文分类到正确的类别。

数据预处理

的概念疲劳这是一个复杂的概念,它在一天中起伏不定,取决于各种因素,比如前一天晚上的睡眠时间。英特尔基础带提供了分钟级的睡眠跟踪数据,使我们能够使用它来估计一个人一天中有多累的初始模型。根据Pressman的工作[31,我们将睡眠不足定义为24小时内睡眠少于6小时。

睡眠标记算法是基于一个简单的线性模型(f(x)=mx+b)创建的,其中每一行的开始都从A的结束开始新的一天睡眠.一个新的一天睡眠指从一天开始到第二天结束的睡眠时长,或者从前一天睡眠结束后的第二天开始。所有在新一天内的午睡时间加上新一天的睡眠总时间被结合起来,以估计新一天睡眠后的总睡眠时间。因此,一个学生在新一天的睡眠结束时总睡眠时间超过6小时(360分钟),他的一天开始时的疲劳水平(TL)为零。这个重置是基于Pressman的[31]的睡眠剥夺研究,是对现实世界疲劳模型的简化;然而,我们的方法将证明足以满足我们的需要。任何其他少于6小时的睡眠时间都以360-γ开始,其中γ代表学生的总睡眠时间(以分钟为单位)。因此,确定新一天睡眠后最小TL的方程为max (360-γ,0)。

一个简单的线性模型被用来描述一个人的认知能力,因为一个人越来越缺乏睡眠。使用这种模型是因为Dawson和Reid [32]显示了一个人在一段时间内的认知表现的一种线性偏离形式,在16小时内,相当于一个血液酒精含量为0.02克/分升的人的表现,而0.02克/分升的血液酒精含量高于美国加利福尼亚州对21岁以下人群的血液酒精含量限制。最后,睡眠剥夺的TL阈值被认为是360,因为如果一个人获得了最少的睡眠量(即1分钟的睡眠),那么他们将从最大TL开始,并被认为是睡眠剥夺(SLD)。因此,每一个线段的斜率都是m=(maxTL最小值TL) / (t道防线- t之后),其中MaxTL在一个完美的新一天睡眠后,受试者清醒超过16小时后的最大TL是多少TL在完美的新一天睡眠后的最低TL是多少道防线一个人在充足的睡眠后,需要多少时间(以分钟为单位)才会睡眠不足之后是指从新的一天的睡眠开始到现在所经过的时间,以分钟为单位。的最小值TL经过一个完美的夜晚的睡眠将永远是零。此外,一个人醒来后的时间也永远为零。因此,每一个线段的斜率都是m=(maxTL最小值TL) / (t道防线-twake) = 360 /(16 * 60) = 3/8。

例如,如图1在美国,一个学生每天睡足7个小时。由于这个睡眠是第一个睡眠,我们假设它是第一个睡眠新的一天在学生早上07:00醒来时睡觉并开始疲劳模型的线性分段。学生首晚睡眠时间为7小时(420分钟);因此,f(x)=(3/8) x+b的y截距变量为max(360-420,0)=0。16个小时后,学生被认为睡眠不足,直到他们再次入睡,在这个例子中,大约发生在23:00到00:00之间。

图1。这显示了一个数值模型的例子,一个学生的疲劳一整天。为了在任何一分钟内给学生的推文贴上标签,研究人员创建了一个简单的疲劳模型,以帮助定义一个帖子的作者什么时候睡眠不足,什么时候睡眠充足。如果一条推文是在一个人处于睡眠剥夺状态时发布的(在线性段高于360的疲劳水平的时间内),这些推文被标记为睡眠剥夺,而所有其他推文都被标记为睡眠充足。
查看此图

在学生睡眠不足期间的任何推文都将被标记为睡眠被剥夺,而所有发生在07:00到23:00之间的推文将被标记为睡眠充足

学生的下一个睡眠阶段开始于学生从最后一个新一天的睡眠中醒来的第二天。因此,本例中显示的第二个睡眠时段被认为是新一天的睡眠。在这个例子中,学生只睡了4个小时(240分钟),因此f(x)=(3/8) x+b的y截距变量是max(360-240,0)=120。该学生当晚睡眠不足,所以他们在13:30左右小睡了大约1.5个小时。由于这种睡眠不是在最后一次新一天睡眠发生后的第二天开始的,也不是在第二天结束的,所以这段休息时间被认为是小睡,并将添加到接下来的新一天睡眠中。

因此,根据我们的定义,这个学生被剥夺睡眠的时间是在14:40到第二天03:00之间,这时学生开始了下一个新的一天的睡眠。该学生在此期间的任何推文都会被标记为睡眠被剥夺

数据分类模型

在数据被标记后,我们可以使用监督模型来根据学生的推特帖子来分类他们是否睡眠不足。在所有监督方法中,门控循环单元(GRU) [33],是一种循环神经网络,基于其将张量作为输入的能力对推文进行分类,并在最终分类器的计算中考虑单词的顺序[34].与其他监督方法相比,GRU的这些关键独特特征有助于该模型证明其优越的性能。

对于大多数监督方法,输入必须是域中的矩阵nxm.最初,本研究在定义域中创建了一个输入矩阵nxm其中,每行表示一条tweet,行中的每个元素(即单词)由单词袋方法表示。单词袋模型计算术语的频率,不考虑单词的顺序或它们与其他单词在意义上的相似性。因此,为了在保持单词顺序的同时增加单词含义的对应关系,将输入矩阵扩展为一个输入张量。类似于定义域中的输入矩阵nxm,每一行代表一条tweet。但是,与单词的词袋词频表示不同,每个单词都由单词向量表示,并且保持了句子中单词的顺序。因此,输入由定义域中的张量I表示δxκξ其中δ是推文的数量,κ是数据集中所有帖子的最大推文长度,ξ是所使用的词向量的长度加3。额外的3是考虑帖子的时间、帖子的情绪和帖子整数的主观性对词向量的连接(见图2).

图2。每个维度的输入张量描述。输入张量的每一行代表一条推文,而张量的每一列是推文中的一个单词(不包括停止词或非英语字符)。最后,第三个维度是一个词的数字向量表示,该词与推文的情感、推文的主观性和推文发布的时间相关联。
查看此图

为了进一步说明,输入矩阵I的每一行都表示一条没有停顿词的tweet(即没有任何意义的词,例如而且一个)和非英语字符,该推文中的每个单词都由一个连续词袋(CBOW)词向量[35沿着第三维度延伸(参见图3).第三维度的下一层是情绪极性,其中范围(0,+1)是积极的推文,(−1,0)是消极的推文,0是中性的推文。此外,下一层是tweet的主观性,范围从0到1,其中0是非常客观的,1是非常主观的。使用TextBlob情感分析库[36].最后一层,即第三个维度,是以24小时表示的推文的小时。最后,如果一条tweet的字数小于κ,那么该行的其余部分将用0填充。

图3。示例推文转换为表示输入张量二维的矩阵格式。这个例子将表示我们输入张量中标记为tweet的部分k图2.停止词(即没有意义的单词,如The和a)被删除,因此只剩下三个单词。每个单词都有一个与它相关联的单词向量,这个词向量来自一个经过训练的连续单词袋模型。最后,词向量表示与整体推文特征相连接:情感极性、主观性和发帖时间。
查看此图

实验设置与数据

本研究中的所有推文都是从加州大学洛杉矶分校一年级学生的研究中收集的,并使用从他们的基频带数据创建的简单线性模型进行标记(在数据预处理小节中进行了描述)。加州大学洛杉矶分校一年级学生推特上的每个单词都与一个单词向量相关联;然而,新生的Twitter数据集不够大,无法创建语义准确的词向量表示。因此,所有的词向量都是在加州大学欧文分校的一个更大的Twitter数据集上训练的。37],历时7个月,包含7.2亿条推文,66亿单词,390万独立单词。词向量使用CBOW Word2Vec算法训练,维数为100,窗口长度为5。此外,出现次数少于5次的罕见词也被删除。

分类算法有18,394条加州大学洛杉矶分校新生的推文,其中8,068条是睡眠不足的推文,10,326条是睡眠充足的推文。除去西班牙语和英语停顿词后,最大句子长度为34个。训练/验证和测试数据集被分成90/10,训练和验证数据集从前一个90分成另一个90/10。最后,出于泛化目的,GRU的稠密层的dropout率为0.5。

为了避免对推文进行错误分类,研究人员假设参与者必须在第二天最后一次睡眠的28小时内入睡。28小时的门槛是根据2017年研究生医学教育认证委员会对最大轮班长度的规定确定的。这个阈值似乎是合理的,因为有研究为医科学生设定了这个阈值,并且假设大一新生保持清醒的时间(即使只是小睡15分钟)不会超过这个最大轮班时间。因此,如果传感器显示一个学生保持清醒超过28小时,这个学生就显示出数据丢失的迹象,并且在28小时之后和下一次新的睡眠之前的每一条推文都会从数据集中删除。

实验结果

最终的成功度量是使用接受者工作特征曲线(AUC)下的面积来计算的,以获得不平衡数据集的公平比较,其中0.5是一个与随机一样好的性能度量。在上述参数下,GRU的效果最好,平均AUC为0.68,SD为0.003。这一结果表明,仅根据学生的推特帖子就有可能确定他们是否睡眠不足。


主要研究结果

研究结果表明,整合可穿戴设备数据和社交媒体数据来监测睡眠剥夺是可行的。

我们从这项研究中确定了两个关键点。首先,为了让研究人员能够使用可穿戴设备作为监测疲劳的方法,需要创建可以使用可穿戴设备监测睡眠质量和数量的模型,以确定一个人何时处于高TL,被认为是睡眠剥夺。据我们所知,目前还没有跟踪一个人的实时疲劳水平的数值模型,因此缺乏确定一个人何时睡眠不足的基本事实。本研究使用基于学生英特尔基频带数据的简单线性模型来定义疲劳,为学生的推文创建数据标签。未来的研究人员可以在这一尝试的基础上建立疲劳模型,以更准确地识别tl。

这项研究是首次整合多种远程数据来源的研究之一,包括社交媒体、基于网络的自我报告调查和英特尔基频带数据。我们整合了这些不同的数据源,开发了一个疲劳模型,并通过社交媒体等非传感器设备被动监测睡眠剥夺情况。研究结果表明,使用可穿戴智能手表和社交媒体(如Twitter)数据监测大学生睡眠不足的情况是可行的。我们发现,在我们的研究中,我们能够训练和测试一个使用推特数据的模型,并可以通过睡眠监测设备来预测学生的客观睡眠水平。因此,由于社交媒体的普及和预测结果的准确性,一种评估全球睡眠充足和剥夺的新技术已经出现。

局限性和未来工作

虽然我们早期的结果看起来很有希望,但这项研究也有局限性。首先,由于要求参与的学生必须佩戴睡眠跟踪设备,进行网络调查,每周至少发3次推特,因此这项试点可行性研究的最终样本量限制在197名新生中的86人。其次,数据只记录在秋季学期,从而限制了这个分类模型的特定人口在特定的时间窗口。在未来,研究可以将这项工作扩展到包括整个学年和其他几所大学,以获得更广泛的睡眠剥夺结果。

此外,我们认识到学生群体有不同的行为和相关的睡眠因素(例如,感觉需要熬夜为考试学习),这些因素对疲劳和睡眠剥夺的影响与其他职业不同,从而降低了将这些发现推广到所有人群和人群的能力。

这项研究的另一个局限性是,我们使用Twitter作为唯一的社交媒体平台。参与者经过筛选,包括那些经常使用Twitter的人,因为Twitter是建模研究中经常使用的数据源。人们使用推特的方式可能与使用Instagram或Facebook的方式不同,所以可能会有睡眠不足的迹象被忽略,因为这项研究没有使用其他社交媒体平台。这个问题可以在未来的研究中进行研究,并已添加为未来研究的建议。

研究还指出,有可能学生改变了他们的推特行为,因为他们知道被观察。因此,这项研究的另一个局限性是,我们没有办法知道一个学生是否会根据观察改变他们的语言;因此,假定语言没有改变。睡眠不足和充足的语言在被观察或不被观察时是如何变化的,这一研究留给了未来的研究。

此外,在验证设备和确定其平均误差方面需要进行更多的研究,因为我们使用的是提供给我们的波段,而没有进行验证方法来评估每个波段读数的准确性。此外,没有可用的指标来确定一个人在一天中的每一分钟有多累;因此,我们创建了一个简单的模型,根据学生前一天晚上的睡眠情况来最好地定义他们的疲劳程度。该模型通过数值模型对睡眠剥夺期的粗略近似限制了分类模型的准确性。同样,睡眠不足是主观的(即人们需要不同程度的睡眠),因此很难客观地评估睡眠不足。为了解决这一问题,我们试图通过将一周一晚或更少的可穿戴(客观)数据与每周调查(主观)测量相对应,询问学生前一天晚上的睡眠情况,来验证研究参与者的数据。未来的研究可以建立和改进这些方法,以实现更准确的分类。

最后,数值模型仅限于只包括睡眠量,以确定学生早上开始的疲劳/睡眠剥夺水平。这个模型可以通过结合睡眠质量、饮料类型和全天摄入的食物来进一步改进;所服用药物的种类;运动持续时间和输入模型。为了确定学生一天开始时的疲劳程度,可以使用智能可穿戴设备捕获的数据对睡眠质量进行定量测量。研究表明,睡眠中被打断的次数和每个睡眠阶段在夜间所占的百分比决定了睡眠质量。38].然而,需要进行更多的研究来对睡眠质量进行数值模拟,并确定它如何影响全天的TL方差。

结论

这项试点研究表明:(1)通过智能腕带设备模拟学生一天中的睡眠时间;(2)根据学生的社交媒体行为确定他们是否睡眠不足。未来的研究应进一步探索整合多个数据源来监测疲劳的实时变化。

致谢

这项研究由加州大学总统办公室、国家心理健康研究所和国家过敏和传染病研究所资助。所使用的可穿戴健身和睡眠追踪设备由英特尔基金会捐赠。作者要感谢Jonathan Lee、Bridget Williams和Emma Zorensky对这项研究的支持。

利益冲突

没有宣布。

  1. 刘勇,惠顿AG,查普曼DP,坎宁安TJ,卢华,克罗夫特JB。成年人健康睡眠时间的患病率——美国,2014年。MMWR Morb Mortal Wkly Rep 2016 Feb 19;65(6):137-141 [免费全文] [CrossRef] [Medline
  2. van Cauter E, Knutson KL.睡眠与儿童和成人肥胖的流行。欧洲内分泌杂志2008年12月;159(增刊1):S59-S66 [免费全文] [CrossRef] [Medline
  3. Mullington JM, Haack M, Toth M, Serrador JM, Meier-Ewert HK。睡眠不足对心血管、炎症和代谢的影响。心血管疾病进展2009;51(4):294-302 [免费全文] [CrossRef] [Medline
  4. 张志刚,张志刚,张志刚。睡眠时间与心血管疾病的相关性研究。Curr Cardiol Rev 2010 Feb;6(1):54-61 [免费全文] [CrossRef] [Medline
  5. 皮雷GN, Bezerra AG, Tufik S, Andersen ML.急性睡眠剥夺对状态焦虑水平的影响:系统回顾和荟萃分析。睡眠医学2016年8月;24:109-118。[CrossRef] [Medline
  6. Spiegel K, Knutson K, Leproult R, Tasali E, van Cauter E.睡眠不足:胰岛素抵抗和2型糖尿病的新危险因素。应用物理学报(英文版)(1985)2005 11月;99(5):2008-2019。[CrossRef] [Medline
  7. 美国交通部,国家公路交通安全管理局。CrashStats - NHTSA - DOT。2008年7月全国机动车事故原因调查:提交给国会的报告https://crashstats.nhtsa.dot.gov/Api/Public/ViewPublication/811059[2019-11-04]访问
  8. 联邦航空管理局,2014年7月18日。NASA控制器疲劳评估报告网址:https://www.faa.gov/data_research/research/media/nasa_controller_fatigue_assessment_report.pdf[2019-11-04]访问
  9. 调查空中交通管制专家对调度规则的看法。中田纳西州立大学基础与应用科学学院的一篇论文,部分满足航空管理理学硕士学位的要求。默弗里斯伯勒,田纳西州:硕士论文,中田纳西州立大学;2015.
  10. Rogers AE, Hwang W, Scott LD, Aiken LH, Dinges DF。医院护士的工作时间与病人安全。卫生Aff (Millwood) 2004;23(4):202-212。[CrossRef] [Medline
  11. 福特ES,坎宁安TJ,克罗夫特JB。1985年至2012年美国成年人自我报告的睡眠时间趋势。睡眠2015年5月1日;38(5):829-832 [免费全文] [CrossRef] [Medline
  12. 刘勇,惠顿AG, Chapman DP, Cunningham TJ,华林,Croft JB。成年人健康睡眠时间的流行情况——美国,2014年。MMWR Morb Mortal Wkly Rep 2016 Feb 19;65(6):137-141 [免费全文
  13. Buysse DJ, Reynolds CF, Monk TH, Berman SR, Kupfer DJ。匹兹堡睡眠质量指数:精神病学实践和研究的新工具。精神病学杂志1989年5月;28(2):193-213。[CrossRef] [Medline
  14. Dewald JF, Meijer AM, Oort FJ, Kerkhof GA, Bögels SM。睡眠质量、睡眠时间和嗜睡对儿童和青少年学业表现的影响:一项元分析综述。Sleep Med Rev 2010 Jun;14(3):179-189。[CrossRef] [Medline
  15. Wheaton A, Chapman D, Presley-Cantrell L, Croft J, Roehler D.疲劳驾驶- 19个州和哥伦比亚特区,2009-2010。MMWR Morb Mortal Wkly Rep 2013年1月4日;61(51 & 52):1033-1037 [免费全文
  16. Wheaton A, Shults R, Chapman D, Ford E, Croft J.昏昏欲睡驾驶和危险行为- 10个州和波多黎各,2011-2012。MMWR Morb Mortal Wkly Rep 2014年7月4日;63(26):557-562 [免费全文
  17. Ferrie JE, Kumari M, Salo P, Singh-Manoux A, Kivimäki M.睡眠流行病学——一个快速发展的领域。国际流行病学杂志2011年12月;40(6):1431-1437 [免费全文] [CrossRef] [Medline
  18. 丘纳拉R,安德鲁斯JR,布朗斯坦JS。社会媒体和新闻媒体能够在2010年海地霍乱爆发早期估计流行病学模式。中国热带医学杂志2012年1月;86(1):39-45 [免费全文] [CrossRef] [Medline
  19. A先生,Segre上午,Polgreen下午。在甲型H1N1流感大流行期间,美国使用Twitter追踪疾病活动水平和公众关注。PLoS One 2011年5月4日;6(5):e19467 [免费全文] [CrossRef] [Medline
  20. Young SD, Yu W, Wang W.朝着自动化HIV识别:机器学习用于快速识别HIV相关社交媒体数据。J Acquir Immune deficiency Syndr 2017 Feb 1;74(增刊2):S128-S131 [免费全文] [CrossRef] [Medline
  21. McClellan C, Ali MM, Mutter R, Kroutil L, Landwehr J.使用社交媒体监测心理健康讨论——来自Twitter的证据。美国医学杂志2017年5月1日;24(3):496-502。[CrossRef] [Medline
  22. Fisichella M, Stewart A, Cuzzocrea A, Denecke K.在社交网络上检测健康事件以实现流行病情报。见:第18届字符串处理和信息检索国际会议论文集。2011年发表于:SPIRE'11;2011年10月17日至21日;意大利比萨,p. 87-103网址:https://doi.org/10.1007/978-3-642-24583-1_10
  23. 李志强,李志强,李志强。基于多语言事件提取的传染病检测方法。2015年10月;65(2):131-143。[CrossRef] [Medline
  24. Culotta A.通过分析Twitter信息来检测流感流行。见:第一届社会媒体分析研讨会论文集。2010年发表于:SOMA'10;2010年7月25-28日;华盛顿特区p. 115-122网址:https://doi.org/10.1145/1964858.1964874CrossRef
  25. Aramaki E, Maskawa S, Morita M. Twitter捕捉流感:使用Twitter检测流感流行。在:自然语言处理经验方法会议论文集。2011年发表于:EMNLP'11;2011年7月27-31日;爱丁堡,苏格兰,英国p. 1568-1576网址:https://www.aclweb.org/anthology/D11-1145
  26. 奥德勒-杜索,布拉德利,JL,皮尔彻,JJ。在睡眠剥夺条件下对持续表现影响的主观感知。生物钟杂志2010年1月;27(2):318-333。[CrossRef] [Medline
  27. 哈里森Y,霍恩JA。睡眠不足会影响短小新颖的语言任务。中华医学会睡眠科学杂志,1998年6月;7(2):95-100 [免费全文] [CrossRef] [Medline
  28. Smith S, Caruso J. Anita Crawley. 2010年10月,大学生和信息技术的ECAR研究,2010http://anitacrawley.net/Resources/Reports/ECAR%20study%20highlights.pdf[2019-11-04]访问
  29. 罗伯茨JA, Yaya LH, Manolis C.隐形成瘾:男女大学生的手机活动和成瘾。《行为成瘾》杂志2014年12月;3(4):254-265 [免费全文] [CrossRef] [Medline
  30. Harvey AG, Stinson K, Whitaker KL, Moskovitz D, Virk H.睡眠质量的主观意义:有和没有失眠的个体的比较。睡眠2008年3月31日(3):383-393 [免费全文] [CrossRef] [Medline
  31. 记者某某先生。2011.睡眠剥夺的定义和后果https://somepomed.org/articulos/contents/mobipreview.htm?11/34/11823/abstract/14[已访问2017-05-05][WebCite缓存
  32. 道森D,里德k,疲劳,酒精和行为障碍。自然杂志1997年7月17日;388(6639):235。[CrossRef] [Medline
  33. 赵K, Bahdanau D, Bougares F, Schwenk H, Bengio Y.基于RNN编码器-解码器的统计机器翻译学习短语表示。在:2014年自然语言处理经验方法会议论文集。2014年发表于:EMNLP'14;2014年10月26-28日;卡塔尔多哈,邮编1724-1734https://doi.org/10.3115/v1/D14-1179CrossRef
  34. Goodfellow I, Bengio Y, Courville A.深度学习。剑桥:麻省理工学院出版社;2016.
  35. 陈凯,陈志强,陈志强。基于向量空间的词表示估计算法。arXiv 2013年1月16日[免费全文
  36. Loria S. GitHub。TextBlob URL:https://github.com/sloria/TextBlob[已访问2017-05-05][WebCite缓存
  37. 贾军,李超,张旭,李超,Carey MJ,苏姗。基于10亿条推文的交互式分析和可视化。见:第24届ACM SIGSPATIAL地理信息系统国际会议论文集,2016年,SIGSPACIAL'16;2016年10月31日- 11月3日;加州伯林盖姆网址:http://doi.acm.org/10.1145/2996913.2996923CrossRef
  38. 马丁SE,幽灵PK,迪瑞IJ,道格拉斯NJ。不可见的睡眠碎片对白天功能的影响。美国呼吸急救医学1997年5月;155(5):1596-1601。[CrossRef] [Medline


AUC:接收机工作特性曲线下面积
CBOW:连续的单词袋
格勒乌:门控循环装置
道防线:睡眠被剥夺
TL:疲劳程度
加州大学洛杉矶分校:加州大学洛杉矶分校


编辑:J Torous;提交10.12.18;同行评议:BM Kyaw, A Davoudi;对作者11.01.19的评论;修订本于04.03.19收到;接受22.03.19;发表06.12.19

版权

©Sara Melvin, Amanda Jamal, Kaitlyn Hill, Wei Wang, Sean D Young。最初发表于JMIR心理健康(http://mental.www.mybigtv.com), 2019年12月6日。

这是一篇开放获取的文章,根据创作共用署名许可协议(https://creativecommons.org/licenses/by/4.0/)的条款发布,允许在任何媒介上不受限制地使用、分发和复制,前提是正确引用了首次发表在JMIR精神健康杂志上的原创作品。必须包括完整的书目信息,http://mental.www.mybigtv.com/上的原始出版物的链接,以及此版权和许可信息。


Baidu
map