这是一篇开放获取的文章,根据创作共用署名许可协议(http://creativecommons.org/licenses/by/2.0/)发布,该协议允许在任何媒体上不受限制地使用、分发和复制,前提是要正确引用最初发表在《医学互联网研究杂志》上的原始作品。必须包括完整的书目信息,//www.mybigtv.com/上的原始出版物链接,以及版权和许可信息。
失眠等睡眠问题影响着超过5000万美国人,并可能导致严重的健康问题,包括抑郁和肥胖,还可能增加受伤的风险。像Twitter这样的社交媒体平台在研究和识别疾病和社会现象方面提供了令人兴奋的潜力。
我们的目的是确定社交媒体是否可以作为一种方法来进行关注睡眠问题的研究。
Twitter帖子被收集和整理,以确定用户是否表现出睡眠问题的迹象,根据推文中出现的几个关键词,如失眠、“睡不着”、安必恩等。推文中包含任何关键词的用户被指定为有自我识别的睡眠问题(睡眠组)。没有自认有睡眠问题的用户(非睡眠组)是从不包含用于代表睡眠问题的预定义单词或短语的推特中选择的。
收集了推文数量、好友、关注者、位置等用户数据,以及推文的时间和日期。此外,我们还确定了每条推文的情绪和每个用户的平均情绪,以调查不睡觉组和睡觉组之间的差异。研究发现,睡眠组的用户在Twitter上的活跃度明显较低(
我们已经展示了一种研究睡眠问题的新方法,它可以快速、经济、可定制地收集数据。
2006年,美国有5000万至7000万成年人存在慢性睡眠或清醒问题,这一趋势正在增加,超过35%的成年人报告睡眠不足[
几十年来,对睡眠问题的兴趣产生了广泛的研究和调查方法。除了美国国家睡眠基金会等私人组织进行的研究和调查外,美国疾病控制和预防中心(CDC)通过行为风险因素监测系统(BRFSS),每年对美国非监禁人口进行调查,涉及多种类型的健康和风险因素。从2009年开始,BRFSS已经包含了一个专门处理睡眠问题的模块[
我们感兴趣的是,有潜在睡眠问题的人与Twitter互动的方式,是否可以用作识别和描述这些人的一种方法。近年来,人们对利用Facebook和Twitter等社交媒体网站产生的大量数据非常感兴趣,试图收集对公共卫生感兴趣的主题的见解,这些平台越来越被认为是有价值的患者信息来源[
我们很想知道在Twitter上发布睡眠问题帖子的人是否比没有的人更活跃,或者他们是否有更多的朋友或关注者。此外,我们还想知道,讨论睡眠问题的人是否在传统的睡眠时间发帖更多,这是否表明他们可能有睡眠困难。此外,我们还对表现出潜在睡眠问题的用户与他们所发推文的情绪之间的关系感兴趣,以此作为探索睡眠问题对情绪、感觉和态度的影响的一种手段。
在这项研究中,发布在推特上的信息被用来识别那些可能表现出自我描述的睡眠相关问题的迹象或症状的人。通过检查推文的内容,将推文中包含特定睡眠相关关键词的用户与不包含这些关键词的随机人群进行比较。然后,我们研究了这些群体在Twitter上的活动是否存在可观察到的差异。
Twitter是一个在线微博网站,用户在这里发布的状态不超过140个字符。它在全球拥有约2.55亿的月活跃用户,其中33%居住在美国[
在推特中提到与睡眠或睡眠问题相关的预定义关键词的推特用户(睡眠组)与推特中不包含预定义关键词的推特用户(非睡眠组)进行比较。从2014年1月7日开始,到2014年4月30日结束,睡眠组推文是根据推文中出现的关键词进行识别的,并以“最近的推文”为基础进行检查和管理。也就是说,在每次筛选过程中,首先分析最近发布到Twitter上的推文。
为了构建睡眠组和非睡眠组用户的语料库,编写了访问Twitter API的代码,该API每15分钟搜索Twitter,查找包含以下任何关键字的所有新tweet:“睡不着”、“失眠”、“褪黑素”、“安必恩”、“安必恩-cr”、“唑吡坦”、“鲁妮斯塔”、“Intermezzo”、“曲扎酮”、“eszopiclone”、“#团队睡眠”和“#睡不着”(注意,“#”是推特标签的符号,表示推特中用户识别的主题,而“团队睡眠”是用户创建的标签,经常被那些宣称自己睡不着的人使用)。通过咨询睡眠相关研究领域的专家,以及实验性地查询Twitter数据库,研究哪些词汇最常被使用,Twitter搜索词列表得以确定。通过包含与特定药物相关的关键词和标签(如唑吡坦、Intermezzo、eszopiclone),我们旨在收集我们非常确信与某种睡眠问题相关的推文,即使收集到的数量很少。相比之下,通过包含更广泛的关键词和标签(睡眠、疲劳、失眠等),我们希望收集大量的推文,但并不是所有的推文都严格相关。由于研究中包含的所有推文都是人工筛选的,在更通用的关键词下收集的推文的低特异性不是问题。这并不是对所有可能的搜索词进行详尽的搜索,而是一种探索性的方法,以测试这种类型的分析的效用。
为了评估真实性并确保它们符合睡眠组的纳入标准,包含一个或多个这些关键字的推文由一个人(DM)手动筛选,寻找以下属性。要被纳入睡眠组推文,一条推文(以及与之相关的推特账户)(1)必须是英文的(在用户设置中选择),(2)似乎来自美国境内,(3)属于一个“普通”人(即,不是公司/公司、名人或垃圾邮件账户),(4)不是“转发推文”(转发最初由不同用户发布的推文)。转发被删除是因为我们只对我们收集信息的个人的经历和感受感兴趣,而对其他人的感受不感兴趣。如果用户定义的位置设置为美国位置,或者根据用户的个人资料信息和以前的帖子的性质,该帐户似乎位于美国,则定性地确定Twitter帐户位于美国境内。此外,还对推文进行了检查,以确保在推文中选择的关键字被用于适当的上下文中。例如,一条写着“刚刚吃了安必恩,希望我今晚能睡得着”的推特会被接受为睡眠群用户,但“我的一个朋友刚刚得到了安必恩的处方”的推特不会被接受,因为它不属于发布推特的人。类似地,对于一个行为或结果是否与写推文的人有关的推文不明确,也不会被视为睡眠组用户。例如,“我吃了安必恩,现在我困了”的推特会被视为睡眠组用户,但“安必恩让你困了”的推特不会被视为睡眠组用户,因为它并不表明这个人吃了安必恩或困了。他们只是在发表一种声明。
通过收集不包含任何预定义关键字的推文,构建了一个潜在的非睡眠组推文的语料库。经过最初的人工筛选,以确保推文和用户是英文的,来自美国,并且是“正常”用户,如果用户在过去10天内的推文中没有包含任何预定义的感兴趣的关键字,则将其添加到非睡眠组;在转发中发现的文本没有被考虑在内。作为一项介绍性和探索性研究,我们选择了10天作为一个天数,这个天数将允许有足够的tweet来为我们的目的提供足够的数据,并且在计算和财务上都是可行的。
推文会在持续的基础上自动收集,管理员会根据“最近的推文”来选择用户进入睡眠组或非睡眠组。也就是说,当策展人登录到策展工具时,最近要收集的tweet就会呈现出来供策展。因此,如果管理员在美国东部时间上午9点管理推文,那么他们将处理符合搜索标准的最近发布的推文。
与用户相关的数据是与用户的Twitter帐户相关的数据,而不是与特定的tweet相关的数据。对于被纳入研究的每个用户,分析中包含的元数据包括推文总数、收藏数(该用户收藏其他用户发布的推文的次数)、关注者总数、好友总数、用户提交的位置、帐户创建日期、用户所在的时区、帐户创建以来每天平均推文数(计算方法为推文总数除以帐户活跃天数)。对于这些收集的变量中的几个,变量的计数在用户帐户的生命周期中也是平均的。这是通过将变量count除以用户活跃的天数来实现的,该天数等于从创建帐户到指定的tweet被写入的天数。通过创建每天平均次数/动作数的数据,一些用户拥有更多的朋友、关注者或状态更新,仅仅是因为他们拥有的Twitter账号比其他一些用户更长。我们还计算了每个用户在Twitter上的关注者与朋友的比例,以创建一种衡量Twitter影响力的方法;较高的关注者:朋友比率表明用户有很多人关注他们的账号,但他们自己关注的人相对较少。这通常是高影响力推特用户的一个指标[
为了确保同时收集所有研究用户的用户数据,用户元数据是在所有推文被识别后收集的,而不是在推文被批准时收集的。这主要是因为与非睡眠组的推文相比,识别睡眠组的推文需要更多的时间。因此,本研究中呈现的用户元数据和tweet数据代表了用户账户截至2014年5月1日的状态。
Tweet数据是与单个Tweet相关的数据,而不是与发布Tweet的用户相关的数据。对于研究中包含的每条推文,分析的推文元数据包括140个字符(最大)的推文文本、推文创建的日期和时间(用通用时间编码,UTC)和推文的地理标记位置(如果可用)。
类似于分析非睡眠组用户前10天的活动来搜索关键字,收集所有用户的附加信息来调查非睡眠组用户与睡眠组用户的推文行为的总体趋势。从人工筛选的原始推文中,从用户的时间轴中收集至少10天以前的推文。该过程继续进行,以便查询Twitter API为给定用户返回200条tweet。如果返回的200条推文少于10天的推文,则重复此过程,直到收集到10天的推文,或者直到Twitter API表明用户没有更多的数据可检索。
对于所有的研究用户,在一天的特定时间(编码为1:午夜5点59分,2:6点-11点59分,3:12点-5点59分,4:6点-11点59分)发布的推文数量以及它们是在一周中的哪一天创建的都是确定的。在此分析中使用的所有tweet时间都从UTC转换为用户的本地时间(基于用户的时区)。虽然用户可能设置了错误的时区,但这是极不可能的,因为这是基于他们的计算机或智能设备的时区。
为了确定睡眠组用户和非睡眠组用户发布推文的情绪差异,使用了亚马逊的土耳其机械(Mechanical Turk, AMT)平台。亚马逊的土耳其机械(Mechanical Turk)是一款在线工具,它可以利用亚马逊雇佣的众多员工的努力,让大型、繁琐的工作快速完成。
为了确保AMT工作人员对推特情绪的评级是可靠的,我们计算了两组工作人员之间的一致性和科恩的kappa值。因为AMT可以为一个项目使用数百个独立的工作人员,我们把精力集中在那些对tweet情绪进行评级的最多产的AMT工作人员上,以获得至少20%的评级工作。
为了研究睡眠组用户和非睡眠组用户之间在高度倾斜分布变量上的差异,采用10000次迭代的再抽样排列分析来研究中值的差异。基于比例的变量,例如用户在一周的某一天发布的推文的比例,通过双尾、两组比例检验在组间进行比较,统计显著性被认为是a
使用PHP(超文本预处理器)编写定制代码来访问Twitter REST API (v1.1),该API利用了开源OAuth库tmhOAuth。推文通过Twitter API作为“状态对象”访问,状态对象是结构化的、json格式的对象,包含关于单个推文和用户的所有元数据。使用GET搜索/tweet请求搜索是否存在关键字。使用GET状态/user_timeline请求收集用户时间线。返回的tweet作为JSON格式的完整状态对象存储在Amazon Web Service (AWS)关系数据库服务(RDS) MySQL数据库中。此外,一些tweet和用户字段存储在单独的MySQL表中,以便更快地访问。后续的分析和数据清理是使用PHP和Python编写的定制脚本完成的。
截至2014年5月1日,在115天内收集并存储在数据库中的睡眠组推文总数为2,820,427条。为每个关键字收集的tweet数报告在
各种失眠或睡眠相关关键词收集的推文数量。一个
关键字 | n | 比例,% |
# TeamNoSleep | 119378年 | 4.23 |
安必恩 | 54420年 | 1.93 |
睡不着 | 1533704年 | 54.38 |
Eszopiclone | 151 | 0.01 |
失眠 | 994049年 | 35.24 |
插曲 | 10145年 | 0.36 |
失眠药Lunesta | 3734年 | 0.13 |
褪黑激素 | 103674年 | 3.68 |
Trazadone | 1149年 | 0.04 |
Zaleplon | 23 | 0.00 |
总计 | 2820427年 | 100.00 |
一个这个列表中每个关键字收集的推文数量代表了每个关键字的不同形式和组合(例如,睡不着包括“睡不着”和“#cantsleep”)以及被转发的推文。一些tweet可能包含多个关键字。
Twitter用户数据。
变量 | 总计 | 每天一个 | |||
的意思是 | 中位数 | 的意思是 | 中位数 | ||
|
|||||
|
Non-sleep集团 | 817 | 777 |
|
|
|
睡眠组 | 1054 | 993 |
|
|
|
|
|
<措施 |
|
|
|
|||||
|
Non-sleep集团 | 1909 | 684 | 4.8 | 1.1 |
|
睡眠组 | 3257 | 1069 | 6.2 | 1.3 |
|
|
|
<措施 |
|
厚 |
|
|||||
|
Non-sleep集团 | 817 | 319 | 5.5 | 0.5 |
|
睡眠组 | 792 | 295 | 1.2 | 0.3 |
|
|
|
。08 |
|
<措施 |
|
|||||
|
Non-sleep集团 | 689 | 318 | 6.4 | 0.5 |
|
睡眠组 | 518 | 295 | 1.3 | 0.3 |
|
|
|
13。 |
|
<措施 |
|
|||||
|
Non-sleep集团 | 1.44 | 1.01 |
|
|
|
睡眠组 | 1.45 | 0.99 |
|
|
|
|
|
0.901 |
|
|
|
|||||
|
Non-sleep集团 | 12609 | 5853 | 22 | 10 |
|
睡眠组 | 15253 | 7622 | 18 | 8 |
|
|
|
<措施 |
|
.04点 |
一个每天的数据是指变量的总数除以用户帐户的活动天数。
按群组在一天中某个时间发布的推文的比例。
|
推文的比例(%)按时间 | |||
|
0:00-5:59 | 6:00-11:59 | 12:00-17:59 | 18:00-23:59 |
Non-sleep集团 | 12.1 | 22.5 | 28.7 | 36.7 |
睡眠组 | 16.8 | 16.3 | 28.6 | 38.1 |
|
<措施 | <措施 | 开市 | <措施 |
睡眠组用户的Twitter账号年龄明显比其他用户大(
对于推文级别的数据,在用户提交的时区数据可用的数据子集上执行每周的天数和每天的时间数据分析。对于所有编译的时间轴推文(n=418,773), 73.5%的用户提交的时区,可以计算特定于时区的日期和时间推文数据。睡眠组和非睡眠组用户在有或没有用户提交的时区信息的比例上有显著差异;76.8%的睡眠组用户透露了他们的时区,而只有64.0%的其他组别用户提供了该数据(
在上午12点至5点59分之间的推文中,大部分来自睡眠组的用户(
AMT计算的情绪评分统计分析显示,睡眠组用户(即那些被识别出有睡眠问题症状的用户)的负面推文情绪明显多于非睡眠组用户(
情绪是通过两名不同员工的平均评分计算出来的。虽然这种方法在AMT情绪分析的文献中被广泛使用,但我们也试图确定工人之间的一致性。对最多产的前10名员工(总共144名员工)计算了同意率和科恩的kappa值,他们总共发布了13170条推文,占所有工作的36个以上。考虑到基于随机概率的同意率,AMT工人同意率为65,而预期同意率为40,kappa值为0.420 (
按用户组划分的每小时发布状态的比例。
按用户组划分的每天发布状态的比例。y轴从10%开始,以便更清楚地显示组间的差异。组间差异均有统计学意义(P<.001)。
这项研究表明,在Twitter上出现睡眠问题迹象的人在社交媒体平台上的活跃程度明显低于其他用户,但他们在传统的睡眠时间发更多的推文,并在他们分享的推文中表现出更多的负面情绪。
尽管在大众媒体上发现了猜测[
睡眠组用户在午夜和凌晨6点发布推文的比例明显更高,这一发现表明我们确定睡眠组的方法是有效的,因为这是大多数正常睡眠模式的人都在睡觉的时间(根据时区调整后)。在没有对所选用户的所有推文进行详细调查的情况下,很难说在午夜至凌晨6点之间发推文的用户是否真的有某种原因(可能是用户上夜班或有其他原因在这段时间内保持清醒),但两组之间差异的显著性表明,用于区分睡眠组和非睡眠组用户的方法是有效的。
这项研究也为失眠和类似睡眠障碍的人可能会增加社会心理问题的风险这一论点提供了介绍性证据。值得注意的是,之前心理学和数据挖掘领域的研究已经成功地利用自动化工具将在线社交媒体使用、负面情绪和抑郁定量联系起来[
鉴于这项研究的性质,有必要简要讨论一下使用Twitter数据进行与心理社会问题有潜在联系的睡眠障碍研究的伦理、法律和社会影响。与其他社交网站不同的是,Twitter是一个微博,它的唯一目的是允许任何人在没有事先批准的情况下查看内容。Twitter使用的隐私政策表明,用户同意收集、传输、操作、存储和公开公开的数据,而每个用户都有能力更改其帐户的隐私设置。这项研究只分析了完全公开的推文(即用户没有选择隐私设置)。因此,用户对隐私没有任何期望。公开的Twitter数据被认为与其他现有的公共数据源一致,由于数据只是被动地综合分析,这种类型的研究通常不被认为属于人类研究的保护范围。然而,积极的数据收集(例如,直接与用户交互)引发了合理的伦理、社会和法律关切,应在适当的谨慎和机构审查委员会的监督下进行。
虽然上述结果表明有必要对这一领域进行进一步研究,但也必须考虑和解释一些潜在的限制。最重要的是,由于该研究的横断面性质,不可能确定社交媒体使用、睡眠问题和心理社会调查结果之间的重要关系的因果关系。此外,还有一些与非睡眠和睡眠组推文管理相关的方法,在进行未来项目时可能需要进行修订。在策展过程中,策展人会看到一些推文,以确定这些推文是否与任何与睡眠相关的障碍有关。候选推文按照推文创建的顺序呈现给策展人,最近发布的推文先于其他推文出现。这种方法不是最佳的,因为策展人正在阅读的推文取决于策展发生的一天中的时间。也就是说,策展人正在处理的推文列表可能与策展人在上午9点和晚上9点工作时看到的推文列表不同。为了避免这种潜在的偏见,未来的分析将涉及从数据库中存储的随机选择的推文中进行策展(因此将每条推文的时间和日期随机化)。虽然这里使用的方法可能会对所选的用户产生潜在的偏见,但它们不应该影响对推文级别数据进行的分析,因为这些分析考虑了用户的所有推文,因此确定属于睡眠组或非睡眠组的推文的时间是无关紧要的。
额外的信息将有助于控制Twitter用户的内在差异。例如,不同年龄、性别或种族的用户使用Twitter的情况可能不同。在未来的研究中,收集这些信息以试图控制这些因素将是有利的。这可以通过估计这些变量的算法来实现,可以通过在更互动的研究中对参与者进行调查,也可以通过跟踪一大批用户在他们自己描述的睡眠问题之前/之后。此外,用户时区信息与tweet的时间(以UTC记录)一起使用,以计算tweet创建的一天中的时间,这是用户提交的变量,因此容易出现潜在的数据不准确性。虽然没有研究调查准确识别的位置字段的比例,但我们怀疑用户很可能会适当地选择他们的时区(这是自愿的)。但是,用户可能会指出一个错误的时区。
非睡眠组用户的定义是,该用户在过去10天的推文中没有预定义的关键字。如上所述,选择这样的时间长度是为了在计算和财务上能够实现,同时仍然能够获得所需的数据量。在未来的研究中,我们打算增加用户的推文中必须不包含这些预定义关键字的时间长度,以便将其纳入非睡眠组。根据可用数据的数量和质量以及涉及的假设类型,这可能需要调查数月、数年,甚至用户的整个推文时间轴,以便确定群组状态。这也将允许我们分析和控制用户帐户历史的特定时间段(例如,帐户创建后的头几个月)。此外,我们可能想进一步描述睡眠组的人群,以确定发帖“睡不着”的用户与发帖“褪黑素”或药物的用户是否不同。这种细粒度特征可能会导致需要独立分析的多个睡眠组。
虽然在这项研究中收集的信息是有趣的,并采取谨慎措施以确保其有效性,但这类数据是观察性的,因此不能假设因果关系。我们发现,在不睡眠的群体和被我们归类为有某种睡眠问题的个体之间存在显著差异;然而,我们不能确定那些符合我们定义的人确实有睡眠问题。这是我们希望在进一步研究中解决的一个重要因素,有可能通过直接与用户交互来帮助确认我们的分类方法。然而,这种方法会引起伦理、社会和法律方面的担忧(如上所述),需要谨慎地实施。
我们还认识到,用户之间可能存在固有的差异,这些差异可以反映在他们的朋友数量、关注者、状态更新频率、位置和其他我们没有考虑到的指标上。在未来的工作中,我们的目标是通过长期跟踪大量用户(在自我描述睡眠问题之前和之后)或使用匹配技术更可靠地比较组来控制这一点。
尽管存在局限性,但这项研究和其他专注于使用社交媒体应用程序解决公共卫生问题的研究表明,这种类型的研究可以为传统方法添加有意义的解释。值得注意的是,虽然我们看到了这些新方法的巨大前景,但它们被设想和设计为与更传统的、高度验证的方法(如BRFSS)一起使用。传统和新兴的收集和分析公共卫生信息和关系的方法各有优缺点。我们希望通过结合这两种类型的研究,我们可以对人口的健康状况获得更完整和准确的看法。
这是首批积极调查社交媒体使用和睡眠问题之间关系的研究之一。研究发现,与没有睡眠问题(基于我们的标准)的用户相比,有明显睡眠问题的人平均而言在Twitter上不太活跃,往往在周末和工作日早期最活跃。此外,我们发现,与其他人相比,有睡眠问题的用户在他们发布的推特中有明显更多的负面情绪,这可能表明通过社交媒体被确认有睡眠问题的人有更大的社会心理问题风险。虽然我们的发现是初步的,但它们值得进一步调查,并开始提供证据反驳社交媒体导致失眠和其他常见睡眠障碍的流行观点。此外,我们目前的发现为扩大使用社交媒体对其他与睡眠相关的健康结果的调查提供了希望。
亚马逊土耳其机器人
行为风险因素监测系统
世界时码
本研究部分由默克公司和NLM (T15LM007092)资助。作者要感谢加州大学圣地亚哥分校的James Fowler博士,感谢他的有益对话和建议。
AC、AM、TF和SJ是默克公司的员工。