这是一篇开放获取的文章,根据创作共用署名许可(https://creativecommons.org/licenses/by/4.0/)的条款发布,允许在任何媒介上无限制地使用、分发和复制,前提是正确引用最初发表在《医学互联网研究杂志》上的原创作品。必须包括完整的书目信息,//www.mybigtv.com/上的原始出版物的链接,以及此版权和许可信息。
抑郁症是最常见的精神疾病,也是全世界致残的主要原因。选择性血清素再摄取抑制剂(SSRIs)是治疗抑郁症最常用的处方药。有些人在推特等社交媒体平台上分享他们服用抗抑郁药的经历。对接受SSRI治疗的Twitter用户发布的消息进行分析,可以得出这些抗抑郁药物如何影响用户行为的有用信息。
这项研究旨在比较用户可能正在接受SSRI治疗时发布的推文的行为和语言特征,与同一用户在不太可能服用这种药物时发布的推文进行比较。
在第一步中,推特用户在推特中提到SSRI抗抑郁药的时间轴是使用128种SSRI的通用名称和品牌名称来选择的。在第二步中,创建了两个推文数据集
用户在接受治疗时每天产生的推文数量高于他们在接受治疗时
当抑郁症患者服用抗抑郁药物时,已经检测到行为和语言的变化。这些特征可以为监测这种疾病的演变提供有趣的见解,并提供与治疗依从性相关的额外信息。这一信息可能对正在接受长期治疗的患者,如抑郁症患者特别有用。
抑郁症是最常见的精神疾病之一。
对于中度和重度抑郁症,药物治疗可改善这些患者的生活质量[
此外,尽管社交媒体平台的创建通常不是出于与健康相关的目的[
推特是一个非常受欢迎的微博平台,在全球拥有超过3.3亿活跃用户。
从Twitter中挖掘药物相关信息已应用于药物警戒领域[
本文旨在丰富我们之前的研究[
这项研究的目的是分析在推特时间线中提到SSRIs的用户的行为模式和语言特征。这项研究分几个步骤进行,重点研究了用西班牙语写的推文。研究的流程图描述在
如
这些数据集的设计方式使得进行学科内比较成为可能,因为
中描述了在两个数据集中选择推文的策略
研究过程流程图。选择性血清素再摄取抑制剂。
处理内和未知处理数据集选择策略。选择性血清素再摄取抑制剂。
推文及其用户的选择是基于Twitter应用程序编程接口提供的过滤实时流支持[
研究中使用了选择性血清素再摄取抑制剂(SSRIs)。
通用名称 | 品牌名称 |
Fluvoxamina(氟伏沙明) | 杜米乐,法维林,氟西弗拉,氟伏新,Luvox, Uvox |
Fluoxetina(氟西汀) | 百忧解,雷奈,阿多芬,乐拉蒙,萨拉芬 |
Paroxetina(帕罗西汀) | 帕罗西汀,莫替凡,氟西诺,普拉西,达帕罗,昔汀, |
Sertralina(舍曲林) | Aremis, Besitran, Zoloft, Altisben, Aserin, Altruline, Ariale, Asertral, Atenix, Eleval, Emergen, Dominium, Inosert, Irradial, Sedora, Serolux, Sertex |
西酞普兰(西酞普兰) | Seropram, Celexa, Akarin, C Pram S, Celapram, Celica, Ciazil, Cilate, Cilift, Cimal, Cipralex, Cipram, cipranil, Cinapen, Ciprapine, Ciprotan, Citabax, Citaxin, Citalec, Citox, Citrol, Citta, Dalsan, Denyl, Humorup, Humorap, Oropram, Opra, Pram, Pramcit, Procimax, Recital, Sepram, szetalax, Zentius, Zetalo, Cipratal, Zylotex |
酞(酞) | 西普雷克斯,迪普雷克斯,依赛提亚,艾赛提恩,海普仑,依赛普罗 |
由于语义模糊,以下7个药品品牌名称被排除在外:Essential、Motivan、Estar、Traviata、Pondera、Recital和emergenen。与此同时,这些商业名称在西班牙语中是非常常见的词,但含义不同,我们在审查了200条提到这些词的推文随机样本后证实了这一点。由于语义模糊而被排除的推文数量为21104条。在对随机抽取的200条推文进行手动检查时,在某些情况下,使用这些词时提到SSRIs的比例为0%(0/200),如Motivan和Estar,而Recital的比例为0.5%(1/200)。最终的单词列表包括128种SSRIs的通用名称和品牌名称。
使用上述128个SSRI名字,我们收集了2019年11月发布的3651条西班牙语推文,其中出现了中列出的单词
2019年11月西班牙语推文中提到的SSRI名字的频率。
SSRI提到 | 频率 |
百忧解 | 998 |
Fluoxetina | 756 |
Sertralina | 542 |
酞 | 248 |
异食癖 | 210 |
Citalo | 109 |
Paroxetina | 69 |
婴儿车 | 49 |
Fluvoxamina | 40 |
西酞普兰 | 33 |
塞尔特 | 22 |
Eleval | 21 |
造成的 | 20. |
仅 | 18 |
Casbol | 14 |
Ariale | 11 |
左洛复 | 9 |
Altruline | 9 |
帕罗西汀 | 7 |
Akarin | 7 |
Heipram | 4 |
整理出 | 4 |
Cimal | 3. |
Tiarix | 2 |
Seretran | 2 |
完全所有权 | 2 |
Citox | 2 |
Atenix | 2 |
Aserin | 2 |
脸上 | 1 |
Dalsan | 1 |
普兰 | 1 |
在第二步中,我们爬取了3138个用户的公共Twitter时间轴(直到每个用户的3200条最新推文被检索出来)。鉴于转发对分析特定用户的语言行为没有帮助,第三步包括排除转发,并检查每个时间轴上的其余推文是否至少提到了一种SSRI。1800个用户被过滤掉了,总共有1338个Twitter用户。在编译这1338个用户的时间线后,我们获得了3791609条推文。从这些时间轴上,自动检测到4872条推文提到了列表中至少一种SSRIs。这4872条推文由两位具有临床经验的心理学家和家庭医生独立审查。这些专家手动选择了那些表明发布推文的用户在发布当天正在服用SSRI的推文。这些推文的示例显示在
正面例子:
“Eso de tener sueños raros debido a la fluoxetina se está saliendo de control。(“因为氟西汀做奇怪的梦已经失控了。”)
“Yo tomo sertralina, como me lo receta el doctor y aún así a veces siento que el mundo donde estoy no es para mi. Ese susto esa angustia esas ganas de correr es algo que sólo el que lo padece lo entiende”(“我按医生开的处方服用舍曲林,即使如此,有时我还是觉得我生活的世界不适合我。这种恐惧,这种焦虑,这种想逃跑的欲望,只有患有这种疾病的人才能理解”)
负面的例子:
“Ella debería tomar百忧解,como嘀嗒糖”(“她应该像吃嘀嗒糖一样吃百忧解”[糖果品牌])
" La Paroxetina es un medicamento que pertenece a La家族抗抑郁症抑制剂recaptación de La血清素' Conoce más清醒él!(“帕罗西汀是一种抗抑郁药物,属于血清素再摄取抑制剂。去了解更多吧!”)
审稿人之间的一致性为93.1% (4537/4872),Cohen kappa评分为0.68,表明审稿人之间的意见基本一致。审稿人对335条不同分类的推文进行了讨论并达成了共识。最后,我们获得了总共518条推文,其中有一条或多条提到了SSRI,这表明发布这些推文的用户在发布推文时正在服用SSRI。这些推文对应279个不同的用户。因此,这些用户有两个特点:首先,他们的时间轴上的推文至少有一次提到了SSRIs,其次,提到SSRIs的推文文本表明用户正在服用抗抑郁药。此外,我们还分析了属于这两个数据集的每个用户发布的推文(
这两个推文数据集,
分析了推文的特征。
特性 | 分析执行 |
时间分布 | 每小时的推文,白天和晚上的推文,每天的推文,工作日和周末的推文 |
长度 | 字符数,字数 |
词性(POS) | 按语法类别划分的单词数量(词性标签) |
情感分析 | 情绪类型的频率 |
否定 | 否定词的频率 |
极性 | 基于西班牙语情感词典的推文极性 |
配对数据统计显著性检验(配对
每条推文的文本内容都使用了我们之前研究中使用的相同方法和工具进行分析[
统计分析使用了Python 3.7、Tweepy、SciPy和自然语言工具包库,以及R版本3.6.2 (R开发核心团队),包括R“psych”包1.9.12.31。前面提到的所有软件工具都是公开可用的。
本研究使用的方案由Salut Mar Parc伦理委员会审查并批准(批准号2017/7234/1)。
进行了几种类型的随时间分布分析,以研究在的潜在影响
所有用户分析的时间周期的平均持续时间为28.2个月(SD为24.7);分析的推文总数的平均值为307.6 (SD 336.0)
白天(上午8点至午夜)发布推文的平均百分比为64.30% (SD 14.83)
期间工作日(周一至周五)产生的推文平均数量为12.28条(SD为11.05)
平均每条推文的字符数为88.03 (SD 30.74)和85.19 (SD 28.82)
包含至少一个链接的推文的平均百分比为23.10% (SD 16.16)和23.27% (SD 15.29)
至于按语法类别(即词性)分析每条推文的字数,我们也比较了
对于不同类型的人称代词,在每个数据集中显示和比较人称代词的平均百分比
在治疗中和未知治疗数据集之间比较词性单词的百分比。
POS一个 |
|
|
差值(%),均值(SD) | 配对 |
|
动词 | 18.50 | 18.20 | 0.3 (1.28) | 3.15 | .002 |
名词 | 19.50 | 19.94 | −0.44 (2.57) | −2.35 | 02 |
代词 | 9.19 | 8.93 | 0.26 (1.33) | 2.61 | . 01 |
副词 | 6.42 | 6.36 | 0.06 (0.84) | 0.97 | 点 |
形容词 | 6.05 | 6.21 | −0.16 (0.95) | −2.34 | 02 |
一个POS:词性。
在治疗中和未知治疗数据集中比较人称代词的平均百分比。
人称代词 |
|
|
差值(%),均值(SD) | 配对 |
|
第一人称单数 | 49.50 | 47.80 | 1.7 (8.68) | 2.67 | .008 |
第二人称单数 | 14.77 | 16.07 | −1.3 (6.17) | −2.88 | 04 |
第三人称单数 | 22.13 | 22.86 | −0.73 (5.79) | −1.72 | 。08 |
第一人称复数 | 3.44 | 3.43 | 0.01 (3.43) | 0.04 | .96点 |
第二人称复数 | 1.00 | 1.00 | 0 (1.22) | −0.01 | .98点 |
第三人称复数 | 5.60 | 5.39 | 0.21 (3.68) | 0.77 | 无误 |
不同情绪的平均百分比,使用西班牙情绪词典在两个时期发布的推文,显示在
在治疗中和未知治疗数据集之间比较不同情绪的平均百分比。
情感 |
|
|
差值(%),均值(SD) | 配对 |
|
幸福 | 26.93 | 25.94 | 0.99 (5.82) | 2.32 | 02 |
悲伤 | 10.01 | 9.76 | 0.25 (4.20) | 0.81 | .41点 |
恐惧 | 3.20 | 3.02 | 0.18 (1.94) | 1.23 | . 21 |
愤怒 | 5.52 | 5.20 | 0.32 (2.71) | 1.62 | 厚 |
厌恶 | 3.11 | 3.06 | 0.05 (1.97) | 0.38 | i = |
惊喜 | 5.59 | 5.06 | 0.53 (2.42) | 2.98 | .003 |
在所有用户中,包含一个或多个否定词的推文的平均百分比为27.66% (SD 10.54),而包含一个或多个否定词的推文的平均百分比为26.59% (SD 9.87)
至于推文的极性,在所有用户的推文中,文本中有一个或多个积极词汇的百分比为15.13% (SD 6.56)
一般来说,社交媒体平台,特别是Twitter,可以提供关于患者在接受药物治疗时如何反应的有用信息,正如几项研究所显示的那样,社交媒体已被用作药物警戒和监测的补充来源[
本研究的结果表明,总体而言,Twitter用户在春节期间发布推文的活动显著增加
同样地,当Twitter用户使用SSRIs治疗时,每条推文的平均字符和单词数量显著增加,这一发现再次表明这些治疗用户的活动增加。此外,每条推文被提及次数的增加可以反映出与他人互动的兴趣增加。所有这些变化都可能是由于药物治疗使他们的快感缺乏症状有所改善。
在语言分析方面,我们观察到在数量上的细微变化
情绪是抑郁症患者的另一个重要特征,因此对其进行了分析。当使用者接受治疗时,他们在快乐和惊讶情绪上表现出微小但有统计学意义的增加,但在悲伤或其他情绪(如愤怒、恐惧和厌恶)上没有增加。至于否定词的数量,用户在测试过程中略微增加了这类词的使用
当用户可能正在接受SSRIs治疗时,他们在Twitter上观察到的活动增加,可能与他们快乐和惊讶情绪的情绪状态改善有关。这些变化与我们之前对非抑郁症推特用户与抑郁症推特用户情绪状态的观察一致[
基于我们具有统计学意义的结果,我们可以声明Twitter时间线可以作为监测受试者的补充工具,以检测对治疗的依从性,这是这类患者的一个重要问题。坚持治疗对疾病缓解至关重要[
这种类型的研究总体上,特别是这一项,存在一些局限性。例如,我们考虑了用西班牙语写的推文和来自公共推特用户的时间轴,这些用户可能不能代表一般人群或患有抑郁症的人[
另一个限制可能是,分享个人药物摄入量的推特用户可能会使用本研究中使用的药物名称列表中不包括的单词或短语用于流推文,尽管我们试图在使用的名称列表中做到详尽无遗。Twitter文本是非正式的,受字符数量的限制,通常包括缩写,错误或俚语[
此外,我们必须考虑到来自社交媒体帖子的数据包含不相关的信息。虽然用于特定研究目的的有用信息的比例可能相当有限,但它构成了一个有用的起点[
社交媒体可以用来监测人们的健康状况,特别是通过分析社交媒体平台上用户的行为和语言,发现与疾病或健康状况相关的症状或特征。此外,当患者服用药物时,检测症状或其他特征的变化可以为监测药物治疗提供有趣的见解,以及跟踪疾病的演变,检测副作用,或提供与治疗依从性相关的信息。某些特征的变化,如推特活跃度或推文长度的减少,通过使用第一人称单数代词而增加自我关注,以及快乐和惊讶情绪的变化,可以作为检测抑郁症患者心理状态恶化的补充工具,以及感知缺乏对治疗的坚持。这一信息可能对正在接受长期治疗的慢性病患者特别有用,对于一般精神障碍,特别是抑郁症患者也是如此。然而,在不进行临床评估的情况下,不可能确定个体在疾病及其治疗框架下在社交媒体平台上改变行为和语言的具体原因。总的来说,这项研究显示了监测服用抗抑郁药物者推文中的行为和语言变化的相关性。这些变化很可能受到疾病的不同阶段和这些推特用户所接受的治疗效果的影响,从而开辟了一条新的研究路线,通过社交媒体更好地了解和跟踪抑郁症。
词性
选择性血清素再摄取抑制剂
我们获得了加泰罗尼亚大学和研究资助管理局(西班牙)的支持,用于纳入新的研究人员(FI2016),以及创新药物倡议2联合承诺(根据资助协议编号802750 (FAIRplus)),并得到了欧盟地平线2020研究和创新计划以及欧洲制药工业和协会公司联合会的支持。
生物医学信息学研究计划是西班牙国家生物信息学研究所的成员,由Salud Carlos III研究所和欧洲区域发展基金(PRB2-ISCIII)资助,并得到PT17/0009/0014赠款的支持。庞培法布拉大学实验与健康科学系是由西班牙经济部资助的“卓越联盟María de Maeztu”[MDM-2014-0370]。开放获取费用的资金来自Agència de Gestió d’ajuts Universitaris i de Recerca Generalitat de Catalunya (2017 SGR 00519)。
利用西班牙卫生、消费者事务和社会福利部下属的西班牙药品和保健品局的初级保健药物流行病学研究数据库,获得了关于抗抑郁药处方频率的有用信息。
没有宣布。