这是一篇开放获取的文章,根据创作共用署名许可协议(https://creativecommons.org/licenses/by/4.0/)的条款发布,允许在任何媒介上不受限制地使用、分发和复制,前提是正确引用了首次发表在JMIR医学信息学上的原创作品。必须包括完整的书目信息,https://medinform.www.mybigtv.com/上的原始出版物的链接,以及此版权和许可信息。gydF4y2Ba
在性少数群体和性别少数群体中,精神健康或物质成瘾问题的高风险可能具有更微妙的特征,传统统计方法可能不容易发现这些特征。gydF4y2Ba
本综述旨在确定使用机器学习(ML)来调查女同性恋、男同性恋、双性恋、变性人、酷儿或质疑者以及双性恋(LGBTQ2S+)人群的心理健康或物质使用问题的文献研究,并指导该领域的未来研究。gydF4y2Ba
在2020年11月至12月期间搜索了MEDLINE、Embase、PubMed、CINAHL Plus、PsycINFO、IEEE Xplore和Summon数据库。我们纳入了使用ML探索LGBTQ2S+人群心理健康或物质使用的原始研究,并排除了基因组学和药代动力学的研究。两位独立审稿人审阅了所有论文,并提取了关于一般研究结果、模型开发和研究结果讨论的数据。gydF4y2Ba
我们纳入了11项研究,其中81%(9/11)是关于精神健康的,18%(2/11)是关于物质使用的。所有的研究都是在过去两年内发表的,而且大多数是在美国进行的。在互不排斥的人群类别中,性少数男性是最常被研究的亚组(5/ 11,45%),而性少数女性则被研究最少(2/ 11,18%)。研究分为3个主要领域:网络内容分析(6/ 11,54%),预测建模(4/ 11,36%)和成像研究(1/ 11,9%)。gydF4y2Ba
ML是一种很有前途的工具,用于捕获和分析LGBTQ2S+人群中心理健康和物质使用问题的隐藏数据。除了对性少数群体妇女、不同的心理健康和药物使用问题以及结果和未来的研究进行更多研究之外,还应探索更新的环境、数据来源,以及与各种健康社会决定因素的交叉。gydF4y2Ba
女同性恋、男同性恋、双性恋、变性人、酷儿或质疑者以及双性恋(LGBTQ2S+)群体的成员经历着显著的心理健康差异,与异性恋和顺性别同龄人相比,他们面临着更高的物质使用问题风险[gydF4y2Ba
有强有力的证据证明性取向和性别认同是健康的社会决定因素,因此LGBTQ2S+群体的成员经历了来自耻辱、社会和经济排斥的压力源,这导致了心理健康挑战的增加,并因此产生了应对策略,包括有问题的药物使用[gydF4y2Ba
随着技术的进步,新的统计方法,如机器学习(ML),已成为分析公共卫生信息学中大量复杂数据的有前途的手段[gydF4y2Ba
机器学习主要有3种类型,包括(1)监督学习,(2)无监督学习,(3)半监督学习。监督学习旨在从标记数据中学习,以预测未标记输入数据或结果变量的类别[gydF4y2Ba
多项检讨,包括最近进行的三项系统检讨,总结ML在药物使用及精神健康问题上的应用[gydF4y2Ba
尽管一项范围综述探索了用ML预测人群特定健康的研究[gydF4y2Ba
本综述旨在对使用ML来调查LGBTQ2S+社区的心理健康或物质使用的研究进行全面搜索,并确定未来研究的范围。我们使用了Arksey和O 'Malley开发的以下5阶段方法学框架[gydF4y2Ba
最初,我们为这次范围审查确定了一系列广泛的初步问题:gydF4y2Ba
在LGBTQ2S+人群的心理健康和物质使用领域使用机器学习分析的文献有多少?gydF4y2Ba
机器学习研究过的LGBTQ2S+人群的心理健康和药物使用领域有哪些?gydF4y2Ba
调查了LGBTQ2S+人群的哪些亚群?有没有使用机器学习分析研究过的特定子群体?gydF4y2Ba
哪些类型的机器学习方法(如监督、无监督、半监督和深度学习)和算法(如决策树、随机森林、逻辑回归和惩罚回归)已被用于研究LGBTQ2S+心理健康和药物使用?gydF4y2Ba
这些研究的现实意义是什么?在未来的研究中是否有任何知识空白或未触及的领域需要解决?gydF4y2Ba
为了收集大量相关文献,我们遵循了之前具有类似目标的综述研究[gydF4y2Ba
两名审稿人(AK和RB)在2020年11月25日至12月13日期间进行了数据库搜索,并将所有引用导入Covidence网络平台,在该平台上自动删除重复论文。这些数据库的搜索范围从数据库创建之日到2020年,没有对发布年份进行筛选。2020年12月13日对纳入的研究和综述论文的参考书目列表进行了审查,以确定任何潜在的研究。完整的Embase搜索策略,代表了应用于所有其他数据库的搜索查询的示例gydF4y2Ba
我们纳入了使用ML来调查LGBTQ2S+人群的心理健康或物质使用行为的研究。部分使用ML但不用于主要统计分析的研究被纳入综述。我们只纳入了实证调查,因此排除了社论、观点文章和评论。我们还排除了使用逻辑回归分析的论文,不是作为ML算法,而是确定LGBTQ2S+身份状态。此外,无法获得机构许可检索全文的研究、基因组学、药代动力学研究以及与人类没有直接关系的研究被排除在外。gydF4y2Ba
两名审稿人(AK和RB)根据资格标准独立筛选每个标题和摘要,并完成其余研究的全文筛选。通过3位审稿人(AK、RB和MC)的讨论解决了分歧,从而产生了最终纳入的研究列表。gydF4y2Ba
为了方便数据图表和报告,个别审稿人(AK和RB)首先审查了所有研究,并从每项研究中提取了关键短语和概念。我们的数据提取项目基于最近报告ML研究的生物医学指南中确定的特征[gydF4y2Ba
我们通过计算每个类别中所有研究的总数和百分比,对提取的数据集进行了描述性统计。为了提供数据范围的可视化概述,我们展示了一个根据研究领域显示研究频率分析的柱状图,以及一个展示ML主要领域研究比例的饼状图。我们使用了叙事综合方法[gydF4y2Ba
对数据库的初步搜索产生了2669篇文章,其中2489篇在删除重复后被检索。我们还搜索了潜在符合条件的文章和以前的综述的参考文献列表,但没有找到任何符合我们纳入标准的研究。经过标题和摘要筛选,筛选出21篇文章进行全文筛选。其中,我们排除了不符合LGBTQ2S+人群目标人群标准的文章(3/ 21,14%)、全文无法检索(1/ 21,4%)、与ML无关(4/ 21,19%)、在会议论文集中发表的重复文章(1/ 21,4%)和评论(1/ 21,4%)。这导致11项研究被纳入最终综述[gydF4y2Ba
系统评价和元分析的首选报告项目,记录研究排除的流程图。LGBTQ+:女同性恋,男同性恋,双性恋,变性人,酷儿,或质疑;ML:机器学习。gydF4y2Ba
所有11项研究都包括[gydF4y2Ba
纳入研究的统计摘要(N=11) [gydF4y2Ba
特征gydF4y2Ba | 研究数,n (%)gydF4y2Ba | |||
|
||||
|
美国gydF4y2Ba | 7 (63)gydF4y2Ba | ||
|
中国gydF4y2Ba | 2 (18)gydF4y2Ba | ||
|
瑞典gydF4y2Ba | 1 (9)gydF4y2Ba | ||
|
澳大利亚gydF4y2Ba | 1 (9)gydF4y2Ba | ||
|
||||
|
2019gydF4y2Ba | 5 (45)gydF4y2Ba | ||
|
2020gydF4y2Ba | 6 (54)gydF4y2Ba | ||
|
||||
|
|
|||
|
|
自杀或自残gydF4y2Ba | 2 (18)gydF4y2Ba | |
|
|
抑郁症gydF4y2Ba | 2 (18)gydF4y2Ba | |
|
|
情绪或影响过程gydF4y2Ba | 3 (27)gydF4y2Ba | |
|
|
少数的压力gydF4y2Ba | 1 (9)gydF4y2Ba | |
|
|
性别不一致gydF4y2Ba | 1 (9)gydF4y2Ba | |
|
|
|||
|
|
烟草gydF4y2Ba | 1 (9)gydF4y2Ba | |
|
|
Poppers或烷基亚硝酸盐gydF4y2Ba | 1 (9)gydF4y2Ba | |
|
||||
|
性少数群体:男性(同性恋,MSMgydF4y2BacgydF4y2Ba双性恋)gydF4y2Ba | 5 (45)gydF4y2Ba | ||
|
性少数群体:女性(女同性恋、双性恋)gydF4y2Ba | 2 (18)gydF4y2Ba | ||
|
跨性别者或性别少数群体gydF4y2Ba | 3 (27)gydF4y2Ba | ||
|
同性恋/”+gydF4y2BadgydF4y2Ba | 3 (27)gydF4y2Ba | ||
|
||||
|
网页内容分析gydF4y2Ba | 6 (55)gydF4y2Ba | ||
|
预测建模gydF4y2Ba | 4 (36)gydF4y2Ba | ||
|
成像研究gydF4y2Ba | 1 (9)gydF4y2Ba | ||
|
||||
|
监督gydF4y2Ba | 9 (82)gydF4y2Ba | ||
|
无人管理的gydF4y2Ba | 3 (27)gydF4y2Ba | ||
|
深gydF4y2Ba | 1 (9)gydF4y2Ba | ||
|
||||
|
乔治。gydF4y2BafgydF4y2Ba | 3 (27)gydF4y2Ba | ||
|
射频gydF4y2BaggydF4y2Ba | 2 (18)gydF4y2Ba | ||
|
支持向量机gydF4y2BahgydF4y2Ba | 2 (18)gydF4y2Ba | ||
|
美国有线电视新闻网gydF4y2Ba我gydF4y2Ba | 1 (9)gydF4y2Ba | ||
|
中长期规划gydF4y2BajgydF4y2Ba | 1 (9)gydF4y2Ba | ||
|
注gydF4y2BakgydF4y2Ba | 1 (9)gydF4y2Ba | ||
|
惩罚回归(LASSOgydF4y2BalgydF4y2Ba、弹性净正则化回归、岭回归)gydF4y2Ba | 2 (18)gydF4y2Ba | ||
|
逻辑回归gydF4y2Ba | 1 (9)gydF4y2Ba | ||
|
提高(XGBoostgydF4y2Ba米gydF4y2Ba,演gydF4y2BangydF4y2Ba,“绿带运动”gydF4y2BaogydF4y2Ba)gydF4y2Ba | 3 (27)gydF4y2Ba | ||
|
分类树gydF4y2Ba | 2 (18)gydF4y2Ba | ||
|
||||
|
是的gydF4y2Ba | 7 (64)gydF4y2Ba | ||
|
没有gydF4y2Ba | 4 (36)gydF4y2Ba | ||
|
||||
|
使用的性能指标gydF4y2Ba | 9 (82)gydF4y2Ba | ||
|
没有使用绩效指标gydF4y2Ba | 1 (9)gydF4y2Ba | ||
|
不讨论业绩gydF4y2Ba | 1 (9)gydF4y2Ba | ||
|
||||
|
抵抗gydF4y2Ba | 2 (18)gydF4y2Ba | ||
|
交叉验证gydF4y2Ba | 7 (64)gydF4y2Ba | ||
|
外部验证gydF4y2Ba | 2 (18)gydF4y2Ba | ||
|
未指明的gydF4y2Ba | 4 (36)gydF4y2Ba |
一个gydF4y2Ba对于某些研究特征,可能有多种反应选项。gydF4y2Ba
bgydF4y2Ba类别并不相互排斥。gydF4y2Ba
cgydF4y2BaMSM:与男性发生性关系的男性。gydF4y2Ba
dgydF4y2BaLGBT/LGBTQ+:女同性恋、男同性恋、双性恋和变性人/女同性恋、男同性恋、双性恋、变性人、酷儿或问题。gydF4y2Ba
egydF4y2BaML:机器学习。gydF4y2Ba
fgydF4y2BaLDA:潜狄利克雷分配。gydF4y2Ba
ggydF4y2BaRF:随机森林。gydF4y2Ba
hgydF4y2Ba支持向量机:支持向量机。gydF4y2Ba
我gydF4y2BaCNN:卷积神经网络。gydF4y2Ba
jgydF4y2BaMLP:多层感知器。gydF4y2Ba
kgydF4y2Ba注:朴素贝叶斯。gydF4y2Ba
lgydF4y2BaLASSO:最小绝对收缩和选择算子。gydF4y2Ba
米gydF4y2BaXGBoost:极端梯度增强。gydF4y2Ba
ngydF4y2BaAdaBoost: Adaptive Boosting。gydF4y2Ba
ogydF4y2BaGBM:广义增强模型。gydF4y2Ba
大多数研究集中在心理健康(9/11,82%)[gydF4y2Ba
这些研究被分为3个主要的ML领域:web内容分析、预测建模和成像研究。超过一半的研究(6/ 11,55%)被确定为网络内容分析[gydF4y2Ba
最常用的ML方法类别是有监督的(9/11,82%)[gydF4y2Ba
大约三分之二(7/ 11,64%)的研究[gydF4y2Ba
54%(6/11)的研究[gydF4y2Ba
在预测建模领域的4项研究中,50%(2/4)的研究分析了成年参与者的数据[gydF4y2Ba
一项影像学试验研究使用了25名变性成人的临床和功能性磁共振成像数据,以确定治疗前大脑功能连通性和激素治疗后身体一致性之间的关系[gydF4y2Ba
我们的研究结果表明,与ML技术在其他健康研究领域的日益使用相比,ML技术在LGBTQ2S+人群中评估心理健康和物质使用行为的应用在健康研究中仍然是新的。尽管截至2020年底,联合国67个成员国继续将LGBTQ2S+定为犯罪,且缺乏对其权利的保护[gydF4y2Ba
在迄今为止进行的少数相关ML研究中,只有少数心理健康问题得到了解决(gydF4y2Ba
关于LGBTQ2S+人群心理健康和物质使用问题的ML研究数量较少,背后的潜在因素可能是与性别和性别身份相关的数据不可见以及社会和制度偏见[gydF4y2Ba
大多数研究都在网络内容分析领域,这表明社交媒体是收集LGBTQ2S+人群数据和使用ML (gydF4y2Ba
虽然有证据表明,各种健康社会和行为决定因素的交叉影响了LGBTQ2S+人群中心理健康和物质使用问题日益普遍的影响[gydF4y2Ba
遵循生物医学研究中ML研究报告的现行指南[gydF4y2Ba
与其他2个领域相比,使用成像数据(即功能性磁共振成像或脑电图)来检查LGBTQ2S+人群的心理健康和物质使用的ML研究存在显著差距(gydF4y2Ba
我们发现,在LGBTQ2S+人群的心理健康和物质使用研究中,ML应用存在显著的研究差距。首先,未来的研究应该调查LGBTQ2S+人群中的其他心理健康问题(即焦虑症和情绪障碍)和物质使用行为和问题(即酒精、阿片类药物和非法药物)。其次,应该探索ML应用在预测药物使用相关结果(即戒烟、过量事件、给药途径、驾驶障碍和其他不良反应)、心理健康服务获取和心理健康相关结果(即残疾、症状管理、自杀和自杀企图、经济负担和医疗费用)方面的潜力。gydF4y2Ba
第三,需要对性少数女性进行进一步的研究。少数研究包括(gydF4y2Ba
据我们所知,我们的综述是第一次探索ML应用在检查LGBTQ2S+人群的心理健康和物质使用方面的应用。我们采用了全面的搜索策略,包括搜索各种多学科同行评议数据库,以尽可能多地识别相关文章。我们回顾的发现需要考虑一个关键的限制来解释。由于研究数量较少,所纳入研究的高度异质性特征,以及模型开发和验证的报告不一致,我们无法对研究进行批判性评估,因此无法对ML技术的整体性能进行显著评论。然而,我们遵循了以前针对类似目标进行范围审查的方法[gydF4y2Ba
随着未来更多研究的发表,下一步的研究应该对相关文献进行系统的回顾和批判性的评价。研究人员正试图扩展已建立的报告指南,以包括适应ML研究的项目,例如个体预后多变量预测模型的透明报告或特定于M的诊断声明[gydF4y2Ba
尽管ML在其他健康研究领域的应用呈指数级增长,但很少有研究将这些技术用于LGBTQ2S+人群的心理健康和物质使用领域。除了进行更多的研究外,未来的研究人员应该专注于应用ML算法,并考虑通过公共卫生干预措施对现实世界的影响,并采取旨在改善卫生公平的政策。gydF4y2Ba
Embase搜索查询。gydF4y2Ba
在女同性恋、男同性恋、双性恋、变性人、酷儿或质疑者以及双精神人群中使用机器学习分析精神健康和物质使用的研究摘要(N=11)。gydF4y2Ba
所使用的机器学习方法的特点总结(N=11)。gydF4y2Ba
女同性恋,男同性恋,双性恋,变性人,酷儿或质疑者,还有双性恋gydF4y2Ba
机器学习gydF4y2Ba
系统评价和元分析的首选报告项目gydF4y2Ba
作者要感谢多伦多大学Gerstein科学信息中心的图书管理员Elena Springall,感谢她在审查数据库搜索策略方面的支持。该研究由加拿大健康研究所资助,资助号为1000993。资助者在研究设计、数据收集、分析或解释、撰写手稿或决定论文是否发表方面没有任何作用。gydF4y2Ba
MC为研究设计做出了贡献,并获得了资金和监督。AK和RB进行了数据库搜索、文章筛选和数据提取。AK负责数据分析和初步起草稿件。所有作者AK、MC、RB、DG、RF、CHL、BB、CY、NM和RS都参与了论文的概念化、起草、审查和批准。gydF4y2Ba
没有宣布。gydF4y2Ba