发表在24卷第八名(2022): 8月

本文的预印本(早期版本)可在https://preprints.www.mybigtv.com/preprint/34126,首次出版
基于问卷的集成学习模型预测眩晕的诊断:模型开发和验证研究

基于问卷的集成学习模型预测眩晕的诊断:模型开发和验证研究

基于问卷的集成学习模型预测眩晕的诊断:模型开发和验证研究

原始论文

1中国上海,复旦大学附属眼科耳鼻喉科

2中国上海,复旦大学眼科和耳鼻喉科医院护理部

3.复旦大学信息管理与信息系统系,上海,中国

4医学神经生物学国家重点实验室,脑科学教育部前沿中心,复旦大学,中国上海

5国家卫生健康委员会听力医学重点实验室,复旦大学,中国上海

6复旦大学脑科学研究所和脑科学协同创新中心,上海,中国

7安徽医科大学附属第二医院耳鼻咽喉头颈外科,合肥,中国

8厦门大学医学院第一附属医院耳鼻咽喉头颈外科,中国厦门

9中国医科大学附属盛京医院耳鼻咽喉头颈外科,沈阳,中国

10上海浦东医院耳鼻喉科,中国上海

11深圳市第二人民医院耳鼻喉科,中国深圳

12重庆医科大学第一附属医院耳鼻喉科,重庆,中国

13复旦大学生物医学研究所,上海,中国

*这些作者贡献相同

通讯作者:

李华伟,医学博士,博士

耳鼻咽喉科

眼科及耳鼻喉科医院

复旦大学

9号楼611室

徐汇区汾阳路83号

上海,200031年

中国

电话:86 021 64377134 ext 2669

电子邮件:hwli@shmu.edu.cn


背景:在过去的20年里,问卷调查被用于预测眩晕的诊断并协助临床决策。基于问卷的机器学习模型有望提高前庭疾病的诊断效率。

摘要目的:本研究旨在开发和验证一个基于问卷的机器学习模型,预测眩晕的诊断。

方法:在这项多中心前瞻性研究中,眩晕患者于2019年8月至2021年3月首次访问7个三级转诊中心的耳鼻喉科和眩晕科诊所时进入连续队列,随访期为2个月。所有参与者在资格筛选后完成诊断问卷。仅接受治疗专家对其主要疾病进行最终诊断的患者被纳入模型开发和验证。2021年2月1日之前入组的患者数据用于建模和交叉验证,之后入组的患者进行外部验证。

结果:共纳入1693例患者,有效率为96.2%(1693/1760)。中位年龄51岁(IQR 38-61岁),女性991例(58.5%);1041例(61.5%)患者在研究期间得到最终诊断。其中928例(54.8%)患者纳入模型开发和验证,随后纳入的113例(6.7%)患者作为测试集进行外部验证。他们被分为5个诊断类别。我们比较了9种候选机器学习方法,重新校准的轻梯度增强机模型的性能最好,交叉验证的曲线下面积为0.937 (95% CI 0.917-0.962),外部验证的曲线下面积为0.954 (95% CI 0.944-0.967)。

结论:基于问卷调查的光梯度增强机能够预测常见的前庭疾病,并协助耳鼻喉科和眩晕诊所的决策。更大样本量的进一步研究和神经学家的参与将有助于评估这种机器学习方法的泛化和鲁棒性。

中国医学杂志,2018;24(8):e34126

doi: 10.2196/34126

关键字



头晕和眩晕是前庭神经系统疾病患者的主要主诉,估计一生中头晕(包括眩晕)的发生率为15%-35% [1].头晕和眩晕会使患者丧失行动能力,并严重影响患者的生活质量。这些情况往往导致活动受限,并与精神障碍密切相关,如焦虑、恐惧和躯体形式障碍[1-3.].头晕和眩晕患者摔伤和摔伤相关的风险也较高,尤其是老年人[4].然而,前庭神经障碍的诊断是具有挑战性和耗时的。它涉及多种前庭和神经系统原因以及复杂的病理过程,导致误诊,并可能在眩晕患者中广泛滥用影像学[5-8].随之而来的诊断延误会加重疾病的功能和心理后果。

人工智能在诊断头晕和眩晕方面的应用可以追溯到30多年前。专家系统,例如眩晕9),Carrusel10),而一个11]由具有固定诊断规则的知识库组成。他们通过无法从患者数据中学习的非自适应算法进行推断。不同的机器学习算法,包括遗传算法、神经网络、贝叶斯方法、k近邻和支持向量机,也被用于分析来自一个12-16].6种常见耳神经诊断的预测准确率为90% ~ 97%,9种诊断类别的预测准确率为76.8% ~ 82.4%。EMBalance是一个综合平台,于2015年推出,通过使用基于决策树的集成学习方法(自适应增强)来辅助平衡障碍的诊断、治疗和进化[1718].前庭神经疾病的计算机辅助诊断方法已经从单纯的知识驱动向数据驱动转变。

除了眩晕,上述所有模型都是基于患者的病史和检查,并结合必要的检查,而在实践中,患者的病史本身就为可能的诊断和进一步的评估提供了重要的线索[19].在过去的20年里,出现了大量关于头晕和眩晕的问卷,以协助前庭神经疾病的临床诊断[20.-27].这些研究大多使用简单的统计模型,通常是逻辑回归,并使用与建模相同的数据进行验证[26-28].很少有研究尝试应用机器学习算法。但由于数据集较小或建模数据选择不当,这些模型的精度不如简单统计模型[2930.].

本研究是耳源性眩晕人工智能研究(OVerAIR)的一部分,其主要目的是建立一个综合平台,利用人工智能对一组耳源性眩晕患者进行诊断、治疗、康复和随访。本研究的具体目标包括开发和验证一个眩晕诊断平台,通过使用机器学习技术协助临床决策,并进一步探索所提议的平台的有效性和临床效用。


研究设计

根据Barany学会对前庭症状的分类,出现新的眩晕或头晕主诉的患者[31]于2019年8月至2021年3月分别在复旦大学眼科医院、安徽医科大学第二医院、厦门大学附属第一医院、中国医科大学盛京医院、上海浦东医院、深圳市第二人民医院、重庆医科大学附属第一医院的耳鼻喉科和眩晕科就诊。在与耳鼻喉科专家的第一次面谈中,患者在知情同意后,通过平板电脑或智能手机完成了电子问卷。那些不能自己阅读和完成问卷的人回答了研究人员读到的问题。我们没有干涉病人的正常医疗程序。在专家认为有必要的情况下,为患者安排下一次就诊;因此,他们没有坚持一个固定的随访时间。

伦理批准

本研究已获得所有参与中心的机构审查委员会的批准(批准号2019091)。本研究遵循个体预后或诊断报告指南的多变量预测模型透明报告[32].

结果

每位患者都进行了常规的病史收集,随后进行了完整的耳神经检查,必要时还进行了进一步的检查(如纯音听力测量、前庭测试、计算机断层扫描和磁共振成像)。由具有5年以上临床经验的耳鼻喉科专家给出的临床诊断被用作参考诊断,这些专家对问卷回答不知情。参考诊断标准包括美国耳鼻咽喉头颈外科学会关于良性阵发性位置性眩晕(BPPV)的实践指南[33]和前庭神经疾病的诊断标准(包括前庭偏头痛[34],梅尼埃病[35],持续性体位知觉性头晕[36],前庭阵发性发作[37],及双侧前庭病[38)。具有典型临床特征但不符合明确诊断标准的患者给予可能诊断。在2个月内没有明确诊断或在最终诊断前不再来就诊的患者被标记为未确诊。

调查问卷的发展

诊断问卷的制定是一个迭代的过程,主要包括以下3个阶段。

  1. 焦点小组和小组会议:首先,召开了焦点小组讨论和3次后续小组会议,以确定耳鼻喉科诊所常见的周围前庭神经障碍。在此过程中,确定了16种疾病,并列出了每种疾病的特征表现。对每种疾病的诊断或实践指南的文献进行了搜索,并仔细审查了相关的文献。之后,起草了由43个项目组成的初步问卷。
  2. 患者访谈:为了便于理解和填写问卷,对我院耳鼻喉科门诊15例眩晕患者进行了访谈。两名患者报告说,手术时间太长、太耗时。另外3人抱怨被问了太多问题,比如心脏病和吃药了,这些问题似乎与他们的眩晕症无关。在这一阶段,问卷的措辞进行了彻底的简化,删除了6个问题。
  3. 专家组会议:在一次全国会议上,邀请了12位专家(来自耳鼻喉科、神经病学、前庭检查、康复)对问卷的适用性和清晰度进行了评估,并提出了进一步修订的建议。在这个过程中,项目被重新排序,一些项目被合并或省略。

统计分析

我们比较了9种候选机器学习方法,以筛选出性能最好的一种。考虑了五种非集成学习算法,即决策树[39],脊回归[40],逻辑回归(l2正则化)[41],支持向量分类[42],以及随机梯度下降支持向量分类[43].集成学习是指一种通用的元方法,通过组合多个模型的预测,从战略上提高预测性能。实现了四种集成学习方法,即随机森林[44]、自适应升压[45,梯度增强决策树[46]、轻型梯度增压机(LGBM) [47].我们采用自举交叉验证,将随机采样的数据按7:3分成训练集和验证集,重复100次,并进行替换[48].模型在训练集上进行训练,并根据验证集上的预测性能进行评估。根据100个验证集的平均预测性能选择和调整最佳模型。曲线下面积(area under The curve, AUC)被用来评价模型的性能。在多类预测中,灵敏度、特异性、似然比和AUC通过一比一休方案(微平均)计算。然后使用校准曲线进行重新校准[49]和Brier分数[50],以调整各诊断类别的预测概率与观测比例之间的差异。外部验证使用队列中最新患者的数据(在最近2个月内登记),这些数据构成了测试集。所有指标的95% ci是通过自举计算得出的。

对布尔变量的缺失值在主要结果中用False进行imputation,并通过比较不同的imputation策略(即不进行imputation和用True进行imputation)进行敏感性分析。所有的机器学习算法都是用Python实现的,代码可以在在线资源中找到。超参数根据最先进的机器学习包sklearn设置为默认值。

稳健性和样本量分析

作为一种促进临床诊断的数据驱动预测方法,需要验证样本数量是否足够用于模型开发和验证。跟随Riley [51]和莱利等人[52],我们根据全局收缩因子和最小样本数来量化样本量的充分性。足够样本量的准则是保证收缩系数>0.9。此外,给定可接受的收缩因子(例如,0.9),可以根据解释方差的Cox-Snell比估计出建立预测模型所需的样品大小。

此外,现代技术灵活性的增加意味着与逻辑回归等经典方法相比,可靠的估计可能需要更大的样本量。因此,我们采用了van der Ploeg等人的方法[53]来评估我们的最佳模型LGBM对样本量的敏感性。训练集的大小不同,并且从开发集中抽取了子样本。每个训练集大小重复30次以消除随机性,而平均AUC测量测试集上的性能。

重要的变量

为了衡量变量的重要性,我们首先根据交叉验证中的信息增益来评估多变量特征的重要性,并选择了前20个重要变量。然后,为了计算单个诊断类别中的特征重要性,每个选择的变量分别用于预测5个诊断类别,并以AUC衡量单变量变量的重要性。


诊断问卷概述

最终问卷由23个项目组成,其中包含分支逻辑。完整版的问卷可在多媒体附件1.项的内容显示在文本框1

诊断问卷中的项目。
  • 关于症状特征的一个问题是:头是否旋转?如果不是,那么需要说明头晕的类型(沉重/头脑混乱,摇摇晃晃或其他)
  • 三个问题关于频率,持续时间,以及第一次眩晕发作后的持续时间
  • 关于听力损失的情况,有一个问题,那就是,它的哪一边和如何变化
  • 关于耳鸣、耳胀、耳痛的情况,具体问三个问题,即发作前/发作中加重,发作后减轻,发作前/发作后是否改变,是哪侧?
  • 关于头痛是否存在的问题,特别是头痛发作的时间和相关家族史
  • 一个关于伴随性恐光症或语音恐惧症的问题
  • 一个关于在眩晕发作期间、之后或没有眩晕发作时的不稳定的问题
  • 一个关于站立或行走时症状是否会恶化的问题
  • 关于跌倒的情况,意识状态,攻击时是否失禁两个问题
  • 五题关于眩晕的触发因素,即躺下、翻身、快速起身、屏气、大声刺激、在一些特殊场景、特殊食物或气味、疲劳、失眠、生气
  • 一问到底是颈性眩晕,即上肢麻木疼痛还是颈部疼痛
  • 一个关于前驱症状的问题,即发病前的感冒、发烧和腹泻
  • 一个关于耳科疾病病史的问题,即耳漏,中耳炎,耳部手术
  • 一个关于头颈部创伤和手术史的问题
文本框1。诊断问卷中的项目。

参与者的人口学特征

来自7个参与中心(表1).回复率为96.2%(1693/ 1760,67人拒绝参与)。在1693例入选患者中,1041例(61.5%)得到了治疗专家的一次最终诊断,14例(0.8%)有一次以上的诊断,145例(8.6%)有可能的诊断,而其他493例(29.1%)在2个月内没有得到最终诊断。最终诊断结果分布不均匀。最常见的诊断为BPPV、前庭偏头痛、突发性感音神经性听力丧失伴前庭功能障碍(SSNHL-V)和梅尼埃病。由于只有1例最终诊断的患者被纳入模型开发和验证,5个诊断类别中的1041例患者(中位年龄50 [IQR 38-61]岁,608例[58.4%]女性)被纳入模型开发和验证。目前,不超过20例的低频率诊断被标记为“其他”,因为没有足够的病例可以形成单独的类别。

在1041例患者中,928例被分为训练集(用于建模和交叉验证),113例被纳入测试集(用于建模和交叉验证)。表2).图1显示了研究流程图。训练集和测试集的详细信息描述在表2

表1。参与者的人口学特征(N=1693)。
特征 价值
年龄(年),中位数(IQR) 51 (38 - 61)
性别,n (%)

991 (58.5)

男性 702 (41.6)
诊断率,n (%)

良性阵发性位置性眩晕 398 (23.5)

前庭偏头痛 203 (12)

梅尼埃病(又名内耳眩晕 194 (11.5)

伴有前庭功能障碍的突发性感音神经性听力丧失 173 (10.2)

其他人一个 73 (4.3)

多个诊断 14 (0.8)

可能的诊断 145 (8.6)

待定 493 (29.1)

一个这一类包括前庭神经炎、持续性体位知觉性头晕、心因性头晕、迟发性内淋巴积液、前庭阵发性发作、颈源性眩晕、听神经瘤、老老性前庭病、轻cupula、Ramsay-Hunt综合征、迷路瘘管和上半规管断裂综合征。

表2。训练数据集和测试集的特征。
特征 训练集(n=928) 测试集(n=113)
年龄(年),中位数(IQR) 50 (37-60) 53 (41 - 63)
性别,n (%)

536 (57.8) 72 (63.7)

男性 392 (42.2) 41 (36.3)
诊断率,n (%)

良性阵发性位置性眩晕 348 (37.5) 50 (44.2)

前庭偏头痛 182 (19.6) 21日(18.6)

梅尼埃病(又名内耳眩晕 168 (18.1) 26 (23)

伴有前庭功能障碍的突发性感音神经性听力丧失 164 (17.6) 9 (8)

其他人一个 66 (7.1) 7 (6.2)

一个这一类包括前庭神经炎、持续性体位知觉性头晕、心因性头晕、迟发性内淋巴积液、前庭阵发性发作、颈源性眩晕、听神经瘤、老老性前庭病、轻cupula、Ramsay-Hunt综合征、迷路瘘管和上半规管断裂综合征。

图1。在2019年8月至2021年3月期间,对新出现眩晕或头晕症状的患者进行了筛查。随访2个月内记录诊断。
查看此图

模型的开发和验证

交叉验证的9个模型中LGBM模型的AUC最高,为0.937 (95% CI 0.917-0.962), Brier评分最低,为0.057 (95% CI 0.049-0.068) (表3).因此,我们将其重新校准并作为最终的预测模型。

灵敏度分析中,用模态(频率最高的标签)输入缺失值时,9种方法的AUC和Brier评分均下降(表4).注意,LGBM不依赖于imputation方法;因此,它可以直接利用来自失踪以达到更好的预测性能。无imputation的LGBM与重新校准的LGBM (imputation为0)的性能相同,这验证了我们方法的鲁棒性。在交叉验证中,除了使用LASSO的逻辑回归外,集成学习方法比非集成学习方法表现更好,这表明在眩晕诊断中引入集成学习在特定的集成方法中是有效的。此外,LGBM在AUC和Brier评分上优于其他方法。

重新校准的LGBM模型在交叉验证中的受试者工作特征曲线如图所示图2表5显示交叉验证和外部验证中不同诊断类别的AUC、敏感性、特异性、似然比和准确性。该模型对SSNHL-V预测精度较高(AUC>0.98,阳性似然比[+LR]>20,阴性似然比[-LR]<0.05),对BPPV和Meniere病预测精度较高(AUC>0.95,敏感性>0.8,特异性>0.9,准确性>0.9,+LR>10, -LR <0.2),对前庭偏头痛具有较好的鉴别能力(AUC 0.9, 95% CI 0.87-0.92)。由于本组样本量有限,异质性较大,其他诊断的预测不稳定,交叉验证AUC为0.771 ~ 0.929,外部验证AUC为0.879 ~ 0.957。

交叉验证的校准曲线(图3)正确估计了梅尼埃病和前庭偏头痛的概率,略微低估了SSNHL-V和BPPV的概率。其他诊断的预测相对保守,因为它不太可能给出接近0或1的概率。交叉验证的Brier评分为0.058 (95% CI 0.049 ~ 0.068),表明预测概率与实际诊断比例吻合良好。我们还将我们的方法应用于外部数据集。结果表明,所选取的最佳模型LGBM对眩晕诊断的预测具有较好的泛化能力,AUC为0.958 (95% CI 0.951 ~ 0.969)。同时,LGBM也优于第二优方法logistic回归,其外部验证的AUC为0.939 (95% CI 0.925-0.956)。多变量特征在信息增益方面的重要性显示在表6

各诊断类别的整体收缩因子分析和敏感性分析结果表明,本研究的样本量足以进行模型开发。看到多媒体附件2有关样本量分析的更多细节。然后,计算特征在各个诊断类别中的重要性,在中的前20个贡献变量中的每一个表6用于独立预测5个诊断类别,单因素变量重要性以AUC (图4).

表3。候选算法的预测性能。
方法 曲线下面积(95% CI) Brier评分(95% CI)
Non-ensemble学习

决策树 0.765 (0.726 - -0.798) 0.125 (0.104 - -0.146)

岭回归 0.803 (0.780 - -0.831) 0.087 (0.071 - -0.104)

逻辑回归 0.928 (0.907 - -0.956) 0.060 (0.051 - -0.069)

支持向量分类 0.501 (0.499 - -0.505) 0.239 (0.220 - -0.258)

随机梯度下降 0.733 (0.611 - -0.824) 0.141 (0.083 - -0.254)
整体学习

随机森林 0.924 (0.900 - -0.949) 0.063 (0.056 - -0.070)

自适应增强 0.851 (0.793 - -0.901) 0.148 (0.144 - -0.151)

梯度增强决策树 0.925 (0.902 - -0.951) 0.064 (0.053 - -0.076)

轻型梯度提升机 0.935 (0.913 - -0.960) 0.057 (0.047 - -0.067)

重新校准光梯度增强机 0.9370.917 - -0.962) 0.058 (0.049 - -0.068)
表4。不同算法在用模式输入缺失数据时的性能。
方法 曲线下面积(95% CI) Brier评分(95% CI)
Non-ensemble学习

决策树 0.746 (0.690 - -0.791) 0.137 (0.114 - -0.169)

岭回归 0.788 (0.733 - -0.817) 0.096 (0.076 - -0.121)

逻辑回归 0.921 (0.900 - -0.943) 0.067 (0.057 - -0.082)

支持向量分类 0.500 (0.500 - -0.500) 0.240 (0.222 - -0.258)

随机梯度下降 0.727 (0.578 - -0.819) 0.148 (0.090 - -0.251)
整体学习

随机森林 0.919 (0.896 - -0.939) 0.068 (0.061 - -0.078)

自适应增强 0.833 (0.741 - -0.887) 0.148 (0.143 - -0.156)

梯度增强决策树 0.915 (0.888 - -0.935) 0.073 (0.059 - -0.093)

轻型梯度提升机 0.929 (0.906 - -0.950) 0.062 (0.055 - -0.072)

轻型梯度增厚机(无imput) 0.935 (0.916 - -0.956) 0.057 (0.049 - -0.065)
图2。每个诊断类别的95% CI(2条虚线之间)的受试者工作特征曲线(实线)。每个诊断类别的性能通过一个对休息方案进行评估。良性阵发性位置性眩晕;SSNHL-V:突发性感音神经性听力丧失伴眩晕。
查看此图
表5所示。不同诊断类别的预测能力。
AUC一个(95%置信区间) 敏感度(95% CI) 特异性(95% CI) + LRb(95%置信区间) lrc(95%置信区间) 准确度(95%置信区间)
良性阵发性位置性眩晕

简历d 0.97 (0.96 - -0.99) 0.94 (0.87 - -0.99) 0.92 (0.85 - -0.97) 13.23 (6.55 - -29.3) 0.07 (0.01 - -0.14) 0.92 (0.89 - -0.95)

电动汽车e 0.98 (0.97 - -0.99) 0.97 (0.92 - 1) 0.90 (0.83 - -0.94) 10.23 (5.88 - -17.92) 0.04 (0 - 0.09) 0.93 (0.90 - -0.96)
前庭偏头痛

简历 0.91 (0.87 - -0.94) 0.86 (0.76 - -0.95) 0.85 (0.74 - -0.95) 6.58 (3.56 - -13.93) 0.17 (0.07 - -0.27) 0.85 (0.78 - -0.92)

电动汽车 0.9 (0.87 - -0.92) 0.66 (0.52 - -0.76) 0.90 (0.85 - -0.96) 7.38 (4.71 - -12.05) 0.38 (0.26 - -0.51) 0.86 (0.82 - -0.88)
伴有眩晕的突发性感音神经性听力丧失

简历 0.99 (0.97 - 1) 0.95 (0.88 - 1) 0.95 (0.90 - -0.99) 25.07 (9.39 - -67.93) 0.05 (0 - 0.12) 0.95 (0.91 - -0.98)

电动汽车 1.00 (1.00 - -1.00) 1.00 (1.00 - -1.00) 0.98 (0.97 - -1.00) f(34.67负) 0.00 (0.00 - -0.00) 0.98 (0.97 - 1)
梅尼埃病(又名内耳眩晕

简历 0.96 (0.93 - -0.98) 0.92 (0.81 - 1) 0.90 (0.82 - -0.96) 10.79 (5.28 -22) 0.09 (0 - 0.21) 0.90 (0.84 - -0.95)

电动汽车 0.97 (0.97 - -0.98) 0.82 (0.69 - -0.88) 0.98 (0.95 - -0.99) 正(18.4负) 0.19 (0.12 - -0.31) 0.94 (0.91 - -0.96)
其他人

简历 0.86 (0.77 - -0.93) 0.83 (0.66 - 1) 0.78 (0.55 - -0.93) 4.44 (2.10 - -9.77) 0.21 (0 - 0.44) 0.78 (0.57 - -0.91)

电动汽车 0.92 (0.88 - -0.96) 0.74 (0.50 - -0.86) 0.90 (0.85 - -0.94) 7.59 (5.05 - -12.02) 0.38 (0.26 - -0.51) 0.89 (0.85 - -0.93)

一个AUC:曲线下面积。

b+LR:正似然比。

c-LR:负似然比。

d简历:交叉验证。

eEV:外部验证。

fInf:正似然比为无穷大,因为特异性为1。

图3。基于重新校准的光梯度增强机模型,在验证数据上逐点95%置信限(灰色带)的校准曲线(蓝色实线)。良性阵发性位置性眩晕;SSNHL-V:突发性感音神经性听力丧失伴眩晕。
查看此图
表6所示。轻梯度增压机模型中多变量特征的重要性。
变量 功能的重要性
突发性听力丧失 1039.8
发作时间 912.3
听力损失 694.8
首次发病时间 468.1
触发:起身、躺下或翻身 358.0
年龄 255.6
头痛病史 250.6
攻击频率 221.4
波动性听力损失 186.3
恐光症 185.7
第一次失聪的时间 183.7
反复出现的症状 155.9
耳鸣 135.5
耳朵丰满 135.4
发作时头痛 117.7
因站立或行走而加重 80.4
诱因:疲劳、睡眠不足 69.7
眩晕 65.0
上肢疼痛或麻木 62.4
攻击时不稳定 59.5
头痛家族史 54.2
男性 54.1
秋天 47.3
失去意识,大小便失禁 44.6
耳鸣:发作前加重,发作后减轻 36.7
触发因素:视觉刺激 31.0
触发:声音和压力 23.0
失稳:首次发病后 22.4
前驱症状:感冒、发烧、呕吐或腹泻 22.0
头晕家族史 17.4
诱因:某些食物 15.9
耳痛 11.6
摔倒时意识清醒 9.8
中耳炎或耳部手术史 7.2
耳鸣:眩晕时加重 4.5
波动的:逐渐恶化的 0.0
攻击之间的不稳定 0.0
近期有头颈部外伤或手术史 0.0
图4。在单变量预测中,采用曲线下面积作为变量重要性的估计。AUC:曲线下面积;良性阵发性位置性眩晕;SSNHL-V:突发性感音神经性听力丧失伴眩晕。
查看此图

主要研究结果

在这项多中心前瞻性队列研究中,开发了一份用于诊断眩晕的问卷,并使用通过问卷收集的患者历史数据开发了LGBM模型。据我们所知,这是第一个基于问卷的机器学习模型来预测眩晕的多种诊断。由于本研究中所有患者均来自耳鼻喉科和眩晕科诊所,因此诊断分布与以往在神经内科和平衡科诊所进行的研究不同[19-2126].在我们的研究中,SSNHL-V的患病率要高得多(173/1693,10.2%),而前庭神经炎的患病率则低得多(22/1693,1.3%)。

我们的模型在预测常见前庭诊断方面优于先前报道的基于问卷的统计模型[20.2126].一个可能的解释是,机器学习方法更擅长处理潜在的非线性关系和过拟合。此外,考虑到患者报告的历史信息的主观性,数据驱动模型比知识驱动模型更适合基于问卷的预测[9115455].与以往使用综合病史数据、体检和实验室检测的机器学习诊断系统相比,我们基于问卷的诊断模型有其优点[13-17].首先,病史为眩晕的原因提供了重要的线索,医生将根据这些线索来确认或排除一个假定的诊断。因此,基于问卷的诊断工具可以根据患者的病史提供早期决策支持,并有助于减少不必要的检查。此外,由于问卷数据直接来自患者,模型的表现不依赖于专业人员对患者病史的准确解释。此外,考虑到特定测试(如纯音测听、热量测试、视频头脉冲测试)的可及性有限,不需要特殊设备的问卷适用于不同的临床环境。然而,基于问卷的诊断模型也有其内在的局限性。患者报告的病史可能不准确,因为它容易受到回忆偏差、误解、患者情绪状态和其他主观因素的影响。同时,对于只有非特异性症状的患者,体检和实验室检查是更为重要的诊断工具。病史应始终与客观证据相结合,以作出更可靠的诊断。因此,未来有必要将体检和实验室检测结果引入系统,进行全面的逐步诊断预测。

限制

本研究存在以下局限性。诊断分布的不均匀使得模型很难对罕见诊断做出准确的预测。为了减少潜在的噪声,我们在建模中只纳入了最终诊断为1例的患者。排除诊断不确定的患者是一个潜在的偏倚来源。有几个原因导致这些病人没有得到明确的诊断。在某些情况下,BPPV患者在等待预定的位置测试和治疗(1-2周后)时可能会自发缓解,这也解释了我们队列中BPPV患病率相对于其他耳鼻喉科诊所较低的原因[56].排除这些患者可以降低噪声,提高模型性能。此外,一些患者仅出现短暂症状,没有明显的结构、功能或心理变化;故未作明确诊断。此外,虽然大多数患者在随访期间完成了所有必要的检查,但也可能有一些罕见的原因在2个月内没有确定,这可能加剧了数据的不平衡。然而,随着队列的扩大,更多的罕见诊断患者将被纳入,这将使模型能够以更高的准确性预测罕见诊断。我们还可以在建模过程中管理不平衡数据的影响。同时,外部验证中观察到的AUC高于交叉验证,这可能是由于测试集的样本量相对较小。需要更多确诊的参与者进行进一步验证。最后,由于本研究是在三级中心的耳鼻喉科和眩晕科门诊进行的,该模型的预测能力还有待于在不同的临床环境中验证。

结论

这项研究提出了第一个基于问卷的机器学习模型预测常见的前庭疾病。该模型采用集成学习方法LGBM,对BPPV、前庭偏头痛、Meniere病和SSNHL-V具有较强的预测能力。作为OVerAIR平台的一部分,它可用于辅助耳鼻喉科诊所的临床决策,并有助于BPPV的远程诊断。我们还在开发一款智能手机应用程序,将调查问卷与转诊、随访、治疗和康复结合起来,以改善眩晕患者的健康状况。OVerAIR研究的下一阶段将涉及神经学家的参与,这有望提高模型对中枢性眩晕的预测能力,并有助于评估其泛化和稳健性。

致谢

本研究得到上海市卫生健康委重大疾病(耳源性眩晕)跨学科诊疗能力建设项目、上海市临床重点专科(shslczdzk00801)、上海市卫生健康委科研基金一般项目(grant 202040286)、国家自然科学基金(91846302、72033003)资助。资金来源在本研究的设计和实施中没有任何作用;数据的收集、管理、分析和解释;报告的撰写;或者是提交稿件发表的决定。

作者的贡献

FY和HD可以完全访问研究中的所有数据,并对数据的完整性和数据分析的准确性负责。FY、PW、HD、CZ和HL负责本研究的概念和设计。所有作者都对数据的获取、分析或解释做出了贡献,并对重要知识内容的手稿进行了批判性修订。FY, PW, HD起草了手稿。FY和HD进行统计分析。HL和CZ获得了本研究的资助。FY、PW、HD、JW、HY、CZ和HL提供行政、技术或物质支持。HL和CZ监督了这项研究。

利益冲突

没有宣布。

多媒体附件1

最终版本的眩晕诊断问卷应用于本研究。

DOCX文件,21 KB

多媒体附件2

样本量分析。

DOCX文件,119 KB

  1. Eckhardt-Henn A, Best C, Bense S, Breuer P, Diener G, Tschan R,等。不同器质性眩晕综合征的精神病共病。中华神经科学杂志2008年3月2日(3):442 -428。[CrossRef] [Medline
  2. 贝斯特C, Eckhardt-Henn A, Tschan R, Dieterich M.不同前庭性眩晕综合征的精神病发病率和共病。一项超过一年的前瞻性纵向研究的结果。中华神经科学杂志2009,1(1):58-65。[CrossRef] [Medline
  3. 拉赫曼C, Henningsen P, Brandt T, Strupp M, Jahn K, Dieterich M,等。眩晕和眩晕患者的精神共病和社会心理障碍。中华神经外科杂志2015年3月86(3):302-308。[CrossRef] [Medline
  4. de Moraes SA, Soares WJDS, Ferriolli E, Perracini MR.社区老年人头晕的患病率和相关性:一项基于横断面人群的研究。BMC Geriatr 2013年1月04日;13:4 [免费全文] [CrossRef] [Medline
  5. Grill E, Strupp M, Müller M, Jahn K.眩晕患者在初级保健中的卫生服务利用:一项回顾性队列研究。中华神经科学杂志2014年8月27日(8):344 - 344。[CrossRef] [Medline
  6. Ahsan SF, Syamal MN, Yaremchuk K, Peterson E, Seidman M.影像学在急诊室评估眩晕患者的成本和效用。喉镜2013年9月;23(9):2250-2253。[CrossRef] [Medline
  7. Bakhit M, Heidarian A, Ehsani S, Delphi M, Latifi SM。眩晕病人的临床评估:诊断试验的必要性和作用。全球健康杂志2014年3月24日;6(3):194-199 [免费全文] [CrossRef] [Medline
  8. Royl G, Ploner CJ, Leithner C.急诊室头晕:诊断和误诊。中华神经病学杂志,2011;29(5):344 - 344。[CrossRef] [Medline
  9. 米拉E,布伊扎A,马格内斯G,曼弗林M,施密德R.专家系统作为耳神经病学的诊断辅助。中华耳鼻咽喉病学杂志,2000,20(2):366 - 366。[CrossRef] [Medline
  10. Gavilán C,加乐高,Gavilán J。Carrusel:前庭神经诊断专家系统。耳鼻咽喉学报1990;110(3-4):161-167。[CrossRef] [Medline
  11. Y, Juhola M, Pyykkö I.头晕和眩晕的计算机辅助诊断专家系统。中华医学杂志1993;18(4):293-305。[CrossRef] [Medline
  12. Laurikkala JPS, Kentala EL, Juhola M, Pyvkkö IV.应用于发现耳科诊断的新型机器学习程序。中国声学杂志2001(4):344 - 344。[CrossRef] [Medline
  13. 张志刚,张志刚,张志刚。基于神经网络的耳神经数据分类及其可视化。计算机生物医学2008年8月;38(8):858-866。[CrossRef] [Medline
  14. 陈晓明,陈晓明。基于贝叶斯概率模型的耳神经科病例分类。中华医学杂志2010 4月34(2):119-130。[CrossRef] [Medline
  15. 王志强,王志强,王志强。基于支持向量机和K -近邻法的耳神经多类问题的分类方法。种马健康技术信息2011;169:579-583。[Medline
  16. 杨晓明,王晓明,王晓明。一种基于机器学习的耳神经分类方法。2013年发表于:第35届IEEE医学与生物工程学会国际年会(EMBC);2013年7月3日至7日;日本大阪,1294-1297页。
  17. Exarchos T, Rigas G, Bibas A, Kikidis D, Nikitas C, Wuyts F,等。挖掘平衡障碍的数据,以开发诊断决策支持系统。Comput生物学医学2016年10月01日;77:240-248。[CrossRef] [Medline
  18. Exarchos T, Bellos C, Bakola I, Kikidis D, Bibas A, Koutsouris D,等。使用决策支持系统管理和建模平衡障碍:EMBALANCE项目。在:GeNeDis 2014: Adv Exp医学生物学。可汗:施普林格;2015:61 - 67。
  19. 赵建国,Piccirillo JF, Spitznagel, Kallogjeri D, Goebel JA。历史资料对头晕诊断的预测能力。耳神经药2011 Feb;32(2):284-290 [免费全文] [CrossRef] [Medline
  20. 杨晓明,张晓明,张晓明,等。眩晕性疾病的诊断指标。BMC Neurol 2010 10月25日;10:98 [免费全文] [CrossRef] [Medline
  21. Friedland DR, Tarima S, Erbe C, Miles a .预测常见前庭诊断的统计模型的发展。美国耳鼻咽喉头颈外科杂志2016年4月;142(4):351-356 [免费全文] [CrossRef] [Medline
  22. 今井T,东新海K,泷本Y,正村C,服部K,野原h。良性阵发性位置性眩晕诊断的访谈新评分系统。中国耳鼻咽喉学报2016;136(3):283-288。[CrossRef] [Medline
  23. 李国强,李国强,李国强,李国强。老年人良性阵发性位置性眩晕诊断的可靠性研究。Aging clinical Exp Res 2016 Oct;28(5):881-888。[CrossRef] [Medline
  24. 陈伟,舒林,王强,潘华,吴娟,方健,等。《中国版头晕障碍量表》中5项和2项问卷筛选客观良性阵发性位置性眩晕的有效性。神经科学2016年8月;37(8):1241-1246。[CrossRef] [Medline
  25. 李玲,齐霞,刘娟,王铮。良性阵发性位置性眩晕诊断问卷的编制与评价。神经科学杂志2017年10月;381:148-149。[CrossRef
  26. 罗琳琳,刘志强,刘志强,等。一份简短的头晕问卷的效用,以区分眩晕的原因和指导适当的转诊:一项多中心前瞻性盲法研究。Otol Neurotol 2015 Dec;36(10):1687-1694 [免费全文] [CrossRef] [Medline
  27. 金华,宋娟,钟玲,杨晓霞,金娟。良性阵发性位置性眩晕的问卷诊断。神经病学2019年12月30日;94(9):e942-e949。[CrossRef
  28. Britt CJ, Ward BK, Owusu Y, Friedland D, Russell JO, Weinreich HM。预测良性阵发性位置性眩晕的统计算法评估。美国耳鼻咽喉头颈外科杂志2018年10月01日;144(10):883-886 [免费全文] [CrossRef] [Medline
  29. Richburg H, Povinelli R, Friedland D.良性阵发性位置性眩晕的直接患者调查诊断。2018年12月发表于:第17届IEEE机器学习与应用国际会议;12月;奥兰多,佛罗里达州,美国p. 332-337。
  30. Masankaran L, Viyanon W, Mahasittiwat V.利用机器学习技术从眩晕障碍量表中分类良性阵发性定位眩晕类型。2018年发表于:智能信息学和生物医学科学国际会议;2018;泰国曼谷,第209-214页。
  31. Bisdorff A, Von Brevern M, Lempert T, Newman-Toker DE.前庭症状的分类:前庭疾病的国际分类。VES 2009十月01;19(1-2):1-13。[CrossRef
  32. Collins GS, Reitsma JB, Altman DG, Moons KGM, TRIPOD Group。透明报告个人预后或诊断的多变量预测模型(TRIPOD): TRIPOD声明。TRIPOD集团。发行量2015年1月13日;131(2):211-219 [免费全文] [CrossRef] [Medline
  33. Bhattacharyya N, Gubbels SP, Schwartz SR, Edlow JA, El-Kashlan H, Fife T,等。临床实践指南:良性阵发性位置性眩晕(更新)。耳鼻喉头颈外科2017 Mar;156(3_supplement):S1-S47。[CrossRef] [Medline
  34. 李志强,李志强,李志强,等。前庭偏头痛:诊断标准。VES 2012 11月01日;22(4):167-172。[CrossRef
  35. 罗佩泽- escamez JA, Carey J, Chung W, Goebel JA, Magnusson M, Mandalà M,等。Menière病的诊断标准。VES 2015 3月01日;25(1):1-7。[CrossRef
  36. Staab JP, Eckhardt-Henn A, Horii A, Jacob R, Strupp M, Brandt T,等。持续性体位知觉性头晕(PPPD)的诊断标准:Bárány学会前庭疾病分类委员会的共识文件。VES 2017 10月21日;27(4):191-208。[CrossRef
  37. 张志刚,张志刚,张志刚,等。前庭阵发性发作:诊断标准。VES 2017年1月27日;26(5-6):409-415。[CrossRef
  38. 崔建平,李志强,李志强,等。双侧前庭病:诊断标准Bárány学会分类委员会共识文件。VES 2017 10月21日;27(4):177-189。[CrossRef
  39. 分类和回归树。电线数据挖掘Knowl发现2011年1月06日;1(1):14-23。[CrossRef
  40. 里夫金RM,利珀特RA。关于正则化最小二乘的注释。CSAIL技术报告,2007年5月1日。URL:http://hdl.handle.net/1721.1/37318[2022-06-25]访问
  41. Hosmer jw, Lemeshow S, Sturdivant RX。应用逻辑回归。新泽西州霍博肯:John Wiley & Sons;2013.
  42. 徐长泉,张春昌,林佳杰。支持向量分类的实用指南。数据科学,2003。URL:http://www.datascienceassn.org/sites/default/files/Practical%20Guide%20to%20Support%20Vector%20Classification.pdf[2021-02-19]访问
  43. 随机梯度下降技巧。在:Montavon G, Orr G, Müller KR,编辑。《神经网络:交易技巧》柏林,海德堡:施普林格;2012:3 - 540。
  44. 随机森林。机器学习2001;45(1):5-32。[CrossRef
  45. 朱军,邹华,刘国强,刘国强。2009;2(3):349-360。[CrossRef
  46. 弗里德曼JH。随机梯度增强。计算统计与数据分析2002 Feb;38(4):367-378。[CrossRef
  47. 柯刚,孟Q, Finley T,王婷,陈伟,马伟,等。Lightgbm:一种高效的梯度增强决策树。2017年12月发表于:神经信息处理系统进展30 (NIPS 2017);2017年12月4日至9日;长滩,加州,美国。
  48. 饶春,吴勇。交叉验证的线性模型选择。统计规划与推理2005年1月;128(1):231-240。[CrossRef
  49. 范卡尔斯特B,尼波尔D,韦尔古威Y,德科克B,彭西娜MJ, Steyerberg EW。定义了风险模型的校准层次结构:从乌托邦到经验数据。中国临床流行病学杂志2016年6月;74:167-176。[CrossRef] [Medline
  50. 哈勒尔JFE。回归建模策略:应用于线性模型,逻辑回归和生存分析。美国纽约:施普林格;2015.
  51. Riley RD, Snell KI, Ensor J等的修正:开发多变量预测模型的最小样本量:第二部分二进制和事件时间结果。统计医学2019年12月30日;38(30):5672 [免费全文] [CrossRef] [Medline
  52. 李志强,李志强,李志强,等。开发多变量预测模型的最小样本量:第一部分-连续结果。2019年3月30日;38(7):1262-1275。[CrossRef] [Medline
  53. van der Ploeg T, Austin PC, Steyerberg EW。现代建模技术是数据饥渴:预测二分类端点的模拟研究。BMC medical Res methodo2014 12月22日;14:37 [免费全文] [CrossRef] [Medline
  54. 董超,王勇,张强,王宁。眩晕智能诊断的动态不确定因果图方法。中国生物医学工程学报,2014,26(1):344 - 344。[CrossRef] [Medline
  55. Feil K, Feuerecker R, Goldschagg N, Strobl R, Brandt T, von Müller A,等。基于ipad的医疗设备(mex)对眩晕和头晕诊断的预测能力。Front Neurol 2018;9:29 [免费全文] [CrossRef] [Medline
  56. Parker I, Hartel G, Paratz J, Choy N, Rahmann A.头晕和眩晕诊断比例的系统回顾。Otol Neurotol 2019 Jan;40(1):6-15。[CrossRef] [Medline


AUC:曲线下面积
BPPV:良性阵发性位置性眩晕
LGBM:轻型梯度提升机
OVerAIR:耳源性眩晕人工智能研究
SSNHL-V:伴有前庭功能障碍的突发性感音神经性听力丧失


R·库卡夫卡编辑;提交12.10.21;R Bajpai, S Kim同行评审;对作者30.01.22的评论;修订版本收到14.02.22;接受13.06.22;发表03.08.22

版权

©俞方舟、吴佩霞、邓浩文、吴景芳、孙珊、于慧倩、杨建明、罗显阳、何静、马秀兰、文俊雄、邱丹红、聂国辉、刘日照、胡国华、陈涛、张程、李华伟。最初发表于《医疗互联网研究杂志》(//www.mybigtv.com), 2022年3月8日。

这是一篇开放获取的文章,根据创作共用署名许可(https://creativecommons.org/licenses/by/4.0/)的条款发布,允许在任何媒介上无限制地使用、分发和复制,前提是正确引用最初发表在《医学互联网研究杂志》上的原创作品。必须包括完整的书目信息,//www.mybigtv.com/上的原始出版物的链接,以及此版权和许可信息。


Baidu
map