发表在gydF4y2Ba在gydF4y2Ba第24卷第10期(2022):10月gydF4y2Ba

本文的预印本(早期版本)可在以下网站获得gydF4y2Bahttps://preprints.www.mybigtv.com/preprint/38472gydF4y2Ba,第一次出版gydF4y2Ba.gydF4y2Ba
监督机器学习在声音障碍筛查和诊断中的有效性:系统综述和元分析gydF4y2Ba

监督机器学习在声音障碍筛查和诊断中的有效性:系统综述和元分析gydF4y2Ba

监督机器学习在声音障碍筛查和诊断中的有效性:系统综述和元分析gydF4y2Ba

审查gydF4y2Ba

1gydF4y2Ba沙特阿拉伯利雅得商业服务精益统一健康记录司gydF4y2Ba

2gydF4y2Ba联合王国利兹铅斯大学医学院利兹健康科学研究所gydF4y2Ba

3.gydF4y2Ba阿拉伯联合酋长国阿布扎比利瓦理工学院医学和健康科学系健康管理系gydF4y2Ba

4gydF4y2Ba哈马德·本·哈利法大学科学与工程学院信息与计算技术学部,卡塔尔基金会,卡塔尔多哈gydF4y2Ba

5gydF4y2Ba精确健康人工智能中心,威尔康奈尔医学,卡塔尔多哈gydF4y2Ba

通讯作者:gydF4y2Ba

阿拉Abd-alrazaq博士gydF4y2Ba

人工智能精准健康中心gydF4y2Ba

威尔康奈尔医学院gydF4y2Ba

教育城,卡塔尔基金会gydF4y2Ba

邮政信箱24144gydF4y2Ba

多哈回合谈判gydF4y2Ba

卡塔尔gydF4y2Ba

电话:974 55708549gydF4y2Ba

电子邮件:gydF4y2Baalaa_alzoubi88@yahoo.comgydF4y2Ba


背景:gydF4y2Ba在调查语音障碍时,包括语音筛查和诊断在内的一系列过程都被使用。这两种方法的标准化测试都有限,受临床医生经验和主观判断的影响。机器学习(ML)算法已被用作筛选或诊断语音障碍的客观工具。然而,ML算法在评估和诊断语音障碍方面的有效性还没有得到足够的学术重视。gydF4y2Ba

摘要目的:gydF4y2Ba本系统综述旨在评估ML算法在甄别和诊断语音障碍方面的有效性。gydF4y2Ba

方法:gydF4y2Ba对5个数据库进行了电子检索。研究检查了任何ML算法在检测病理声音样本中的性能(准确性、敏感性和特异性)。两名审稿人独立选择了这些研究,从纳入的研究中提取了数据,并评估了偏倚的风险。使用RevMan 5软件(Cochrane图书馆)的诊断准确性研究质量评估2工具评估各研究的方法学质量。提取研究、人群和指标检验的特征,并进行荟萃分析,以汇集ML技术的准确性、敏感性和特异性。异质性问题是通过讨论可能的来源和在必要时排除研究来解决的。gydF4y2Ba

结果:gydF4y2Ba在检索到的1409份记录中,有13项研究和4079名参与者纳入了本综述。在纳入的研究中,共使用了13种ML技术,最常见的技术是最小二乘支持向量机。ML技术筛查语音障碍的综合准确性、敏感性和特异性分别为93%、96%和93%。最小二乘支持向量机的准确率最高(99%),而k最近邻算法的灵敏度最高(98%),特异性最高(98%)。二次鉴别分析达到最低的准确性(91%),灵敏度(89%)和特异性(89%)。gydF4y2Ba

结论:gydF4y2BaML在声音障碍的筛查中显示出有希望的结果。然而,由于使用ML进行诊断的研究数量有限,这些发现在诊断语音障碍方面并不是结论性的;因此,需要进行更多的调查。虽然ML不可能单独作为当前诊断工具的替代品,但它可以作为临床医生评估患者的决策支持工具,这可以改善评估的管理流程。gydF4y2Ba

试验注册:gydF4y2Ba普洛斯彼罗CRD42020214438;https://www.crd.york.ac.uk/prospero/display_record.php?RecordID=214438gydF4y2Ba

J medical Internet Res 2022;24(10):e38472gydF4y2Ba

doi: 10.2196/38472gydF4y2Ba

关键字gydF4y2Ba



背景gydF4y2Ba

嗓音障碍是指声音产生的异常,可能是由于声带结构的病变或异常改变而引起的[gydF4y2Ba1gydF4y2Ba].据估计,2019年瑞典有16.9%的人口患有声音障碍[gydF4y2Ba2gydF4y2Ba],在2014年,研究发现在美国,每13个成年人中就有1个会出现声音障碍[gydF4y2Ba3.gydF4y2Ba].这在美国造成8.45亿美元的损失,原因是嗓音障碍的员工旷工[gydF4y2Ba4gydF4y2Ba,gydF4y2Ba5gydF4y2Ba].在个人层面,与背痛等其他慢性疾病相比,嗓音障碍可严重影响患者的社交生活和心理健康[gydF4y2Ba6gydF4y2Ba].因此,4.3%的嗓音障碍患者报告说,他们由于嗓音障碍而无法完成某些与工作相关的任务[gydF4y2Ba7gydF4y2Ba];这尤其影响到对声音有很高要求的职业,例如教师。gydF4y2Ba8gydF4y2Ba,歌手或电话接线员[gydF4y2Ba9gydF4y2Ba].因此,甄别或诊断嗓音障碍对于发现其他相关健康状况至关重要,例如可能是癌症症状的喉部病变[gydF4y2Ba10gydF4y2Ba];因此,应尽快作出诊断[gydF4y2Ba11gydF4y2Ba,gydF4y2Ba12gydF4y2Ba].gydF4y2Ba

诊断和筛选嗓音障碍包括听觉-知觉和工具评估。听觉-知觉评估由有资格的言语和语言治疗师(SLT)进行;在这个评估中,SLT通过倾听患者持续的元音产生来确定他们的声音质量;例如,the, aa,或发音或连续语音[gydF4y2Ba13gydF4y2Ba,gydF4y2Ba14gydF4y2Ba].此外,仪器评估包括喉部成像,以检查患者发出元音时声带的结构和功能;其他技术也被使用,包括视频喉内窥镜和视频喉频闪检查。此外,利用声学仪器分析患者声音样本的声学特征(频率、音高、音量和声音质量),利用计算机软件评估语音障碍[gydF4y2Ba13gydF4y2Ba-gydF4y2Ba15gydF4y2Ba].尽管上述评估得到了美国演讲-语言-听力协会的认可[gydF4y2Ba13gydF4y2Ba和美国耳鼻喉头颈外科学会[gydF4y2Ba16gydF4y2Ba],但仍缺乏规范这些或其他评估的标准化方法和指导方针[gydF4y2Ba17gydF4y2Ba].因此,若干限制可能对当前的评估构成风险[gydF4y2Ba18gydF4y2Ba,gydF4y2Ba19gydF4y2Ba].虽然每个病例都是客观评估的(通过仪器技术,如频闪镜),这些客观测试包括声学和视觉成像和视频;声学技术揭示患者语音样本的语音特征,具体来说,频率、强度、响度和音高,让临床医生了解其他指标,如患者的语速或声音;例如,声音可能是呼吸的或颤抖的。gydF4y2Ba18gydF4y2Ba].尽管这些仪器方法使临床医生能够进行客观测试,但测试的有效性在很大程度上取决于临床医生的听觉-知觉技能[gydF4y2Ba18gydF4y2Ba].这是因为临床医生首先评估仪器管理或患者路径,然后选择使用仪器评估的类型。当然,听觉-知觉评估的任何错误都会影响到工具管理,进而影响到整个病例的管理;这种主观判断可能不可靠,因为它依赖于临床医生的技能和经验[gydF4y2Ba18gydF4y2Ba].由于每个病例的诊断或筛查条件和经验水平不同,严重病例可能比轻症更容易诊断或筛查;因此,SLT的经验及其对每个患者病情判断的可靠性是不同的,可能会出现较低的评分间相关性(<0.9)[gydF4y2Ba19gydF4y2Ba].此外,有经验的slt和无经验的slt之间的一致性<75%,这使得经验成为诊断或筛查的重要部分[gydF4y2Ba20.gydF4y2Ba].gydF4y2Ba

机器学习(ML)在20世纪80年代初被引入语音研究[gydF4y2Ba21gydF4y2Ba].ML可以通过分析之前存储在数据库中的声音记录样本的声学特征来自动执行,例如马萨诸塞州眼耳医院(MEEI),该数据库存储了临床环境中患者的声音样本录音,这些录音记录了患者在发元音时的声音,如在MEEI [gydF4y2Ba22gydF4y2Ba或连续语音,或Saarbruecken语音数据库中的短语[gydF4y2Ba23gydF4y2Ba].ML也被用于临床病人的分析,通过麦克风记录病人的声音[gydF4y2Ba1gydF4y2Ba,gydF4y2Ba21gydF4y2Ba,gydF4y2Ba24gydF4y2Ba].ML被用于s的鉴别诊断,包括将声音样本诊断为2种疾病(声音障碍a或声音障碍b)中的一种,或将不同的声音样本筛选为健康或病理声音。该方法有助于提高诊断和筛查过程的客观性。ML涉及两种不同的模型:分类(监督学习)和聚类或分类(无监督学习)[gydF4y2Ba25gydF4y2Ba].在无监督模型中,算法对数据集中的关系进行分类和识别[gydF4y2Ba26gydF4y2Ba].相比之下,分类是一种预测模型,在临床诊断中定义标签,例如,疾病或非疾病[gydF4y2Ba26gydF4y2Ba],使其更常用于诊断[gydF4y2Ba27gydF4y2Ba].gydF4y2Ba

研究问题与目的gydF4y2Ba

尽管有几项研究调查了ML算法在检测和诊断语音障碍方面的有效性,但据我们所知,只有1篇综述试图总结这些研究得出的证据[gydF4y2Ba27gydF4y2Ba].然而,该综述也存在一些局限性,包括以下几点:它没有排除没有使用验证技术验证其ML结果的研究;它包括依赖科学而非技术或客观解决方案的研究,它们只依赖主观评价;它没有评估纳入的研究与任何偏见评估的风险。因此,本系统综述旨在评估监督ML算法在甄别和诊断语音障碍方面的有效性。因此,我们只考虑有监督的ML技术,因为有监督的ML算法更常用来诊断和检测疾病。gydF4y2Ba


本系统评审遵循Cochrane图书馆的诊断测试准确性(DTA)系统评审指南[gydF4y2Ba28gydF4y2Ba],以达到检讨的目标。本次评审的方案已注册到PROSPERO (CRD42020214438)。gydF4y2Ba

搜索策略gydF4y2Ba

搜索源gydF4y2Ba

2021年6月24日,我们搜索了以下5个数据库:MEDLINE(通过Ovid)、Embase、Scopus、Web of Science和ACM数字图书馆。没有语言限制,翻译非英语文章以检查其对审查的适用性。使用EndNote 9导出和管理检索到的引用。gydF4y2Ba

搜索条件gydF4y2Ba

总共有两组关键词被用于搜索数据库:一组代表目标诊断(如语音障碍),另一组代表感兴趣的干预(如ML算法)。这些术语来源于ML和语言治疗专家。还包括医学主题标题,以最大限度地提高MEDLINE和Embase搜索的敏感性。应用于MEDLINE和Web of Science的详细搜索策略分别见多媒体附录1和2。gydF4y2Ba

合格标准gydF4y2Ba

入选标准gydF4y2Ba

本综述的研究对象包括被诊断患有语音障碍的患者。对人口特征的类型(如年龄、性别和种族)没有任何限制。关于索引测试,我们重点关注有监督的ML技术(分类),该技术通过使用在受控环境(如语音实验室、医院、诊所和数据库)中收集的语音样本,用于筛选或诊断二元结果(如病态语音vs健康语音或语音障碍a vs b)中的语音障碍。本文关注的参考标准是工具评估和听觉-知觉评估,因为两者都遵循了美国演讲-语言-听力协会的建议[gydF4y2Ba17gydF4y2Ba和美国耳鼻喉学会[gydF4y2Ba16gydF4y2Ba].为了纳入这篇综述,研究必须通过使用以下结果中的至少一个来评估ML算法的诊断性能:准确性、敏感性和特异性。我们只纳入了同行评审的文章和实证研究,而不管它们的研究设计如何。对出版国家、出版年份或出版语言没有任何限制。gydF4y2Ba

排除标准gydF4y2Ba

我们排除了仅依靠临床医生判断而不使用任何工具来确保综述的有效性和可靠性的研究,因为依赖主观评估可能会受到临床医生经验水平的影响。排除无监督ML方法。会议论文、评论、报告、社论、正在进行的研究、非同行评审的文章、仅评估准确性的研究以及未评估敏感性和特异性的研究也被排除在外。gydF4y2Ba

研究选择gydF4y2Ba

研究选择首先通过筛选检索到的研究的标题和摘要进行。尽管我们排除了标题和摘要不符合任何合格标准的研究,但所有符合合格标准或因标题和摘要中缺乏信息而不明确的研究都被保留。然后,我们阅读了标题和摘要筛选后剩下的研究全文,以评估他们是否符合本综述。研究选择过程由2名审稿人完成。gydF4y2Ba

数据提取gydF4y2Ba

两位审阅人员创建了一个数据提取表单(gydF4y2Ba多媒体附录3gydF4y2Ba),并从每个纳入的研究中提取数据。如果一项研究没有报告所需的信息,我们会联系相应的作者以获取任何缺失的信息。如果通讯作者在两周内没有回复,我们会发送两次提醒。如果我们在第二次提醒两周后仍未收到答复,缺失的信息将被称为gydF4y2Ban / a:不适用gydF4y2Ba数据从Excel电子表格中提取。gydF4y2Ba

方法学质量评价gydF4y2Ba

使用诊断准确性研究质量评估(QUADAS)的修订版工具评估纳入研究的偏倚风险-2 [gydF4y2Ba29gydF4y2Ba],得到了Cochrane协作网的大力推荐[gydF4y2Ba30.gydF4y2Ba].QUADAS-2评估了纳入研究中4个领域的偏倚风险:患者选择、指标试验、参考标准、流量和时间(gydF4y2Ba多媒体附录4gydF4y2Ba7)。此外,QUADAS-2从患者选择、指标检验和参考标准3个方面对纳入研究的适用性进行了评价。QUADAS-2被修改以适应这篇综述(gydF4y2Ba多媒体附录8gydF4y2Ba).2名审稿人使用Review Manager (RevMan 5.4版)评估所有纳入研究的方法学质量。gydF4y2Ba

数据综合与分析gydF4y2Ba

通过叙述和定量综合来分析每种ML技术的结果(准确性、敏感性和特异性)。如果>1研究使用相同的ML技术,结果之间的差异不显著(<5%),则在meta分析中考虑最佳结果。所有结果均列于提取表(gydF4y2Ba多媒体附录3gydF4y2Ba).此外,如果一项研究使用了来自2个不同数据库的语音样本,则每个样本都被包含进来,以说明样本量(在森林图中称为样本a和样本B)。gydF4y2Ba

从符合条件的研究中提取的ML方法的准确性、敏感性和特异性通过随机效应比例荟萃分析进行分析,以估计集合比例和95% CI,其基于Wilson评分[gydF4y2Ba31gydF4y2Ba)程序。为了稳定方差,使用Freeman-Tukey双反正弦变换[gydF4y2Ba32gydF4y2Ba的异质性计算gydF4y2Ba我gydF4y2Ba2gydF4y2Ba测量(gydF4y2Ba33gydF4y2Ba].≤50%为低,51% ~ 75%为中等,≥76%为高[gydF4y2Ba33gydF4y2Ba].所有的结果都被绘制在森林图中。如果使用ML的范围是筛查,则纳入meta分析。使用统计软件stata16进行随机效应meta分析。gydF4y2Ba


搜索结果gydF4y2Ba

提出了在gydF4y2Ba图1gydF4y2Ba,通过搜索这5个数据库,共识别出1409个点击。没有从其他资源获得其他记录。去除重复后,剩余95.31%(1343/1409)的文章。扫描标题和摘要后,93.89%(1261/1343)条记录被排除,剩下82条(6.11%)条记录供全文阅读。在全文阅读后,我们进一步排除了84%(69/82)的文章;因此,只有16%(13/82)的研究被纳入本综述[gydF4y2Ba34gydF4y2Ba-gydF4y2Ba46gydF4y2Ba].gydF4y2Ba

‎gydF4y2Ba
图1。研究选择过程流程图。gydF4y2Ba
把这个图gydF4y2Ba

研究特点gydF4y2Ba

研究元数据gydF4y2Ba

所示gydF4y2Ba表1gydF4y2Ba在美国,这13项研究是在2000年至2020年期间进行的。然而,大多数研究(11/13,85%)是在2010年至2020年期间进行的。2016年是研究数量最多的一年(3/ 13,23%)。纳入的研究在12个不同的国家进行,其中约30%(4/13)在伊朗进行。所有的研究都是观察性研究,同行评议的文章,并用英语撰写。gydF4y2Ba

表1。纳入研究的元数据。gydF4y2Ba
研究gydF4y2Ba 一年gydF4y2Ba 国家gydF4y2Ba 出版语言gydF4y2Ba
Akbari和Arjmandi [gydF4y2Ba34gydF4y2Ba]gydF4y2Ba 2015gydF4y2Ba 伊朗gydF4y2Ba 英语gydF4y2Ba
Arias-Londoño等[gydF4y2Ba35gydF4y2Ba]gydF4y2Ba 2011gydF4y2Ba 希腊gydF4y2Ba 英语gydF4y2Ba
Arjmandi和Pooyan [gydF4y2Ba36gydF4y2Ba]gydF4y2Ba 2012gydF4y2Ba 伊朗gydF4y2Ba 英语gydF4y2Ba
Arjmandi等人[gydF4y2Ba37gydF4y2Ba]gydF4y2Ba 2011gydF4y2Ba 伊朗gydF4y2Ba 英语gydF4y2Ba
科代罗等人[gydF4y2Ba38gydF4y2Ba]gydF4y2Ba 2017gydF4y2Ba 葡萄牙gydF4y2Ba 英语gydF4y2Ba
加西姆扎德等人[gydF4y2Ba39gydF4y2Ba]gydF4y2Ba 2015gydF4y2Ba 伊朗gydF4y2Ba 英语gydF4y2Ba
Godino-Llorente和Gómez-Vilda [gydF4y2Ba40gydF4y2Ba]gydF4y2Ba 2004gydF4y2Ba 西班牙gydF4y2Ba 英语gydF4y2Ba
哈吉多罗夫等人[gydF4y2Ba41gydF4y2Ba]gydF4y2Ba 2000gydF4y2Ba 保加利亚和法国gydF4y2Ba 英语gydF4y2Ba
哈里哈兰等人[gydF4y2Ba42gydF4y2Ba]gydF4y2Ba 2014gydF4y2Ba 火鸡gydF4y2Ba 英语gydF4y2Ba
Lopes等人[gydF4y2Ba43gydF4y2Ba]gydF4y2Ba 2017gydF4y2Ba 巴西gydF4y2Ba 英语gydF4y2Ba
穆罕穆德等人[gydF4y2Ba44gydF4y2Ba]gydF4y2Ba 2020gydF4y2Ba 沙特阿拉伯和马来西亚gydF4y2Ba 英语gydF4y2Ba
苏伊西和谢里夫[gydF4y2Ba45gydF4y2Ba]gydF4y2Ba 2016gydF4y2Ba 突尼斯gydF4y2Ba 英语gydF4y2Ba
王等人[gydF4y2Ba46gydF4y2Ba]gydF4y2Ba 2011gydF4y2Ba 中国gydF4y2Ba 英语gydF4y2Ba
参与者或样本特征gydF4y2Ba

参加者或声音样本数目由40至960不等,共4019人,平均309人(gydF4y2Ba表2gydF4y2Ba).纳入的研究收集了6个不同来源的数据。在纳入的研究中,MEEI数据库是最常用的数据库(9/ 13,69%)。在大多数纳入研究中,从男性、女性和阴阳人参与者中收集声音样本(12/13,92%);然而,8%(1/13)的研究仅使用女性参与者的声音样本[gydF4y2Ba43gydF4y2Ba].纳入研究的参与者年龄从13岁到86岁,平均年龄45岁(平均46岁,标准差29.5岁)。gydF4y2Ba

表2。参与者或样本的特征。gydF4y2Ba
研究gydF4y2Ba 声音样本大小,ngydF4y2Ba 年龄(年),范围gydF4y2Ba 男性(%)gydF4y2Ba 设置或数据库gydF4y2Ba 数据库的可访问性gydF4y2Ba
Akbari和Arjmandi [gydF4y2Ba34gydF4y2Ba]gydF4y2Ba 293gydF4y2Ba 13 - 82gydF4y2Ba 40gydF4y2Ba MEEIgydF4y2Baag)ydF4y2Ba数据库gydF4y2Ba 私人gydF4y2Ba
Arias-Londoño等[gydF4y2Ba35gydF4y2Ba]gydF4y2Ba 628gydF4y2Ba 19 - 70gydF4y2Ba - - - - - -gydF4y2BabgydF4y2Ba MEEI公司芬欧汇川集团和gydF4y2BacgydF4y2Ba数据库gydF4y2Ba 私人gydF4y2Ba
Arjmandi和Pooyan [gydF4y2Ba36gydF4y2Ba]gydF4y2Ba 120gydF4y2Ba 18 - 86gydF4y2Ba 56gydF4y2Ba MEEI数据库gydF4y2Ba 私人gydF4y2Ba
Arjmandi等人[gydF4y2Ba37gydF4y2Ba]gydF4y2Ba One hundred.gydF4y2Ba 16 - 85gydF4y2Ba 67gydF4y2Ba MEEI数据库gydF4y2Ba 私人gydF4y2Ba
科代罗等人[gydF4y2Ba38gydF4y2Ba]gydF4y2Ba 154gydF4y2Ba - - - - - -gydF4y2Ba 34gydF4y2Ba MEEI数据库gydF4y2Ba 私人gydF4y2Ba
加西姆扎德等人[gydF4y2Ba39gydF4y2Ba]gydF4y2Ba 393gydF4y2Ba - - - - - -gydF4y2Ba - - - - - -gydF4y2Ba MEEI数据库gydF4y2Ba 私人gydF4y2Ba
Godino-Llorente和Gómez-Vilda [gydF4y2Ba40gydF4y2Ba]gydF4y2Ba 135gydF4y2Ba - - - - - -gydF4y2Ba - - - - - -gydF4y2Ba MEEI数据库gydF4y2Ba 私人gydF4y2Ba
哈吉多罗夫等人[gydF4y2Ba41gydF4y2Ba]gydF4y2Ba 400gydF4y2Ba - - - - - -gydF4y2Ba - - - - - -gydF4y2Ba 索菲亚大学医院语音科gydF4y2Ba 私人gydF4y2Ba
哈里哈兰等人[gydF4y2Ba42gydF4y2Ba]gydF4y2Ba 274gydF4y2Ba 20 - 68gydF4y2Ba - - - - - -gydF4y2Ba MEEI和MAPACI数据库gydF4y2Ba 私人gydF4y2Ba
Lopes等人[gydF4y2Ba43gydF4y2Ba]gydF4y2Ba 279gydF4y2Ba 18 - 65gydF4y2Ba 0gydF4y2Ba 语音实验室gydF4y2Ba 私人gydF4y2Ba
穆罕穆德等人[gydF4y2Ba44gydF4y2Ba]gydF4y2Ba 960gydF4y2Ba - - - - - -gydF4y2Ba - - - - - -gydF4y2Ba 圣言会gydF4y2BadgydF4y2Ba 私人gydF4y2Ba
苏伊西和谢里夫[gydF4y2Ba45gydF4y2Ba]gydF4y2Ba 120gydF4y2Ba - - - - - -gydF4y2Ba - - - - - -gydF4y2Ba 圣言会gydF4y2Ba 私人gydF4y2Ba
王等人[gydF4y2Ba46gydF4y2Ba]gydF4y2Ba 226gydF4y2Ba 26-58gydF4y2Ba - - - - - -gydF4y2Ba MEEI数据库gydF4y2Ba 私人gydF4y2Ba

ag)ydF4y2Ba马萨诸塞州眼耳医院。gydF4y2Ba

bgydF4y2Ba不可用。gydF4y2Ba

cgydF4y2BaUPM: Universidad Autónoma de Madrid。gydF4y2Ba

dgydF4y2BaSVD: Saarbruecken语音数据库。gydF4y2Ba

指数测试特性gydF4y2Ba

纳入的研究使用12ml算法(gydF4y2Ba表3gydF4y2Ba).最小二乘支持向量机(ls - svm)是所有研究中使用最多的算法(9/ 13,69%),其次是二次判别分析(QDA)(3/ 13,23%)和k -最近邻(K-NN)(4/ 13,31%)。85%(11/13)的研究报告采用了特征提取技术。61%(8/13)的研究提取了短期特征(如mel频率倒谱系数),23%(3/13)的研究提取了长期特征(如抖动和微光和基频)。在纳入的研究中,共使用了3种特征约简技术;线性判别分析是最常用的技术(4/ 13,31%),训练-测试分离验证是纳入研究中最主要的技术(10/ 13,77%),其次是交叉验证技术(4/ 13,31%)。gydF4y2Ba

表3。指数测试特性。gydF4y2Ba
研究gydF4y2Ba 机器学习方法gydF4y2Ba 特征提取gydF4y2Ba 功能降低gydF4y2Ba 验证gydF4y2Ba
Akbari和Arjmandi [gydF4y2Ba34gydF4y2Ba]gydF4y2Ba 回归模型gydF4y2Baag)ydF4y2Ba 均值,方差,偏度,系数峰度,小波子带系数gydF4y2Ba 线性预测分析和LDAgydF4y2BabgydF4y2Ba 70%的培训和30% 0%的测试gydF4y2Ba
Arias-Londoño等[gydF4y2Ba35gydF4y2Ba]gydF4y2Ba 回归模型gydF4y2Ba 12 MFCCgydF4y2BacgydF4y2Ba和MSMRgydF4y2BadgydF4y2Ba MSMR和二gydF4y2Ba 75%的培训和25%的测试(交叉验证-测试分离验证)gydF4y2Ba
Arjmandi和Pooyan [gydF4y2Ba36gydF4y2Ba]gydF4y2Ba QDAgydF4y2BaegydF4y2Ba, NMCgydF4y2BafgydF4y2Ba基于事例,gydF4y2BaggydF4y2Ba二,ML-NNgydF4y2BahgydF4y2Ba,电脑gydF4y2Ba我gydF4y2Ba 主成分分析gydF4y2BajgydF4y2Ba与乔治;功能选择:如果gydF4y2BakgydF4y2Ba, FFSgydF4y2BalgydF4y2Ba,石gydF4y2Ba米gydF4y2Ba, bbfgydF4y2BangydF4y2Ba PCA与乔治gydF4y2Ba 70%的培训和30%的验证gydF4y2Ba
Arjmandi等人[gydF4y2Ba37gydF4y2Ba]gydF4y2Ba QDA, NMC, PC, K-NN, LS-SVM和ML-NNgydF4y2Ba 基本频率(平均,高,低变化),STDgydF4y2BaogydF4y2Ba,再生能源gydF4y2BapgydF4y2Ba,抖动,微光,RAPgydF4y2Ba问gydF4y2Ba, PPQgydF4y2BargydF4y2Ba,平滑PPQ, vAmgydF4y2Ba年代gydF4y2Ba, NHRgydF4y2BatgydF4y2Ba方法,gydF4y2BaugydF4y2Ba, SPIgydF4y2BavgydF4y2Ba, FTRIgydF4y2BawgydF4y2Ba,阿特gydF4y2BaxgydF4y2Ba, TsamgydF4y2BaygydF4y2Ba, T0gydF4y2BazgydF4y2Ba,闪烁在dB, DVBgydF4y2BaaagydF4y2Ba近年来,gydF4y2BaabgydF4y2Ba, DUVgydF4y2Ba交流gydF4y2Ba, NVBgydF4y2Ba广告gydF4y2Ba, NSHgydF4y2BaaegydF4y2Ba,周期间基音提取过程中基音周期的总片段数gydF4y2Ba PCA与乔治gydF4y2Ba 70%的培训和30%的测试gydF4y2Ba
科代罗等人[gydF4y2Ba38gydF4y2Ba]gydF4y2Ba 支持向量机和达gydF4y2Ba房颤gydF4y2Ba MFCCs,线谱频率,和δ mfccgydF4y2Ba N/AgydF4y2Baag)gydF4y2Ba 75%训练和25%测试(k-fold交叉验证法,k=4;训练测试验证)gydF4y2Ba
加西姆扎德等人[gydF4y2Ba39gydF4y2Ba]gydF4y2Ba 安gydF4y2Baag)ydF4y2BahgydF4y2Ba和二gydF4y2Ba 伪邻分数和互信息gydF4y2Ba LDA和二gydF4y2Ba 70%的训练和30%的测试使用交叉验证gydF4y2Ba
Godino-Llorente和Gómez-Vilda [gydF4y2Ba40gydF4y2Ba]gydF4y2Ba LVQgydF4y2Baag)ydF4y2Ba我gydF4y2Ba MFCC系数,能量,一阶和二阶时间导数gydF4y2Ba MFCCgydF4y2Ba 70%的训练和30%的测试分离验证gydF4y2Ba
哈吉多罗夫等人[gydF4y2Ba41gydF4y2Ba]gydF4y2Ba 事例gydF4y2Ba Pitch period (To), PPQ, APQgydF4y2BaajgydF4y2Ba,刺gydF4y2Baag)ydF4y2BakgydF4y2Ba,形状的不相似程度[gydF4y2Ba47gydF4y2Ba的音高脉冲,LHERgydF4y2Baag)ydF4y2BalgydF4y2BaNHR,曼gydF4y2Ba我gydF4y2Ba和能量在音高脉冲-初拍gydF4y2Ba 乔治。gydF4y2Ba 训练-测试分离验证阶段(200发音);测试(200发声)gydF4y2Ba
哈里哈兰等人[gydF4y2Ba42gydF4y2Ba]gydF4y2Ba K-NN, LS-SVM和GRNNgydF4y2Ba一个gydF4y2Ba 5级WPTgydF4y2BaaogydF4y2Ba分解gydF4y2Ba N/AgydF4y2Ba 70%的训练和30%的测试使用常规验证和交叉验证gydF4y2Ba
Lopes等人[gydF4y2Ba43gydF4y2Ba]gydF4y2Ba QDAgydF4y2Ba F0测量(平均值和SD、抖动、微光和GNEgydF4y2Ba美联社gydF4y2Ba)gydF4y2Ba N/AgydF4y2Ba 交叉验证gydF4y2Ba
穆罕穆德等人[gydF4y2Ba44gydF4y2Ba]gydF4y2Ba 美国有线电视新闻网gydF4y2BaaqgydF4y2Ba 八度及其一阶和二阶导数gydF4y2Ba N/AgydF4y2Ba 10倍交叉验证gydF4y2Ba
苏伊西和谢里夫[gydF4y2Ba45gydF4y2Ba]gydF4y2Ba 回归模型和安gydF4y2Ba MFCC和一阶二阶导数gydF4y2Ba MFCC, LDA和deltagydF4y2Ba 70%的培训;和30%的测试gydF4y2Ba
王等人[gydF4y2Ba46gydF4y2Ba]gydF4y2Ba 生物法gydF4y2Baag)ydF4y2BargydF4y2Ba 每帧18-倒谱系数计算36维1导数的MFCC参数gydF4y2Ba 8 16 32的混合物gydF4y2Ba 10倍交叉验证gydF4y2Ba

ag)ydF4y2BaLS-SVM:最小二乘支持向量机。gydF4y2Ba

bgydF4y2BaLDA:线性判别分析。gydF4y2Ba

cgydF4y2BaMFCC:梅尔频率倒谱系数。gydF4y2Ba

dgydF4y2BaMSMR:调制光谱最小冗余。gydF4y2Ba

egydF4y2BaQDA:二次判别分析。gydF4y2Ba

fgydF4y2BaNMC:神经形态计算。gydF4y2Ba

ggydF4y2Ba事例:再。gydF4y2Ba

hgydF4y2BaML-NN:多层神经网络。gydF4y2Ba

我gydF4y2BaPC: Parzen分类器。gydF4y2Ba

jgydF4y2Ba主成分分析:主成分分析。gydF4y2Ba

kgydF4y2BaIFS:个体特征选择。gydF4y2Ba

lgydF4y2BaFFS:正向特征选择。gydF4y2Ba

米gydF4y2BaBFS:反向特征选择。gydF4y2Ba

ngydF4y2BaBBFS:分支定界特性选择。gydF4y2Ba

ogydF4y2BaSTD:基频的标准差。gydF4y2Ba

pgydF4y2BaPFR:发音基频。gydF4y2Ba

问gydF4y2Ba相对平均摄动。gydF4y2Ba

rgydF4y2BaPPQ:基音摄动商。gydF4y2Ba

年代gydF4y2BavAm:峰值振幅变化。gydF4y2Ba

tgydF4y2BaNHR: noise-to-harmonic比率。gydF4y2Ba

ugydF4y2BaVTI:语音乱流指数。gydF4y2Ba

vgydF4y2BaSPI:软语音索引。gydF4y2Ba

wgydF4y2BaFTRI:地震强度指数。gydF4y2Ba

xgydF4y2BaATRI:振幅震颤强度指数。gydF4y2Ba

ygydF4y2BaTsam:以秒为单位的分析语音数据样本的长度。gydF4y2Ba

zgydF4y2BaT0:声门平均周期。gydF4y2Ba

aagydF4y2BaDVB:语音中断的程度。gydF4y2Ba

abgydF4y2Ba次谐波度。gydF4y2Ba

交流gydF4y2BaDUV:无声程度。gydF4y2Ba

广告gydF4y2BaNVB:语音中断次数。gydF4y2Ba

aegydF4y2BaNSH:次谐波段数。gydF4y2Ba

房颤gydF4y2Ba大卫·爱登堡:判别分析。gydF4y2Ba

ag)gydF4y2BaN / A:不适用。gydF4y2Ba

啊gydF4y2Ba人工神经网络。gydF4y2Ba

人工智能gydF4y2BaLVQ:学习矢量量化。gydF4y2Ba

ajgydF4y2BaAPQ:螺距脉冲的振幅。gydF4y2Ba

正义与发展党gydF4y2BaSTAB:表示t0代的稳定性。gydF4y2Ba

艾尔gydF4y2BaLHER:高低能比。gydF4y2Ba

我gydF4y2BaHNR:谐波噪声比。gydF4y2Ba

一个gydF4y2Ba一般回归神经网络。gydF4y2Ba

aogydF4y2BaWPT:小波包变换。gydF4y2Ba

美联社gydF4y2BaGNE:声门噪声激励。gydF4y2Ba

aqgydF4y2BaCNN:传统神经网络。gydF4y2Ba

基于“增大化现实”技术gydF4y2BaGMM:高斯混合模型。gydF4y2Ba

质量评估结果gydF4y2Ba

偏见的风险gydF4y2Ba

在患者选择领域,只有38%(5/13)的研究被判定在患者采样中有较低的偏差风险,因为他们使用了适当的采样过程来选择声音样本(gydF4y2Ba多媒体附件9gydF4y2Ba).在所有纳入的研究中,由于有监督的ML试验的性质,指数试验的偏倚风险都很高,而且在对参考标准试验结果有事先了解的情况下解释了它们的结果。由于语音评估的主观性,目前尚不清楚参考标准对患者的分类是否正确。这导致在所有研究中参考标准领域存在不明确的偏倚风险,尽管参考标准是在指数检验之前使用的,而且研究结果不受指数检验结果的影响。在几乎所有的研究中,患者流量和时间的报道都很差(12/13,92%)。因此,这些研究被判定在患者流量和时间方面存在不明确的偏倚风险。gydF4y2Ba多媒体附件9gydF4y2Ba显示了QUADAS-2工具在所有3个领域的每个纳入研究中的偏倚判断风险,以及每个研究的适用性问题。gydF4y2Ba

适用性问题gydF4y2Ba

在所有纳入的研究中,患者是如何被选择的,不存在适用性问题,因为患者的特征、条件和每个测试的设置都符合回顾问题和标准(gydF4y2Ba多媒体附件9gydF4y2Ba).同样,由于纳入研究的ML算法方法符合ML的综述定义,所有纳入研究在指标检验中被判定适用性关注度较低。但84%(11/13)的研究在参考标准中适用性关注度不明确,因为这些研究的语音样本来自数据库,没有描述每个语音样本的详细诊断过程。gydF4y2Ba

ML算法的性能gydF4y2Ba

语音障碍诊断gydF4y2Ba

只有8%(1/13)的研究使用QDA算法来区分2 [gydF4y2Ba43gydF4y2Ba].所示gydF4y2Ba表4gydF4y2Ba, QDA的准确性、敏感性和特异性分别为70% ~ 77%、20% ~ 65%和74.76% ~ 95%。有关如何将QDA用作筛选工具的描述,请参见下面的部分。有关诊断结果的细目,请参阅gydF4y2Ba多媒体附件10gydF4y2Ba.gydF4y2Ba

表4。机器学习在诊断语音障碍中的表现。gydF4y2Ba
算法gydF4y2Ba 检测疾病gydF4y2Ba 精度(%)gydF4y2Ba 灵敏度(%)gydF4y2Ba 特异性(%)gydF4y2Ba 研究gydF4y2Ba
QDAgydF4y2Baag)ydF4y2Ba 声带息肉vs健康gydF4y2Ba 70.56gydF4y2Ba 50gydF4y2Ba 74.76gydF4y2Ba Lopes等人[gydF4y2Ba43gydF4y2Ba]gydF4y2Ba
QDAgydF4y2Ba 声带囊肿vs健康gydF4y2Ba 72.67gydF4y2Ba 60.83gydF4y2Ba 78.1gydF4y2Ba Lopes等人[gydF4y2Ba43gydF4y2Ba]gydF4y2Ba
QDAgydF4y2Ba 单边VFgydF4y2BabgydF4y2Ba麻痹或健康gydF4y2Ba 79.82gydF4y2Ba 20.gydF4y2Ba 92.38gydF4y2Ba Lopes等人[gydF4y2Ba43gydF4y2Ba]gydF4y2Ba
QDAgydF4y2Ba 中后三角间隙vs健康gydF4y2Ba 71.11gydF4y2Ba 45gydF4y2Ba 80.43gydF4y2Ba Lopes等人[gydF4y2Ba43gydF4y2Ba]gydF4y2Ba
QDAgydF4y2Ba 声带沟vs健康gydF4y2Ba 78.75gydF4y2Ba 50gydF4y2Ba 83.33gydF4y2Ba Lopes等人[gydF4y2Ba43gydF4y2Ba]gydF4y2Ba
QDAgydF4y2Ba VDDGERgydF4y2BacgydF4y2Ba与健康gydF4y2Ba 72.44gydF4y2Ba 33.33gydF4y2Ba 90.71gydF4y2Ba Lopes等人[gydF4y2Ba43gydF4y2Ba]gydF4y2Ba
QDAgydF4y2Ba 声带结节vs单侧VF麻痹gydF4y2Ba 76.61gydF4y2Ba 20.gydF4y2Ba 88.57gydF4y2Ba Lopes等人[gydF4y2Ba43gydF4y2Ba]gydF4y2Ba
QDAgydF4y2Ba 声带小结vs声带沟gydF4y2Ba 72.68gydF4y2Ba 50gydF4y2Ba 75.95gydF4y2Ba Lopes等人[gydF4y2Ba43gydF4y2Ba]gydF4y2Ba
QDAgydF4y2Ba 声带结节vs VDDGERgydF4y2Ba 71gydF4y2Ba 33.33gydF4y2Ba 89.05gydF4y2Ba Lopes等人[gydF4y2Ba43gydF4y2Ba]gydF4y2Ba
QDAgydF4y2Ba 声带小结vs声带沟gydF4y2Ba 70gydF4y2Ba 30.gydF4y2Ba 95gydF4y2Ba Lopes等人[gydF4y2Ba43gydF4y2Ba]gydF4y2Ba
QDAgydF4y2Ba 声带息肉vs健康gydF4y2Ba 75.14gydF4y2Ba 65gydF4y2Ba 78.33gydF4y2Ba Lopes等人[gydF4y2Ba43gydF4y2Ba]gydF4y2Ba
QDAgydF4y2Ba 声带囊肿vs健康gydF4y2Ba 73.22gydF4y2Ba 62.5gydF4y2Ba 78.57gydF4y2Ba Lopes等人[gydF4y2Ba43gydF4y2Ba]gydF4y2Ba

ag)ydF4y2BaQDA:二次判别分析。gydF4y2Ba

bgydF4y2BaVF:声襞。gydF4y2Ba

cgydF4y2BaVDDGER:胃食管反流引起的声音障碍。gydF4y2Ba

检查语音障碍gydF4y2Ba

在系统综述纳入的13项研究中,10项(77%)纳入meta分析,3项(23%)被排除[gydF4y2Ba39gydF4y2Ba,gydF4y2Ba40gydF4y2Ba,gydF4y2Ba44gydF4y2Ba,gydF4y2Ba46gydF4y2Ba].在这10项研究中,2项(20%)通过使用2个不同的数据库检验了ML技术:Arias-Londoño等[gydF4y2Ba35gydF4y2Ba(MEEI和unisidad Autónoma de Madrid [UPM]数据库)和Hariharan等[gydF4y2Ba42gydF4y2Ba因此,ML技术在这些数据库中的表现被纳入meta分析。有关筛选表现的更多资料,请参阅(gydF4y2Ba多媒体附件11gydF4y2Ba).gydF4y2Ba

精度gydF4y2Ba

在77%(10/13)的研究中,ML技术在评估语音障碍方面的准确性被报道。这些研究检查了9ml技术的准确性。9 ML技术的合并准确性为96% (95% CI 93%-98%;gydF4y2Ba图2gydF4y2Ba).meta分析研究显示显著异质性(gydF4y2Ba我gydF4y2Ba2gydF4y2Ba= 93.51%;gydF4y2BaPgydF4y2Ba<.001),下面讨论这种异质性的可能原因。在语音障碍评估方面,ML技术准确率最高的是LS-SVM(99%),而准确率最低的是QDA(91%)。gydF4y2Ba

‎gydF4y2Ba
图2。森林图显示了机器学习算法在语音障碍筛选中的准确性。人工神经网络;GRNN:一般回归神经网络;事例:再;LS-SVM:最小二乘支持向量机;ML-NN:多层神经网络;NMC:神经形态计算;PC: parzan分类器;QDA:二次判别分析; SVM: support vector machine.
把这个图gydF4y2Ba
灵敏度gydF4y2Ba

77%(10/13)的研究报告了ML技术在评估语音障碍方面的敏感性。这些研究检查了3ml技术的敏感性。3ml技术的合并灵敏度为96% (95% CI 91%-100%;gydF4y2Ba图3gydF4y2Ba).荟萃分析研究显示显著异质性(gydF4y2Ba我gydF4y2Ba2gydF4y2Ba= 95.49%;gydF4y2BaPgydF4y2Ba<.001),以及这种异质性的可能原因将在后面的部分中讨论。3 ML技术中K-NN的灵敏度最高(98%),QDA的灵敏度最低(89%)。gydF4y2Ba

‎gydF4y2Ba
图3。森林图显示了机器学习算法在语音障碍筛选中的敏感性。事例:再;QDA:二次判别分析;支持向量机:支持向量机。gydF4y2Ba
把这个图gydF4y2Ba
特异性gydF4y2Ba

77%(10/13)的研究检查了ML技术在评估语音障碍方面的特异性,其中包括3种ML技术的特异性。3ml技术的集合特异性为93% (95% CI 88%-97%;gydF4y2Ba图4gydF4y2Ba).meta分析证据显示显著异质性(gydF4y2Ba我gydF4y2Ba2gydF4y2Ba= 84.3%;gydF4y2BaPgydF4y2Ba<措施);异质性的可能原因将在下面讨论。ML技术特异性最高的是K-NN(98%),而特异性最低的是QDA(89%)。gydF4y2Ba

‎gydF4y2Ba
图4。森林图显示了机器学习算法在语音障碍筛选中的特殊性。事例:再;QDA:二次判别分析;支持向量机:支持向量机。gydF4y2Ba
把这个图gydF4y2Ba
异构和池化性能gydF4y2Ba

我们探索了合并绩效异质性的可能来源,以及使用短期参数的研究,如Arjmandi等人的研究[gydF4y2Ba37gydF4y2Ba],增加了K-NN和LS-SVM的异质性。在K-NN算法中,Arjmandi等[gydF4y2Ba37gydF4y2Ba](使用长期参数)被排除;特异性方面,敏感性为84.92%,准确性为91.55%。hadjitdorov等人的研究也发现了这一点。gydF4y2Ba41gydF4y2Ba],它也使用了长期参数,当它被排除时,所有K-NN结果的异质性降低了(gydF4y2Ba多媒体附件12gydF4y2Ba当每个研究被移除时,给出了关于异质性值的进一步细节)。同样,当Arjmandi等人的研究[gydF4y2Ba37gydF4y2Ba]从LS-SVM森林图中移除,发现在gydF4y2Ba我gydF4y2Ba2gydF4y2Ba测试值下降到91.89%。因此,长期参数会影响LS-SVM的灵敏度和K-NN中所有3种结果。此外,Arias-Londoño等人使用的数据库[gydF4y2Ba35gydF4y2Ba和苏伊西和谢里夫[gydF4y2Ba45gydF4y2Ba可能会增加LS-SVM性能的异质性。Arias-Londoño等[gydF4y2Ba35gydF4y2Ba]使用了西班牙语语音数据库UPM,因此将研究排除在LS-SVM的敏感性和特异性森林图之外,异质性分别降低到58%和71%。另一方面,Souissi和Cherif [gydF4y2Ba45gydF4y2Ba]使用了S(德语语音样本数据库)中的语音样本,而其余研究使用了英语语音样本数据库(MEEI;gydF4y2Ba多媒体附件12gydF4y2Ba).gydF4y2Ba


主要研究结果gydF4y2Ba

该研究系统地回顾了ML在评估语音障碍方面的表现,与Syed等人的另一项研究相似[gydF4y2Ba27gydF4y2Ba]检验了语音数据库级别的ML算法的准确性,并定性分析了每种ML算法技术的准确性。结论LS-SVM是本研究中最常用的算法,这与我们的研究结果一致。此外,性能表明LS-SVM的准确性为>93%,这与我们的研究结果相似。一般来说,当ML被用作筛查工具而不是诊断时,其表现被发现更有前途,在所有3个结果(准确性、敏感性和特异性)中均达到>90%。其次,不同算法之间,甚至同一算法在不同研究中的结果差异显著。例如,LS-SVM在所有3个结果中几乎为100%;Parzen分类器的灵敏度为74% ~ 100%。由于研究数量有限,ML在≤2项研究中的表现尚不清楚。在诊断中使用的ML算法也注意到了这一点,因为只有一项研究实现了ML算法来区分不同的疾病(诊断)。例如,QDA在筛查中的表现为83%的准确性,91%的敏感性和68%的特异性。 By contrast, it was found to be <76% in diagnosis, and the percentage fell sharply in sensitivity and specificity in the same study [43gydF4y2Ba].然而,由于使用ML进行诊断的研究数量有限(1项研究),这一发现不能成为结论性的。gydF4y2Ba

分析结果表明,K-NN和LS-SVM的准确率最高。K-NN的特异性增强;然而,LS-SVM被发现能更好地检测真阳性病例。因为在纳入的研究中,ML被用作筛查工具(病态声音vs健康声音),ML更敏感的能力可能比特异性的能力更重要。这可能是由于将健康的嗓音患者诊断为病理性嗓音的后果,这只会导致进一步的检查(频频检查)。此外,它不会给病人造成任何痛苦,因为诊断不是最终的,病人只会被转介作进一步检查。然而,在不太敏感的检测中,对患者的误诊可能导致有害的后果。gydF4y2Ba

研究及实践意义gydF4y2Ba

实际意义gydF4y2Ba

当一个人的力量、灵活性和声带结构导致病理性噪音和音色降低时,他们的声音病理可能严重到足以被认定为声音障碍。这些疾病可由组织疾病和组织变化、机械应力、表面不适、全身变化、肌肉和神经变化以及许多其他因素引起[gydF4y2Ba48gydF4y2Ba].它的研究取得了广泛的范围,部分原因是它的社会效益。开发了标准的数据库,以减轻语音障碍,包括新的功能和重点,同时使用深度神经网络针对特定的语音障碍。近年来,对发声问题的主客观评价在研究领域受到了相当多的关注[gydF4y2Ba49gydF4y2Ba].gydF4y2Ba

主观评估可能由临床医生进行,因为他们关注患者的声音,并使用不同的仪器来辨别各种声音障碍的诊断。ML可作为临床医生进行听觉-知觉评估的决策支持工具[gydF4y2Ba14gydF4y2Ba].第二种评估被称为“目标评估评估”,重点是自动、基于计算机的声学信号处理。这些信号评估和识别潜在的声乐病理,这可能无法被临床医生筛选或诊断[gydF4y2Ba50gydF4y2Ba].因此,这种类型的评价是非主观的。此外,在使用这种类型的评估时,可以通过使用各种智能设备的云技术在全球范围内捕获和存储声音。这对全球的研究人员是有益的,他们可以通过不同的学术机构访问数据。gydF4y2Ba

使用ML作为评估工具可以减少有经验和无经验的临床医生之间的学习差距。巴西奇和勒德洛[gydF4y2Ba20.gydF4y2Ba]发现在评估息肉或声带结节患者的语音质量时,法官间测试-重测试一致性<75%;因此,在语音评估中对有经验的临床医生的全面依赖可能会被消除。此外,在实践中使用工具评估的做法可以被取消,因为ML可以减少对更多典型案例进行工具评估的需要[gydF4y2Ba27gydF4y2Ba].然而,完全取消仪器评估可能导致误诊,例如,如果喉癌患者被筛查为“健康”,临床医生可能没有进行频闪检查。因此,我们的目标是进一步研究建立一个理想的、自动化的基于ml的系统。我们期望该系统能够灵敏、准确、高效、成功地检测和诊断各种语音障碍,为患者和从业者提供快速、轻松的服务。gydF4y2Ba

该综述显示ML在甄别和诊断语音障碍方面提供了最佳性能,可以通知临床医生异常。由于每项研究的特点不同,建议对ML算法的性能进行比较,包括准确性、特异性和敏感性。目前最常用的语音障碍的ML诊断方法是LS-SVM和人工神经网络算法。然而,在研究中没有明确解释使用1毫升方法对另一个方法的偏好。所有研究都使用内部验证(训练和测试分割和交叉验证)来评估ML质量。然而,外部验证是评估新数据ML预测真实质量的必要步骤。因此,在日常临床实践中实施ML诊断语音障碍,外部验证是必不可少的。因此,在使用ML进行任何临床诊断之前,必须进行外部验证。本综述中所研究的ML方法都没有使用外部验证。gydF4y2Ba

影响的研究gydF4y2Ba

本文分析了使用ML算法筛选和诊断语音障碍的有效性相关文献。它不仅提供了对过去20年进行的研究类型的洞察,而且还强调了需要进一步实验和分析的研究领域。研究者和实践者可以利用这项研究来提高他们对言语病理的客观筛选或诊断。例如,声音障碍[gydF4y2Ba23gydF4y2Ba], MEEI [gydF4y2Ba22gydF4y2Ba]和UPM数据库[gydF4y2Ba51gydF4y2Ba对语音障碍案例研究感兴趣的研究人员都可以访问。然而,这些数据仓库并非没有缺陷。例如,某些数据库被统一划分为健康类和不健康类。在使用这些数据发表的大多数研究中,这些声音通常被归类为“健康的”和“病态的”。有些数据库没有说明嗓音障碍的严重程度,也没有提供有关发声过程中病理症状的充分细节。因此,一些样本可能看起来健康正常,尽管被标记为病理,反之亦然。此外,>1紊乱可能用于标记文档,这可能会对合并或排除不同语言的样本具有挑战性[gydF4y2Ba52gydF4y2Ba].监督ML的性质,即“标记”测试需要对相应测试的参考标准查找的先验知识。这可能会导致在一些质量评估工具中存在较高的偏差风险,例如QUADAS-2工具,它在指数测试领域显示了较高的偏差风险。未来的研究人员可能希望考虑提供关于在检查ML的性能时如何应用参考标准的信息。此外,这些知识库可以确定对合适的人口统计学特征的更具体的判断,以及如何对这些细节进行适当的分类。最后,通过区分每种疾病的结果及其严重程度,可以更好地检验ML的鉴别诊断能力。这将允许更明确和具体的发现,对哪种类型的患者ML可能会更有效地使用。gydF4y2Ba

因为在纳入的研究中ML被用作筛查工具(病态声音vs健康声音),ML更敏感的能力可能比它更具体的能力更重要。这可能是由于将健康患者诊断为不健康(嗓音有病态的患者)的后果,这将导致进一步的检查(频频检查),而不会造成患者痛苦,因为此时的诊断还不是最终的,患者将被转到进一步的检查。误诊病人(较不敏感的检查)可能导致有害的后果和痛苦,例如,如果喉癌等威胁生命的疾病被误诊。gydF4y2Ba

还应考虑ML可以作为临床医生的决策支持工具,同时主观判断患者的声音,以决定是否需要进一步检查。应用ML算法作为筛选工具可以帮助预先确定患者的语音状况。因此,这可以支持临床医生在嗓音障碍评估中的整个管理过程,特别是在他们决定是否为患者应用仪器检查时,这一决定目前是主观的。因此,将ML作为筛查工具可以减少有经验和无经验临床医生之间的差距(一致性<75%)[gydF4y2Ba20.gydF4y2Ba],在声音评估方面对有经验的临床医生的全面依赖可能会被消除。此外,在实践中可以取消使用仪器评估,因为并非所有患者都必须接受仪器评估(ML可能会减少对健康病例使用仪器的需要)。因此,评估嗓音障碍的成本可能会降低。gydF4y2Ba

我们的发现也暗示ML可以用于基于网络的方法来检测语音障碍。这意味着算法可以用于智能手机应用程序或用户的电话,以检测语音障碍的存在,甚至跟踪他们的治疗进展。这可能会减少临床医生用于筛查、诊断或记录每次随访进展的时间。这项研究还发现,研究人员可能需要考虑调查各种ML算法在识别和诊断语音障碍方面的适用性。此外,建议添加到先前建立的数据库,这包括添加不同的语言,如阿拉伯语音病理数据库,到其他主流存储库。gydF4y2Ba

的优势gydF4y2Ba

这一审查的关键优势在于它遵循了DTA系统审查和搜索策略。首先,这篇综述是根据Cochrane图书馆DTA系统综述,其次,它使用了各种医学、计算机和工程数据库。这增加了审查的敏感性,扩大了搜索范围,克服了有关文章数量有限的问题。此外,在筛选过程中,如果摘要的相关性不明确,则将该研究纳入全文扫描。这就消除了从评论中删除相关文章的任何机会。此外,在参考标准试验中,纳入标准被限制在受控环境中,这可能会确保更准确和可靠的结果。gydF4y2Ba

这是第一次系统评估不同ML算法在语音障碍评估和诊断中的性能。共纳入13项观察性研究,这些研究招募了来自不同性别和不同年龄组(13-85岁)的患者。总共测试了14种ML技术,其中9种被纳入meta分析,并对其综合准确性、敏感性和特异性进行了估计。gydF4y2Ba

限制gydF4y2Ba

这篇综述的主要缺点是初级研究报告的局限性;例如,从数据库或患者招募过程中选择声音样本的标准,样本人口统计学特征的不良报告,以及每个病例中声音障碍的严重程度。这妨碍了发现异质性来源的能力,因为无法调查基于性别、年龄组或类型或每种疾病严重性的亚组分析。此外,审查的主要结果不能更具体地针对某一性别或年龄组或疾病的类型或严重程度。提及这些细节可以让我们进一步研究哪些因素——声音障碍、性别或年龄组——决定了ML表现的准确性。在患者选择领域,超过一半(8/ 13,60%)纳入的研究显示存在不明确的偏倚风险。关于如何从数据库中选择声音样本的糟糕报告导致估计的准确性受到偏差的影响。当声音样本不是随机选择的时候,偏差就会增加,因为它们可能是根据未报告的严重程度选择的。然而,由于纳入的研究数量有限,不可能将这些研究从meta分析中删除。gydF4y2Ba

所有纳入的研究(13/13,100%)都没有报告参考标准是如何使用的,因此导致总体参考标准的偏倚评估风险“不明确”。这主要是因为使用了数据库中的声音样本;因此,临床医生的评估不是由主要研究的作者进行的。此外,临床医生的评估被选择的数据库所应用,并没有在研究中报告。不知道评估是如何进行的增加了偏见的风险,审查的结果被发现是不明确的。虽然联系了作者要求更多关于声音样本选择和参考标准评估的细节,但没有收到任何回复。在几乎所有纳入的研究中(12/13,92%),报告不到位导致了患者流量和时间上的不明确偏见风险,特别是缺乏临床医生评估和患者声音记录之间的时间间隔的报告。例如,如果在临床医生评估后的几个月间隔录制一次录音,患者的病情可能与第一次录音时有所不同。因此,这增加了错误分类或误诊的机会,因为声音样本的诊断可能与临床医生的诊断不同。更好地报告患者的诊断和招募过程将导致更明确的偏见评估风险。gydF4y2Ba

结论gydF4y2Ba

ML在筛查中表现出良好的结果,其准确性、敏感性和特异性均较高。研究结果还表明,ML可以进一步用于新的智能手机应用程序的筛选目的,并且可以在网络上进行筛选。在学术研究中,建议对特定的患者人口统计和疾病进行更多的研究。然而,由于研究数量有限(仅1篇),尚不能就ML在诊断中的有效性得出明确的结论。因此,我们建议临床医生在筛查时使用ML作为决策支持工具。为获得更明确的结论,建议进行更多的研究,并鼓励进行适合ML在医疗目的应用和监督ML的偏倚风险评估。gydF4y2Ba

致谢gydF4y2Ba

作者对生物医学工程师Munerah Al-Abdulsalam的支持和指导表示诚挚的感谢。gydF4y2Ba

的利益冲突gydF4y2Ba

没有宣布。gydF4y2Ba

‎gydF4y2Ba
多媒体附录1gydF4y2Ba

Web of Science的搜索策略。gydF4y2Ba

PNG文件,196kbgydF4y2Ba

‎gydF4y2Ba
多媒体附录2gydF4y2Ba

MEDLINE的搜索策略。gydF4y2Ba

PNG文件,117kbgydF4y2Ba

‎gydF4y2Ba
多媒体附录3gydF4y2Ba

提取表。gydF4y2Ba

DOCX文件,14kbgydF4y2Ba

‎gydF4y2Ba
多媒体附录4gydF4y2Ba

诊断准确性研究质量评估2工具;病人选择域。gydF4y2Ba

PNG文件,97kbgydF4y2Ba

‎gydF4y2Ba
多媒体附件5gydF4y2Ba

诊断准确性研究质量评估2工具;指数测试领域。gydF4y2Ba

PNG文件,99kbgydF4y2Ba

‎gydF4y2Ba
多媒体附件6gydF4y2Ba

诊断准确性研究质量评估2工具;参考标准域。gydF4y2Ba

PNG文件,101kbgydF4y2Ba

‎gydF4y2Ba
多媒体附件7gydF4y2Ba

诊断准确性研究质量评估2工具;流和时间域。gydF4y2Ba

PNG文件,102kbgydF4y2Ba

‎gydF4y2Ba
多媒体附录8gydF4y2Ba

改进的诊断准确性研究质量评估2工具用于本系统综述。gydF4y2Ba

PNG文件,200kbgydF4y2Ba

‎gydF4y2Ba
多媒体附件9gydF4y2Ba

诊断准确性研究的质量评估2 .在所有领域和适用性关注的每个纳入的研究中,偏见判断的工具风险。gydF4y2Ba

PNG文件,96kbgydF4y2Ba

‎gydF4y2Ba
多媒体附件10gydF4y2Ba

用于诊断的机器学习算法的性能总结。gydF4y2Ba

PNG文件,40kbgydF4y2Ba

‎gydF4y2Ba
多媒体附件11gydF4y2Ba

机器学习算法在筛选中的性能总结。gydF4y2Ba

PNG文件,39kbgydF4y2Ba

‎gydF4y2Ba
多媒体附件12gydF4y2Ba

剔除各林样地的异质性研究后的异质性值。gydF4y2Ba

PNG文件,62kbgydF4y2Ba

  1. Baken RJ, Orlikoff RF。言语和声音的临床测量,第二版。巴尔的摩,马里兰州,美国:奇异出版社;2000.gydF4y2Ba
  2. Lyberg-Åhlander V, Rydell R, Fredlund P, Magnusson C, Wilén s基于斯德哥尔摩公共卫生队列的一般人群中声音障碍的患病率。J Voice 2019 11月33(6):900-905。[gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  3. 美国成年人中普遍存在的声音问题。喉镜2014年10月,124(10):2359 - 2362。[gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  4. Zabret M, hoevar boltegar I, Šereg Bahar M.职业性声音负荷对器质性声音障碍发生和治疗的重要性。Zdr Varst 2018年3月57日(1):17-24 [gydF4y2Ba免费的全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  5. 王晓燕,王晓燕,王晓燕,等。喉部功能障碍对工作功能障碍的影响。喉镜2012年7月,122(7):1589 - 1594。[gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  6. Benninger MS, Ahuja AS, Gardner G, Grywalski C.评估语音障碍患者的预后。J Voice 1998 Dec;12(4):540-550。[gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  7. Roy N, Merrill RM, Gray SD, Smith EM.普通人群中的嗓音障碍:患病率、危险因素和职业影响。喉镜2005年11月,115(11):1988 - 1995。[gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  8. 工作中的声音问题:对职业安全和健康安排的挑战。植物学报2000;52(1-3):120-125。[gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  9. 考夫曼JA,艾萨克森G.声音功能障碍的频谱。北岸耳鼻喉科医院1991年10月;24(5):985-988。[gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  10. 一个快速接入的沙哑声音诊所:对诊断喉部病理有用。中华医学会喉科杂志2001年12月15日(12):978-980。[gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  11. Dankovičová Z, Sovák D, Drotár P, Vokorokos L.基于机器学习的语音障碍检测方法。应用科学2018年10月15日;8(10):1927。[gydF4y2BaCrossRefgydF4y2Ba]gydF4y2Ba
  12. Tsanas A, Little MA, McSharry PE, Ramig LO。映射到标准度量的非线性语音分析算法实现了帕金森病平均症状严重程度的临床有用量化。J R Soc接口2011年6月06;8(59):842-855 [gydF4y2Ba免费的全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  13. 孤独症谱系障碍。美国演讲语言听力协会,2022年。URL:gydF4y2Bahttps://www.asha.org/practice-portal/clinical-topics/autism/gydF4y2Ba[2022-03-08]访问gydF4y2Ba
  14. Kempster GB, Gerratt BR, Verdolini Abbott K, Barkmeier-Kraemer J, Hillman RE.语音的听觉-知觉一致评价:标准化临床方案的发展。中华医学杂志2009年5月;18(2):124-132。[gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  15. 机能亢进的声音:误用和滥用综合症。正确的做法:福克斯·M,编辑。嗓音障碍及其管理。美国纽约:施普林格;1991:139 - 175。gydF4y2Ba
  16. Stachler RJ, Francis DO, Schwartz SR, Damask CC, Digoy GP, Krouse HJ,等。临床实践指南:声音嘶哑(发音困难)(更新)执行摘要。耳鼻咽喉头颈外科2018年3月158(3):409-426。[gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  17. Patel RR, Awan SN, Barkmeier-Kraemer J, Courey M, Deliyski D, Eadie T,等。声音仪器评估推荐方案:美国言语-语言-听力协会专家小组制定了一个声音功能仪器评估方案。Am J Speech Lang Pathol 2018 Aug 06;27(3):887-905。[gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  18. 运动语言障碍:基质、鉴别诊断和管理。美国马萨诸塞州波士顿:施普林格;2019.gydF4y2Ba
  19. Maier A, Haderlein T, Eysholdt U, Rosanowski F, Batliner A, Schuster M,等。一个自动评估声音和语言障碍的系统。演讲通讯2009年5月;51(5):425-437。[gydF4y2BaCrossRefgydF4y2Ba]gydF4y2Ba
  20. Bassich CJ, Ludlow CL。新临床医生使用感知方法评估语音质量。J Speech Hear disdis1986五月;51(2):125-133。[gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  21. Hegde S, Shetty S, Rai S, Dodderi T.自动检测语音障碍的机器学习方法研究。J Voice 2019年11月33(6):947.e11-947.e33。[gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  22. 实验室数据库|生理学、声学和语音感知实验室。麻省理工学院开放课程。2022.URL:gydF4y2Bahttps://ocw.mit.edu/courses/electrical-engineering-and-computer-science/6-542j-laboratory-on-the-physiology-acoustics-and-perception-of-speech-fall-2005/lab-database/gydF4y2Ba[2022-06-12]访问gydF4y2Ba
  23. Pützer M, Barry W. Saarbrücken语音数据库手册。2022年德意志Forschungsgemeinschaft。。URL:gydF4y2Bahttp://www.stimmdatenbank.coli.uni-saarland.de/help_en.php4gydF4y2Ba[2022-06-12]访问gydF4y2Ba
  24. Jackson-Menaldi MC. La voz patológica。西班牙马德里:社论Médica Panamericana;2002.gydF4y2Ba
  25. Larrañaga P,卡尔沃B,桑塔纳R,贝尔扎C,加尔迪亚诺J,因扎I,等。生物信息学中的机器学习。生物信息2006 3月7日(1):86-112。[gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  26. 罗舍尔特S,劳本海默K,梅尔顿PE,黄瑞杰。机器学习和临床表观遗传学:诊断和分类的挑战综述。临床表观遗传学2020 Apr 03;12(1):51 [gydF4y2Ba免费的全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  27. Syed SA, Rashid M, Hussain S.语音障碍数据库和应用机器学习技术的元分析。数学生物科学工程2020年11月11日;17(6):7958-7979 [gydF4y2Ba免费的全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  28. Macaskill P, Gatsonis C, Deeks J, Harbord R, Takwoingi Y. Cochrane诊断测试准确性系统回顾手册。科克伦方法。2010。URL:gydF4y2Bahttps://methods.cochrane.org/sdt/gydF4y2Ba[2022-06-12]访问gydF4y2Ba
  29. Whiting PF, Rutjes AW, Westwood ME, Mallett S, Deeks JJ, Reitsma JB, QUADAS-2 Group。QUADAS-2:诊断准确性研究质量评估的修订工具。Ann Intern Med 2011年10月18日;155(8):529-536 [gydF4y2Ba免费的全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  30. Deeks JJ, Bossuyt PM, Gatsonis C. Cochrane诊断测试准确性系统回顾手册。Cochrane协作网,2009。URL:gydF4y2Bahttps://methods.cochrane.org/sdt/gydF4y2Ba[2022-06-12]访问gydF4y2Ba
  31. 纽康比RG。单比例的双边置信区间:七种方法的比较。1998年4月30日;17(8):857-872。[gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  32. 弗里曼MF,杜克JW。与角和平方根相关的变换。安数学统计1950年12月21(4):607-611。[gydF4y2BaCrossRefgydF4y2Ba]gydF4y2Ba
  33. 希金斯JP,汤普森得分后卫,迪克斯JJ,奥特曼DG。测量元分析中的不一致性。BMJ 2003年9月6日;327(7414):557-560 [gydF4y2Ba免费的全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  34. Akbari A, Arjmandi MK.利用小波子带的线性预测残差信号自动检测喉部病理。生物医学信号处理控制2015 Apr;18:293-302。[gydF4y2BaCrossRefgydF4y2Ba]gydF4y2Ba
  35. Arias-Londoño JD,高迪诺-略伦特,马基基M, Stylianou Y.结合调制光谱信息和梅尔频率倒谱系数的病理声音自动检测。logomed Phoniatr Vocol 2011 july;36(2):60-69。[gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  36. 基于小波包特征、线性判别分析和支持向量机的病理语音质量评估优化算法。生物医学信号处理控制2012年1月7(1):3-19。[gydF4y2BaCrossRefgydF4y2Ba]gydF4y2Ba
  37. Arjmandi MK, Pooyan M, Mikaili M, Vali M, Moqarehzadeh A.基于不同特征约简方法的长时间特征和支持向量机识别语音障碍。J Voice 2011年11月25(6):e275-e289。[gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  38. 刘志军,刘志军,刘志军。基于层次分类和系统组合的喉生理和神经肌肉病变自动识别方法。J Voice 2017 5月;31(3):384.e9-384.14。[gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  39. Ghasemzadeh H,塔吉克Khass M, Khalil Arjmandi M, Pooyan M.基于相空间参数和Lyapunov谱的语音障碍检测。生物医学信号处理控制2015年9月22日:135-145。[gydF4y2BaCrossRefgydF4y2Ba]gydF4y2Ba
  40. Godino-Llorente JI, Gómez-Vilda P.基于短时倒谱参数和神经网络检测器的语音障碍自动检测。IEEE生物工程学报2004年2月;51(2):380-384。[gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  41. hadjitdorov S, Boyanov B, Teston B.用类特异性神经图谱检测喉病理。IEEE生物技术学报2000 3月4日(1):68-73。[gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  42. 王晓燕,王晓燕。一种检测声带病变的新方法。中国生物医学工程学报2014;29(6):891 - 891。[gydF4y2BaCrossRefgydF4y2Ba]gydF4y2Ba
  43. Lopes LW, Batista Simões L, Delfino da Silva J, da Silva Evangelista D, da Nóbrega E Ugulino AC, Oliveira Costa Silva P,等。声学分析测量在评估不同喉部诊断患者中的准确性。J Voice 2017 5月;31(3):382.e15-382.e26。[gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  44. Mohammed MA, Abdulkareem KH, Mostafa SA, Khanapi Abd Ghani M, Maashi MS, Garcia-Zapirain B,等。基于卷积神经网络模型的语音病理检测与分类。应用科学2020年5月27日;10(11):3723。[gydF4y2BaCrossRefgydF4y2Ba]gydF4y2Ba
  45. 李晓峰,李晓峰。人工神经网络和支持向量机在语音障碍识别中的应用。计算机科学学报2016;29(5):339-344。[gydF4y2BaCrossRefgydF4y2Ba]gydF4y2Ba
  46. 王旭,张军,闫燕。基于GMM-SVM的病态与正常声音识别。J Voice 2011 Jan;25(1):38-43。[gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  47. 系统审查:CRD在医疗保健领域进行审查的指南。评论与传播中心,2009。URL:gydF4y2Bahttps://www.york.ac.uk/media/crd/Systematic_Reviews.pdfgydF4y2Ba[2022-06-12]访问gydF4y2Ba
  48. Hariharan M, Polat K, Sindhu R, Yaacob S.一种用于声带病理远程监测的混合专家系统方法。app Soft Comput 2013 Oct;13(10):4148-4161。[gydF4y2BaCrossRefgydF4y2Ba]gydF4y2Ba
  49. Mehta DD, Hillman RE.声音评估:知觉、声学、空气动力学和内视镜成像方法的更新。Curr Opin耳鼻喉头颈外科2008年6月;16(3):211-215 [gydF4y2Ba免费的全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  50. Mesallam TA, Farahat M, Malki KH, Alsulaiman M, Ali Z, al - nasheri A,等。阿拉伯语语音病理数据库的开发及其利用语音特征和机器学习算法的评价。J Healthc Eng 2017;2017:8783751 [gydF4y2Ba免费的全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  51. Arias-Londoño JD, Godino-Llorente JI, Sáenz-Lechón N, Osma-Ruiz V, Castellanos-Domínguez G.一种改进的基于hmm特征空间变换的语音病理检测方法。模式识别2010 9月43(9):3100-3112。[gydF4y2BaCrossRefgydF4y2Ba]gydF4y2Ba
  52. Harar P, Galaz Z, Alonso-Hernandez JB, Mekyska J, Burget R, Smekal Z.面向稳健的语音病理检测。神经计算应用2018年04月04日;32(20):15747-15757。[gydF4y2BaCrossRefgydF4y2Ba]gydF4y2Ba


‎gydF4y2Ba
DTA:gydF4y2Ba诊断测试精度gydF4y2Ba
事例:gydF4y2Ba再gydF4y2Ba
二:gydF4y2Ba最小二乘支持向量机gydF4y2Ba
MEEI:gydF4y2Ba马萨诸塞州眼耳医院gydF4y2Ba
ML:gydF4y2Ba机器学习gydF4y2Ba
QDA:gydF4y2Ba二次判别分析gydF4y2Ba
显得无用:gydF4y2Ba诊断准确性研究的质量评估gydF4y2Ba
SLT:gydF4y2Ba言语和语言治疗师gydF4y2Ba
芬欧蓝:gydF4y2Ba马德里大学AutónomagydF4y2Ba


R·库卡夫卡编辑;提交04.04.22;A Ahmed, D Alhuwail的同行评议;对作者22.04.22的评论;修订版收到17.06.22;接受28.07.22;发表14.10.22gydF4y2Ba

版权gydF4y2Ba

©Ghada Al-Hussain, Farag Shuweihdi, Haitham Alali, Mowafa housh, Alaa Abd-alrazaq。最初发表于《医疗互联网研究杂志》(//www.mybigtv.com), 2022年10月14日。gydF4y2Ba

这是一篇开放获取的文章,根据创作共用署名许可协议(https://creativecommons.org/licenses/by/4.0/)发布,该协议允许在任何媒体上不受限制地使用、分发和复制,前提是要正确引用最初发表在《医学互联网研究杂志》上的原始作品。必须包括完整的书目信息,//www.mybigtv.com/上的原始出版物链接,以及版权和许可信息。gydF4y2Ba


Baidu
map