发表在gydF4y2Ba在gydF4y2Ba24卷gydF4y2Ba第六名gydF4y2Ba(2022)gydF4y2Ba: 6月gydF4y2Ba

本文的预印本(早期版本)可在gydF4y2Bahttps://preprints.www.mybigtv.com/preprint/30210gydF4y2Ba,首次出版gydF4y2Ba.gydF4y2Ba
基于机器学习的文本分析在紧急医疗调度中预测重伤患者:模型开发和验证gydF4y2Ba

基于机器学习的文本分析在紧急医疗调度中预测重伤患者:模型开发和验证gydF4y2Ba

基于机器学习的文本分析在紧急医疗调度中预测重伤患者:模型开发和验证gydF4y2Ba

原始论文gydF4y2Ba

1gydF4y2Ba台湾新北市卫生福利部台北医院急诊科gydF4y2Ba

2gydF4y2Ba国立台湾大学土木工程系,台北市gydF4y2Ba

3.gydF4y2Ba台湾新北市远东纪念医院急诊科gydF4y2Ba

4gydF4y2Ba台北市消防局紧急医疗服务科,台北市gydF4y2Ba

5gydF4y2Ba台北市台大医院急诊科gydF4y2Ba

6gydF4y2Ba台湾云林县台大医院云林分院急诊科gydF4y2Ba

*这些作者贡献相同gydF4y2Ba

通讯作者:gydF4y2Ba

陈耀华博士gydF4y2Ba

土木工程系gydF4y2Ba

国立台湾大学gydF4y2Ba

罗斯福路4区1号gydF4y2Ba

台北市,106gydF4y2Ba

台湾gydF4y2Ba

电话:886 2 3366 4255gydF4y2Ba

电子邮件:gydF4y2BaAlbertChen@ntu.edu.twgydF4y2Ba


背景:gydF4y2Ba在院前早期识别严重受伤的患者对于及时治疗和将患者运送到进一步的治疗机构至关重要。在以往的研究中,很少涉及调度精度问题。gydF4y2Ba

摘要目的:gydF4y2Ba在本研究中,我们的目标是通过对紧急呼叫的文本挖掘,建立一个基于机器学习的模型,用于道路事故后严重受伤患者的自动识别。gydF4y2Ba

方法:gydF4y2Ba获取2018年台湾台北市道路交通事故录音,随机采样。通话转移或非普通话演讲的数据被排除在外。为了预测紧急医疗技术人员在现场确定的严重创伤病例,所有纳入的病例都由人类(6名调度员)和机器学习模型(即院前激活的重大创伤(PAMT)模型)进行评估。PAMT模型使用词频-逆文档频率、基于规则的分类和伯努利naïve贝叶斯分类器开发。采用重复随机子抽样交叉验证方法评价模型的稳健性。比较了调度员和PAMT模型在严重情况下的预测性能。表现由敏感性、特异性、阳性预测值、阴性预测值和准确性来表示。gydF4y2Ba

结果:gydF4y2Ba虽然PAMT模型获得的平均敏感性和负预测值高于调度员,但其获得的平均特异性、阳性预测值和准确性更高。除5级和6级外,PAMT模型从0级(最低确定性)到6级(最高确定性)的平均准确度较高。调度员的总体性能与PAMT模型相似;然而,在调度员对自己的判断不太确定的情况下,PAMT模型具有更高的准确性。gydF4y2Ba

结论:gydF4y2Ba一个基于机器学习的模型,称为PAMT模型,被开发用于预测严重的道路事故创伤。研究结果表明,PAMT模型的精度并不优于参与调度员的精度;然而,当调度员在做出判断时缺乏信心时,它可以帮助他们。gydF4y2Ba

中国医学杂志,2018;24(6):e30210gydF4y2Ba

doi: 10.2196/30210gydF4y2Ba

关键字gydF4y2Ba



背景gydF4y2Ba

创伤是全球意外死亡的主要原因。据世界卫生组织统计,每年有500万人死于伤害。2012年,道路交通事故造成的伤害最多,是第九大死亡原因[gydF4y2Ba1gydF4y2Ba].严重创伤是一种时间敏感的紧急情况。及时转运有利于血流动力学特征不稳定的神经创伤和穿透性损伤患者[gydF4y2Ba2gydF4y2Ba].交通延误与功能预后不良有关[gydF4y2Ba3.gydF4y2Ba].gydF4y2Ba

院前分诊可使重症患者接受适当的时效性管理。对于心脏骤停和中风患者,调度员可以在手机上获得关键信息,如患者的意识水平、呼吸模式或院前中风程度[gydF4y2Ba4gydF4y2Ba,gydF4y2Ba5gydF4y2Ba].然而,当调度员遇到严重创伤时,还没有为他们设计标准化的问题。只有少数关于直升机紧急医疗服务的研究涉及创伤受害者派遣的准确性[gydF4y2Ba6gydF4y2Ba].目前预测严重程度的创伤量表需要生理或解剖评估[gydF4y2Ba7gydF4y2Ba].因此,在第一批紧急医疗技术人员(EMTs)到达现场之前,无法识别或评估受害者的病情。gydF4y2Ba

动机gydF4y2Ba

已对紧急呼叫进行内容分析,以发现影响调度的因素,并有可能协助院前分诊[gydF4y2Ba8gydF4y2Ba,gydF4y2Ba9gydF4y2Ba].具体来说,文本分类已经证明了对电话记录事件进行分类的有效性[gydF4y2Ba10gydF4y2Ba].此外,自然语言处理已应用于急诊医学。文本挖掘技术已被用于预测急诊科患者的分诊级别、住院时间、处置和死亡率[gydF4y2Ba11gydF4y2Ba-gydF4y2Ba16gydF4y2Ba].开发了基于文本分析的机器学习框架,以协助调度员在院前阶段进行院外心脏骤停(OHCA)识别;此框架已商业化[gydF4y2Ba17gydF4y2Ba-gydF4y2Ba20.gydF4y2Ba].这些技术可以在没有结构化问题时对患者进行风险分层,类似于通过电话对创伤患者进行评估。gydF4y2Ba

文本分类的经典过程包括文本预处理、特征提取和分类器构建。文本预处理的目的是通过文本的清洗和组织来去除噪声,有效地检索信息[gydF4y2Ba21gydF4y2Ba].常用的特征提取方法大致可分为词频和语义两个方面[gydF4y2Ba22gydF4y2Ba,gydF4y2Ba23gydF4y2Ba].机器和深度学习模型,如k-最近邻、决策树、支持向量机、多层感知器分类器和naïve贝叶斯,被广泛用作分类器[gydF4y2Ba24gydF4y2Ba-gydF4y2Ba28gydF4y2Ba].gydF4y2Ba

目的gydF4y2Ba

我们假设,在紧急呼叫中,可以根据呼叫者和接听者之间的沟通内容来识别严重创伤病例。本研究的主要研究问题和目标是通过对紧急呼叫的文本挖掘,开发一个基于机器学习的模型来自动识别道路交通事故中的重伤员。我们关注道路事故而不是所有的创伤病例,因为道路事故是造成创伤的主要原因,与其他类型的伤害相比,道路事故的紧急呼叫内容是同质的。由于之前没有合适的研究进行比较,我们的第二个目标是将模型的结果与6个参与调度的调度人员的判断进行比较。gydF4y2Ba


研究设计与设置gydF4y2Ba

本文描述了一项横断面研究,通过使用机器学习分析紧急呼叫的普通话文本来识别道路事故中的重伤患者。结果与人类判断的结果进行了比较。我们将重伤患者定义为符合EMT创伤分诊方案的重大创伤标准的患者,即院前激活的重大创伤(PAMT)。gydF4y2Ba

数据采集gydF4y2Ba

数据来自台北创伤登记处,这是一个创伤事故信息数据库,来自18家具有急救能力的医院中的8家。抽取了2018年被认为是PAMT的病例总数的四分之一的随机样本。剔除信息不完整的病例后,纳入92例PAMT患者(377例登记病例中的92例)。作为对照案例,调度系统将3个连续的非PAMT道路事故呼叫与同一天的每个PAMT进行匹配。如果某一天要匹配的非pamt案例数量不足,则只包括1或2个调用。本研究共考虑了92个PAMT呼叫和255个非PAMT呼叫。排除标准如下:呼叫者不在受害者身边,呼叫者不会说普通话,事故与车辆无关,呼叫者没有提供足够的信息。最终分析数据共114例,其中PAMT 42例,非PAMT 72例(gydF4y2Ba图1gydF4y2Ba).gydF4y2Ba

‎gydF4y2Ba
图1。数据采集和研究设计。PAMT:院前激活的重大创伤。gydF4y2Ba
查看此图gydF4y2Ba
伦理批准gydF4y2Ba

本研究由台大医院机构评审委员会(病例号201902043RINB)批准。gydF4y2Ba

模型开发gydF4y2Ba

如gydF4y2Ba图2gydF4y2Ba其中,形式化模型开发包括四个步骤:(1)文本预处理,(2)特征工程,(3)模型分类,(4)模型增强,提高模型性能。gydF4y2Ba

‎gydF4y2Ba
图2。模型的发展。PAMT:院前激活的重大创伤;TF-IDF:词频-逆文档频;KNN: k-最近邻;支持向量机:支持向量机;MNB:多项式naïve贝叶斯;BNB:伯努利naïve贝叶斯;MLP:多层感知器;SENS:敏感性; SPEC: specificity; PPV: positive predictive value; NPV: negative predictive value; ACC: accuracy. Repeated random subsampling-cross validation (RRS-CV) for 100 times were performed in the step of model enhancement. All training data include 39 PAMT and 65 non-PAMT cases; testing data included 3 PAMT and 7 non-PAMT cases.
查看此图gydF4y2Ba
文本预处理(步骤1)gydF4y2Ba

文本预处理的目的是组织数据,以便检索有用的信息。此过程包括分词、删除停止词和同义词分组(gydF4y2Ba图2gydF4y2Ba).首先,每个紧急呼叫都被手动转换为文本形式。连续的文本字符串被分割成单词,这些单词是最短的意义单位,至少包含一个字符。中文分词系统由中央研究院信息科学研究所及语言研究所开发[gydF4y2Ba29gydF4y2Ba,gydF4y2Ba30.gydF4y2Ba].为消除汉语复合词歧义造成的分词错误,在经验和试错的基础上,手工构建了具有权重的特殊术语词典。分词系统是指强迫某些词合并或分离所需的权重。随后,停止词被删除,以删除无关紧要的单词,如连词、代词和冠词。然后,对同义词进行分组,并将其视为同一个单词,从而潜在地减少了模型对特定单词的过拟合,从而为偏差方差控制提供了一种手段。从114篇原始文本中的27,000个字符中,大约有7000个不同的词义被识别出来。gydF4y2Ba

特征工程(步骤2)gydF4y2Ba

在特征工程中,通过特征提取将分割后的单词转换为机器可读的格式(步骤2.1,gydF4y2Ba图2gydF4y2Ba).由于紧急电话通常很短,谈话也很紧急,因此经常会提到一些重要的词(gydF4y2Ba多媒体附件1gydF4y2Ba).因此,我们使用词频-逆文档频率(TF-IDF)来衡量每个单词。TF-IDF计算包括两部分:TF和IDF (gydF4y2Ba多媒体附件2gydF4y2Ba).TF说明了单词的频率,而IDF解释了单词在整个文档中出现的罕见程度。一个词在一篇特定的文章中出现的频率越高,说明它的重要性。相反,这个词在整个文本中出现的频率越高,它的重要性就越低。通过同时考虑这2个频率,我们对所有单词的重要性进行排序,进行特征选择(步骤2.2,gydF4y2Ba图2gydF4y2Ba).7000个单词中最重要的160个是根据实验选出的。选择的特征被放置在特征空间中,以减少维度的数量,并使结果更具解释性。特征空间包括用于开发模型的选定特征。gydF4y2Ba

模型选择(第三步)gydF4y2Ba

对于模型选择,我们评估了几种常用的用于文本分类的机器学习模型,包括k-最近邻、决策树、支持向量机、多层感知器、多项naïve贝叶斯和伯努利naïve贝叶斯(BNB)。重复随机次抽样交叉验证(RRS-CV) 100次,避免过拟合,获得更稳定可靠的分类结果。RRS-CV以随机和重复的方式分割样本,不进行替换。用于比较的不同模型的表现为RRS-CV得分为100分的平均值。根据gydF4y2Ba表1gydF4y2Ba,其中,基于bnb的模型效果最好。BNB分类器是一种基于贝叶斯定理的监督学习模型。它假定每个输入变量与其他变量无关。根据式中的BNB方程gydF4y2Ba多媒体附件2gydF4y2Ba时,计算集中于该词是否出现在文档中的二进制信息。所选特征的布尔表达式构成了每个文档的特征向量。文档的类别估计依赖于每个类的最大后验值gydF4y2BakgydF4y2Ba,由类给出文档的可能性组成gydF4y2BakgydF4y2Ba它的先验概率。后验值最高的类别为机密文件。为避免出现零概率情况,采用拉普拉斯平滑法将附加平滑参数设为1。因此,BNB不需要超参数调优。与其他文本分类模型相比,BNB模型具有简单、计算速度快、无需超参数调整就能达到较高精度的优点。此外,该模型适用于处理小规模数据和短文本[gydF4y2Ba31gydF4y2Ba,gydF4y2Ba32gydF4y2Ba].给出了其他模型的结果和超参数整定gydF4y2Ba多媒体gydF4y2Ba.gydF4y2Ba

表1。机器学习模型的比较。gydF4y2Ba
模型gydF4y2Ba SENSgydF4y2Ba一个gydF4y2Ba(%)gydF4y2Ba 规范gydF4y2BabgydF4y2Ba(%)gydF4y2Ba PPVgydF4y2BacgydF4y2Ba(%)gydF4y2Ba 净现值gydF4y2BadgydF4y2Ba(%)gydF4y2Ba ACCgydF4y2BaegydF4y2Ba(%)gydF4y2Ba Youden指数gydF4y2Ba
然而,gydF4y2BafgydF4y2Ba 18.7gydF4y2Ba 89.0gydF4y2Ba 32.6gydF4y2Ba 72.1gydF4y2Ba 67.9gydF4y2Ba 0.077gydF4y2Ba
决策树gydF4y2Ba 32.7gydF4y2Ba 76.0gydF4y2Ba 35.9gydF4y2Ba 72.9gydF4y2Ba 63.0gydF4y2Ba 0.087gydF4y2Ba
支持向量机gydF4y2BaggydF4y2Ba 55.7gydF4y2Ba 74.0gydF4y2Ba 49.3gydF4y2Ba 80.3gydF4y2Ba 68.5gydF4y2Ba 0.297gydF4y2Ba
MNBgydF4y2BahgydF4y2Ba 19.0gydF4y2Ba 96.1gydF4y2Ba 42.2gydF4y2Ba 73.8gydF4y2Ba 73.0gydF4y2Ba 0.151gydF4y2Ba
BNBgydF4y2Ba我gydF4y2Ba 53.0gydF4y2BajgydF4y2Ba 86.7gydF4y2BajgydF4y2Ba 67.0gydF4y2BajgydF4y2Ba 81.6gydF4y2BajgydF4y2Ba 76.6gydF4y2BajgydF4y2Ba 0.397gydF4y2BajgydF4y2Ba
中长期规划gydF4y2BakgydF4y2Ba 53.7gydF4y2Ba 79.0gydF4y2Ba 55.6gydF4y2Ba 80.6gydF4y2Ba 71.4gydF4y2Ba 0.327gydF4y2Ba

一个gydF4y2BaSENS:敏感性。gydF4y2Ba

bgydF4y2Ba规范:特异性。gydF4y2Ba

cgydF4y2BaPPV:阳性预测值。gydF4y2Ba

dgydF4y2BaNPV:负预测值。gydF4y2Ba

egydF4y2BaACC:准确性。gydF4y2Ba

fgydF4y2BaKNN:最近的邻居。gydF4y2Ba

ggydF4y2Ba支持向量机:支持向量机。gydF4y2Ba

hgydF4y2BaMNB:多项式naïve贝叶斯。gydF4y2Ba

我gydF4y2BaBNB:伯努利naïve贝叶斯。gydF4y2Ba

jgydF4y2Ba基于bnb的模型获得了最佳的ACC和约登指数。gydF4y2Ba

kgydF4y2BaMLP:多层感知器。gydF4y2Ba

对于训练数据和验证数据的分割,我们在验证数据中设置了固定的PAMT与非PAMT案例的比例。如gydF4y2Ba图3gydF4y2Ba,当训练数据量大于验证数据量时,训练分数逐渐降低,验证分数逐渐增加。当训练数据和验证数据大小分别为104和10时,这两条线最接近。收敛性表明,在这样的训练样本数量下,增加更多的训练数据并不能显著提高分类性能。因此,对于所有文本分类模型,随机选择104个文本作为训练数据,其余10个文本作为验证数据(gydF4y2Ba图2gydF4y2Ba).训练数据包括39例PAMT和65例非PAMT,验证数据包括3例PAMT和7例非PAMT。模型分类的ground truth是EMT的现场判断,以二进制标签的形式表现出来。gydF4y2Ba图4gydF4y2Ba说明了基于bnb模型的可扩展性。随着训练数据的增加,模型拟合时间在0.002秒左右适度波动,但当训练数据大小为>104时,模型拟合时间显著增加。此外,104个训练数据点中有10个验证数据点具有最高的验证分数和第三短的模型拟合时间(gydF4y2Ba图5gydF4y2Ba).gydF4y2Ba

‎gydF4y2Ba
图3。学习曲线的伯努利naïve贝叶斯。gydF4y2Ba
查看此图gydF4y2Ba
‎gydF4y2Ba
图4。伯努利naïve贝叶斯的可扩展性。gydF4y2Ba
查看此图gydF4y2Ba
‎gydF4y2Ba
图5。伯努利naïve贝叶斯的性能。gydF4y2Ba
查看此图gydF4y2Ba
模型增强(第四步)gydF4y2Ba

为了优化模型的最终性能,我们使用特征添加(步骤4.1)和基于规则的判断(步骤4.2)增强了基于bnb的模型。在特征添加中,我们收集了专家提供的37个关键词,并与步骤2.2中选择的160个单词相结合,形成新的特征空间(gydF4y2Ba图2gydF4y2Ba).专家包括6名调度员和2名急诊医生。在他们听了114段录音后,他们被问到:“在紧急呼叫中,哪个关键字可以表明患者是PAMT患者还是非PAMT患者?”然后,他们根据自己的个人经验提供了关键词。37个关键字有望扩展重要特征集,这可能受到数据量小的限制。将160个单词和37个单词合并创建的特征空间用于开发增强模型。虽然重要的特征必须包括在内,但如果它们的频率不显著,它们对分类的贡献可能很小。因此,基于规则的判断(步骤4.2)被设计来突出37个建议关键字的重要性。具体来说,验证中使用的任何文本,只要包含专家提供的37个单词中的至少2个,就被归类为PAMT。不符合此规则的文本由BNB分类器进一步检查(gydF4y2Ba图2gydF4y2Ba).gydF4y2Ba

将基于bnb的改进模型与基于不同步骤组合的各种导数模型进行了比较。中给出了基于bnb模型的4个导数版本gydF4y2Ba表2gydF4y2Ba.模型A包括手动选择的特征和基于规则的判断。模型B是经典的文本分类模型,包括TF-IDF特征提取和BNB分类选择。模型C包括特征工程步骤和BNB分类的人工特征添加。最后,我们将最佳版本命名为PAMT模型。它包括步骤1到4.2,包括文本预处理、特征工程、模型分类和两种模型增强方法。gydF4y2Ba

表2。基于bnb的不同步骤组合模型。gydF4y2Ba
模型gydF4y2Ba 性能gydF4y2Ba 步骤包括gydF4y2Ba一个gydF4y2Ba BNBgydF4y2BabgydF4y2Ba分类gydF4y2Ba

SENSgydF4y2BacgydF4y2Ba(%)gydF4y2Ba 规范gydF4y2BadgydF4y2Ba(%)gydF4y2Ba PPVgydF4y2BaegydF4y2Ba(%)gydF4y2Ba 净现值gydF4y2BafgydF4y2Ba(%)gydF4y2Ba ACCgydF4y2BaggydF4y2Ba(%)gydF4y2Ba Youden指数gydF4y2Ba 1gydF4y2Ba 2gydF4y2Ba 4.1gydF4y2Ba 4.2gydF4y2Ba
模型gydF4y2Ba 54.7gydF4y2Ba 82.1gydF4y2Ba 56.8gydF4y2Ba 80.9gydF4y2Ba 73.9gydF4y2Ba 0.368gydF4y2Ba ✓gydF4y2Ba
✓gydF4y2Ba ✓gydF4y2Ba
模型BgydF4y2Ba 53.0gydF4y2Ba 86.7gydF4y2Ba 67.0gydF4y2Ba 81.6gydF4y2Ba 76.6gydF4y2Ba 0.397gydF4y2Ba ✓gydF4y2Ba ✓gydF4y2Ba

✓gydF4y2Ba
模型CgydF4y2Ba 54.0gydF4y2Ba 87.3gydF4y2Ba 67.8gydF4y2Ba 82.1gydF4y2Ba 77.3gydF4y2Ba 0.413gydF4y2Ba ✓gydF4y2Ba ✓gydF4y2Ba ✓gydF4y2Ba
✓gydF4y2Ba
PAMTgydF4y2BahgydF4y2Ba模型gydF4y2Ba 68.0gydF4y2Ba 78.0gydF4y2Ba 60.6gydF4y2Ba 85.8gydF4y2Ba 75.0gydF4y2Ba 0.460gydF4y2Ba ✓gydF4y2Ba ✓gydF4y2Ba ✓gydF4y2Ba ✓gydF4y2Ba ✓gydF4y2Ba

一个gydF4y2Ba步骤1,文本预处理;步骤2,词频-逆文档频率特征提取与选择;步骤4.1,手动特征添加;步骤4.2,基于规则的判断。gydF4y2Ba

bgydF4y2BaBNB:伯努利naïve贝叶斯。gydF4y2Ba

cgydF4y2BaSENS:敏感性。gydF4y2Ba

dgydF4y2Ba规范:特异性。gydF4y2Ba

egydF4y2BaPPV:阳性预测值。gydF4y2Ba

fgydF4y2BaNPV:负预测值。gydF4y2Ba

ggydF4y2BaACC:准确性。gydF4y2Ba

hgydF4y2BaPAMT:院前激活的重大创伤。gydF4y2Ba

人类参与者gydF4y2Ba

为了与PAMT模型进行参考比较,我们进行了一项调查,收集了6名志愿调度员的严重创伤判断。他们来自台北市和新北市的消防部门(gydF4y2Ba表3gydF4y2Ba).参与者被要求听114段交通事故的音频片段。由于我们专注于文本分析,参与者不允许接收文本以外的任何信息。因此,音频剪辑被转录成计算机合成的声音使用文本到语音工具。这些音频片段以男女声音随机播放。这样,讲话的语气、语速和情绪都被中和了。在听录音时,每个参与者根据个人经验和直觉将这些案例分为PAMT和非PAMT。他们还分享了关于每种情况下的确定性(确定或不确定)的信息。gydF4y2Ba

表3。参与调度员的简介。gydF4y2Ba
参与者gydF4y2Ba 性gydF4y2Ba 年龄(年),范围gydF4y2Ba 服务的城市gydF4y2Ba EMTgydF4y2Ba一个gydF4y2Ba经验(年)gydF4y2Ba 派遣经验(年)gydF4y2Ba
一个gydF4y2Ba 男性gydF4y2Ba - 39gydF4y2Ba 新北市gydF4y2Ba 13gydF4y2Ba 6gydF4y2Ba
BgydF4y2Ba 女gydF4y2Ba 40至49gydF4y2Ba 新北市gydF4y2Ba 10gydF4y2Ba 2gydF4y2Ba
CgydF4y2Ba 男性gydF4y2Ba - 39gydF4y2Ba 新北市gydF4y2Ba 14gydF4y2Ba 1gydF4y2Ba
DgydF4y2Ba 男性gydF4y2Ba - 39gydF4y2Ba 新北市gydF4y2Ba 10gydF4y2Ba 1gydF4y2Ba
EgydF4y2Ba 男性gydF4y2Ba - 39gydF4y2Ba 台北市gydF4y2Ba 10gydF4y2Ba 4gydF4y2Ba
FgydF4y2Ba 男性gydF4y2Ba - 39gydF4y2Ba 台北市gydF4y2Ba 9gydF4y2Ba 4gydF4y2Ba

一个gydF4y2Ba急救医学技术员。gydF4y2Ba

数据分析gydF4y2Ba

分析确定了PAMT模型预测的准确性、阳性预测值、阴性预测值、敏感性、特异性以及参与者的平均判断[gydF4y2Ba33gydF4y2Ba,gydF4y2Ba34gydF4y2Ba].gydF4y2Ba

准确率是指正确预测PAMT病例和非PAMT病例的比例。PAMT结果真预测值和非PAMT结果的病例比例可分别表示为阳性预测值和阴性预测值。敏感性和特异性分别表示分类系统正确识别PAMT和非PAMT病例的能力。用不同的模型计算约登指数,可表示为敏感性和特异性之和减1。gydF4y2Ba

所有114个案例都被分为0到6的确定性级别,这取决于有多少参与者认为一个案例是确定的gydF4y2Ba某些gydF4y2Ba.例如,一个确定性等级为4的案例表明,4个参与者对他们的判断是确定的,而另外两个则不是。同时计算了不同确定度的准确度。gydF4y2Ba

使用Python (Python Software Foundation)和Excel (Microsoft Corporation)进行数据管理和统计分析。gydF4y2Ba


样本gydF4y2Ba

最终分析共纳入114例患者。转录文本范围为84 ~ 652个字符,平均241.4个字符(SD 106.7);PAMT病例的平均字符数大于非PAMT病例(266,SD 102 vs 227, SD 107)。转录的计算机合成音频的长度范围为24 ~ 145秒,平均为58.9秒(SD 24.5秒),并且PAMT病例的平均通话时长长于非PAMT病例(64,SD 24秒vs 54, SD 24秒)(gydF4y2Ba多媒体附件4gydF4y2Ba).gydF4y2Ba

结果数据gydF4y2Ba

在这项研究中,机器学习模型在104个案例的随机样本上进行训练,并在其余10个案例上进行验证。RRS-CV进行100次,以获得更大的无偏性验证结果;此外,没有外部数据用于测试训练模型的性能。根据gydF4y2Ba表1gydF4y2Ba, BNB优于其他模型,因为它具有最高的整体指标:准确度(76.6%)和约登指数(0.397)。BNB的平均敏感性为53.0%,特异性为86.7%,阳性预测值为67.0%,阴性预测值为81.6%。由于仍有改进空间,在BNB的基础上进行模型增强以提高性能。增强的基于bnb的模型,即PAMT模型,表现出最佳的性能。其约登指数为0.460,平均敏感性、特异性、阳性预测值、阴性预测值和准确度分别为68.0%、78.0%、60.6%、85.8%和75.0% (gydF4y2Ba表2gydF4y2Ba).模型C仅通过添加6名志愿调度员提供的特征来增强其性能,其性能排名在PAMT模型之后。模型C的平均敏感性、特异性、阳性预测值、阴性预测值、准确度和约登指数分别为54.0%、87.3%、67.8%、82.1%、77.3%和0.413。模型A仅包含专家提供的特征,并基于规则判断进行分类。结果最差(敏感性54.7%;特异性82.1%;阳性预测值56.8%;阴性预测值80.9%;准确率73.9%;约登指数0.368)。gydF4y2Ba

相比之下,6名受试者的平均敏感性、特异性、阳性预测值、阴性预测值和准确度分别为63.1%、85.0%、71.7%、80.3%和76.8% (gydF4y2Ba多媒体gydF4y2Ba).表现最好的PAMT模型具有较高的敏感性和阴性预测值,但特异性、阳性预测值和准确性均低于参与者。总体而言,PAMT模型并没有超过参与调度员的性能(gydF4y2Ba图6gydF4y2Ba).gydF4y2Ba

‎gydF4y2Ba
图6。参与调度员与院前激活的重大创伤(PAMT)模型的总体表现。ACC:精度;NPV:负预测值;PAMT:院前激活的重大创伤;PPV:正预测值;SENS:敏感性;规范:特异性。gydF4y2Ba
查看此图gydF4y2Ba

在亚群分析中,如图gydF4y2Ba图7gydF4y2Ba,参与者在0 ~ 6确定水平上的平均准确率分别为66.7%、64.3%、68.2%、76.4%、56.9%、79.8%和87.1%。PAMT模型在0 ~ 6确定性水平上的平均准确率分别为83.3%、70.4%、72.7%、91.7%、58.3%、64.3%和81.3%。在将所有病例按不同的确定性级别进行分类后,除4级外,0 - 6级参与者的准确性普遍提高,而PAMT模型的准确性并没有呈现出这样的线性模式。PAMT模型的结果没有显示出明显的趋势;也就是说,由于BNB模型根据特征分布对案例进行分类,所以它们受到确定性水平的影响。如果我们将第5和第6级定义为gydF4y2Ba某些情况下gydF4y2Ba0到4级gydF4y2Ba不确定的情况下gydF4y2Ba,我们可以观察到,虽然PAMT模型的准确性低于参与者gydF4y2Ba某些gydF4y2Ba病例(77.52% vs 85.48%),其准确性高于参与者gydF4y2Ba不确定的gydF4y2Ba病例(73.57% vs 66.34%;gydF4y2Ba图7gydF4y2Ba).gydF4y2Ba

‎gydF4y2Ba
图7。参与调度员和PAMT模型在不同确定性水平上预测院前激活性重大创伤(PAMT)的准确性。gydF4y2Ba
查看此图gydF4y2Ba

主要研究结果gydF4y2Ba

我们的研究对该领域做出了3个主要贡献。首先,这是使用基于机器学习的模型在调度阶段识别严重受伤患者的初步研究。其次,该模型的整体性能与人工调度员的性能相似(gydF4y2Ba图6gydF4y2Ba).第三,对于调度人员不确定的情况(gydF4y2Ba图7gydF4y2Ba).gydF4y2Ba

由于没有合适的既往研究作为参考,我们招募了6名志愿调度员参与我们的研究。他们的判断被作为与模型比较的参考。尽管如此小的样本量不能代表所有调度员,但我们仍然能够观察到人类表现的异质性。如gydF4y2Ba多媒体gydF4y2Ba,三名参与者(A、B和E)具有高特异性和低敏感性,而其他三名参与者(C、D和F)在特异性和敏感性之间具有更平衡的数字。我们可以推测,不同的经历可能会影响判断,每个参与者选择的政策,无论是激进的还是保守的,也会产生影响。该模型具有较好的稳定性和可调性,可以缩小人为差异的范围,降低不确定性。gydF4y2Ba

本文提出的机器学习模型是文本分类模型。由于重要的词语经常在简短而断断续续的紧急呼叫中被反复提及(gydF4y2Ba多媒体附件1gydF4y2Ba),基于频率的特征提取方法TF-IDF证明了在严重创伤呼叫中选择代表性词语的能力。并对这些词进行特征相关分析(gydF4y2Ba多媒体附件6gydF4y2Ba).具有高相关系数的特征是在普通话中频繁出现的词语,或者在电话中需要问的问题中出现的词语。相比之下,低相关性词汇表明它们是独立出现的。尽管相关程度不同,但所有选择的特征都是有意义的,并且有可能成为判断PAMT的关键字。因此,这些单词的出现是机器学习模型的主要输入。此外,我们分析了文本的长度和PAMT与参与者之间的准确性。由于每个文本都是由单词出现次数构成的特征向量来表示的,原始长度可能是影响准确性的因素之一。gydF4y2Ba多媒体gydF4y2Ba给出进一步的结果。gydF4y2Ba

为了探索为什么机器学习在分类不确定案例时表现得更好,我们比较了专家建议的单词和模型选择的单词。在专家提供的37个单词中,有23个被认为是专门用于PAMT的关键词。在gydF4y2Ba多媒体附件8gydF4y2Ba,我们将这23个单词与模型选择的最可能出现在PAMT文本中的前23个决定性单词进行比较。在左栏中,大部分单词聚集在“患者状态”和“患者基本信息”类别中;在“地理信息”和“辅助词及其他信息”类别中很少。相比之下,右侧栏中的单词不仅被分组在“患者状态”类别中,还被分组在“地理信息”和“辅助词和其他信息”中。这一现象表明,参与者更多地关注患者的情况和受伤机制,而所提出的模型能够捕捉到其他信息,如事故发生的地点或对话中的措辞。在不确定的情况下,PAMT的明显关键字可能更少,这可能是所提出的模型更有用的原因。gydF4y2Ba

除了PAMT模型,我们还尝试了不同的特征组合和分类方法来开发其他三个模型。模型A、模型B、模型C分别为基于规则判断的人工特征添加、BNB分类的TF-IDF特征工程、TF-IDF特征工程+ BNB分类的人工特征添加(gydF4y2Ba表2gydF4y2Ba).PAMT模型由步骤2.1至4.2组成。在开发分类工具时,考虑敏感性和特异性是很重要的;因此,我们选择优登指数最高的模型作为我们最终的模型,即PAMT模型。PAMT模型的灵敏度也是最高的,适合作为一种分类工具使用。gydF4y2Ba

我们的结果表明,有必要结合机器学习(步骤2.1和2.2)和人类经验(步骤4.1和4.2)来开发院前调度分诊工具(gydF4y2Ba表2gydF4y2Ba).使用专家提供的基于规则判断的特征的纯手工模型(如模型A)或经典的基于机器学习的文本分类模型(如模型B)的性能都不够好。虽然C模型的特征是由TF-IDF选择组成的,并且是由专家提供的,但是由于没有基于规则的判断来增加这些关键词的重要性,所以它的表现不如PAMT模型。基于规则的判断使得专家建议词的附加特征在分类中更加重要,这是对有限数据的补充。尽管BNB模型的最佳分类性能表明,在通话中出现单词是识别PAMT案例的关键,但目前还没有机器学习模型可以完全取代人类调度员。gydF4y2Ba

与之前工作的比较gydF4y2Ba

利用院前数据对严重创伤患者进行早期识别的现场分诊和预后预测方面进行了大量研究。然而,在以往的研究中很少涉及调度精度[gydF4y2Ba35gydF4y2Ba,gydF4y2Ba36gydF4y2Ba].这些研究中使用的预测因子,无论是生理数据还是损伤机制,都很难通过电话获得。在为数不多的关于调度准确性的研究中,大多涉及直升机紧急医疗服务调度[gydF4y2Ba6gydF4y2Ba,gydF4y2Ba37gydF4y2Ba-gydF4y2Ba40gydF4y2Ba].在另一项研究中,苏格兰院前重症监护小组的临床医生和非临床医生之间的所有创伤紧急呼叫都被包括在内,并进行了比较[gydF4y2Ba41gydF4y2Ba].在研究中,两组识别重大创伤(损伤严重程度评分> - 15)的敏感性分别为0.112和0.259,特异性分别为0.998和0.995。我们的模型具有较高的敏感性和较低的特异性。然而,随着金本位的不同,结果也有所不同。我们选择现场EMT的判断作为金标准,因为它代表了院前的综合信息,而损伤严重程度评分是只有在医院才能获得的预后数据。此外,较高的灵敏度,避免了分流不足,使我们能够将模型应用于早期分流工具,可以根据患者的严重程度确定优先调度。gydF4y2Ba

针对机器学习调度支持系统,提出了一种通过调度识别OHCA的商业化模型[gydF4y2Ba17gydF4y2Ba].该模型由语音自动识别和文本分析两部分组成。在丹麦和瑞典进行的两项回顾性研究中,在准确性和时间方面均报告了积极的结果[gydF4y2Ba18gydF4y2Ba,gydF4y2Ba19gydF4y2Ba].在丹麦的一项随机对照试验中,该模型的表现超过了人类的识别能力;然而,在模型辅助下,调度员识别OHCA的能力没有显著提高[gydF4y2Ba20.gydF4y2Ba].尽管在识别OHCA和严重创伤方面存在许多差异,但该模型也使用了基于机器学习的文本分析。另一种基于机器学习的语音分析模型被提出来识别OHCA呼叫者的情绪状态[gydF4y2Ba42gydF4y2Ba].虽然目标与我们的方法不同,但该研究的样本量也较小,数据来源是紧急呼叫的音频。我们有理由期待,语义和情感分析的结合可能会提高未来模型的性能。gydF4y2Ba

限制gydF4y2Ba

我们的研究有几个局限性。首先,文本预处理需要人为干预。录音中的对话往往是片段,没有完整的语法结构,包含特定的术语。需要根据特定的医学领域、地域特征和文化,构建用于分词、停词删除和同义词分组的定制词典。虽然有参考文献,但应用这些程序需要研究人员完全理解电话对话[gydF4y2Ba29gydF4y2Ba].我们假设每个理解对话的人都会以同样的方式处理音频和文本材料;否则,我们在后面的步骤中使用的特性将是不同的。这一限制可以通过用自动程序取代这一步骤来克服。gydF4y2Ba10gydF4y2Ba].第二,调度员在提供关键词之前听了114段音频片段。尽管他们不知道答案,并被要求根据他们的经验提供他们的观点,他们可能会从他们刚刚听到的音频中选择单词。第三,由于严格的协议和行政部门对这一新颖研究概念的关注,不允许复制紧急呼叫的录音,只允许有限数量的工作人员在短时间内访问这些录音。考虑到预处理步骤是劳动密集型的,我们无法招募大样本量。为了弥补这一不足,我们在台北创伤登记处随机抽取了2018年全年的pamt。对于文本分类,影响结果的主要因素可能不是由数据大小决定的[gydF4y2Ba43gydF4y2Ba].另一项创新研究,对特定领域贡献了少量数据[gydF4y2Ba42gydF4y2Ba].本研究作为概念的证明,旨在揭示该方法在目标应用中的潜力。然而,一些先进的文本分类模型,如具有语义特征提取方法的深度学习模型[gydF4y2Ba44gydF4y2Ba],可能会受到数据大小和特征的限制。因此,研究应该在更大的规模上进行,更多的参与者,整合数据,形成更成熟的模型,以供实际部署。gydF4y2Ba

结论gydF4y2Ba

研究结果表明,应用机器学习模型在识别严重创伤事故呼叫方面并不优于调度员;然而,当调度员对呼叫判断缺乏信心时,该模型可以帮助调度员。为了进一步的模型开发和验证,需要进行更大规模的研究。gydF4y2Ba

致谢gydF4y2Ba

本研究由台湾科技部(授权MOST 108-2314-B-002-130-MY3和MOST 109-2314-B-002-154-MY2)和国立台湾大学医院(授权UN110-052)资助。作者在此感谢参与本研究的6位志愿者调度员:刘启礼、王定川、赖杰里、钟顺伟、张玉池和徐玉珠。如果没有他们的帮助,这是不可能的。作者对台北市消防局救护部及调度中心的急救医疗技术人员的出色表现和质量保证表示赞赏。他们的承诺和成就大大改善了院前护理。作者也要感谢工作人员和国立台湾大学医院统计咨询组的张晋浩博士在统计方面的帮助。gydF4y2Ba

作者的贡献gydF4y2Ba

KCC和YCC作为第一作者投稿,WCC和AYC作为通讯作者投稿。KCC对形式化分析、可视化和原始草案做出了贡献。YCC对数据管理、形式分析、方法论和原始草案做出了贡献。JTS对概念化、数据管理、方法论、资源、可视化以及手稿的审查和编辑做出了贡献。CYO对数据管理做出了贡献。CHH对数据管理和资源做出了贡献。MCT对数据管理和资源做出了贡献。MHMM为资金获取、项目管理、资源和监督做出了贡献。WCC在概念化、数据管理、方法论、可视化审查、编辑和监督方面做出了贡献。AYC在概念化、形式化分析、资金获取、项目管理、编辑和监督方面做出了贡献。gydF4y2Ba

利益冲突gydF4y2Ba

没有宣布。gydF4y2Ba

‎gydF4y2Ba
多媒体附件1gydF4y2Ba

示例文本。gydF4y2Ba

DOCX文件,18kbgydF4y2Ba

‎gydF4y2Ba
多媒体附件2gydF4y2Ba

模型中使用的方程和Python脚本。gydF4y2Ba

DOCX文件,29 KBgydF4y2Ba

‎gydF4y2Ba
多媒体gydF4y2Ba

机器学习模型的比较。gydF4y2Ba

DOCX文件,52 KBgydF4y2Ba

‎gydF4y2Ba
多媒体附件4gydF4y2Ba

音频和文本文件的描述性统计。gydF4y2Ba

DOCX文件,18kbgydF4y2Ba

‎gydF4y2Ba
多媒体gydF4y2Ba

参与调度员的概况和预测性能。gydF4y2Ba

DOCX文件,15 KBgydF4y2Ba

‎gydF4y2Ba
多媒体附件6gydF4y2Ba

特征相关分析。gydF4y2Ba

DOCX文件,55kbgydF4y2Ba

‎gydF4y2Ba
多媒体gydF4y2Ba

文章长度与准确性的关系。gydF4y2Ba

DOCX文件,19kbgydF4y2Ba

‎gydF4y2Ba
多媒体附件8gydF4y2Ba

专家选择的院前激活性重大创伤(PAMT)的代表性关键词和PAMT模型。gydF4y2Ba

DOCX文件,23kbgydF4y2Ba

  1. 伤害和暴力:2014年的事实。世界卫生组织,2014。URL:gydF4y2Bahttps://apps.who.int/iris/bitstream/handle/10665/149798/9789241508018_eng.pdfgydF4y2Ba[2022-05-19]访问gydF4y2Ba
  2. hamsen AM, Giannakopoulos GF, Moerbeek PR, Jansma EP, Bonjer HJ, Bloemers FW。入院前时间对创伤患者预后的影响:一项系统综述。损伤2015年4月;46(4):602-609。[gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  3. 陈超,申世德,孙俊杰,孙晓峰,田中华,宋桂杰,等。4个亚洲国家创伤患者入院前时间与结局之间的关系:一项跨国、多中心队列研究PLoS Med 2020 10月6日;17(10):e1003360 [gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  4. Drennan IR, Geri G, Brooks S, Couper K, Hatanaka T, Kudenchuk P,基本生命支持(BLS),儿科生命支持(PLS)以及复苏国际联络委员会(ILCOR)的教育、实施和团队(EIT)工作队,BLS工作队,儿科工作队,EIT工作队。急诊医疗调度诊断院外心脏骤停:诊断系统综述。复苏2021年2月;159:85-96。[gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  5. 张志刚,张志刚,张志刚。院前脑卒中量表在脑卒中和短暂性脑缺血发作中的应用。Cochrane Database Syst Rev 2019 Apr 09;4(4):CD011427 [gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  6. Bohm K, Kurland L.医疗派遣的准确性-一个系统的评价。Scand J创伤复苏急诊医学2018年11月09日;26(1):94 [gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  7. Gianola S, Castellini G, Biffi A, Porcu G, Fabbri A, Ruggieri MP,意大利国家卫生研究所指南工作组。重大创伤院前分诊工具的准确性:一项包含荟萃分析和净临床效益的系统评价。世界急诊外科2021年6月10日;16(1):31 [gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  8. 李志刚,王波,马库尔,李志刚,等。识别9-1-1呼叫中的关键字中风:混合方法的方法。Prehosp急诊护理2017;21(6):761-766 [gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  9. Riou M, Ball S, Williams TA, Whiteside A, O'Halloran KL, Bray J,等。影响院外心脏骤停紧急呼叫识别和调度的语言和互动因素:混合方法语言分析研究方案BMJ公开赛2017 07月09;7(7):e016510 [gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  10. 崔希略,奥雷拉娜,阿科斯塔米。应用自然语言处理技术的紧急呼叫记录支持系统设计。见:厄瓜多尔第六届信息和通信技术会议记录,2019年发表于:TIC。EC的19个;2019年11月27-29日;厄瓜多尔昆卡市,p. 53-65网址:gydF4y2Bahttps://doi.org/10.1007/978-3-030-35740-5_4gydF4y2Ba[gydF4y2BaCrossRefgydF4y2Ba]gydF4y2Ba
  11. 崔文文,高涛,洪佳杰,金克辉。基于机器学习的韩国分诊和急诊科患者敏锐度水平预测。Healthc Inform Res 2019 10月;25(4):305-312 [gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  12. 陈超,谢建国,程立林,林丽玲,林伟辉,郑建辉。利用自然语言处理对低敏锐度门诊患者急诊住院时间的早期短期预测Am J急诊医学2020年11月38日(11):2368-2373。[gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  13. Sterling NW, Patzer RE, Di M, Schrager JD。基于分诊记录自然语言处理的急诊病人处置预测。国际医学杂志2019年9月;129:184-188。[gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  14. 张x, Kim J, Patzer RE, Pitts SR, Patzer A, Schrager JD。基于自然语言处理和神经网络的急诊科入院预测2017年10月26日;56(5):377-389。[gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  15. Lucini FR, Fogliatto FS, da Silveira GJ, Neyeloff JL, Anzanello MJ, Kuchenbecker RS,等。利用急诊科早期医疗记录预测入院的文本挖掘方法。国际医学杂志2017年4月;100:1-8。[gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  16. 费尔南德斯M,门德斯R,维埃拉SM,莱特F,帕洛斯C,约翰逊A,等。使用机器学习和自然语言处理向急诊科就诊的危重患者的死亡和心肺骤停风险PLoS One 2020年4月2日;15(4):e0230876 [gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  17. 患者咨询的人工智能。螺旋器。URL:gydF4y2Bahttps://www.corti.ai/gydF4y2Ba[2021-09-12]访问gydF4y2Ba
  18. Blomberg SN, Folke F, Ersbøll AK, Christensen HC, Torp-Pedersen C, Sayre MR,等。机器学习作为紧急呼叫中识别心脏骤停的支持性工具。复苏2019年5月;138:322-329 [gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  19. Byrsell F, Claesson A, Ringh M, Svensson L, Jonsson M, Nordberg P,等。机器学习可以支持调度员在紧急呼叫中更好更快地识别院外心脏骤停:一项回顾性研究。复苏2021年5月;162:218-226 [gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  20. Blomberg SN, Christensen HC, Lippert F, Ersbøll AK, Torp-Petersen C, Sayre MR,等。在呼叫紧急医疗服务期间,机器学习对调度员识别院外心脏骤停的影响:一项随机临床试验。美国医学会网络公开赛2021年1月04日;4(1):e2032320 [gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  21. 王志刚,王志刚。预处理对文本分类的影响。Inf Process Manag 2014 Jan;50(1):104-112 [gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba]gydF4y2Ba
  22. 词汇特异性的统计学解释及其在检索中的应用。J Doc 1972 Jan;28(1):11-21 [gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba]gydF4y2Ba
  23. 陈凯,陈志强,陈志强。基于向量空间的词表示估计算法。见:2013年学习表征国际会议论文集。2013年发表于:ICLR '13;2013年5月2-4日;斯科茨代尔,AZ,美国。gydF4y2Ba
  24. 卡马斯CN, Bukhari SS, Dengel A.传统机器学习和深度学习方法在文本分类中的比较研究。见:2018年ACM文档工程研讨会论文集。2018年发表于:DocEng '18;2018年8月28日至31日;哈利法克斯,加拿大p. 1-11网址:gydF4y2Bahttps://doi.org/10.1145/3209280.3209526gydF4y2Ba[gydF4y2BaCrossRefgydF4y2Ba]gydF4y2Ba
  25. 王晓明,王晓明。基于事件模型的贝叶斯文本分类方法研究。人工智能发展协会,1998。URL:gydF4y2Bahttps://www.cs.cmu.edu/~knigam/papers/multinomial-aaaiws98.pdfgydF4y2Ba[2022-05-19]访问gydF4y2Ba
  26. 张志强,张志强,张志强。基于TF-IDF框架的文本分类算法。程序工程,2014;69:1356-1364 [gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba]gydF4y2Ba
  27. 罗德华,孙丽娟,刘文杰,刘文杰。基于文本核的文本分类方法。J Mach Learn Res 2002 Feb;2:419-444。gydF4y2Ba
  28. 李勇,王旭,徐鹏。基于深度学习的中文文本分类模型。未来互联网2018年11月20日;10(11):113 [gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba]gydF4y2Ba
  29. 马文文,陈凯杰。首届国际中文分词大赛CKIP中文分词系统简介。见:第二届SIGHAN中文语言处理研讨会论文集。2003发表于:SIGHAN '03;2003年7月11日至12日;札幌,日本p. 168-171gydF4y2Bahttps://doi.org/10.3115/1119250.1119276gydF4y2Ba[gydF4y2BaCrossRefgydF4y2Ba]gydF4y2Ba
  30. 李福平,付廷杰,马文文。为什么关注吗?分析NER的BiLSTM缺乏症及其治疗方法。见:第34届AAAI人工智能会议记录,2020年发表于:AAAI '20;2020年2月7日至12日;美国纽约州纽约p. 8236-8244。[gydF4y2BaCrossRefgydF4y2Ba]gydF4y2Ba
  31. Venkatesh, Ranjitha KV。基于机器学习的文本数据分类优化方案naïve贝叶斯分类器。见:2018年IEEE通信工程世界研讨会论文集。2018年发表于:WSCE '18;2018年12月28日至30日;新加坡,新加坡p. 33-36网址:gydF4y2Bahttps://doi.org/10.1109/WSCE.2018.8690536gydF4y2Ba[gydF4y2BaCrossRefgydF4y2Ba]gydF4y2Ba
  32. 王晓明,王晓明,王晓明。文本挖掘中分类算法的比较。应用数学学报,2017;26(4):344 - 344。gydF4y2Ba
  33. Chatterjee A, Gerdes MW, Prinz A, Martinez S.一种用于多类分类的先进模式识别算法的性能比较研究。见:2020年数据挖掘和信息安全新兴技术会议记录,2020年发表于:IEMIS '20;2020年7月2-4日;印度加尔各答,p. 111-124gydF4y2Bahttps://doi.org/10.1007/978-981-15-9774-9_11gydF4y2Ba[gydF4y2BaCrossRefgydF4y2Ba]gydF4y2Ba
  34. 查特吉A,格德斯MW,马丁内斯SG。识别与肥胖和超重相关的风险因素-机器学习概述。传感器(巴塞尔)2020年5月11日;20(9):2734 [gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  35. Sewalt CA, Venema E, Wiegers EJ, Lecky FE, Schuit SC, den Hartog D,等。创伤模型,以确定院前设置的重大创伤和死亡率。中华外科杂志2020年3月;20 (4):373-380 [gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  36. 张晓东,张晓东,张晓东,等。道路交通伤害严重伤害院前预测:一项多中心横断面研究。损伤2019年9月;50(9):1499-1506 [gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  37. Giannakopoulos GF, Bloemers FW, Lubbers WD, Christiaans HM, van Exter P, de Lange-de Klerk ES,等。取消直升机紧急医疗服务(HEMS)调度的标准。急诊医学杂志2012 july;29(7):582-586。[gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  38. 威尔默我,粉笔G,戴维斯GE,韦弗AE, Lockey DJ。空中救护任务:受伤机制、电话询问或救护人员评估?急诊医学杂志2015 Oct;32(10):813-816。[gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  39. 科茨TJ,牛顿A.直升机紧急医疗服务的呼叫选择:对救护车控制的影响。中华社会医学杂志1994 Apr;87(4):208-210 [gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  40. Cameron S, Pereira P, Mulcahy R, Seymour J.直升机主检索:任务分配:谁应该做?新兴医学Australas 2005 Aug;17(4):387-391。[gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  41. 辛克莱N,斯文顿PA,唐纳德M, Curatolo L,林德尔P,琼斯S,等。救护车控制中的临床医生任务改善了重大创伤患者的识别和院前重症护理团队任务。损伤2018年5月;49(5):897-902。[gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  42. 陈建春,谢廷涛,蒋卫武,钱玉春,孙俊涛,林海燕,等。院外心脏骤停调度中呼叫者情绪的早期识别:一种人工智能方法。复苏2021年10月;167:144-150。[gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  43. Ong MS, Magrabi F, Coiera E.使用统计文本分类的临床事件报告自动分类。Qual Saf保健2010年12月19(6):e55。[gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  44. 李继勇,李志强。基于循环和卷积神经网络的序列短文本分类。见:计算语言学协会北美分会2016年会议记录:人类语言技术。2016年发表于:NAACL HLT '16;2016年6月12日至17日;圣地亚哥,加州,美国p. 515-520。[gydF4y2BaCrossRefgydF4y2Ba]gydF4y2Ba


‎gydF4y2Ba
BNB:gydF4y2Ba伯努利naïve贝叶斯gydF4y2Ba
EMT:gydF4y2Ba紧急医疗技术员gydF4y2Ba
OHCA:gydF4y2Ba院外心脏骤停gydF4y2Ba
PAMT:gydF4y2Ba院前激活的重大创伤gydF4y2Ba
RRS-CV:gydF4y2Ba重复随机子抽样交叉验证gydF4y2Ba
TF-IDF:gydF4y2Ba术语频率-逆文档频率gydF4y2Ba


编辑:T Leung;提交05.05.21;A Chatterjee, M Torii, J Hüsers;对作者11.08.21的评论;修订版本收到28.09.21;接受22.04.22;发表10.06.22gydF4y2Ba

版权gydF4y2Ba

©钱宽琛,郑玉佳,孙振堂,欧致彦,胡春华,蔡明智,马惠明,蒋文柱,陈永杰。最初发表于《医疗互联网研究杂志》(//www.mybigtv.com), 2022年6月10日。gydF4y2Ba

这是一篇开放获取的文章,根据创作共用署名许可(https://creativecommons.org/licenses/by/4.0/)的条款发布,允许在任何媒介上无限制地使用、分发和复制,前提是正确引用最初发表在《医学互联网研究杂志》上的原创作品。必须包括完整的书目信息,//www.mybigtv.com/上的原始出版物的链接,以及此版权和许可信息。gydF4y2Ba


Baidu
map