卡塔尔世界杯8强波胆分析|卡塔尔世界杯4强波胆分析

JMI

JMIR Med Inform

JMIR医学信息学

2291 - 9694

卡塔尔世界杯8强波胆分析

加拿大多伦多

v10i2e27936

34997958

10.2196/27936

原始论文

使用行政索赔数据库预测住院死亡率的深度学习模型的开发:回顾性队列研究

洛维斯

基督教

Shadmi

Efrat

Flaks-Manov

娜塔莉

松井秀喜

Hiroki

英里每小时 1

临床流行病学与卫生经济系“，公共卫生学院东京大学

7-3-1 Hongo村

Bunkyo-ku

东京,1130033

日本 81 3 5841 1888 81 3 5841 1887 ptmatsui-tky@umin.ac.jp

https://orcid.org/0000-0003-0004-4743

Yamana

Hayato

医学博士 2

https://orcid.org/0000-0003-2214-6695

故事

Kiyohide

医学博士 3.

https://orcid.org/0000-0002-1894-0290

Yasunaga

Hideo

医学博士 1

https://orcid.org/0000-0002-6017-469X

1 临床流行病学与卫生经济系“，公共卫生学院东京大学

东京

日本 2 卫生服务研究部医学研究生院东京大学

东京

日本 3. 卫生政策和信息部东京医科和牙科大学研究生院

东京

日本

通讯作者:Hiroki Matsui ptmatsui-tky@umin.ac.jp

2 2022

11 2 2022

10 2

e27936

13 2 2021 2 4 2021 5 6 2021 2 1 2022

©松井裕树，山名Hayato, Fushimi Kiyohide, Yasunaga Hideo。最初发表在JMIR医学信息学(https://medinform.www.mybigtv.com)， 11.02.2022。

2022

这是一篇开放获取的文章，根据创作共用署名许可协议(https://creativecommons.org/licenses/by/4.0/)的条款发布，允许在任何媒介上不受限制地使用、分发和复制，前提是正确引用了首次发表在JMIR医学信息学上的原创作品。必须包括完整的书目信息，https://medinform.www.mybigtv.com/上的原始出版物的链接，以及此版权和许可信息。

背景

行政索赔数据库因其样本量大且易于获取而在研究中得到广泛应用。然而，使用行政数据库的研究缺乏疾病严重程度的信息，因此需要开发一种风险调整方法。

客观的

我们的目标是开发和验证基于深度学习的急性护理患者住院死亡率预测模型。

方法

主要模型仅使用行政索赔数据(年龄、性别、诊断和入院当天的程序)开发。我们还使用这些疾病的常见严重程度指标构建了急性心肌梗死、心力衰竭、中风和肺炎的疾病特异性模型。使用2010年7月至2017年3月的日本诊断程序组合数据，我们确定了46,665,933名住院患者，并以95:5的比例将其分为衍生队列和验证队列。主要模型使用9层深度神经网络开发，其中4个隐藏密集层有1000个节点，并与相邻层完全连接。我们以接受者工作特征曲线(AUC)下的面积来评价模型的鉴别能力，以校准图来评价模型的校准能力。

结果

在符合条件的患者中，2,005,035例(4.3%)死亡。模型的鉴别和校正结果令人满意。验证队列中主要模型的AUC为0.954 (95% CI 0.954-0.955)。主模型比疾病特异性模型具有更高的鉴别能力。

结论

我们基于深度学习的模型使用诊断和程序产生了有效的院内死亡率预测。

预后模型深度学习真实的数据急症护理索赔数据心肌梗死心脏衰竭中风肺炎

简介

行政索赔数据库已广泛用于临床和流行病学研究，因为其样本量大，易于获取。然而，行政数据通常缺乏临床信息[ 1， 2]且不区分入院时的共病和入院后的并发症[ 3.］．风险调整在使用管理数据库的研究中不一定可行，因为缺乏疾病严重程度的数据，风险调整不充分可能导致适应症混淆。

使用管理数据中记录的共病，已经开发了各种预测住院死亡率的模型。在这些模型的基础上，已经创建了风险评分，并用于临床和流行病学研究中调整疾病严重程度。然而，这些模型的有效性和可用性仍存在争议[ 1， 4- 6］．例如，Charlson共病指数是用来预测住院死亡率的，在使用行政索赔数据库的研究中，它通常被用作风险调整措施，以捕捉发病率水平。然而，该指数仅使用《国际疾病和相关健康问题统计分类第十版(ICD-10)》系统中记录的共病信息[ 4］．

先前的研究表明，额外的临床信息提高了使用管理数据库的死亡率预测模型的性能。在之前的研究中，我们使用日本诊断程序组合(DPC)数据库(一个全国性的行政索赔数据库)开发了一个基于程序的预测模型[ 7］．然而，这些先前的研究使用的逻辑回归模型只包括有限数量的预测因子。

机器学习(包括深度学习)方法的最新进展使处理大量信息和复杂模型成为可能[ 8， 9］．机器学习方法允许研究人员输入大量的预测因子，变量选择是自动执行的。相反，传统的逻辑回归需要基于专家现有知识的变量选择。

许多先前的研究使用机器学习来创建特定疾病的死亡率预测模型(包括心力衰竭模型[ 10]，笔画[ 11]、心肌梗塞[ 12])，以及所有病人的死亡率预测模型[ 12， 13］．这些模型大多使用电子健康记录和测试结果[ 9- 13］．然而，要从广泛的医疗机构收集这些数据，就必须对电子病历进行规范。此外，为了将这些数据用于临床和流行病学研究，每个疾病领域的专家必须手动提取针对目标疾病的预测变量信息。这些因素使得在全国范围内标准化和使用电子病历变得困难。

在这项研究中，我们开发并验证了一个基于深度学习的模型，仅使用行政索赔数据(包括诊断和程序数据)预测所有患者的住院死亡率，这些数据是统一格式化的，并在全国范围内定期收集。为了测试全患者模型的性能，我们还构建了疾病特异性模型，用于预测急性心肌梗死(AMI)、心力衰竭(HF)、中风或肺炎患者的住院死亡率，使用每个疾病亚组的常见严重程度指数。然后，我们比较了每个疾病亚组的全患者模型和疾病特异性模型之间的预测能力。

方法数据源

我们进行了一项回顾性队列研究。2010年7月至2017年3月的数据来自DPC数据库。将数据库中的所有患者纳入，以最大限度地提高结果的泛化性。在研究期间，1569家医院为数据库提供了数据。数据库中的患者约占日本所有急症住院患者的50% [ 14］．

DPC数据库包括以下数据:每个患者的年龄、性别、入院日期、出院日期、诊断和程序(药物、检查、手术和非手术治疗)。在DPC数据库中，入院时存在的合并症与入院后出现的并发症明显区别。所有诊断均使用国际疾病和相关健康问题统计分类第十版(ICD-10)代码进行记录。程序记录用日本常规代码编码。

DPC数据库还包括若干严重程度指数，即AMI的Killip分类[ 15， 16]，纽约心脏协会心衰分级[ 17]，入院时日常生活活动Barthel指数评分[ 18入院时意识水平量表[ 19];年龄、脱水、呼吸、定向、血压(A-DROP)、日本呼吸学会社区获得性肺炎严重程度指数[ 20.， 21］．日本昏迷量表(Japan Coma Scale)在日本被广泛用于衡量意识受损:0分表示意识警觉;个位数得分(1,2,3)表示在没有刺激的情况下保持清醒;两位数的分数(10,20,30)表明患者可以被某些刺激唤醒;三位数的分数(100,200,300)表示昏迷。a - drop是一种评分肺炎严重程度的系统，包括年龄(男性≥70岁，女性≥75岁)、脱水(血清尿素氮≥21 mg/dL)、呼吸衰竭(脉搏血氧饱和度≤90%或PaO)₂≤60mmhg)、定向障碍(思维混乱)、低血压(收缩压≤90mmhg)。

我们的研究得到了东京大学医学院伦理委员会的批准(批准号:3501-(4))。

病人的选择

我们提取了2010年7月1日至2017年3月31日期间出院的住院患者的数据。研究人群随机分为衍生队列(95%)和验证队列(5%)。对于住院1天的病例，我们收集预测信息的时间与结果发生的时间可以同时进行。由于这可能导致对预测模型准确性的高估，我们从验证队列中排除了出院或住院当天死亡的患者。

变量

结局变量为住院死亡。对于预测变量，我们使用了患者的人口统计信息(年龄、性别、入院前180天内的住院史)、入院时所有基于icd -10的诊断以及入院当天执行的所有程序。年龄被视为一个连续变量;其他变量作为二分类变量(0或1)处理。我们还提取了Killip分类[ 15， 16]、纽约心脏协会分类[ 17]， Barthel指数得分[ 18]、日本昏迷量表[ 19]， A-DROP分数[ 20.， 21]作为特定疾病的常见严重程度指数。

主要模型的开发

我们开发了一个深度神经网络模型，作为预测所有患者住院死亡的主要模型，使用9层4隐密层[ 22， 23］．为此，我们使用了患者的人口统计信息，入院时所有基于icd -10的诊断，以及入院当天执行的所有程序。所有层都有1000个节点，并与相邻层完全连接。我们使用一个带有2个节点的softmax层作为输出层[ 24］．由于死亡患者和活着患者的数量差异很大，我们用死亡病例比例的倒数(即1/0.045=22.3)对死亡病例进行加权[ 23］．我们使用随机梯度下降迭代获取神经网络权重[ 25］．为了避免过拟合，在每个密集层中夹入20%的退出层，并采用早期停止程序，包括使用推导队列中3%的数据进行学习步骤[ 26］．权重优化过程的细节描述在多媒体附件1．

疾病特异性模型的开发

我们构建了疾病特异性模型，用于预测AMI、HF、stoke或肺炎亚组的住院死亡率。4个模型包括患者背景(年龄、性别、入院前180天的住院史)和诊断，没有一个模型包括手术。对于AMI特异性模型，我们选择了AMI患者，并纳入了Killip分类[ 15， 16］．对于HF特异性模型，我们选择了HF患者，并纳入了纽约心脏协会的分类[ 17］．对于卒中特异性模型，我们选择卒中患者，并在入院时纳入Barthel指数和日本昏迷量表[ 18， 19］．对于肺炎特异性模型，我们选择了肺炎患者，并纳入了A-DROP评分[ 20.， 21］．

主模型与疾病特异性模型的预测能力比较

我们将主模型应用于AMI、HF、stoke和肺炎患者亚组，并将其预测性能与疾病特异性模型对AMI、HF、stoke和肺炎的预测性能进行比较。我们通过计算验证队列中的性能度量来评估每个模型的性能。性能指标包括接受者工作特征曲线(AUC)下的面积，用于确定模型的鉴别能力。我们使用DeLong方法计算AUC的95% CI [ 27]并绘制校准曲线以确定拟合优度。我们还计算了尤登指数法确定的阈值的敏感性、特异性以及阳性和阴性预测值[ 28］．我们获得了所有2000个自举指数的ci。

我们还研究了由疾病特异性模型计算的风险评分是否提高了由主模型计算的风险评分的辨别能力。我们将主要模型和疾病特异性模型计算的风险评分纳入logistic回归模型的预测变量，并计算预测每种疾病人群住院死亡率的联合风险评分。通过综合风险评分的AUC评价其判别能力，并与主模型的AUC进行比较。使用DeLong方法计算AUC的ci和主模型风险评分与综合风险评分之间差异的假设检验。

结果

我们从DPC数据库中获得了研究期间46,665,942例患者的数据，并将其分为推导队列(n=44,334,477)和验证队列(n=2,331,465)。我们根据排除标准将患者从验证队列中排除，验证队列中剩下2,277,968例患者( 图1）.

推导和验证队列的特征显示在表1．推导组和验证组的平均住院时间分别为14.2天和14.5天，住院死亡率分别为4.3%和3.7%。验证队列中的患者比推导队列中的患者年龄稍大，有更多的合并症。

主要模型的结构如图所示表2．共有49,297个预测变量，包括3个关于患者人口统计学和病史的变量(年龄、性别、入院前180天的住院史)，入院时的19,930个诊断，以及29,364个程序(药物、检查、手术和非手术治疗)。总体而言，在推导过程中优化了52,302,002个层间链接的权重(= 49297 × 1000 + 1001 × 1000 + 1001 × 1000 + 1001 × 2)。包括模型权重在内的深度学习模型脚本可在我们的网站[ 29］．

图1

推导和验证队列和疾病特异性亚组中的患者数量。AMI:急性心肌梗死，HF:心力衰竭。

表1

推导和验证队列中患者的特征。

特征			推导队列(n=44,334,477)	验证队列(n=2,277,968)	P价值
死亡，n (%)			1905286 (4.3)	83292 (3.7)	<措施
住院天数(天)，平均值(SD)			14.2 (24.1)	14.5 (24.2)	<措施
年龄(年)，平均值(SD)			60.1 (24.4)	60.4 (24.2)	<措施
性别(男性)，n (%)			23480628 (53.0)	1207886 (53.0)	07
180天内住院史，n (%)			12282386 (27.7)	632362 (27.8)	07
Charlson共病指数，n (%)						<措施
	0 - 1	28734890 (64.8)		1465779 (64.3)
	2 - 3	11432403 (25.8)		594500 (26.1)
	≥4	4165579 (9.4)		217605 (9.6)

表2

主要模型的结构。

层	输入(节点)	输出(节点)	重量、n
1:输入	49297年	1000	49297000年
2:退学	N/A^一个	N/A	N/A
3:隐藏1	1001	1000	1001000年
4:退学	N/A	N/A	N/A
5:隐藏2	1001	1000	1001000年
6:退学	N/A	N/A	N/A
7:隐藏3	1001	1000	1001000年
8:退学	N/A	N/A	N/A
9:输出	1001	2	2002
权值和	N/A	N/A	52302002年

^一个N/A:不适用。

本文概述了本研究中使用的主要模型和疾病特异性模型表3．权值总数的计算公式为:权值总数=输入节点数× 1000 + 1001 × 1000 + 1001 × 1000 + 1001 × 1000 + 1001 × 2。

验证队列中主要模型的AUC为0.954 (95% CI 0.9537-0.9547)。主模型尤登指数法测定的敏感性、特异性和截止点(0.0435)的阳性预测值和阴性预测值分别为0.920 (95% CI 0.915 ~ 0.924)、0.855 (95% CI 0.852 ~ 0.860)、0.195 (95% CI 0.192 ~ 0.199)和0.996 (95% CI 0.996 ~ 0.997) ( 表4）.

验证队列中观察到的和估计的死亡率的校准曲线见图2．观察死亡率和估计死亡率强相关，但估计死亡率略低于观察死亡率。

主要和疾病特异性模型的auc和其他预测指标显示在表4．AMI、HF、卒中和肺炎亚组主要模型的auc分别为0.944、0.832、0.921和0.918。AMI、HF、中风和肺炎亚组的疾病特异性模型的auc分别为0.876、0.745、0.894和0.863。主模型对4个亚组的鉴别能力均显著高于疾病特异性模型。

表3

主要模型和疾病特异性模型概述。

模型	输入(节点)	重量、N
主要模型	49297年	52302002年
急性心肌梗死模型	9	3014002年
中风模型	54	3059002年
心力衰竭模型	9	3014002年
肺炎模型	9	3014002年

表4

主要模型和疾病特异性模型的性能。

			AUC^一个(95%置信区间)		阈值		敏感度(95% CI)		特异性(95% CI)		PPV^b(95%置信区间)		净现值^c(95%置信区间)
验证队列(n=2,331,465)
	主要模型	0.954 (0.954 - -0.955)		0.0435		0.920 (0.915 - -0.924)		0.855 (0.852 - -0.860)		0.195 (0.192 - -0.199)		0.996 (0.996 - -0.997)
急性心肌梗死(n= 14213)
	主要模型	0.944 (0.938 - -0.950)		0.087		0.888 (0.864 - -0.947)		0.862 (0.796 - -0.881)		0.334 (0.264 - -0.363)		0.990 (0.988 - -0.995)
	针对疾病的模型	0.876 (0.866 - -0.887)		0.087		0.837 (0.797 - -0.877)		0.783 (0.745 - -0.817)		0.233 (0.210 - -0.257)		0.984 (0.981 - -0.988)
心力衰竭(n=43,792)
	主要模型	0.831 (0.825 - -0.837)		0.118		0.782 (0.729 - -0.813)		0.719 (0.678 - -0.771)		0.220 (0.205 - -0.245)		0.970 (0.965 - -0.973)
	针对疾病的模型	0.745 (0.738 - -0.753)		0.097		0.727 (0.678 - -0.754)		0.642 (0.613 - -0.688)		0.172 (0.166 - -0.184)		0.958 (0.954 - -0.961)
中风(n = 82454)
	主要模型	0.921 (0.918 - -0.925)		0.091		0.863 (0.847 - -0.901)		0.824 (0.781 - -0.837)		0.267 (0.234 - -0.279)		0.988 (0.987 - -0.991)
	针对疾病的模型	0.894 (0.890 - -0.898)		0.080		0.824 (0.805 - -0.836)		0.800 (0.793 - -0.818)		0.235 (0.229 - -0.249)		0.984 (0.983 - -0.985)
肺炎(n = 87775)
	主要模型	0.918 (0.915 - -0.920)		0.075		0.913 (0.896 - -0.925)		0.769 (0.762 - -0.786)		0.209 (0.204 - -0.219)		0.993 (0.991 - -0.994)
	针对疾病的模型	0.863 (0.859 - -0.867)		0.064		0.851 (0.809 - -0.913)		0.705 (0.638 - -0.744)		0.160 (0.143 - -0.173)		0.986 (0.983 - -0.991)

^一个AUC:接收机工作特性曲线下的面积。

^bPPV:阳性预测值。

^cNPV:负预测值。

图2

主模型验证队列中观察和估计死亡率的校准曲线。x轴表示预测死亡率，y轴表示实际死亡率。

综合风险评分和主模型计算的风险评分的判别能力显示在表5．除急性心肌梗死(AMI)外，所有合并风险评分的auc均显著高于主要模型风险评分。然而，主要模型风险评分和综合风险评分之间的差异很小。

亚组的主要模型和疾病特异性模型的校准曲线如图所示图3．在AMI、HF和卒中亚组中，主模型观察到的死亡率和估计死亡率之间的相关性优于疾病特异性模型( 图3a - c)。对于肺炎亚组，当预测死亡率≤0.8时，主要模型和疾病特异性模型之间的相关性相似。然而，当预测死亡率≥0.8时，疾病特异性模型无法很好地估计死亡率( 图3D)。

表5

综合风险评分与主模型计算的风险评分的判别能力比较。

	主要型号AUC^一个(95%置信区间)	综合风险评分AUC (95% CI)	P价值
急性心肌梗死	0.944 (0.938 - -0.950)	0.945 (0.939 - -0.951)	23)
心脏衰竭	0.831 (0.825 - -0.837)	0.838 (0.832 - -0.844)	<措施
中风	0.921 (0.918 - -0.925)	0.927 (0.924 - -0.930)	<措施
肺炎	0.918 (0.915 - -0.920)	0.921 (0.918 - -0.924)	<措施

^一个AUC:接收机工作特性曲线下的面积。

图3

疾病特异性模型验证队列中观察到的和估计的死亡率的校准曲线。(A)急性心肌梗死，(B)心力衰竭，(C)中风，(D)肺炎的模型。x轴:预测死亡率。y轴:实际死亡率。实线:主要型号。虚线:疾病特异性模型。

讨论主要研究结果

我们利用大型日本住院患者数据库构建了基于深度倾斜的住院死亡率预测模型。患者背景、诊断和入院第一天的治疗被输入模型。在AMI、HF、中风和肺炎患者亚组中，模型的整体辨别能力较高。主模型比使用常见严重程度指数的疾病特异性模型具有更好的鉴别能力。我们整合了主要模型和特定疾病模型的风险评分，并计算了综合风险评分。然而，与主要模型风险评分相比，联合风险评分在预测性能方面的改进只是轻微的。

以前已经从行政索赔数据库中开发了风险评分。例如，Charlson和Elixhauser模型利用共病信息预测长期生存，已被用于临床和流行病学研究中的风险调整[ 30.， 31］．在本研究中，利用行政索赔数据建立的新的住院死亡率预测模型具有较高的歧视力(AUC=0.945)。我们相信，我们的模型也可以用于临床和流行病学研究中的风险调整，使用包括诊断和程序在内的行政索赔数据。

在之前的一项研究中，我们构建了住院死亡率的预测模型，其中包括入院当天的合并症和几个选定的程序(血液检查、x线摄影、超声心动图)[ 7］．然而，该模型缺乏普遍性;例如，它不适用于危重病人。该模型可用于多种疾病严重程度患者的风险预测和调整。

在之前的一项研究中，将单独使用行政索赔数据的模型的预测能力与使用电子病历结合行政索赔数据的模型的预测能力进行了比较[ 32］．具有电子病历的模型的预测能力更高，因为电子病历包含了与每个患者相关的详细信息，如血液检查结果、生命体征和指数入院前2天收集的入院数据。

在这项研究中，只使用大量管理数据的深度学习模型比使用特定疾病严重程度信息的模型具有更高的预测能力。基于我们的结果，我们认为大规模的行政数据可以用来预测住院死亡率比一般使用的严重程度指数更准确。Kharrazi等[ 33]报告说，与单独使用每个数据源相比，从行政数据和电子健康记录中获取信息提高了其模型的预测准确性。泽尔策等[ 32]发现，将住院期间收集的电子健康记录信息，以及行政数据和住院前的电子健康记录信息输入他们的模型，可以更准确地评估死亡风险。Rajkomar等[ 9]通过使用结构化电子健康记录中的信息，以与我们在本研究中获得的相同水平的准确性预测住院死亡率。我们还发现，通过将主要模型与特定疾病模型集成而获得的综合风险评分，比从主要模型获得的风险评分显示出更高的预测精度。但在本研究中，主模型与合并风险评分差异较小，两种AMI风险评分之间无显著差异。这表明，即使没有特定疾病的严重程度信息，主模型也能够构建与综合风险评分相当的风险评分。因此，我们建议患者结局研究可以仅使用行政数据进行，如初始住院过程和诊断，而不需要疾病严重程度的数据。

以标准化的方式收集电子健康档案信息并用于研究并不容易。我们相信，这项研究的结果可以用于不可能获得详细临床信息的情况，如疾病严重程度和生命体征，这些信息将包含在电子健康记录中。

限制

这项研究有几个局限性。首先，我们没有进行外部验证。其次，我们没有使用各种机器学习方法(如随机森林、套索回归、XGBoost及其集合)，因此我们无法比较其他机器学习方法的预测性能。第三，由于本研究使用的数据库是急性住院，我们无法获得长期结果的数据。第四，并非所有疾病都能保证模型的准确性，因此需要考虑模型对其他人群的适用性。

结论

总之，我们构建了一个深度神经网络模型，使用日本行政索赔数据库中入院当天进行的所有诊断和程序数据来预测住院死亡率。我们只使用行政索赔数据的模型比使用更普遍使用的严重程度指数的模型显示出更高的预测能力。我们建议使用仅从行政索赔数据库获得的诊断和程序数据的预后模型可以预测住院死亡率，并可用于临床和流行病学研究中的风险调整。

多媒体附件1

模型权重优化过程细节。

缩写

一滴水

年龄，脱水，呼吸衰竭，定向障碍，低血压

AMI

急性心肌梗死

AUC

接收机工作特性曲线下面积

DPC

日语诊断程序组合

高频

心脏衰竭

icd -

《国际疾病和有关健康问题统计分类》，第十版

净现值

负预测值

PPV

阳性预测值

没有宣布。

唱

年代

谢长廷

花王杨

林

陈

胡

利用数据挖掘技术在行政数据基础上建立中风严重程度指数是可行的

临床流行病学 2015 11 68 11 1292 300

10.1016 / j.jclinepi.2015.01.009

25700940

s0895 - 4356 (15) 00017 - 7

Virnig

英航

麦克比恩

米

公共卫生监测和规划的行政数据

公共卫生 2001 22 213 30.

10.1146 / annurev.publhealth.22.1.213

11274519

22/1/213

Yamana

松井秀喜

Sasabuchi

故事

Yasunaga

在管理数据库中分类诊断和程序记录改善了死亡率预测

临床流行病学 2015 09 68 9 1028 35

10.1016 / j.jclinepi.2014.12.004

25596112

s0895 - 4356 (14) 00535 - 6

Sundararajan

全

Halfon请求

故事

Luthi

努力

Ghali

佤邦

国际健康信息编码方法学联合会

ICD-10查尔森指数三个版本的跨国比较表现

医疗保健 2007 12 45 12 1210 5

10.1097 / MLR.0b013e3181484347

18007172

00005650-200712000-00013

Elixhauser

一个

施泰纳

哈里斯

博士

科菲

与管理数据一起使用的共病措施

医疗保健 1998 01 36 1 8 27

10.1097 / 00005650-199801000-00004

9431328

松

米

约旦

海关

Elixhauser

一个

弗莱

德

Hoaglin

直流

琼斯

Meimban

华纳

冈萨雷斯

改进索赔数据，以改进医院死亡率的风险调整

《美国医学会杂志》 2007 01 03 297 1 71 6

10.1001 / jama.297.1.71

17200477

297/1/71

Yamana

松井秀喜

故事

Yasunaga

基于程序的住院病人严重程度指数:开发和验证使用管理数据库

BMC运行状况服务决议 2015 07 08 15 261

10.1186 / s12913 - 015 - 0889 - x

26152112

10.1186 / s12913 - 015 - 0889 - x

PMC4495704

Purushotham

年代

孟

切

刘

在大型医疗保健数据集上对深度学习模型进行基准测试

J生物医学信息 2018 07 83 112 134

10.1016 / j.jbi.2018.04.007

29879470

s1532 - 0464 (18) 30071 - 6

Rajkomar

一个

奥伦

陈

戴

我

Hajaj

哈特

米

刘

马库斯

唱ydF4y2Ba

米

桑德博格

绮

张

弗洛勒斯

达根

通用电气

欧文

勒

问

Litsch

Mossin

一个

Tansuwan

王

Wexler

威尔逊

路德维希

Volchenboum

周

皮尔森

米

Madabushi

年代

沙阿

孤峰

豪厄尔

医学博士

崔

柯拉

迪安

可扩展和精确的深度学习与电子健康记录

NPJ数字医院 2018 5 8 1 1 18

10.1038 / s41746 - 018 - 0029 - 1

31304302

PMC6550175

拉希米

班尼特

康拉德

威廉姆斯

巴苏

德怀特

伍德沃德

米

帕特尔

一个

McMurray

mcmahon

年代

心力衰竭患者的风险预测:一项系统回顾和分析

心脏衰竭 2014 10 2 5 440 6

10.1016 / j.jchf.2014.04.008

25194291

s2213 - 1779 (14) 00261 - 3

王

Kiik

米

偷看

Curcin

马歇尔

陆克文

AG)

王

Douiri

一个

乌尔夫

布雷

用结构化数据对预测中风结果的机器学习模型进行系统回顾

《公共科学图书馆•综合》 2020 15 6 e0234722

10.1371 / journal.pone.0234722

32530947

玉米饼- d - 20 - 04723

PMC7292406

赵

年代

奥斯丁

罗斯

Abdel-Qadir

Chicco

汤姆林森

塔

Foroutan

Lawler

公关

Billia

Gramolini

一个

Epelman

年代

王

李

预测心肌梗死再入院率和死亡率的机器学习与传统统计模型的比较:一项系统综述

Can J Cardiol 2021 08 37 8 1207 1214

10.1016 / j.cjca.2021.02.020

33677098

s0828 - 282 (21) 00129 - x

Tabak

唱ydF4y2Ba

Nunez

厘米

约翰内斯

利用电子病历数据建立住院患者死亡率预测模型:急性实验室死亡风险评分(ALaRMS)

美国医学信息协会 2014 21 3. 455 63

10.1136 / amiajnl - 2013 - 001790

24097807

amiajnl - 2013 - 001790

PMC3994855

Yasunaga

日本真实世界数据:第二章诊断程序组合数据库

王牌 2019 1 3. 76 79

10.37737 / ace.1.3_76

Killip

金博

在冠状动脉监护室治疗心肌梗死。两年的250个病人的经验

Am J Cardiol 1967 10 20. 4 457 64

10.1016 / 0002 - 9149 (67) 90023 - 9

6059183

0002 - 9149 (67) 90023 - 9

受伤

Kohno

中村

Yanagiuchi

桥本

年代

伊藤

木村

米

松井秀喜

一个

横井

Arihara

米

兵库县

米

日本岛

泽田师傅

Matoba

年代

山田

Matsumuro

一个

Shirayama

Kitamura

米

古河道

ami -京都多中心风险研究小组

高基利普级急性心肌梗死患者经皮冠状动脉介入治疗后住院预后的预测因素

地中海的实习生 2014 53 9 933 9

10.2169 / internalmedicine.53.1144

24785883

DN / JST.JSTAGE / internalmedicine / 53.1144

白色

迈尔斯

毫米

心脏诊断的分类

《美国医学会杂志》 1921 10 29 77 18 1414

10.1001 / jama.1921.02630440034013

达菲

Gajree

年代

尔

斯托特

奎因

评估中风幸存者的Barthel指数的可靠性(评分者间一致):系统回顾和荟萃分析

中风 2013 03 44 2 462 8

10.1161 / STROKEAHA.112.678615

23299497

STROKEAHA.112.678615

Shigematsu

Nakano

渡边

单独的眼反应测试足以预测中风的结果-日本昏迷量表的再引入:一项队列研究

BMJ开放 2013 3. 4 e002736

10.1136 / bmjopen - 2013 - 002736

23633419

bmjopen - 2013 - 002736

PMC3641437

20.

Miyashita

Matsushima

奥卡河

米

日本呼吸学会

成人社区获得性肺炎管理的JRS指南:更新和新建议

地中海的实习生 2006 45 7 419 28

10.2169 / internalmedicine.45.1691

16679695

JST.JSTAGE / internalmedicine / 45.1691

安

崔

莎莉

扩展A- drop评分:预测社区获得性肺炎住院患者死亡率的新评分系统

Sci代表 2018 10 01 8 1 14588

10.1038 / s41598 - 018 - 32750 - 2

30275523

10.1038 / s41598 - 018 - 32750 - 2

PMC6167349

Chollet

api的用户体验设计

Keras博客 2015

2022-02-04

https://blog.keras.io/author/francois-chollet.html

Abadi

米

阿加瓦尔

一个

巴勒

Brevdo

陈

雪铁龙

柯拉

戴维斯

一个

迪安

德温

米

格玛沃特

年代

格拉汉姆·古德费勒

我

竖琴

一个

欧文

Isard

米

Jozefowicz

贾

凯撒

Kudlur

米

Levenberg

鬃毛

舒斯特尔

米

Monga

摩尔

年代

穆雷

Olah

Shlens

施泰纳

Sutskever

我

犯错误

塔克

Vanhoucke

Vasudevan

维埃加斯

Vinyals

监狱长

瓦滕伯格

米

Wicke

米

余

郑

TensorFlow:异构分布式系统上的大规模机器学习

出来了。预印本于2016年3月14日在线发布 2016

Geron

一个

Softmax回归

使用scikit-learn和tensorflow进行机器学习:构建智能系统的概念、工具和技术。第1版 2017

塞瓦斯托波尔,

O ' reilly媒体

147 149

Geron

一个

随机梯度下降

使用scikit-learn和tensorflow进行机器学习:构建智能系统的概念、工具和技术。第1版 2017

塞瓦斯托波尔,

O ' reilly媒体

122 126

Geron

一个

通过正则化避免过拟合

使用scikit-learn和tensorflow进行机器学习:构建智能系统的概念、工具和技术。第1版 2017

塞瓦斯托波尔,

O ' reilly媒体

363 371

德龙

呃

德龙

Clarke-Pearson

戴斯。莱纳姆:

比较两条或多条相关的受试者工作特征曲线下的面积:一种非参数方法

生物识别技术 1988 10 44 3. 837 45

3203132

Youden

对诊断测试进行评级的索引

癌症 1950 01 3. 1 32 5

10.1002 / 1097 - 0142 (1950) 3:1 < 32: aid-cncr2820030106 > 3.0.co; 2 - 3

15405679

松井秀喜

开发利用行政索赔数据库预测住院死亡率的深度学习模型

Researchmap 2022-02-01

https://researchmap.jp/ptmatsui

30.

松井秀喜

乔

故事

Yasunaga

慢性阻塞性肺疾病加重期早期和延迟康复后的结局:日本一项全国性回顾性队列研究

和物 2017 04 21 18 1 68

10.1186 / s12931 - 017 - 0552 - 7

28431501

10.1186 / s12931 - 017 - 0552 - 7

PMC5399848

松井秀喜

小池百合子

年代

故事

和田

Yasunaga

神经专科人员配备对脑梗死后30天住院死亡率的影响

王牌 2019 1 3. 86 94

10.37737 / ace.1.3_86

Zeltzer

Balicer

理查德·道金斯

烤

Flaks-Manov

Einav

Shadmi

电子医疗记录与行政索赔的预测准确性

医疗保健 2019 07 57 7 551 559

10.1097 / MLR.0000000000001135

31135691

Kharrazi

气

常

理查兹

加拉格尔

努森

维纳

摩根大通

比较基于人群的风险分层模型性能，使用从门诊电子健康记录中提取的人口统计学、诊断和药物数据与行政索赔

医疗保健 2017 08 55 8 789 796

10.1097 / MLR.0000000000000754

28598890