这是一篇开放获取的文章,根据创作共用署名许可(https://creativecommons.org/licenses/by/4.0/)的条款发布,允许在任何媒介上无限制地使用、分发和复制,前提是正确引用最初发表在《医学互联网研究杂志》上的原创作品。必须包括完整的书目信息,//www.mybigtv.com/上的原始出版物的链接,以及此版权和许可信息。
多病是一项全球性的卫生挑战,需要更全面地了解多病的模式和趋势。然而,迄今为止完成的大多数研究往往依赖于自我报告的病情,尚未对慢性疾病共发的整个谱系同时进行评估,特别是在发展中地区。
我们试图提供一个多维的方法来了解中国西南地区普通住院患者慢性疾病共发的全谱,以调查多病模式和时间趋势,并评估他们的年龄和性别差异。
我们基于2015年至2019年中国西南某特大城市约500万名各年龄段患者的880万份出院记录进行了回顾性队列分析。我们使用ICD-10(国际疾病分类,第10版)3位数代码检查了所有慢性诊断,并重点关注每个年龄和性别阶层患病率≥1%的慢性疾病,这导致男性和女性分别有149和145例慢性疾病。我们根据性别和年龄在一般人群中构建多病网络,并使用余弦指数来衡量慢性疾病的共发情况。然后,我们将网络划分为社区,并评估其时间趋势。
结果表明,慢性疾病之间的相互作用复杂,男性与≥40岁住院患者之间的联系更为密切。在多病网络中,共有9种慢性病同时被划分为中心病、枢纽病和爆发病。其中高血压、慢性缺血性心脏病、脑梗死、其他脑血管疾病、动脉粥样硬化等5种疾病男性和女性均常见病。最早的跳跃(跳跃度≥6)出现在男性发生在25-29岁的糖蛋白代谢紊乱,比女性早约15年。随着时间的推移,社区中慢性病的数量不断增加,但新进入者并没有取代社区的根源。
我们的多病网络分析确定了性别和年龄在慢性诊断共发生方面的特定差异,这可能有助于设计住院患者多病的临床干预措施。
随着最近临床干预的改进、公共卫生的进步、生活方式的改变和环境暴露,多病已成为一个日益严峻的全球卫生挑战[
随着电子信息系统的存储容量和可访问性的增强,数字化的临床记录保存使常规收集的管理数据具有前所未有的深度和可变性,可供研究人员使用。这为网络分析的应用提供了一个机会,可以从庞大而混乱的数据集中提取概念性的见解[
为了解决这些差距,我们对居住在中国西南某特大城市的所有住院患者进行了回顾性研究。我们采用多病的标准化定义和分类系统[
本研究的工作流程见
研究工作流程。SCI: Salton余弦指数。疾病:慢性病。
本研究已获四川省卫生信息中心伦理委员会批准。这些数据是匿名分析的,以维护住院患者数据的隐私。作为对以前收集的行政数据的研究,这项工作不受知情同意要求的限制。
在这项回顾性队列分析中,我们使用了四川省卫生信息中心提供的住院患者纵向临床数据的区域数据库。该区域数据库包括四川省534家二级医院和144家三级医院的匿名出院报告(hdr);因此,每个住院患者的纵向临床资料是可用的。每个HDR包含匿名身份、年龄、性别、居住地址、访问和出院日期、主要出院诊断和多达15个次要诊断的信息。所有疾病都根据ICD-10(国际疾病分类,第十版)的3位编码进行了详细说明。
入选标准包括在整个研究期间均为成都居民且存活的住院患者。2015 - 2019年共纳入520万人(约占成都市人口的31.5%),920万hdr。由于我们对疾病(ICD-10: A00-R99)感兴趣,患者仅被标记为一般症状的住院治疗[
2018年,美国医学科学院建议对多重疾病采用统一的定义和报告系统[
为了产生更一致和可靠的估计值,我们将重点放在以下年龄层患病率≥1%的慢性病:<7岁、7-14岁、15-19岁、20-24岁、25-29岁、30-34岁、35-39岁、40-44岁、45-49岁、50-54岁、55-59岁、60-64岁、65-69岁、70-74岁、75-79岁和80岁以上的男性和女性[
由住院病人发展而来的多病网络包含一组通过边缘连接的节点。节点代表一种慢性疾病(ICD-10编码为3位),因此节点大小与疾病流行率成正比,其颜色标识ICD-10类别。
多病网络中的边缘表示共存疾病之间的共病强度。通常情况下,一对疾病的共病强度越高,单靠偶然性共存的概率就越低[
在哪里
一般来说,SCI的截止点是通过评估皮尔逊相关和SCI之间的关系来定义的,其中两个网络中显著相关的疾病数量相等[
应用Kolmogorov-Smirnov检验来研究度分布是否遵循幂律。结构性质可以用密度、直径、平均径长、度、加权度、紧密中心性、中间中心性等网络指标来测量[
研究人群特征。(A)多病研究人群的选择流程。(B) 180万多病住院患者的年龄和性别分布。(C) 500万独立住院患者中多病住院患者的年龄和性别比例。(D) 180万多病住院患者中按年龄和性别分列的慢性病平均数量。
为了区分网络中的节点中心性,PageRank算法[
疾病的连通性
为了找到跨年龄组边缘数量大幅增加的节点(定义为爆发),并探索第一次大飞跃发生时年龄的性别差异,我们分别构建了男性和女性基于年龄的程度轨迹(
社区检测将一般无向网络的节点分离为社区,这样社区内部的连接比它们之间的连接更强[
观察社区如何随时间变化也可以提供关于网络的有价值的信息[
所有统计分析、网络构建和可视化均在R软件(3.5.1版本;R开发核心团队)。
本次研究共纳入500万独立住院患者(约占成都市总人口的30.3%),其中36.8%(共1,843,050名独立住院患者,约占成都市人口的11.2%)患有两种或两种以上慢性疾病(
表型多病网络分析确定了网络的整体结构,并发现了具有更密切共发性的慢性疾病(
性别特异性表型多病网络的特性。(A)疾病对的相对风险(RR)与Pearson相关系数之间的散点图;由于关注紧密联系的疾病,我们排除了RR <1或相关性<0的互斥疾病对。(B)使用Pearson相关系数和SCI的网络中显著疾病对数量相等的Sclton余弦指数(SCI)的截断点。(C)使用SCI的性别特异性多病网络的度(k)分布。(D)和(E)每个多病网络中跨年龄层和按性别连接的节点和边缘的数量。(F) SCI跨年龄层和性别的箱形图。盒子的宽度与每一层网络中边缘的数量成比例。
性别和年龄特异性多病网络特性。
各个年龄组的网络(年) | 密度 | 直径 | 平均路径长度 | 平均度 | Avg.w程度一个 | Avg.clos中心b | Avg.bet中心c | |
|
|
|
|
|
|
|
|
|
|
<7 | 0.077 | 4 | 1.6 | 2.3 | 0.58 | 0.74 | 4.4 |
|
7 - 14 | 0.045 | 4 | 1.5 | 1.5 | 0.50 | 0.82 | 2.4 |
|
15 - 19 | 0.071 | 4 | 1.5 | 1.6 | 0.62 | 0.86 | 3.0 |
|
至24 | 0.064 | 4 | 1.9 | 2.2 | 0.71 | 0.67 | 7.3 |
|
25 - 29 | 0.067 | 5 | 2.4 | 2.8 | 0.75 | 0.57 | 16.5 |
|
- 34 | 0.064 | 8 | 2.5 | 3.0 | 0.73 | 0.52d | 23.4 |
|
35-39 | 0.064 | 6 | 2.4 | 3.4 | 0.78 | 0.51d | 20.4 |
|
40-44 | 0.091 | 6 | 2.8 | 5.2 | 1.02 | 0.40d | 57.8 |
|
45-49 | 0.129 | 6 | 2.7 | 7.5d | 1.30d | 0.38d | 63.5 |
|
50 - 54 | 0.137 | 5 | 2.6 | 8.6d | 1.47 | 0.39d | 73.6 |
|
55-59 | 0.144 | 5 | 2.5 | 9.3 | 1.61 | 0.41 | 64.5 |
|
60 - 64 | 0.165 | 5 | 2.4 | 11.1 | 1.84 | 0.43 | 62.1 |
|
65 - 69 | 0.185 | 6 | 2.3 | 12.6 | 2.13 | 0.45 | 64.0 |
|
70 - 74 | 0.187 | 5 | 2.1 | 13.5 | 2.40 | 0.48 | 58.6 |
|
75 - 79 | 0.197 | 5 | 2.1 | 14.4 | 2.63 | 0.49 | 61.8 |
|
80 + | 0.214 | 4 | 1.9 | 15.6 | 3.00 | 0.53 | 50.2 |
|
|
|
|
|
|
|
|
|
|
<7 | 0.134 | 2 | 1.3 | 2.8 | 0.74 | 0.83 | 4.0 |
|
7 - 14 | 0.054 | 3. | 1.4 | 1.6 | 0.58 | 0.82 | 2.3 |
|
15 - 19 | 0.047 | 2 | 1.2 | 1.3 | 0.50 | 0.91 | 1.7 |
|
至24 | 0.050 | 4 | 1.8 | 1.8 | 0.59 | 0.72 | 4.6 |
|
25 - 29 | 0.057 | 5 | 2.1 | 2.3 | 0.64 | 0.61 | 8.7 |
|
- 34 | 0.069 | 8 | 3.4 | 2.7 | 0.70 | 0.42 | 45.5 |
|
35-39 | 0.067 | 10 | 4.0 | 2.8 | 0.70 | 0.36 | 69.2 |
|
40-44 | 0.085 | 9 | 3.7 | 4.1 | 0.82 | 0.34 | 88.7 |
|
45-49 | 0.098 | 6 | 3.1 | 5.6 | 0.93 | 0.34 | 94.3 |
|
50 - 54 | 0.113 | 7 | 2.9 | 6.9 | 1.08 | 0.36 | 82.2 |
|
55-59 | 0.131 | 6 | 2.7 | 7.8 | 1.30 | 0.39 | 68.7 |
|
60 - 64 | 0.167 | 5 | 2.4 | 10.0 | 1.65 | 0.43 | 59.4 |
|
65 - 69 | 0.186 | 5 | 2.3 | 11.3 | 1.96 | 0.45 | 50.2 |
|
70 - 74 | 0.187 | 5 | 2.2 | 12.6 | 2.28 | 0.48 | 58.5 |
|
75 - 79 | 0.194 | 5 | 2.1 | 13.8 | 2.57 | 0.50 | 57.2 |
|
80 + | 0.227 | 4 | 2.0 | 14.6 | 2.80 | 0.53 | 47.3 |
一个average .w degree:加权平均度。
baverage .clos中心性:平均亲近中心性。
caverage .bet中心性:平均中间中心性。
d男性多病网络的数值在统计学上高于女性(
女性和男性多病网络可视化
通过分析每种疾病的连通性轨迹来评估随年龄变化的疾病进展(
多病网络、中心疾病、枢纽和连接轨迹。女性(A)和男性(B)年龄调整多病网络。节点代表慢性疾病(ICD-10[国际疾病分类,第10版]编码为3位),因此节点大小与多病患者的患病率成正比,其颜色标识ICD-10类别。链接权重与余弦指数的大小成比例。(C)按性别划分各年龄层的中心疾病。每一阶层PageRank前10个百分位的疾病被确定为中心疾病。(D)各年龄层和性别的中心。每一层中枢纽的前10个百分位的节点被识别为枢纽。女性(E)和男性(F)爆发度(k)的基于年龄的轨迹。三角形表示连续年龄组的程度跳跃≥6。至少有两次这样的程度跳跃的疾病被定义为爆发,这意味着疾病关联的爆发导致多病。
跨年龄组的性别特异性连通性(累积的节点平均Sclton余弦指数[SCI])。所有节点(A),中心疾病与非中心疾病(B),枢纽与非枢纽(C),爆发与非爆发(D)。
群落结构随时间变化不大,而群落根随时间趋于稳定(
女性(A)和男性(B)多疾病网络社区的时间趋势。通过逐年进行网络,跨时间进行比较,我们能够获得社区的时间趋势。根定义为社区内具有最高特征向量中心性的节点,使用ICD-10(国际疾病分类,第十版)标记为3位数字。使用连续年获得的社区的Pearson相关系数评估时间的相似性,且无显著性(
我们在成都市各年龄段的多病住院患者(约占成都市人口的11.2%)中构建了多病网络,建立了来自中国西南地区1650万人口的特大城市普通住院人群慢性病之间的联系。多病影响所有年龄段的人群,其复杂的相互作用在男性和≥40岁的住院患者中更为强烈。值得注意的是,在女性多病网络中,精神健康障碍与各种精神和身体疾病(如代谢疾病、心血管疾病、神经退行性疾病)共存,其中7-79岁的14个年龄组中发现抑郁发作与其他焦虑障碍并存。此外,还发现了疾病连通性的飞跃,中心疾病和高度相互联系的社区。据我们所知,这是发展中国家第一个应用区域医院出院记录而不是自我报告的调查数据来概述多病患病率、获得多病模式并评估性别和年龄差异的区域性研究。我们的研究结果表明,将基于网络的算法应用于日常收集的卫生保健数据可能提供一种更好地筛选和识别慢性疾病之间复杂相互作用的方法。
多病影响所有年龄段的人,甚至包括住院儿童(≤14岁),其中5%的儿童至少有两种慢性疾病。这些发现与先前基于普通人群的研究报告一致,因为患病率因年龄范围、性别、种族、社会经济地位以及生活方式、文化和寻求健康的行为而不同[
我们确定了按年龄和性别划分的住院患者群体的多病模式,这与发达国家或地区以往的研究具有可比性[
我们在多病住院患者中发现终身共病对,例如,≥15岁的男性和女性均伴有糖尿病(E11)的脂蛋白代谢障碍(E78),≥15岁的女性伴有心脏病并发症(I51)的心力衰竭(I50),以及7-79岁女性伴有其他焦虑障碍(F41)的抑郁发作(F32)。先天性畸形,通常是生命中最早被诊断的疾病(即产前或围产期),在我们的研究中,多病女孩(<7岁)的患病率高于男孩(<7岁),特别是循环系统的先天性畸形(包括先天性心脏间隔畸形,Q21;先天性肺动脉和三尖瓣畸形,Q22;主动脉和二尖瓣先天性畸形,Q23;其他先天性心脏畸形,Q24;和先天性大动脉畸形,Q25)。女童的先天性心脏病患病率高于男童[
在每个多病网络中,我们确定了在网络中发挥最重要作用的中心疾病(例如,有大量共病,从而增加网络规模,有相对较少的共病,但表现出更强的共病优势,并发挥连接作用,将那些不相关的疾病连接起来)。在生物医学场景中,中心疾病可以解释为更有可能出现在多病患者或导致多病的疾病。因此,共同的致病基因和分子过程或信号通路可能在中心疾病及其邻近疾病中共享[
此外,我们观察到,随着时间的推移,一些社区保持稳定,而另一些社区由于发生更多疾病而变得更加广泛。很少有研究观察到网络或社区的时间趋势[
本研究的主要优势可以概括为以下几点。首先,这是发展中国家基于大规模数据集(880万份出院记录)的第一个区域研究,以检查多病模式和趋势,以及它们在年龄和性别之间的差异。此外,应用基于网络的方法从常规收集的医院出院记录中提取概念见解。这种方法的使用可以扩展到其他卫生保健数据集。最后,在区域一级使用常规收集的行政数据是有利的,因为数据分布均匀,没有偏见,这为确定临床罕见疾病的共同发生提供了机会。
本研究有一定的局限性。首先,本研究的主要局限性是无法获得个人层面的社会经济地位、生活方式和临床变量。这些因素将在理解多种疾病模式之间的差异方面发挥重要作用[
在本文中,我们对880万份出院记录进行了基于网络的分析,并确定了多病模式的年龄和性别差异以及多病随时间的演变。这项纵向研究提供了来自发展中国家的第一个证据,证明多病影响所有年龄段的人,其复杂的相互作用在男性和≥40岁的住院患者中更为强烈。与男性相比,女性精神健康障碍与更多的精神和身体疾病共病。本研究中发现的终生共病对、疾病连通性飞跃、中心疾病、高度相互关联的社区以及年龄和性别特异性共病模式可能为加强多病患者的综合管理提供建议。同时,在我们的研究中应用的基于网络的方法可以在人口水平上调查所有的多疾病联系,这可以在其他环境下的卫生保健数据集中使用。
男女患病率≥1%的疾病。
各年龄层和性别多病患病率。
出院报告
《国际疾病分类》第十版
相对风险
萨尔顿余弦指数
本研究得到四川省重点研发计划项目(2018SZ0114和2019YFS0271)的资助。
没有宣布。