发表在9卷(2023)

本文的预印本(早期版本)可在https://preprints.www.mybigtv.com/preprint/41640,首次出版
中国不吸烟女性肺癌风险预测:回顾性横断面队列研究

中国不吸烟女性肺癌风险预测:回顾性横断面队列研究

中国不吸烟女性肺癌风险预测:回顾性横断面队列研究

原始论文

1河南省癌症防治工程研究中心,河南省国际癌症防治联合实验室,郑州大学附属肿瘤医院,河南省肿瘤医院,郑州

2郑州大学附属肿瘤医院、河南省肿瘤医院放射科,中国郑州

通讯作者:

Shaokai Zhang,医学博士

癌症流行病学与预防部,河南省癌症防治工程研究中心,河南国际癌症预防联合实验室

郑州大学附属肿瘤医院、河南省肿瘤医院

东明路127号

郑州,450008

中国

电话:86 37165587361

电子邮件:shaokaizhang@126.com


背景:据信,吸烟不是全球约53%的女性肺癌诊断的原因。

摘要目的:该研究旨在开发和验证一种简单、无创的模型,用于评估和分层不吸烟中国女性的肺癌风险。

方法:基于中国城市人群癌症筛查项目,本回顾性、横断面队列研究在庞大的人口基础和大量参与者中进行。训练集和验证集都是使用数据的随机分布构造的。通过多变量Cox回归分析确定相关危险因素后,开发了预测nomogram。进一步进行判别(曲线下面积)和校准,以评估风险预测nomogram在训练集中的有效性,然后在验证集中进行验证。

结果:总共有151,834人报名参加了这项调查。训练集(n=75,917)和验证集(n=75,917)都由随机选择的参与者组成。肺癌的潜在预测因素包括年龄、慢性呼吸道疾病史、一级肺癌家族史、更年期和乳腺良性疾病史。我们使用这5个因素显示了1年、3年和5年肺癌风险预测的nomogram图。在训练集中,曲线下1年、3年和5年肺癌风险面积分别为0.762、0.718和0.703。在验证集中,模型显示出适度的预测判别。

结论:我们为不吸烟的女性设计并验证了一个简单的非侵入性肺癌风险模型。该模型可用于识别和分类不吸烟女性中患肺癌的高危人群。

JMIR公共卫生监测2023;9:e41640

doi: 10.2196/41640

关键字



2020年,中国是世界上肺癌死亡病例最多的国家。据国际癌症研究机构(International Agency for Research on Cancer)估计,2020年,全球约有180万例致命肺癌病例。中国占这些病例的39.8% [1].在中国,肺癌死亡人数在过去二十年持续上升的原因是女性肺癌发病率上升[2].此外,东南亚50%或更多的女性肺癌诊断为非吸烟者[3.-5].2012-2014年,我国肺癌病例临床进展最多,其中III-IV期肺癌占64.6% [6].2003年至2015年,中国肺癌生存率(以5年为标准)增长至20% [7].肺癌的预后与发现肺癌的阶段密切相关;5年生存率从IV期癌症患者的0%到I期癌症患者的80%,且患者接受了手术[8].

从2002年开始的国家肺部筛查试验表明,低剂量计算机断层扫描筛查可使肺癌死亡率降低20% [9].然而,该项目仅筛查了基于年龄和吸烟史(55-74岁,吸烟不少于30包年,戒烟不超过15年)的肺癌高危人群(41%女性)。中国女性有自己的特点,肺癌危险因素暴露和发病率模式,其中最重要的是,虽然女性吸烟比率远低于高收入国家如美国在中国(2.4%和23.6%)在美国,肺癌频率相对类似(22.8/100000在中国和在美国的30.8/100000,基于标准化的世界人口的肺癌发病率)(1011].这一发现表明,现有的全球肺癌筛查指南将吸烟作为高危人群的主要预测因素,这对于中国女性,尤其是不吸烟的女性来说是不合适的。因此,确定一种准确预测不吸烟女性肺癌风险的方法,并引导她们选择更具成本效益的低剂量ct筛查,是实现肺癌高效早期诊断和治疗的可行方法。

早期的研究已经开发了许多与特定人群人口统计学相关的肺癌风险预测模型[12-41];然而,很少有预测方法关注中国大陆的不吸烟女性[42].因此,根据早期研究中一致确定的危险因素,开发针对中国不吸烟女性的肺癌风险预测工具已成为首要目标[43].然而,这一目标是艰巨而困难的。与烟草引起肺癌的研究结果相反,不吸烟女性肺癌进展的风险变量尚未确定。虽然也提出了其他危险因素,但其相对重要性在地理位置之间差异很大[3.44445].据观察,前列腺癌、肺癌、结直肠癌和卵巢癌筛查试验(PLCO)模型可能不适用于亚洲非吸烟者,其中包括近2000例亚洲非吸烟者,只有7例肺癌[46].在参加PLCO研究的非吸烟者(n=65,711)中,没有人的6年风险大于0.0151。

基于中国城市癌症筛查项目(CanSPUC),我们创建了这样一个模型[47].在本文中,我们的目标是创建并内部验证一个适用于不吸烟中国女性的肺癌风险预测模型,重点关注常规癌症筛查中已确定的肺癌风险因素。


数据来源及研究对象

这项回顾性、横断面队列研究是在CanSPUC范围内进行的,CanSPUC是一项针对中国城市人口的全国性癌症筛查项目。CanSPUC用于检测5种最常见的恶性肿瘤,包括肺癌、结直肠癌、上消化道癌、肝癌和女性乳腺癌。CanSPUC方法在之前的研究中有详细描述[4748].所有合格的受试者都由高技能的工作人员进行了询问,以收集他们接触风险变量的信息,并使用特定的癌症风险评分系统评估他们的癌症风险。在当地社区使用户籍制度,以确定年龄在40-74岁、无肺癌症状、无癌症诊断史的符合条件的常住居民。无法作出知情同意、有身体残疾且不太可能完成治愈性肺癌手术、有肺癌史、过去5年内接受过任何癌症治疗或有任何癌症证据的个人(非黑素瘤皮肤癌和大多数原位癌除外),或有肺癌症状(包括过去12个月内不明原因的体重减轻7.5 kg或不明原因的咯血)不符合参加条件。2013年10月,CanSPUC在河南省实施,覆盖8个癌症登记数据完整的城市(郑州、驻马店、安阳、洛阳、南阳、焦作、濮阳、新乡)。我们研究了河南省前6年(2013年10月至2019年10月)收集的数据。这项调查只包括不吸烟的女性。

伦理批准

经郑州大学附属肿瘤医院、河南省肿瘤医院伦理委员会评审并批准(no.2021-KY-0028-001)。我们的样本来自电子健康记录中记录的回顾性遭遇;这些数据在两组分析中均未被识别,且不需要知情同意。

结果、变量和测量

所有肺癌新病例都是通过与中国河南省癌症登记数据库匹配(通过唯一ID号)确定的,并在2013年10月1日至2020年3月10日期间进行组织学确认。在河南省,肺癌的记录首先由医院和医疗机构提交到当地癌症登记处,然后由当地癌症登记处提交到中国河南省中央癌症登记处。采用《国际疾病分类第十版》按部位对新诊断的肺部恶性肿瘤进行分类。肺癌由国际疾病分类第十版代码C33-C34确定。为了寻找可能的肺癌风险变量,收集了自我报告的信息(文本框1).

自我报告收集的信息。
  1. 人口统计学因素,如年龄、种族、教育状况、婚姻状况、身高和体重
    • 低教育水平定义为小学及以下,中等教育水平定义为初中或高中,高教育水平定义为大学及以上
    • 根据《中国成人超重和肥胖防治指南》,BMI与个体的身高和体重有关,并划分为“<18.5 kg/m”2,”18.5-23.9 kg/m2,”“24.0-27.9 kg/m2≥28.0 kg/m2"类别[49
  2. 饮食习惯
    • 过去2年饮食摄入以下食物:蔬菜(除土豆、红薯和淀粉外的绿叶植物和真菌)<2.5 kg/周或≥2.5 kg/周;粗粮(除白面粉和大米外的所有其他谷物)<0.5 kg/周或≥0.5 kg/周;水果<1.25 kg/周或≥1.25 kg/周。食物的重量是在烹调之前测量的
  3. 生活环境、行为习惯
    • 烹饪油烟暴露:如果在烹饪过程中使用烟囱、油烟提取器或无烟锅,则认为暴露为“没有或少量”;否则,它被认为是“很多”
    • 被动吸烟:经常生活或工作在一个封闭的区域,人们经常吸烟被认为是“是的”;否则,就被认为是“不”
    • 饮酒:“目前”是指平均每周至少饮酒一次,持续6个月以上的人;“前者”指的是那些已经停止饮酒的人;“从不”指的是那些从未饮酒的人
    • 体育活动:游泳;太极拳、气功或散步;长距离运行;有氧运动;体育项目(如篮球、乒乓球、羽毛球等);跳秧歌或快走;以及其他体育活动(如爬山、跳绳、踢毽子)。每周至少进行三次训练,总时间≥90分钟的受试者被归类为“重体力活动”;否则,他们被归类为“适度或不进行体育活动”
  4. 心理和情绪方面,如有严重创伤史和6个月以上的精神抑郁
    • 严重创伤被描述为家庭成员的重大疾病或死亡、家庭冲突和分居、重大财产损失、意外失业、严重意外身体伤害、暴力危险等
  5. 合并症,如慢性呼吸道疾病、肺结核、慢性支气管炎、肺气肿、哮喘、支气管扩张、高血压、高脂血症和糖尿病
    • 每一个自我报告的共病病例都需要专业医疗机构的评估
  6. 肺癌家族史
    • 一级亲属、二级亲属、三级亲属是否患有肺癌
  7. 生理与生育
    • 包括初潮年龄(<12岁或≥12岁)、更年期(是或否)、生育状况(是或否)、哺乳状况(是或否)、乳腺良性疾病史(是或否)、生殖系统手术史(是或否)
文本框1。自我报告收集的信息。

统计分析

为了对比肺癌患者和非癌症患者的资料,使用了描述性统计数据,以分类数据的百分比表示。采用卡方检验检验基线特征与肺癌进展之间的单因素相关性。对于连续变量,使用平均值(SD)或中位数(IQR)。

在本研究中,根据使用逐步多变量Cox回归的独立预后变量,应用集成模型生成nomogram来测量训练集中肺癌风险的1年、3年和5年估计(P条目=。15一个ndP保持= 10)。使用校准曲线来确定nomogram的有效性。采用50%和84%分位数,将风险预测分为低风险组、中风险组和高风险组,如前所述[50].风险预测模型分别对肺癌低危组、中危组、高危组进行Kaplan-Meier曲线分析。对3条曲线进行对数秩分析比较。受试者工作特征曲线和曲线下面积(AUC)用于量化训练集和验证集中1年、3年和5年肺癌风险估计的预测性能。通过比较观测概率和预测概率,采用自举抽样方法对当前模型的校准进行评估。

所有统计分析均采用R (version 4.0.3;R基础统计计算)和SAS(版本9.4;SAS研究所)软件。图是用rms包中。利用测量仪绘制了接收机的工作特性曲线survivalROC包中。使用ggplot2包,一个校准曲线创建。所有的测试都是用双尾假设完成的,而且P<。05被认为有统计学意义。


研究人群特征

这项研究共有151,834名合格参与者,平均年龄为55.34岁(SD 8.65岁)。受试者被随机分为75,917名训练集和75,917名验证集(图1).到2020年3月,151,834名受试者中发生了204例肺癌病例,事件密度为每10万人-年42.24例。肺癌病例在年龄较大的人群中更为常见(P<.001),有呼吸道疾病史(P=.001),有一级肺癌家族史(P=.02),并有更年期(P<措施)。额外的特性显示在表1及表格S1多媒体附件1

图1。本次分析的参与者流程图。
查看此图
表1。训练集采用卡方检验比较非肺癌组和肺癌组的基线特征。
变量 总(N = 75917)一个 Non-lung癌症b 肺癌b χ2df P价值
所有的参与者 75917 (100) 75798 (99.84) 119 (0.16)

人-年,中位数(IQR) 2.95 (1.73 - -4.83) 2.95 (1.73 - -4.83) 1.56 (0.83 - -2.38)

人口特征

年龄(年),平均值(SD) 55.37 (8.65) 55.36 (8.65) 60.37 (7.20)


年龄(年)n (%) 47.96 (6) <措施c


40-44 9226 (12.15) 9221 (99.95) 5 (0.05)



45-49 13558 (17.86) 13551 (99.95) 7 (0.05)



50 - 54 14389 (18.95) 14376 (99.91) 13 (0.09)



55-59 11857 (15.62) 11838 (99.84) 19日(0.16)



60 - 64 12927 (17.03) 12889 (99.71) 38 (0.29)



65 - 69 10181 (13.41) 10151 (99.71) 30 (0.29)



70 - 74 3779 (4.98) 3772 (99.81) 7 (0.19)


种族,n (%) 0.05 (1)


汉族 74431 (98.04) 74314 (99.84) 117 (0.16)



其他人 1486 (1.96) 1484 (99.87) 2 (0.13)


教育d, n (%) 0.12 (2) 总收入


16139 (21.26) 16115 (99.85) 24 (0.15)



媒介 49922 (65.76) 49842 (99.84) 80 (0.16)



9856 (12.98) 9841 (99.85) 15 (0.15)


婚姻,n (%) 1.89 (1)


未婚、离异或丧偶的 3193 (4.21) 3191 (99.94) 2 (0.06)



结婚了 72724 (95.79) 72607 (99.84) 117 (0.16)


BMI(公斤/米2), n (%) 1.84 (3)


< 18.5 1133 (1.49) 1133 (100) 0 (0)



18.5 - -24.0 35445 (46.69) 35388 (99.84) 57 (0.16)



24.0 - -28.0 30729 (40.48) 30681 (99.84) 48 (0.16)



≥28.0 8610 (11.34) 8596 (99.84) 14 (0.16)

饮食习惯,n (%)

蔬菜摄入量(公斤/周) 0.01 (1) .92


≥2.5 39282 (51.74) 39221 (99.84) 61 (0.16)



< 2.5 36635 (48.26) 36577 (99.84) 58 (0.16)


水果摄入量(kg/周) 0.71 (1) .40


≥1.25 43683 (57.54) 43610 (99.83) 73 (0.17)



< 1.25 32234 (42.46) 32188 (99.86) 46 (0.14)


粗饲料摄入量(kg/周) 0.64 (1)


≥0.5 51713 (68.12) 51636 (99.85) 77 (0.15)



< 0.5 24204 (31.88) 24162 (99.83) 42 (0.17)

生活环境、行为习惯,n (%)

烹饪油烟暴露 0.05 (1) 总共花掉


没有还是有一点 65819 (86.70) 65715 (99.84) 104 (0.16)



很多 10098 (13.3) 10083 (99.85) 15 (0.15)


被动吸烟 0.63 (1)


没有 49045 (64.6) 48964 (99.83) 81 (0.17)



是的 26872 (35.4) 26834 (99.86) 38 (0.14)


饮酒 0.11 (2) .95


从来没有 71567 (94.27) 71454 (99.84) 113 (0.16)



当前的 3647 (4.8) 3642 (99.86) 5 (0.14)



703 (0.93) 702 (99.86) 1 (0.14)


体育活动 3.19 (1) 07


适度或不 40014 (52.71) 39961 (99.87) 53 (0.13)



35903 (47.29) 35837 (99.82) 66 (0.18)

心理与情绪,n (%)

有严重创伤史 1.22 (1) 低位


没有 65199 (85.88) 65101 (99.85) 98 (0.15)



是的 10718 (14.12) 10697 (99.8) 21日(0.2)


精神抑郁6个月以上 0.00 (1) .98点


没有 64379 (84.8) 64278 (99.84) 101 (0.16)



是的 11538 (15.2) 11520 (99.84) 18 (0.16)

合并症,n (%)

有慢性呼吸道疾病史 11.53 (1) 措施


没有 64070 (84.39) 63983 (99.86) 87 (0.14)



是的 11847 (15.61) 11815 (99.73) 32 (0.27)


肺结核病史 1.24 (1) 低位


没有 74895 (98.65) 74779 (99.85) 116 (0.15)



是的 1022 (1.35) 1019 (99.71) 3 (0.29)


慢性支气管炎病史 3.44 (1 06


没有 66728 (87.9) 66630 (99.85) 98 (0.15)



是的 9189 (12.1) 9168 (99.77) 21日(0.23)


肺气肿史 3.21 (1) 07


没有 75204 (99.06) 75088 (99.85) 116 (0.15)



是的 713 (0.94) 710 (99.58) 3 (0.42)


哮喘支气管扩张史 1.27 (1)


没有 73473 (96.78) 73360 (99.85) 113 (0.15)



是的 2444 (3.22) 2438 (99.75) 6 (0.25)


高血压病史 1.66 (1) .20


没有 60976 (80.32) 60886 (99.85) 90 (0.15)



是的 14941 (19.68) 14912 (99.81) 29 (0.19)


高脂血症病史 1.67 (1) .20


没有 63309 (83.39) 63215 (99.85) 94 (0.15)



是的 12608 (16.61) 12583 (99.8) 25 (0.2)


糖尿病病史 0.00 (1) .98点


没有 70767 (93.22) 70656 (99.84) 111 (0.16)



是的 5150 (6.78) 5142 (99.84) 8 (0.16)

肺癌一级家族史n (%) 5.15 (1) 02

没有 69955 (92.15) 69852 (99.85) 103 (0.15)


是的 5962 (7.85) 5946 (99.73) 16 (0.27)

生理与生育能力,n (%)

月经初潮年龄(年) 0.34 (1) 56


< 12 1910 (2.52) 1908 (99.9) 2 (0.1)



≥12 74007 (97.48) 73890 (99.84) 117 (0.16)


更年期 29.26 (1) <措施


没有 26927 (35.47) 26913 (99.95) 14 (0.05)



是的 48990 (64.53) 48885 (99.79) 105 (0.21)


生育状况 1.67 (1) .20


没有 1047 (1.38) 1047 (100) 0 (0)



是的 74870 (98.62) 74751 (99.84) 119 (0.16)


哺乳期的地位 0.06 (1) .80


没有 4233 (5.58) 4227 (99.86) 6 (0.14)



是的 71684 (94.42) 71571 (99.84) 113 (0.16)


乳腺良性疾病史 3.61 (1) 06


没有 53977 (71.1) 53883 (99.83) 94 (0.17)



是的 21940 (28.9) 21915 (99.89) 25 (0.11)


生殖系统手术史 1.75 (1) .19


没有 60480 (79.67) 60391 (99.85) 89 (0.15)



是的 15437 (20.33) 15407 (99.81) 30 (0.19)

一个这一列中的百分比的分母为N=75,917。

b这些列中的百分比将“Total”列中的n值作为分母在同一行中。

c斜体值表示统计显著性。

2低=小学或以下;中等=初中或高中;高=本科及以上学历。

肺癌风险评估模型的建立

表2显示每个指标的95% CI的风险比(HRs)。在训练集中,年龄(≥55岁:HR 1.34, 95% CI 0.38-4.80;≥60岁:HR 2.33, 95% CI 0.67-8.11;≥65岁:HR 2.41, 95% CI 0.69-8.49;≥70岁:HR 1.79, 95% CI 0.43 ~ 7.40)、慢性呼吸道疾病史(HR 1.94, 95% CI 1.24 ~ 3.04)、一级肺癌家族史(HR 1.60, 95% CI 0.91 ~ 2.83)、绝经史(HR 2.16, 95% CI 0.90 ~ 5.19)、乳腺良性疾病史(HR 0.58, 95% CI 0.36 ~ 0.94)是肺癌的独立危险因素。因此,我们应用这些参数来构建模型。我们绘制了肺癌的1年、3年和5年风险预测图(图2一个)。

表2。训练集肺癌风险的多变量Cox回归预测模型。
变量 β系数 SE 人力资源一个(95%置信区间) χ2df P价值
年龄(年)
40-44 N/Ab N/A 1.00 N/A N/A
45-49 -0.19 0.59 0.83 (0.26 - -2.64) 0.10 (1) 综合成绩
50 - 54 -0.06 0.62 0.94 (0.28 - -3.19) 0.01 (1) 公布
55-59 0.30 0.65 1.34 (0.38 - -4.80) 0.21 (1) 主板市场
60 - 64 0.85 0.64 2.33 (0.67 - -8.11) 1.78 (1) 只要
65 - 69 0.88 0.64 2.41 (0.69 - -8.49) 1.89 (1)
70 - 74 0.58 0.72 1.79 (0.43 - -7.40) 0.65 (1)
有慢性呼吸道疾病史
没有 N/A N/A 1.00 N/A N/A
是的 0.66 0.23 1.94 (1.24 - -3.04) 8.45 (1) 04c
一级肺癌家族史
没有 N/A N/A 1.00 N/A N/A
是的 0.47 0.29 1.60 (0.91 - -2.83) 2.63 (1)
更年期
没有 N/A N/A 1.00 N/A N/A
是的 0.77 0.45 2.16 (0.90 - -5.19) 2.95 (1) .09点
乳腺良性疾病史
没有 N/A N/A 1.00 N/A N/A
是的 -0.55 0.25 0.58 (0.36 - -0.94) 4.97 (1) 03

一个HR:风险比。

bN/A:不适用。

c斜体表示有统计学意义。

图2。(A)计算个人1年、3年和5年肺癌风险的Nomogram, (B)不同癌症风险类别的肺癌发病率。
查看此图

模型的预测性能

风险预测分为低风险、中风险和高风险类别,日志秩检验显示3组之间存在显著差异(图2B;P<措施)。

通过使用该模型,训练集中1年、3年和5年肺癌风险的AUC分别为0.762、0.718和0.703。该模型得出被动吸烟者的AUC(1年:0.787,3年:0.715,5年:0.745)高于非被动吸烟者(1年:0.741,3年:0.721,5年:0.689;图3).校准是可接受的,观察到的和预测的危险非常相似(图4).

图3。训练集中预测模型的接受者工作特征曲线。(A)全体人口;(B)非被动吸烟者;被动吸烟者。AUC:曲线下面积。
查看此图
图4。训练集(A) 1年、(B) 3年和(C) 5年肺癌无癌率的nomogram校准曲线。
查看此图

肺癌风险模型的验证

该模型在验证集中显示出中等的预测辨别能力,1年、3年和5年肺癌风险的auc分别为0.646、0.658和0.650(图S1)多媒体附件1),以及令人满意的相对风险校准(图S2多媒体附件1).


我们在内部构建并验证了一个简单的非吸烟女性肺癌风险预测模型,依赖于5个常见的因素,如人口统计学(年龄)、共病(慢性呼吸道疾病)、一级肺癌家族史和生育能力(绝经期和良性乳腺疾病史)。结果表明,该模型对非被动吸烟者和被动吸烟者均具有中等的鉴别准确性和拟合优度。

在不吸烟的女性中发现了多种肺癌风险变量,例如被动吸烟[5152]、既往肺部疾病(肺结核、慢性支气管炎、肺气肿和既往肺部疾病[慢性阻塞性肺病])[53]、室内氡[54]、烹调油烟[55],以及有肺癌家族史[56].已确定的肺癌风险变量,如年龄、肺癌家族史和慢性呼吸道疾病史,与研究结果相似。根据我们的调查,年龄是不吸烟女性肺癌最重要的风险变量,65-69岁年龄组的风险是40-44岁年龄组的2.4倍以上。

根据嵌套病例-对照数据的汇总分析,绝经与肺癌发病风险增加相关,总优势比为1.33 (95% CI 0.90-1.96) [57],这与我们的发现一致。有趣的是,我们发现有良性乳腺疾病病史的女性患肺癌的可能性较小,这可能是因为这些女性在患乳腺疾病后比没有患乳腺疾病的女性更注意自己的生活方式和饮食。这一发现需要在未来的研究中得到验证。

风险预测模型除了指标准确外,还应达到鉴别(区分肺癌病例与对照病例的鉴别能力)和校正(定义为观察到的肺癌风险与预测的肺癌风险的一致性)的性能标准。自2010年以来,肺癌风险预测模型的研究数量大幅增长,表明使用预测模型驱动人群分流的必要性。最初,模型,如巴赫模型[12], Spitz模型[13]、利物浦肺脏计划模式[14]和PLCOM2012模型(58],强调了应用经典流行病学风险变量的重要性,包括年龄、吸烟史、个人疾病史和癌症家族史。据我们所知,这项研究是为数不多的对不吸烟中国女性肺癌风险预测进行建模的研究之一。由于每个模型都是在具有不同基线风险和随访时间的不同人群中创建的,因此比较风险预测模型的鉴别性能具有挑战性。每个模型的辨别能力相当,c统计量在0.72到0.86之间。与之前的研究相比,我们的模型显示出相当的预测性能。

在理解我们的发现时,应该仔细考虑某些优势和局限性。我们的研究是在中国大陆进行的一个大规模的基于人群的癌症筛查项目,这是一个优势。此外,该模型中包含的变量可以很容易地收集和更新,无需任何成像、复杂的测试或计算。此外,该模型将被用作一种方便的方法,在不吸烟的女性中对高危人群进行分类,并将参与公共卫生倡议,例如关于控制不吸烟者肺癌的建议。然而,基于自我报告的统计数据可能容易受到社会可接受性偏差和回忆偏差的影响。由于数据收集和质量控制是按照高标准进行的,因此可以依靠大量的信息。其次,我们的风险预测模型的性能在使用之前没有针对外部数据集进行验证。另一方面,内部校准的结果表明,该模型在应用于各种人群时将令人满意地发挥作用。

总之,中国的一个大规模肺癌筛查项目为创建和内部校准一个直接的不吸烟女性肺癌风险预测模型奠定了基础。该模型具有中度的歧视性,可作为分类高危人群以预防不吸烟女性肺癌的工具。为了在外部人群中验证这一概念,还需要进一步的前瞻性研究。

致谢

本研究得到河南省自然科学基金项目(No. 212300410261)和河南省中青年健康科技创新优秀人才培养项目(YXKC2022045)的资助。我们衷心感谢来自中国癌症中心和河南省的所有中国城市癌症筛查项目成员。我们也非常感谢参与这项研究的参与者。

数据可用性

由于我们所有的数据都受到中国国家癌症中心、郑州大学附属肿瘤医院和河南省肿瘤医院的监管,因此本手稿的数据集无法公开。存取数据集的请求应送交深圳。

作者的贡献

LG和SZ为概念和设计做出了贡献。LG和L Zheng对统计分析也有贡献。LG, QM, L Zheng, QC, YL, HX, RK, L Zhang, SL, XS和SZ对数据采集和数据解释有贡献。文章由LG起草。所有作者修改了手稿,并批准了手稿的最终版本。

利益冲突

没有宣布。

多媒体附件1

补充表格和图表。

DOCX文件,169 KB

  1. 王晓明,王晓明,王晓明,等。2020年全球癌症统计:GLOBOCAN估计了185个国家的36种癌症的发病率和死亡率。CA癌症杂志2021年5月;71(3):209-249 [免费全文] [CrossRef] [Medline
  2. 张文文,郑瑞生,杨志祥,曾宏明,孙克霞,顾晓霞,等。2000-2014年中国癌症登记区肺癌发病率和诊断年龄趋势分析文章中文。中华计量计量杂志2018 06;52(6):579-585。[CrossRef] [Medline
  3. Sun S, Schiller JH, Gazdar AF.从不吸烟的肺癌——一种不同的疾病。2007年10月7日(10):778-790。[CrossRef] [Medline
  4. Couraud S, Zalcman G, Milleron B, Morin F, Souquet PJ。从不吸烟的人患肺癌——综述。中华癌症杂志2012 Jun;48(9):1299-1311。[CrossRef] [Medline
  5. Scagliotti GV, Longo M, Novello S.从不吸烟者的非小细胞肺癌。2009年3月21日(2):99-104。[CrossRef] [Medline
  6. 石建峰,王磊,吴楠,李建林,惠志刚,刘思明,LuCCRES集团。2005-2014年中国肺癌的临床特征和医疗服务利用:多中心回顾性流行病学调查的总体设计和结果肺癌2019 Feb;128:91-100。[CrossRef] [Medline
  7. 曾华,陈伟,郑锐,张松,季建军,邹霞,等。2003-15年中国癌症生存率的变化:对17个基于人群的癌症登记的汇总分析Lancet Glob Health 2018年5月;6(5):e555-e567 [免费全文] [CrossRef] [Medline
  8. Detterbeck FC, Boffa DJ, Kim AW, Tanoue LT.第八版肺癌分期分类。胸部2017年1月;151(1):193-203。[CrossRef] [Medline
  9. 国家肺筛查试验研究小组,Aberle DR, Adams AM, Berg CD, Black WC, Clapp JD,等。低剂量ct筛查降低肺癌死亡率。N Engl J Med 2011 Aug 04;365(5):395-409 [免费全文] [CrossRef] [Medline
  10. 李强,夏军,杨刚。2010年中国吸烟流行情况。中华医学杂志2011年6月23日;364(25):2469-2470。[CrossRef] [Medline
  11. Cepeda-Benito A, Doogan NJ, Redner R, Roberts ME, Kurti AN, Villanti AC,等。在美国农村和城市环境中,男性和女性的趋势差异。Prev Med 2018 12月;117:69-75。[CrossRef] [Medline
  12. Bach PB, Kattan MW, Thornquist MD, Kris MG, Tate RC, Barnett MJ,等。吸烟者肺癌风险的差异。中华肿瘤学杂志2003,19(6):497 - 497。[CrossRef] [Medline
  13. 施皮兹,洪伟科,慈慈慈,吴旭,沙巴思,董强,等。肺癌的风险预测模型。中华肿瘤学杂志2007 5月02日;39(9):715-726。[CrossRef] [Medline
  14. Cassidy A, Myles JP, van Tongeren M, Page RD, Liloglou T, Duffy SW,等。LLP风险模型:肺癌的个体风险预测模型。中华癌症杂志2008年1月29日;29 (2):270-276 [免费全文] [CrossRef] [Medline
  15. 刘敏,刘志刚,刘志刚,董强,等。非裔美国人肺癌风险预测模型的开发和验证。Cancer Prev Res (Phila) 2008九月;1(4):255-265 [免费全文] [CrossRef] [Medline
  16. 施皮兹先生,Etzel CJ,董q, Amos CI, Wei Q,吴旭,等。一个扩展的肺癌风险预测模型。Cancer Prev Res (Phila) 2008九月;1(4):250-254 [免费全文] [CrossRef] [Medline
  17. Young RP, Hopkins RJ, Hay BA, Epton MJ, Mills GD, Black PN,等。基于年龄、家族史和遗传变异的肺癌易感性模型。PLoS One 2009年4月23日;4(4):e5302 [免费全文] [CrossRef] [Medline
  18. D'Amelio AMJ, Cassidy A, Asomaning K, Raji OY, Duffy SW, Field JK,等。三种肺癌风险模型的鉴别能力和准确性比较。中华肿瘤学杂志2010 july 27;103(3):423-429 [免费全文] [CrossRef] [Medline
  19. Raji OY, Agbaje OF, Duffy SW, Cassidy A, Field JK。将遗传因素纳入预测肺癌个体风险的流行病学模型:利物浦肺计划。Cancer Prev Res (Phila) 2010年5月;3(5):664-669。[CrossRef] [Medline
  20. Maisonneuve P, Bagnardi V, Bellomi M, Spaggiari L, Pelosi G, Rampinelli C,等。肺癌风险预测选择吸烟者进行CT筛查——基于意大利COSMOS试验的模型。Cancer Prev Res (Phila) 2011年11月;4(11):1778-1789。[CrossRef] [Medline
  21. Tammemagi CM, Pinsky PF, Caporaso NE, Kvale PA, Hocking WG, Church TR,等。肺癌风险预测:前列腺癌、肺癌、结直肠癌和卵巢癌筛查试验模型和验证。中华肿瘤学杂志2011 7月06日;39 (12):1058-1068 [免费全文] [CrossRef] [Medline
  22. Tammemagi MC, Lam SC, McWilliams AM, Sin DD.肺功能和痰DNA图像细胞术在肺癌风险预测中的增量价值。Cancer Prev Res (Phila) 2011四月;4(4):552-561。[CrossRef] [Medline
  23. Hoggart C, Brennan P, Tjonneland A, Vogel U, Overvad K, Østergaard JN,等。肺癌发病率的风险模型。Cancer Prev Res (Phila) 2012 Jun;5(6):834-846 [免费全文] [CrossRef] [Medline
  24. 李华,杨林,赵霞,王杰,钱杰,陈辉,等。利用多因子遗传模型预测中国人群肺癌风险BMC Med Genet 2012 Dec 10;13(1):118 [免费全文] [CrossRef] [Medline
  25. Raji OY, Duffy SW, Agbaje OF, Baker SG, Christiani DC, Cassidy A,等。利物浦肺计划风险模型对肺癌ct筛查患者分层的预测准确性:一项病例对照和队列验证研究安实习医学2012年8月21日;157(4):242-250 [免费全文] [CrossRef] [Medline
  26. 朴山,南彬,杨宏华,李智,林海,韩俊涛,等。韩国男性肺癌个体化风险预测模型。PLoS One 2013 Feb 07;8(2):e54823 [免费全文] [CrossRef] [Medline
  27. 施皮兹先生,阿莫斯CI,兰德S,吴旭,董强,温兹拉夫AS,等。选择性基因变异在非裔美国人肺癌风险中的作用。中华外科杂志2013年4月;8(4):391-397 [免费全文] [CrossRef] [Medline
  28. Tammemägi MC, Katki HA, Hocking WG, Church TR, Caporaso N, Kvale PA,等。肺癌筛查的选择标准。N Engl J Med 2013 Feb 21;368(8):728-736 [免费全文] [CrossRef] [Medline
  29. 张晓东,张晓东,张晓东,等。肺癌ct筛查:十年年度筛查结果及宇宙预测模型验证。肺癌2013年12月;82(3):426-430。[CrossRef] [Medline
  30. El-Zein RA, Lopez MS, D'Amelio AM, Liu M, Munden RF, Christiani D,等。细胞分裂阻断微核试验作为肺癌的一个强有力的预测指标:肺癌风险预测模型的扩展。癌症流行病学生物标志物2014年11月;23(11):2462-2470 [免费全文] [CrossRef] [Medline
  31. 李K, Hüsing A, Sookthai D, Bergmann M, Boeing H, Becker N,等。选择高危人群进行肺癌筛查:德国EPIC队列中现有风险模型和资格标准的前瞻性评估Cancer Prev Res (Phila) 2015 Sep;8(9):777-785。[CrossRef] [Medline
  32. Marcus MW, Chen Y, Raji OY, Duffy SW, Field JK。LLPi: Liverpool Lung Project肺癌发病率风险预测模型。Cancer Prev Res (Phila) 2015 Jun;8(6):570-575。[CrossRef] [Medline
  33. 王霞,马凯,崔娟,陈霞,金玲,李伟。基于中国人群肺癌个体风险预测模型肿瘤杂志2015 Feb 14;101(1):16-23。[CrossRef] [Medline
  34. Marcus MW, Raji OY, Duffy SW, Young RP, Hopkins RJ, Field JK。在肺癌风险预测模型中纳入遗传易感性单核苷酸多态性的上位相互作用。Int J Oncol 2016 july;49(1):361-370 [免费全文] [CrossRef] [Medline
  35. 王鑫,马凯,迟玲,崔健,金玲,胡健,等。结合端粒酶逆转录酶遗传变异rs2736100与流行病学因素预测肺癌易感性。中华癌症杂志2016;7(7):846-853 [免费全文] [CrossRef] [Medline
  36. 吴霞,文大鹏,叶勇,蔡明,文超,罗斯佳,等。台湾一项前瞻性队列中从不吸烟者、轻度吸烟者和重度吸烟者的个性化风险评估。科学报告2016年11月02日;6:36482 [免费全文] [CrossRef] [Medline
  37. Muller DC, Johansson M, Brennan P.纳入肺功能的肺癌风险预测模型:在英国生物银行前瞻性队列研究中的开发和验证。中华临床杂志2017年3月10日;35(8):861-869 [免费全文] [CrossRef] [Medline
  38. Weber M, Yap S, Goldsbury D, Manners D, Tammemagi M, Marshall H,等。确定肺癌针对性筛查的高危人群:PLCO风险预测工具的独立验证。国际肿瘤学杂志2017 july 15; 41(2):242-253 [免费全文] [CrossRef] [Medline
  39. Charvat H, Sasazuki S, Shimazu T, Budhathoki S, Inoue M,岩崎M, JPHC研究组。肺癌风险预测模型的开发:基于日本公共卫生中心的前瞻性研究癌症科学2018 Mar 21;109(3):854-862 [免费全文] [CrossRef] [Medline
  40. Katki HA, Kovalchik SA, Petito LC,张LC, Jacobs E, Jemal A,等。九种风险预测模型对选择经常吸烟者进行ct肺癌筛查的意义。Ann实习生医学2018 07月03日;169(1):10-19 [免费全文] [CrossRef] [Medline
  41. Markaki M, Tsamardinos I, Langhammer A, Lagani V, Hveem K, Røe OD。所有年龄和暴露类型的吸烟者肺癌的有效临床风险预测模型:HUNT研究。电子生物医学2018年5月;31:36-46 [免费全文] [CrossRef] [Medline
  42. 吕志智,李宁,陈世生,王刚,谭伟富,冯小生,等。建立女性非吸烟者肺癌风险预测模型的探索性研究。文章中文。中华育方学刊2020年11月06日;54(11):1261-1267。[CrossRef] [Medline
  43. 从不吸烟的肺癌筛查。中华胸肺科杂志2019 3月;14(3):336-337 [免费全文] [CrossRef] [Medline
  44. 杜春,高峰,林伟,梁松,方坤,叶松,等。从不吸烟的肺癌患者:一种独特疾病实体的流行病学证据。中华临床杂志2006年5月20日;24(15):2245-2251。[CrossRef] [Medline
  45. Sisti J, Boffetta P.,在从不吸烟者中,有多大比例的肺癌可归因于已知的危险因素?国际肿瘤学杂志2012 july 15; 31(2):265-275 [免费全文] [CrossRef] [Medline
  46. Tammemägi MC, Church TR, Hocking WG, Silvestri GA, Kvale PA, Riley TL,等。肺癌风险的评估,筛查曾经和从不吸烟者:筛查规则适用于PLCO和NLST队列。PLoS Med 2014 12月;11(12):e1001764 [免费全文] [CrossRef] [Medline
  47. 郭丽文,陈强,沈玉春,孟QC,郑丽丽,吴勇,等。中国河南低剂量计算机断层扫描肺癌筛查项目的评估。美国医学会网络公开赛2020年11月02日;3(11):e2019039 [免费全文] [CrossRef] [Medline
  48. 郭玲,张松,刘松,郑玲,陈强,曹旭,等。中国基于人群的上消化道癌筛查项目参与和检出率的决定因素2019年11月;8(16):7098-7107 [免费全文] [CrossRef] [Medline
  49. 陈超,陆富峰,中国卫生部疾病控制司。中国成人超重和肥胖防治指南。生物环境科学2004;17增刊:1-36。[Medline
  50. Royston P, Altman DG。Cox预后模型的外部验证:原则和方法。BMC Med Res methodo2013 Mar 06;13:33 [免费全文] [CrossRef] [Medline
  51. Hackshaw AK, Law MR, Wald NJ。肺癌与环境烟草烟雾的累积证据。英国医学杂志1997 Oct 18;315(7114):980-988 [免费全文] [CrossRef] [Medline
  52. 李志强,李志强,李志强,等。肺癌风险和工作场所暴露于环境烟草烟雾。中华医学会公共卫生杂志2007年3月97(3):545-551。[CrossRef] [Medline
  53. Brenner DR, McLaughlin JR, Hung RJ。既往肺部疾病与肺癌风险:系统回顾和荟萃分析PLoS One 2011 3月31日;6(3):e17479 [免费全文] [CrossRef] [Medline
  54. 李文杰,李志强,李志强,等。家中氡与肺癌风险:来自13个欧洲病例对照研究的个人数据的合作分析。英国医学杂志2005年1月29日;330(7485):223 [免费全文] [CrossRef] [Medline
  55. 赵艳,王珊珊,郝娟,王晓燕,王晓燕,王晓燕。中国空气污染与肺癌风险的meta分析。环境科学学报2006年8月1日;26(3):344 - 344。[CrossRef] [Medline
  56. 李志强,李志强,李志强,等。家族史与肺癌风险:东欧和中欧的国际多中心病例对照研究和荟萃分析癌症病因控制2010 july;21(7):1091-1104。[CrossRef] [Medline
  57. 金凯,洪瑞杰,Thomas S, Le Marchand L, Matsuo K, Seow A,等。激素因素与亚洲女性肺癌的关联:来自国际肺癌协会的汇总分析。国际癌症杂志2021年5月01日;148(9):2241-2254 [免费全文] [CrossRef] [Medline
  58. Tammemägi MC, Katki HA, Hocking WG, Church TR, Caporaso N, Kvale PA,等。肺癌筛查的选择标准。N Engl J Med 2013 Feb 21;368(8):728-736 [免费全文] [CrossRef] [Medline


AUC:曲线下面积
CanSPUC:中国城市癌症筛查项目
人力资源:风险比
全方位:前列腺,肺癌,结肠直肠癌和卵巢癌筛查试验


A Mavragani编辑;提交03.08.22;同行评审:Dai M, Wang L;对作者25.10.22的评论;修订版本于04.11.22收到;接受25.11.22;发表06.01.23

版权

©郭兰薇,青城孟,郑丽阳,陈琼,刘茵,徐慧芳,康瑞华,张璐瑶,刘树正,孙锡斌,张绍凯。最初发表于JMIR公共卫生与监测(https://publichealth.www.mybigtv.com), 2023年1月6日。

这是一篇根据创作共用署名许可协议(https://creativecommons.org/licenses/by/4.0/)发布的开放获取文章,允许在任何媒介上不受限制地使用、分发和复制,前提是正确引用了首次发表在JMIR公共卫生和监测上的原创作品。必须包括完整的书目信息,https://publichealth.www.mybigtv.com上的原始出版物的链接,以及此版权和许可信息。


Baidu
map