这是一篇根据知识共享署名许可(https://creativecommons.org/licenses/by/4.0/)的条款发布的开放获取文章,该许可允许在任何媒介上不受限制地使用、分发和复制,前提是原始作品首次发表在JMIR公共卫生与监测上,并适当引用。必须包括完整的书目信息,到http://publichealth.www.mybigtv.com上原始出版物的链接,以及版权和许可信息。
迫切需要持续收集有关COVID-19发病率和死亡率的人口统计数据,并以开放和可获取的方式与公众分享。由于在COVID-19最初传播期间数据报告缺乏一致性,国会提出了《COVID-19公平数据收集和披露法》,该法案要求按年龄、性别、种族和民族、主要语言、社会经济地位、残疾和县收集和报告COVID-19人口统计数据,包括检测、治疗和死亡。据我们所知,没有研究评估在这项立法出台之前和之后如何收集COVID-19人口统计数据。
本研究旨在评估2020年4月21日在国会引入《COVID-19公平数据收集和披露法》之前(法案前)、之后(法案后)和6个月后(6个月随访),美国各州卫生部门和华盛顿哥伦比亚特区在报告和公开COVID-19人口统计数据方面的差异。
我们审查了美国所有50个州和华盛顿特区的卫生部门网站(N=51)。我们评估了每个州在三个时间点如何报告所有确诊的COVID-19病例和死亡的年龄、性别、种族和族裔数据,以及他们如何提供这些数据(即,仅使用图表和表格,或与仪表板和机器可操作的可下载格式相结合)。
我们发现,报告COVID-19病例年龄特定数据的卫生部门数量在统计上显著增加(
尽管对分类需求的增加改善了卫生部门对人口统计数据的公开报告,但仍然迫切需要国会通过拟议的立法,以便美国各州持续收集和提供COVID-19病例、死亡和疫苗接种的特征,以便分配资源以减轻疾病传播。
新冠肺炎疫情于2019年12月在中国爆发。2020年1月20日,美国疾病控制与预防中心在华盛顿州斯诺霍米什县报告了美国首例新冠肺炎确诊病例[
自2020年3月13日宣布全国进入紧急状态以来[
与此同时,人们对COVID-19信息资源的兴趣激增。美国主要新闻网站的网页访问量增长了50%,冠状病毒的报道占网页浏览量的10%-25%。
由于预防COVID-19需要全球参与预防工作,一名感染者就有可能导致大规模聚集性感染,因此令人困惑、缺失或无法获得的COVID-19数据很可能成为一种障碍
为了满足这一需求,各机构和机构根据官方政府报告和各种报纸资源建立了仪表板。例如,《大西洋月刊》的COVID跟踪项目[
数据可用性的障碍很多,包括数据同步和共享的时间和精力;需要有足够的平台,以促进认识但不存在识别风险的方式促进共享;除了伦理、政治和法律界限之外,元数据的准确性(S. C. Clarke, MLIS,未发表的数据,2019年8月)。虽然病例监测数据的收集和向卫生部门的内部报告往往以结构良好的格式执行,但这些标准应加以扩展并转化为公开报告[
在COVID-19在美国最初传播的整个过程中,人口水平(和暴露水平)的报告不一致,许多数据点不可靠或不可用[
因此,不仅迫切需要统一收集有关COVID-19发病率和死亡率统计数据的人口数据,而且还需要以开放和可获取的方式共享数据。开放和可访问的数据共享使卫生教育工作者、研究人员和立法者能够计算出准确的统计数据,以便为特定州实施有针对性的干预措施,并制定政策,以减轻病毒的传播和影响。
由于对透明度的要求越来越高,2020年4月21日,在美国公共卫生协会的支持下,众议院6585号法案《COVID-19公平数据收集和披露法》被提交给国会,要求按种族、民族、性别、年龄、残疾、主要语言、社会经济地位和县收集和报告COVID-19的人口统计数据,包括检测、治疗和死亡[
为了满足这一需求,本研究旨在确定美国卫生部门缺乏标准报告指南的后果。我们的具体目标是评估全州范围内(1)报告COVID-19确诊病例和死亡人口统计数据的即时和6个月差异,以及(2)由于公众要求提高透明度的压力越来越大,仅通过图表或表格、仪表板和机器可操作的数据集公开数据的可用性。
我们审查了所有50个州和华盛顿哥伦比亚特区的地方卫生部门的网站,以确定如何向公众、健康教育工作者和研究人员提供COVID-19数据,并确定报告了哪些人口统计数据。为了确定在报告中立即采取的行动并确定报告随时间的变化,在2020年4月21日实施《COVID-19公平数据收集和披露法》之前(2020年4月13日至20日)、之后(2020年4月27日至28日)和6个月后(2020年10月23日)收集和审查了数据。
我们评估了美国每个州如何报告实验室确诊的COVID-19病例和死亡的人口统计学特征。创建变量以确定每个州或直辖市是否报告了确诊的COVID-19病例和死亡的年龄(不同年龄组)、性别(包括男性和女性)、种族或民族(无、种族和民族分开,或种族和民族作为综合衡量标准)数据。我们还评估了种族和民族数据的报告是否基于OMB制定的联邦报告标准,其中包括对白人、黑人或非裔美国人、亚洲人、美洲印第安人或阿拉斯加原住民、夏威夷原住民或其他太平洋岛民种族和西班牙裔或拉丁裔种族的识别。
数据可用性被描述为“用户获取数据和相关信息的便利程度....”[和]包括用户在访问数据时可能遇到的困难程度”及其及时性[
描述性统计(频率和百分比)用于以表格和可视化格式呈现每个州的数据报告特征。McNemar试验用于确定显著(
这项二次研究没有涉及人类受试者;因此,不需要机构审查委员会的批准。
每个州的数据可用性得分以及在《2019冠状病毒病公平数据收集和披露法》提交国会之前和之后的数据报告情况见
在实施《2019冠状病毒病公平数据收集和披露法》之前、之后立即和6个月,对报告COVID-19确诊病例和死亡数据并向公众提供数据的方式进行了统计比较
美国各州公共卫生部门在(A)实施《COVID-19公平数据收集和披露法》之前、(B)之后和(C)实施《COVID-19公平数据收集和披露法》后6个月报告的COVID-19人口统计数据。数据可用性得分:1=仅总数(该州的确诊病例和死亡病例);2=显示任何种类的分类的数字或网络表格;3 =交互式仪表板;4=机器可操作的数据。可用的分类类型有:A=ASR(年龄、性别、种族),B=AS(年龄和性别),C=A(年龄),D=R(种族)。
对《COVID-19公平数据收集和披露法》实施前(法案实施前)、实施后(法案实施后)和实施后6个月(6个月随访)报告的数据进行统计比较(N=51)。
数据报告 | 值,n (%) |
|
||||
|
|
的天性 | 邮政法 | 6个月随访 |
|
|
|
||||||
|
例确诊病例 | 46 (90) | 50 (98) | 50 (98) | .045 | |
|
死亡 | 25 (49) | 35 (69) | 39 (77) | <.001 | |
|
||||||
|
例确诊病例 | 45 (88) | 48 (94) | 49 (96) | .045 | |
|
死亡 | 21 (41) | 30 (57) | 36 (71) | <.001 | |
|
||||||
|
例确诊病例 | 18 (35) | 31 (61) | 46 (90) | <.001 | |
|
死亡 | 13 (24) | 25 (49) | 39 (77) | <.001 | |
管理预算办公室c标准 | 5 (10) | 22 (43) | 27 (53) | <.001 | ||
|
||||||
|
仅使用图表或表格 | 9 (18) | 9 (18) | 2 (4) | <.001 | |
|
指示板d | 35 (69) | 31 (61) | 26 (51) | <.001 | |
|
Machine-actionablee | 7 (14) | 11 (22) | 23日(45) | <.001 |
一个在2020年4月13日至20日、4月23日至27日和10月23日期间收集了COVID-19确诊病例和死亡病例的年龄、性别、种族和族裔数据。
b报告了法案实施前和法案实施后6个月的McNemar测试结果。
cOMB:管理和预算办公室。
d除了图表和表格之外,还有仪表板。
e除图表和表格外,机器可操作的数据。
我们研究的目的是描述和比较美国州和华盛顿特区卫生部门如何报告COVID-19确诊病例和死亡,并向公众提供数据。在立法(2020年4月21日《COVID-19公平数据收集和披露法》)提出之前、之后和6个月之后,分析和比较了人口统计学特征和数据可获得性,敦促一致收集和报告某些COVID-19数据[
第一个
第二个
第三,我们发现在立法出台后立即和6个月后提供机器可操作数据的州数量显著增加。大多数州(49/ 51,96%)有交互式仪表板,而只有23个州和华盛顿特区(45%)有机器可读的发病率和死亡率数据(除了他们的仪表板)。仪表板是通过数据可视化工具和地理信息系统软件创建的,已经成为一种现代方式,可以显示按地点跟踪疾病的基本流行病学数据,这种方式已经使用了几个世纪。展示美国COVID-19数据的最著名的仪表板不是来自公共卫生部门,而是来自约翰霍普金斯大学[
除了上述三个主要发现外,本研究还揭示了目前缺乏数据报告的其他领域。所报告的大部分数据仍以下列方式提供
在我们的数据收集期结束时,只有夏威夷、印第安纳州、堪萨斯州、北卡罗来纳州和犹他州报告了种族或族裔占人口的比例(5/ 51,10 %),只有加利福尼亚州卫生部门报告了与相应人口百分比相比的确诊COVID-19病例和死亡的种族和族裔数据[
尽管我们的事后分析显示,在引入《COVID-19公平数据收集和披露法》之前和之后,州级数据报告有了显着改善,但我们的结果并未考虑其他因素,例如媒体报道和对该疾病的了解的提高。因此,我们认识到显著的改善可能并不直接代表因果关系。由于每天监测数据报告的快速变化,本研究的最大局限性是信息偏差。各州每天报告的病例和死亡人数不同,但由于新的计数标准、数据维护以及周末和假日,病例数经常增加,有时急剧增加,有时减少。各州报告人口统计数据的方式也存在差异。例如,尽管有几个州报告了2020年4月13日至20日的年龄、性别、种族和族裔数据,但报告数据的方式因病例和死亡而异。《COVID-19公平数据收集和披露法》要求按性别、年龄、种族和民族、主要语言、社会经济地位、残疾和县收集发病率和死亡率监测数据[
州和地方各级报告实践的差异表明,美国需要标准化的报告,需要一个国家基础设施来监测、审计和评估各州和次区域数据报告的质量。数据报告的改进可归因于几个因素,包括提高了数据的清晰度和共享能力,以及公众对改进报告的需求;然而,需求仍在继续,并包括进一步分层,以提供更多数据点,包括住院率和医院供应情况,以及人群中COVID-19疫苗供应情况和疫苗接种率。
尽管数据共享存在许多障碍,包括技术、动机、政治、经济、法律和道德障碍(S. C. Clarke, MLIS,未发表的数据,2019年8月),但政策制定者必须为地方公共卫生机构设定报告要求,以确定哪些数据应该公开提供,以及如何将数据传达给公众。此外,与开放数据运动一致,如果可能的话,数据应该以机器可操作的格式共享,允许其他人探索数据,以发现新趋势和早期发现,为决策提供信息,并确保透明度和问责制。
有标准化的计数、计算和报告发病率的方法可以防止未来对数据准确性的分歧[
疾病控制和预防中心
哥伦比亚特区
众议院
管理和预算局
便携文件格式
作者感谢Anahita Samadi, Paul Lewis Lobo和Diane Billmeier为本研究的数据收集和验证做出的贡献。
没有宣布。