医学互联网研究杂志——大型综合卫生系统中数字症状检查器的使用特征和分诊敏锐度:基于人群的描述性研究

原始论文

¹美国加州帕洛阿尔托斯坦福大学医学院儿科

²美国加州帕洛阿尔托斯坦福大学医学院生物医学信息研究中心

^3.临床领导团队，萨特健康，萨克拉门托，加州，美国

⁴帕洛阿尔托医学基金会研究所，美国加州帕洛阿尔托

通讯作者:

Keith E Morse，医学博士，工商管理硕士

儿科

斯坦福大学医学院

韦尔奇道750号

315套房

帕洛阿尔托，加州，94304

美国

电话:1 650 723 5711

电子邮件:kmorse@stanfordchildrens.org

背景:由于人口老龄化、医疗支出增加以及最近的COVID-19大流行，美国医疗保健系统面临的压力一直在增加。对这种压力的应对受到阻碍，部分原因是依赖有限的训练有素的卫生保健专业人员，因此需要可扩展的技术解决方案。数字症状检查器是人工智能支持的软件工具，使用会话“聊天机器人”格式来支持快速诊断和一致的分类。COVID-19大流行使人们重新关注这些工具，因为需要避免面对面接触并保持紧急护理能力。然而，基于证据的部署这些聊天机器人需要了解用户人口统计数据和由大量普通人群生成的相关分类建议。

摘要目的:在这项研究中，我们评估了与美国大型综合卫生系统合作部署的症状检查聊天机器人提供的用户人口统计数据和分诊敏锐度水平。

方法:这项基于人群的描述性研究包括2019年4月24日至2020年2月1日在萨特卫生系统(北加州24家医院)的网站和患者门户网站上完成的所有基于网络的症状评估。用户人口统计数据与美国人口普查相关数据进行了比较。

结果:在研究期间共完成了26646次症状评估。大多数评估(17,816/26,646,66.9%)由女性用户完成。用户的平均年龄为34.3岁(SD为14.4岁)，而普通人群的年龄中位数为37.3岁。最常见的首发症状为腹痛(2060/ 26646,7.7%)。相当数量的评估(12,357/ 26,646,46.4%)是在典型的医生办公时间之外完成的。大多数使用者被建议当天就医(7299/ 26646,27.4%)或2-3天内就医(6301/ 26646,23.6%)。超过四分之一的评估显示高度紧急(7723/ 26646,29.0%)。

结论:症状检查聊天机器人的用户广泛地代表了我们的患者群体，尽管他们倾向于年轻和女性用户。分诊建议与护士工作人员的电话分诊线路相当。尽管COVID-19的出现增加了人们对远程医疗评估工具的兴趣，但重要的是要采取循证方法来部署这些工具。

中国医学网络杂志2020;22(11):e20549

doi: 10.2196/20549

关键字

症状检查程序；聊天机器人；计算机辅助诊断；诊断自我评价；人工智能；自我保健；新型冠状病毒肺炎

由于人口老龄化、卫生服务的经济改革以及最近COVID-19大流行的出现，美国的卫生保健服务正面临越来越大的压力[1］．培训卫生保健专业人员是一个缓慢的过程，由于整个系统普遍缺乏训练有素的人员和关键空缺[2]，必须评估可扩展的技术替代方案。一种潜在的方法是数字症状检查器，这是一种人工智能(AI)支持的软件工具，它使用对话式“聊天机器人”格式询问患者的症状，并返回可能的诊断列表，以支持自我诊断和适当的分类[3.］．

COVID-19大流行使人们更加迫切地考虑使用聊天机器人，因为需要避免面对面接触，保持面对面护理能力，并以前所未有的数量对患者进行分类[4］．然而，影响医疗服务的数字工具应经过严格的评估，以循证确定其功效。症状检查分诊建议已被理论化，以减少不必要的门诊和急诊室就诊[5]，最近的一项研究表明，完成基于网络的症状评估会降低患者寻求治疗的紧迫性[6］．然而，人们对在更大人群中使用症状检查器生成的总体分类建议知之甚少，最近一些综述呼吁分享更多的研究[5，7，8］．在这里，我们描述了与北加州一个大型综合医疗保健系统合作部署的一个症状检查聊天机器人的使用特征和分诊建议。

招聘

这项研究的背景是萨特健康(Sutter Health)，这是一家位于北加州的非营利性医疗保健系统，拥有24家医院。2019年，症状检查聊天机器人被引入整个卫生系统，广泛用于16岁以上的任何现有和潜在患者。该聊天机器人被整合到萨特健康的主要网站(图1)和基于网络的病人门户网站。营销通过几个渠道进行，包括向现有患者发送电子邮件和社交媒体广告。

本研究的数据包括2019年4月24日至2020年2月1日完成的所有症状评估。这项研究得到了萨特健康机构审查委员会的批准。

症状检查程序

症状检查器，由Ada Health (Ada Health，柏林，德国[9])，使用会话聊天机器人风格的界面来引出用户的基本人口统计数据，并显示症状以及其他详细信息，如症状持续时间和严重程度。人工智能算法对这些信息进行分析，以产生可能的诊断和相关的分类建议。症状检查评估是匿名的;因此，无法确定经常使用的用户，也无法将使用情况与卫生系统电子健康记录中的患者数据联系起来。

统计分析

因为这是一个描述性的服务改进研究，我们没有可证伪的假设;因此，我们没有进行正式的权力分析。为了与更广泛的人口进行比较，我们从美国人口普查局的阿拉米达县数据中提取了人口水平的人口统计数据，阿拉米达县是萨特健康服务的北加州最大的县之一[10］．分析的数据包括患者输入的人口统计信息、报告的初始症状、评估时间以及症状检查聊天机器人生成的分诊建议。分诊建议采用八种可能的建议之一的形式，分为低、中、高敏锐度。低敏锐度包括在家处理症状的建议，在2-3周内寻求医疗建议，或向药房寻求建议。中度敏锐度包括建议在2-3天内就医或当天就医。高敏锐度包括建议在4小时内寻求治疗、呼叫救护车或在急诊科寻求治疗。

用户统计数据和使用时间

研究期间共完成了26646次症状评估，无缺失数据。大多数用户(17816 / 26646,66.9%)为女性，其余为男性(8830/ 26646,33.1%)。阿拉米达县的比较人口中女性占50.9% [10］．

使用者的平均年龄为34.3岁(SD 14.4岁);分组检查(表1)显示，使用者以30-39岁居多(7009/ 26646,26.3%)。然而，相当一部分用户年龄较大;年龄在60岁或以上的有3531/ 26646人(13.3%)。相比之下，阿拉米达县的中位年龄为37.3岁，18.4%的人口年龄在60岁或以上[10］．

略低于一半的评估(12,357/ 26,646,46.4%)是在典型的医生办公时间(上午9点至下午6点)之外完成的(表1)．最常见的首发症状为腹痛(2060/ 26646,7.7%)。最常见的10种初始症状显示在表2．

表1。使用症状检查器的人口统计学和时间(N=26,646)。

特征		数(%)
性别
	男性	8830 (33.1)
	女	17816 (66.9)
年龄(年)
	＜19	863 (3.2)
	为20 - 29	6441 (24.2)
	- 39	7009 (26.3)
	40至49	4663 (17.5)
	50-59	4139 (15.5)
	60 - 69	2209 (8.3)
	70 - 79	951 (3.6)
	80 - 89	247 (0.9)
	90 - 99	44 (0.2)
	＞100	80 (0.3)
评税时间
	凌晨12点到2点59分	1267 (4.8)
	凌晨3点到5点59分	1143 (4.3)
	早上6点到8点59分	3768 (14.1)
	上午9点至11点59分	5456 (20.5)
	下午12时至2时59分	4890 (18.4)
	下午3点至5点59分	3943 (14.8)
	下午6点至8点59分	3237 (12.2)
	晚上9点到11:59	2942 (11.0)

表2。症状检查器中报告的前10个最常见的初始症状(N=26,646)。

症状	数(%)
腹部疼痛	2060 (7.7)
咳嗽	1537 (5.8)
头疼	1085 (4.1)
喉咙痛	897 (3.4)
头晕	621 (2.3)
乏力	559 (2.0)
胸部疼痛	534 (2.0)
腰痛	528 (2.0)
腹泻	466 (1.7)
尿痛	460 (1.7)

分流的紧迫性

根据用户的症状表现，症状检查聊天机器人提供了八个级别的分类建议，这些建议被分为三个级别的敏锐度(表3)．在26646个评估中，5323个(20.0%)指导用户进行低敏锐度护理，13600个(51.0%)指导用户进行中敏锐度护理，7723个(29.0%)指导用户进行高敏锐度护理。最常见的分诊建议是寻求当日医疗护理(表3)．

表3。症状检查人员提供的评估建议和分诊敏锐度(N=26,646)。

敏锐度和建议		数(%)
高		7723 (29.0)
	叫救护车		1796 (6.7)
	寻求急救		3703 (13.9)
	4小时内求医		2224 (8.3)
媒介		13600 (51.0)
	当天求医		7299 (27.4)
	在2-3天内就医		6301 (23.6)
低		5323 (20.0)
	向药房寻求医疗建议		3433 (12.9)
	在2-3周内寻求医疗建议		1617 (6.1)
	在家安全管理		273 (1.0)

主要结果

这项研究是首批发表的关于由美国患者群体生成的人工智能驱动的症状检查聊天机器人的分类建议的研究之一。在9个月的时间里，我们看到了强劲的使用，尤其是来自年轻和女性用户。只有不到一半的评估是在典型的医生办公时间之外完成的，这表明有大量的低敏锐度问题，在下班时间不容易获得量身定制的指导。

在回答后续更微妙的问题之前，了解症状检查工具的用户统计信息是一个重要的里程碑。例如，人们公认有必要研究使用症状检查器是否能增强患者对其疾病的理解和管理，即通常所说的"健康素养" [8］．然而，基线健康素养因患者人口统计数据(包括年龄)而异[11]，在评估症状检查器时必须考虑到这一点。此外，卫生系统担心虚拟医疗选择的扩大导致“数字鸿沟”的扩大[12依靠人口统计信息来识别和支持那些更愿意通过传统渠道接受治疗的患者。

这项研究的独特之处在于，我们评估了与实体卫生系统合作部署的症状检查器的使用。认识到患者对症状检查的不确定性[13]，与熟悉的卫生服务机制合作可能会提高患者的参与度。为此，我们的研究结果显示，老年用户(13.1%的用户年龄在60岁及以上)大量使用基于web的工具，他们通常不被认为是重度用户。此外，从理论上讲，症状检查器可以作为医生建议的替代品，为缺乏护理的患者提供建议[13］．然而，我们的人口主要是萨特医疗网络的一部分;因此，他们将症状检查器与现有的面对面护理选项结合使用。

与之前工作的比较

之前的一项基于网络的症状检查研究发现，用户主要是女性，平均年龄为40岁[6］．这表明我们的症状检查器用户与其他症状检查器工具的用户相似，尽管稍微偏年轻。这种年轻的年龄倾斜可能是由于Sutter Health通过主要的数字渠道(如电子邮件、网站横幅、数字通讯)推广症状检查聊天机器人，这可能在已经使用数字工具的患者中产生了不相称的意识，因此可能更年轻。

在之前的研究中，美国护士分诊电话线的分诊建议中，19.7%-48.6%的呼叫建议为高敏敏度，而本研究为28.9%;28%-48.2%的呼叫建议为中等敏敏度，本研究为50.9%;24%-36%的呼叫建议为低敏敏度，本研究为20.1% [14-16］．因此，来自症状检查聊天机器人的分诊建议的灵敏度分布似乎一般可与美国护士分诊电话线相比较。这些结果对于分流自动化的发展是令人鼓舞的，这将使临床医生能够重新分配到更好地利用他们广泛培训的角色，并有可能改善医疗保健人员短缺。

限制

本研究的局限性包括可能缺乏对其他症状检查器的适用性，因为结果完全依赖于单个症状检查器的配置。结果还受到单个地理人群对数字卫生工具的兴趣的影响;因此，它们可能无法在全国推广。如果没有患者水平的比较，无法评估分诊建议的真正适当性，与现有的临床医生分诊电话线的金标准进行比较，需要进一步的研究来评估该工具的诊断准确性。最后，虽然通过萨特健康网页提供了访问症状检查器，但使用检查器不需要任何登录或验证与萨特健康保健网络的关系;因此，非萨特健康的患者可能被包括在我们的结果中。然而，非萨特健康患者的这种使用被认为是最少的，因为Ada健康症状检查聊天机器人在网络上的其他地方是免费的，并且通过萨特健康网页导航需要额外的步骤，而一般人群不太可能采取这些步骤。

结论

这项研究是首批发表的关于由美国患者群体生成的人工智能驱动的症状检查聊天机器人的分类建议的研究之一。该聊天机器人的用户广泛地代表了我们地区的普通人群，尽管他们倾向于年轻和女性用户。我们的结果表明，分类建议是可以接受的;然而，数字症状评估工具的医疗准确性还需要进一步的研究。尽管最近COVID-19的出现以及采取保持社交距离预防措施的必要性可能会导致对此类工具的更大依赖，但重要的是采取基于证据的方法来部署这些工具。

致谢

保罗·威克斯参与了手稿的起草。这项研究没有得到外部资助。

利益冲突

作者VJ和AC是萨特健康公司的员工。

Dieleman JL, Squires E, Bui AL, Campbell M, Chapin A, Hamavid H，等。1996-2013年美国医疗保健支出增加的相关因素JAMA 2017 Nov 07;318(17):1668-1678 [免费全文] [CrossRef] [Medline］
卫生人力资源全球战略:2030年劳动力。世界卫生组织，2016年。URL:https://www.who.int/hrh/resources/global_strategy_workforce2030_14_print.pdf?ua=1[2020-05-04]访问
李志强，李志强，李志强，等。卫生保健中会话代理的个性化:系统回顾。J Med Internet Res 2019 11月07日;21(11):e15360 [免费全文] [CrossRef] [Medline］
Espinoza J, Crown K, Kulkarni O.儿科医疗机构COVID-19筛查聊天机器人指南。JMIR公共卫生监测2020年4月30日;6(2):e18808 [免费全文] [CrossRef] [Medline］
钱伯斯D, Cantrell AJ, Johnson M, Preston L, Baxter SK, Booth A，等。针对紧急健康问题的数字和在线症状检查和健康评估/分类服务:系统审查。英国医学杂志公开赛2019年8月1日;9(8):e027743 [免费全文] [CrossRef] [Medline］
温恩，M索迈，弗格斯特姆，克罗蒂BH。使用在线症状检查器与患者寻求治疗计划的关联。2019年美国医学会网络公开赛12月02日;2(12):e1918561 [免费全文] [CrossRef] [Medline］
李志强，李志强，李志强，等。症状检查器在自我诊断和分诊中的应用研究。BMJ 2015 july 08;351:h3480 [免费全文] [CrossRef] [Medline］
Aboueid S, Liu RH, Desta BN, Chaurasia A, Ebrahim S.公众对人工智能自我诊断数字平台的使用:范围审查。JMIR Med Inform 2019 5月01日;7(2):e13445 [免费全文] [CrossRef] [Medline］
艾达。URL:https://ada.com/[2020-11-24]访问
人口概况-加州和县。加州就业发展局。URL:https://www.labormarketinfo.edd.ca.gov/data/california-and-counties-demographic-profiles.html[2020-05-04]访问
陈志伟，陈志伟，陈志伟。老年人健康素养与年龄的关系。老年科学B心理科学与社会科学2000年11月1日;55(6):S368-S374。［CrossRef] [Medline］
穆兰吉，郭绍尔，易卜拉欣。医疗保健信息技术和创新时代的公平。医疗护理2019;57:S106-S107。［CrossRef］
Meyer AND, Giardina TD, Spitzmueller C, Shahid U, Scott TMT, Singh H.患者对人工智能辅助症状检查器有用性的看法:横断面调查研究。J Med Internet Res 2020年1月30日;22(1):e14679 [免费全文] [CrossRef] [Medline］
Bogdan GM, Green JL, Swanson D, Gabow P, Dart RC。评估患者对护士咨询热线建议的依从性以及对医疗成本的影响。Am J Manag Care 2004 Aug;10(8):534-542 [免费全文] [Medline］
Moore JD, Saywell RM, Thakker N, Jones TA。分析患者对下班后呼叫中心护士建议的依从性。Am J Manag Care 2002四月;8(4):343-351 [免费全文] [Medline］
欧康奈尔JM，托尔斯W，尹M，马勒卡CL。患者决策:使用和坚持以电话为基础的护士分诊建议。2016年6月25日;22(4):309-317。［CrossRef］

‎

人工智能:人工智能

G·艾森巴赫(G Eysenbach)编辑;提交21.05.20;S Aboueid, J Tully, B Zhao同行评审;对作者13.06.20的评论;修订本收到07.07.20;接受07.11.20;发表30.11.20

这是一篇开放获取的文章，根据创作共用署名许可(https://creativecommons.org/licenses/by/4.0/)的条款发布，允许在任何媒介上无限制地使用、分发和复制，前提是正确引用最初发表在《医学互联网研究杂志》上的原创作品。必须包括完整的书目信息，//www.mybigtv.com/上的原始出版物的链接，以及此版权和许可信息。

本文内容如下e-collection /主题问题:

大型综合卫生系统中数字症状检查器的使用特征和分诊灵敏度:基于人群的描述性研究