JMIR形成性研究-用于健康焦虑管理的认知行为治疗聊天机器人:混合方法试点研究

原始论文

¹奥克兰大学心理医学系，奥克兰，新西兰

²奥克兰理工大学心理与神经科学系，奥克兰，新西兰

通讯作者:

Liesje Donkin，硕士，博士

心理学与神经科学系“，

奥克兰理工大学

韦尔斯利东街55号

私人包92006

奥克兰,1010

新西兰

电话:64 21847886

电子邮件:liesje.donkin@aut.ac.nz

背景:在COVID-19大流行期间，健康焦虑有所增加。然而，由于保持身体距离的限制和紧张的心理健康系统，人们无法获得管理健康焦虑的支持。聊天机器人正在成为一种交互式手段，以可扩展的方式提供心理干预，并为大量人群提供新疗法，包括那些可能难以获得传统疗法的人。

摘要目的:这项混合方法试点研究的目的是调查基于认知行为疗法(CBT)的聊天机器人(Otis)在2019冠状病毒病大流行期间作为新西兰成年人早期健康焦虑管理干预的可行性、可接受性、参与度和有效性。

方法:用户被要求完成一个由Otis运行的14天程序，Otis是Facebook Messenger上一个主要基于决策树的聊天机器人。在干预前、干预后和12周随访中测量了健康焦虑、一般焦虑、对不确定性的不耐受、个人幸福感和生活质量。配对样本t进行了检验和单因素方差分析，以调查结果随时间的相关变化。半结构化访谈和自我报告问卷和Facebook Messenger中的书面回答进行了主题分析。

结果:该试验由29名参与者完成，他们在干预后和随访中提供了结果测量。虽然干预后健康焦虑的平均下降没有达到显著性(P=.55)或跟进(P=.08)，定性分析表明，参与者认为从干预中受益。在干预后和随访中，奥的斯的使用与一般焦虑、个人幸福感和生活质量的显著改善有关。拟人化、奥的斯的外观和内容的传递促进了奥的斯的使用。相比之下，技术困难和高绩效和努力期望是奥的斯接受和参与的障碍。

结论:奥的斯可能是一种可行的、可接受的、有吸引力的方式来提供CBT来改善焦虑管理、生活质量和个人幸福，但可能不会显著减少健康焦虑。

JMIR Form Res 2022;6(10):e37877

doi: 10.2196/37877

关键字

健康的焦虑；会话代理；疾病焦虑障碍；新型冠状病毒肺炎；直肠；用户体验；神人同形同性论

鉴于身体健康对生存的重要性，人们对自己的健康保持警惕和恐惧，从事促进健康的行为，扫描健康威胁，这是自然的，也是适应的[1，2]。然而，当这种恐惧与功能损害和痛苦有关时，它被称为健康焦虑[3.]。健康焦虑是基于对身体症状的误解而产生的对疾病的持续担忧，是疾病焦虑障碍的一个标准。健康焦虑的个体倾向于将典型的良性症状误解为感染的迹象[4，5例如COVID-19的症状(如发烧、咳嗽、疲劳)可能解释了报告中COVID-19大流行期间健康焦虑增加的原因[6]。

健康焦虑会导致对个人认为有威胁的人和环境的回避，导致寻求帮助的减少。例如，之前的一项研究报告称，与对照组相比，患有严重健康焦虑的人更有可能将健康人的照片评为不健康的人，这表明他们倾向于将他人视为健康威胁[7]。或者，或者与逃避行为相结合，健康焦虑的人可能会寻求安慰来缓解焦虑。回避和寻求安慰都维持了焦虑，因为个体放弃了意识到自己应对感知恐惧的能力的机会[8，9]，从而防止长期的认知改变[10]。

除了流行病造成的身体健康负担外，心理健康往往也很脆弱。健康焦虑尤其与更大程度的痛苦有关，因此更需要心理支持[11-13]。然而，在COVID-19大流行期间，为缓解病毒而采取的保持身体距离措施限制了获得心理治疗的机会。因此，医疗保健服务出现了从面对面到远程医疗的转变。尽管服务交付方式发生了变化，但需要更多的治疗工具，如聊天机器人，以满足日益增长的支持需求。

聊天机器人是会话代理，与用户进行文本、语音或基于视觉的对话[14]。聊天机器人的交互由两个主要机制决定:人工智能(AI)和决策树。基于人工智能的聊天机器人使用复杂的数学算法，根据用户输入的信息产生特定的预定义输出。基于决策树的聊天机器人遵循预先写好的脚本，用户通过选择预先写好的回答来与之交互。该技术中对人类对话的模仿很好地帮助了聊天机器人在心理健康环境中的使用。之前的研究表明，聊天机器人干预可以改善包括重度抑郁症在内的心理障碍[15]、恐慌症[16]、创伤后应激障碍[17]、抗精神病药物依从性[18]，以及感知压力[19]。

认知行为疗法(CBT)与几个对照条件相比，在健康焦虑管理方面有最大的证据基础，包括照常治疗、药物治疗、安慰剂、等待名单、支持小组、非CBT基础的心理教育和其他心理干预[20.，21]。CBT已被改编为基于互联网的使用(iCBT)治疗健康焦虑，并显示出与面对面CBT类似的效果[22]。iCBT已通过几种数字健康干预(DHI)媒体进行传播，如计算机程序、网站、电子邮件、视频、移动应用程序，以及最近的聊天机器人。尽管iCBT已经适应了几种治疗健康焦虑的数字交付模式，但据我们所知，还没有一种聊天机器人旨在帮助人们使用CBT来管理健康焦虑。

通过聊天机器人技术提供的CBT健康焦虑管理可能是一种合适的DHI，特别是在大流行的背景下。聊天机器人可以提供初步的管理干预，减轻寻求帮助的个人的负担，否则他们可能会过度利用卫生服务。此外，由于临床医生的存在和引发焦虑的环境(如医院和诊所)，它可能会鼓励回避型个体的互动，否则他们就不愿意寻求治疗。尽管聊天机器人已经证明了在总体幸福感方面的改善，但很少有人被用于解决特定的临床重大心理健康障碍，如健康焦虑。

招聘

这项混合方法试点研究采用单一小组、测试前-测试后干预框架和半结构化访谈来评估自动对话代理“Otis”(图1)，作为一个简短的健康焦虑管理计划。在2020年5月至2020年7月期间，研究人员通过Facebook和Instagram广告、作者和教师账户的Twitter推广以及电子邮件邀请招募了参与者。在为期14天的研究中，年龄在18岁及以上的参与者都有Facebook Messenger账户，并且可以上网每天使用Messenger。如果参与者不在新西兰居住，或无法理解书面英语，同意参加学习并完成项目，则被排除在外。

道德的考虑

该研究得到了奥克兰大学人类参与者伦理委员会(UoA Reference: 024655)的批准。一旦参与者点击广告，就会在Facebook Messenger上打开与奥的斯的对话，邀请参与者阅读参与者信息表。参与者信息表概述了纳入标准、研究时间表和作者联系方式，并提供了在线同意书的链接。

程序

使用基于网络的调查软件Qualtrics完成基线问卷[23，参与者被提供了一个随机的用户识别号码来访问Facebook Messenger上的奥的斯。在14天的计划或放弃结束时，以先到者为准，联系参与者完成干预后问卷调查。那些完成干预后问卷调查的人被邀请与一名研究人员完成关于他们的用户体验的访谈，然后在12周内再次联系以完成后续问卷调查。参与者可以参加抽奖，每完成一份问卷，就可以赢得5张50新西兰元(28.36美元)的零售券。完成面试的人可以获得额外的条目。

干预

Otis主要是一个基于决策树的会话代理或聊天机器人，旨在以14天计划的形式提供CBT的日常模块。参与者每天与奥蒂斯聊天5到10分钟，学习如何管理健康焦虑。这款聊天机器人是使用Chatfuel开发的，Chatfuel是一款广泛用于Facebook Messenger的商业聊天机器人引擎，可以通过Facebook Messenger应用程序或桌面网站访问。以前对健康焦虑有效的CBT干预大约有12个模块[24，25]。因此，奥的斯也选择了12个专注于内容的模块，每天一个模块提供给参与者。

我们在课程开始和结束时增加了2个额外的模块，使课程总共长达14天。第一个模块主要介绍干预措施和收集参与者数据，最后一个模块对内容进行总结。聊天机器人的内容来源于之前的iCBT干预和作者的临床知识。表1提供12个模块中涵盖的核心组件的概述。

表1。聊天机器人干预的核心组件。

组件	描述
心理教育	健康焦虑思想与行为，健康焦虑管理的重要性
认知行为治疗^一个五个部分的模型中	介绍模型的不同组件以及组件之间的关系
认知重构和思维错误	帮助识别和命名无用的思维模式
减少焦虑	正念、放松、推迟忧虑练习(例如，忧虑时间)
曝光	讨论有机会忍受焦虑的重要性，完成暴露阶梯

^一个CBT:认知行为疗法

在聊天机器人的初始开发阶段，它可以产生粗糙的响应，用户可能会认为这些响应是无效的、机器人的或与他们的响应无关的[26]。因此，考虑到在线讨论心理健康的敏感性，主要基于决策树的聊天机器人被选为最合适的机制。此外，使用基于决策树的聊天机器人确保参与者得到一致的干预。参与者在基于决策树的聊天机器人中进行的对话是基于预先编写的脚本，这样用户就可以按照设定的对话路径进行对话，而不是接收机器学习的响应。参与者通过选择预先确定的文字和表情符号与聊天机器人互动，被称为“快速回复”(图2）.快速回复可以确保谈话不会偏离当天的内容，因为不同的回复往往会引起奥蒂斯相同的回复。为了模拟同理心，一些快速的回答会提示特定的验证，这些验证从路径中分离出来，形成树的“分支”，然后最终汇聚回主脚本。当奥蒂斯的消息后面跟着一个写字手的表情符号时，这表明用户可以自己输入消息，而不是使用快速回复。内置了一些基本的人工智能规则来回应用户的问候(例如，“你好”，“你好吗?”“再见”)，改变通知偏好，并在参与者寻求帮助或使用暗示自杀意念的危险词汇时，引导他们拨打危机求助热线。

参与者被分配了21天来完成这个14天的项目，以最大限度地提高参与度，并考虑到动机和可用性的波动。在第一天，参与者可以选择一个签到时间，这样聊天机器人就会在每天的同一时间触发通知提醒。如果通知没有得到回应或参与者没有在3天内完成当天的模块，则会发送额外的通知。如果参与者在7天内没有积极使用奥的斯，则会发送类似的通知。当参与者完成项目或完成基线问卷后21天，聊天机器人会发送一个干预后问卷的链接，但不会发送项目(放弃)，以先到者为准。当程序被放弃或完成时，用户无法再访问聊天机器人;然而，危机线功能是安全可用的。在研究结束时，奥的斯没有提供给新用户。

措施

人口统计资料

在基线时，记录了参与者的人口统计数据(年龄、性别、种族、教育水平、就业状况和家庭收入)、技术使用情况、心理健康服务使用情况和药物使用情况。

结果测量

短期健康焦虑量表

短期健康焦虑量表(SHAI-18) [27是一份包含18个项目的自我报告问卷，用于评估过去6个月健康焦虑的严重程度。它已经证明了相当的有效性和可靠性(Cronbachɑ=.86)，其最初的64项对应的健康焦虑量表[2]。该测试的每一项都包含4个陈述，要求参与者选择一个最能描述他们过去6个月感受的陈述。每个陈述的得分在0到3之间，并进行相加，得分越高表明临床、非临床和医学样本的健康焦虑越严重[28]。SHAI-18的分值在不同的研究中有所不同[29-31];然而，之前的一项研究得出结论，健康焦虑与其他焦虑症的区别在于得分在27分以上[2]。因此，本研究选择27分作为分值。

广泛性焦虑障碍-7

广泛性焦虑障碍7项量表(GAD-7)是一种简短的自我报告测量方法，用于评估过去两周内焦虑思想和行为的严重程度。该测量是基于精神疾病诊断手册(DSM)-IV广泛性焦虑障碍的标准，其中焦虑的严重程度是通过参与者在每个项目上的得分总和来计算的。5分、10分和15分分别表示轻度、中度和重度焦虑。GAD-7已在成人人群中验证，Cronbachɑ为0.92，具有较高的收敛和判别效度[32]。

不确定度短不容忍7级

由于健康焦虑与对不确定性的不耐受有关[2，33，34]、短期不确定度不能容忍量表(IUS-12) [35，这是一项包含12个项目的自我报告，旨在评估个人对模棱两可的情况、不确定性和未来事件的反应。对于每个项目，参与者被要求评价每个项目的特征程度。评分从1到5进行加权，并进行求和，得分越高，表示对不确定性的不容忍程度越高。该测量显示出优秀的内部一致性(Cronbachɑ=.94)，良好的测试-重测信度，以及收敛和发散效度[36]。

个人幸福领域

国家统计局个人幸福领域(ONS4)是一个简短的，四项自我报告评估，衡量幸福的潜在变化。ONS4广泛应用于不同的患者群体[36-40]并且已经证明了良好的内部可靠性(克朗巴赫α=.90)和收敛效度[41]。

世界卫生组织五项幸福指数

世界卫生组织五项幸福指数(WHO-5)是一种5项自我报告工具，用于评估个人感知的积极情绪、活力、总体兴趣和生活质量。原始分数的范围从0到25，是通过总分计算出来的，0代表最差的生活质量，25代表最好的生活质量。大量文献支持该测量在几个人群中的有效性和可靠性[42-45]。

依从性

Facebook参与者的基本使用数据也被记录了下来，包括用户数量和完成率。14天计划的完成率被用作依从性的衡量标准(<4天=依从性差;<7天=低依从性;<10天=适度坚持;<14天=高依从性)。

弃置原因

在干预后，参与者被要求说明如果他们没有完成所有14天的项目，他们放弃项目的原因。参与者被要求从缺乏时间、技术困难、无聊、不再需要聊天机器人、以及无法应用他们通过聊天机器人学到的技能等选项中选择最能描述他们放弃的原因的选项。

可接受性评价

研究人员使用混合形式的问题来评估聊天机器人的乐趣和满意度。所使用的第一个测量方法由研究人员开发的与聊天机器人用户体验相关的6个陈述组成(文本框1）.参与者被要求指出在他们使用聊天机器人的经历中，每个陈述的真实程度。评分范围从“一点也不”到“肯定”，权重从0到4。对各个项目的评分进行汇总，得分越高表明对奥的斯的满意度和接受度越高。在第二项测试中，参与者被要求为聊天机器人提供从1到10的总体评分。包括关于如何改进奥的斯的开放式问题，参与者认为奥的斯最有用的是什么，以及他们最喜欢和最不喜欢聊天机器人的什么。

奥的斯试点研究中使用的可接受性测量项目。

这很有帮助。
它很容易使用。
这很有趣。
奥蒂斯长得很好看。
它工作得很顺利(例如，没有重大的技术故障)。
我想把它存在我的设备上。

文本框1。奥的斯试点研究中使用的可接受性测量项目。

面试

在完成干预后问卷调查后，参与者被邀请完成与一名研究人员关于他们的用户体验的采访。半结构化访谈收集了关于奥的斯的可行性、可接受性和参与度的定性数据。采访者还询问了参与者关于聊天机器人的内容和内容交付(动图、图像、视频、文本)。访谈参与者主要通过视频通话平台Zoom [46];然而，由于农村地区的网络连接困难，一些参与者通过电话完成了采访。

统计分析

定量数据使用SPSS Version 26进行分析(IBM Corp, Armonk, NY) [47]。统计学意义定义为P≤0。。在单个时间点上，人口统计学特征与结果测量(健康焦虑、一般焦虑、不确定性不耐受、感知幸福感和生活质量)之间的关系被探索t或者卡方检验。通过使用平均完成率和坚持完成该计划的参与者数量来测试依从性。使用单向方差分析(anova)探讨了依从性(分为差、低、中、高)与干预后和12周随访时结局指标变化评分之间的剂量-反应关系。平均参与者的满意度评分被用来部分测试可接受性。最后，采用配对样本对聊天机器人的有效性进行了测试t测试从基线到干预后和随访的结局指标的变化。定性数据由作者手动编码。

定性分析包括在项目中、干预后和12周随访中收集的访谈和反馈。进行了归纳主题分析，以确定与参与者接受和参与奥的斯相关的因素。然后将出现的因素组织成主题，以回答可接受性和参与度的问题。参与被定义为与参与者对干预的兴趣和持久性有关的因素，而参与者对奥的斯作为健康焦虑管理聊天机器人的使用和感知被定义为与可接受性有关的因素。

摩擦

在完成基线测量的69名参与者中，35名参与者(51%)完成了干预后问卷调查，29名参与者(42%)完成了12周的随访。此外，7名参与者表示对研究人员感兴趣并完成了采访。

人口统计资料

完成所有随访问卷的29名参与者的最终样本以女性为主(25/ 29,86%)，年龄从21岁到80岁，平均年龄37.4岁(SD 15.1岁)。新西兰欧洲人或Pākehā是样本中最常见的族群(20/29,69%)。大多数参与者(16/ 29,55%)表示他们参与是因为他们想要帮助管理他们的焦虑，其次是对聊天机器人技术的好奇(8/ 29,28%)。大约一半(19/ 29,66%)的样本在研究前没有使用任何DHI治疗焦虑。卡方检验显示，完成基线调查问卷的患者和完成所有随访调查问卷的患者之间没有显著的人口统计学差异。

评价结果

在21天的时间结束之前，参与者平均完成了9.8天(SD 4.43)或70%的聊天机器人干预。在最终分析的29名参与者中，有12人(41%)完成了14天的完整课程。最常见的遗弃原因是缺乏时间(14/29,35%)。看到表2有关放弃该计划的原因摘要。由于Facebook数据分析系统的技术故障，参与者与奥的斯的独特互动相关的数据无法准确报告。总体用户体验平均为18.24 (SD 3.38)，满分为30分。该聊天机器人的整体接受度在1到10的范围内被评为良好(平均值8.24，标准差1.80)。

平均而言，从基线(平均19.93,SD 8.82)到治疗后(平均19.31,SD 9.02)和12周随访(平均17.38,SD 10.03)，健康焦虑有所降低。然而，这种改善在治疗后没有达到显著性(t₂₈= 0.61,P=.55)或跟进(t₂₈= 1.82,P=。08)。在基线时参与者的不确定耐受性中观察到同样的模式(平均9.69,SD 4.34)，在治疗后，这些评分的降低没有达到显著性(平均7.59,SD 4.38;t₂₈= 1.82,P=.08)或随访(平均7,SD 4.99;t₂₈= 0.44,P=点)。

表2。放弃聊天机器人项目的原因(n=29)。

放弃奥的斯的原因	结果，n (%)
我没时间用聊天机器人。	14 (48)
我遇到了技术问题。	7 (24)
我不担心我的健康，所以我不再需要它了。	6 (21)
我试着把这些技巧应用到实践中，但对我没用。	1 (3)
太无聊了。	1 (3)

从基线(平均9.69,SD 4.38)到干预后(平均7.58,SD 4.38;t₂₈= 3.30,P= .003)。在12周的随访中，总体焦虑的下降保持不变(平均7.00,SD 4.99;t₂₈= 3.26,P= .003)。平均而言，自我报告的个人幸福感从基线(平均5.70,SD 1.30)增加到干预后(平均6.31,SD 1.06)和12周随访(平均6.50,SD 1.55)。干预后(t₂₈= -1.12,P=.03)及跟进(t₂₈= -1.47,P= 03)。干预后自我报告的生活质量也有显著改善(t₂₈= -2.39,P=.02)和12周随访(t₂₈= -3.64,P<措施;表3）.配对样本t对所有完成干预后问卷的参与者(n=35)进行健康焦虑、不确定性耐受、一般焦虑、个人幸福感和生活质量的测试，结果无差异。

配对样本t对所有完成干预后问卷调查的参与者(n=35)进行健康焦虑、不确定性耐受、一般焦虑、个人幸福感和生活质量的测试，结果相似(表4）.健康焦虑从基线(平均19.91,SD 8.36)到干预后(平均19.34,SD 8.45;t₃₄= 0.65,P=.52)从基线(平均35.63,SD 10.50)到干预后(平均33.40,SD 10.5;t₃₄= 1.88,P= . 07)。一般焦虑的降低(基线:平均10.20,SD 4.80;干预后:平均8.26,SD 4.96)，以GAD-7测量有显著性(t₃₄= 3.58,P<措施)。从最后的样本中可以看出，个人幸福感从基线(平均5.66,SD 1.26)到干预后(平均6.15,SD 1.05;t₃₄= -2.11,P=.04)，生活质量(基线:平均9.49，标准差4.35;干预后:平均11.09,SD 4.53;t₃₄= -2.62,P= . 01)。

表3。干预对健康焦虑、不确定性不耐受、一般焦虑、个人幸福感和生活质量的影响。

测量	基线(n=29)，平均值(SD)	干预后(n=29)，平均值(SD)	随访(n=29)，平均值(SD)	基线到干预后		基线到随访
				t（df）	P价值	t（df）	P价值
健康焦虑(SHAI-18^一个）	19.93 (8.83)	19.31 (9.03)	17.38 (10.03)	0.61 (28)	55	-2.28 (28)	。08
不能容忍不确定性(IUS-12)^b）	34.10 (9.70)	31.72 (9.71)	33.38 (10.78)	1.82 (28)	。08	0.44 (28)	点
一般焦虑(GAD-7^c）	9.69 (4.34)	7.59 (4.38)	7.00 (4.99)	3.30 (28)	.003	3.26 (28)	.003
个人幸福(ONS4^d）	5.70 (1.30)	6.31 (1.06)	6.50 (1.55)	-2.33 (28)	03	-2.28 (28)	03
生活质量(WHO-5^e）	9.62 (4.53)	11.31 (4.90)	12.93 (5.08)	-2.39 (28)	02	-3.64 (28)	措施

^一个SHAI-18:短期健康焦虑量表。

^bIUS-12:不确定度短不能容忍量表。

^c广泛性焦虑障碍7项量表。

^dONS4:国家统计局个人幸福领域。

^e世卫组织-5:世界卫生组织五项幸福指数。

表4。干预对完成干预后问卷调查的所有参与者的健康焦虑、不确定性不耐受、一般焦虑、个人幸福感和生活质量的影响。

测量	基线(n=35)，平均值(SD)	干预后，(n=35)，平均值(SD)	基线到干预后
			t（df）	P价值
健康焦虑(SHAI-18^一个）	19.91 (8.36)	19.34 (8.45)	0.65 (34)	点
不能容忍不确定性(IUS-12)^b）	35.63 (10.50)	33.40 (10.50)	1.88 (34)	07
一般焦虑(GAD-7^c）	10.20 (4.80)	8.26 (4.96)	3.58 (34)	措施
个人幸福(ONS4^d）	5.66 (1.26)	6.15 (1.05)	-2.11 (34)	.04点
生活质量(WHO-5^e）	9.49 (4.35)	11.09 (4.53)	-2.62 (34)	. 01

^一个SHAI-18:短期健康焦虑量表。

^bIUS-12:不确定度短不能容忍量表。

^c广泛性焦虑障碍7项量表。

^dONS4:国家统计局个人幸福领域。

^e世卫组织-5:世界卫生组织五项幸福指数。

单向方差分析和事后测试(Tukey B和Games-Howell)显示，在干预后和12周随访中，差、低、中、高依从性组的IUS-12、GAD-7、ONS4和WHO-5评分变化无显著差异。然而，随访时的SHAI-18变化评分在中度和轻度坚持项目的参与者之间有显著差异(F_3、25= 3.59,P= .02点)。散点图用于进一步调查变化分数与完成天数之间的相关性，但没有发现其他显著的关系。

在定性数据中，出现了3个与敬业度和接受度相关的关键因素(图3）.与这些因素相关的报价可以在多媒体附件1．参与者报告说，内容交付、技术困难和努力期望是影响他们使用聊天机器人的因素，而与聊天机器人的外观、感知好处和互动性(聊天机器人的互动性)有关的主题影响了接受度。在互动性因素中，奥的斯拟人化和高性能期望2个子因素显著影响可接受性。

订婚

关于工作期望，参与者报告说，尽管“签到”时间很短，但每天与聊天机器人交谈很乏味，而且对参与时间的期望太多。社交活动、疲劳和日常任务通常被认为是分心的原因。

技术困难被认为是放弃定量数据的主要原因之一。这反映在反馈和采访中，人们讨论了Facebook和Chatfuel故障的挫败感，以及难以理解如何与奥蒂斯互动。

在内容传递方面，以简短的“签到”和短信形式传递信息受到了参与者的青睐，他们报告说，如果信息以一长串文本形式呈现，阅读起来会更累，也不那么吸引人。此外，与会者指出，信息传递的速度是可控的，易于理解。

验收

互动性通过奥的斯拟人化和高性能期望进行评估。关于奥的斯的拟人化，几乎所有的参与者都认为奥的斯具有类似人类的特征，并在第4天、第11天和第14天将奥的斯当作一个人来反馈。尽管有机器人化身，但参与者解释说，对话的内容、表情符号的使用和发短信的体验让奥蒂斯感觉自己是另一个与他们在线聊天的“人”。在高性能期望方面，尽管参与者认为Otis具有类似人类的特征，但他们也意识到基于决策树的聊天机器人的局限性。参与者描述了本可以通过“智能”或人工智能聊天机器人实现的个性化缺失。另一些人则描述了他们无法深入讨论某些主题或根本无法解决这些主题的情况，因为它们不是脚本的一部分。

奥蒂斯的出现似乎对接受聊天机器人作为健康焦虑干预手段很重要。相比人类或类人设计，人们似乎更喜欢聊天机器人的化身。

关于感知的好处，参与者报告说，他们发现奥的斯很有帮助，让他们对健康焦虑有了更深入的了解，并制定了挑战焦虑想法的策略。这些益处似乎表明参与者接受奥的斯是治疗健康焦虑的有效干预措施。

主要研究结果

根据对文献的回顾，据我们所知，这是第一个评估聊天机器人(Otis)用于成年人健康焦虑管理的可行性、有效性、可接受性和参与度的研究。结果表明，尽管健康焦虑没有显著减少，但聊天机器人被接受为健康焦虑管理的干预手段，并与广泛性焦虑的减少和感知焦虑管理、个人福祉和生活质量的增加有关。该研究确定了聊天机器人提供心理干预的参与度和可接受性的几个障碍(高性能期望、努力期望、技术困难)和促进因素(外观、拟人化、感知益处、内容交付)。

与之前工作的比较

这项研究发现，大约41%的参与者完成了研究，平均而言，最终样本完成了70%的干预，这比大多数文献中看到的都要高[48-50]。高依从率可能表明:(1)高度积极的参与者样本，考虑到大多数参与者需要帮助管理焦虑(55%)，(2)样本中频繁的电话使用者(每天>10次= 35%)，或者(3)聊天机器人的会话性质是一种比其他在线CBT项目更吸引人的媒介。

尽管奥的斯可能很吸引人，但干预与干预后或12周随访时健康焦虑的显著减少无关，这可能表明通过聊天机器人提供的CBT作为健康焦虑的治疗无效。这与之前的研究报告不一致，在之前的研究中，通过数字媒体提供的CBT可以有效地减少成年人的健康焦虑[22]。相反，结果与对心理健康聊天机器人的系统回顾和元分析一致，该研究表明聊天机器人产生临床显著心理结果的证据不足[26]。

未达到显著性也可以解释为由于样本量小，研究的统计力较低。此外，结果可能表明在COVID-19大流行期间存在下限效应，在此期间对健康保持警惕是适应的，在这种情况下，SHAI-18可能一直在衡量大流行期间看到和鼓励的非典型行为。因此，尽管聊天机器人与减少健康焦虑有关，也许在大流行的背景下，奥的斯在降低健康焦虑方面可能没有进一步的效果。

定性结果显示，参与者认为奥的斯在减少他们的健康焦虑方面是有用的。定量和定性结果之间的不一致可能表明，该项目与焦虑管理的改善有关，但健康焦虑作为对COVID-19和新西兰几次封锁的适应性反应仍然存在。此外，研究中只有5名参与者达到了健康焦虑的分值(25)[2]，这进一步支持了样本中剩余部分存在底效应的假设。此外，这些结果可能反映了与拟人化相关的聊天机器人的实际功能之外的有用性增加的感知[51]。

据我们所知，与使用基于cbt的聊天机器人的对照组相比，没有研究表明焦虑有显著改善。例如，一项关于Woebot对焦虑影响的研究发现，只提供信息的条件在减轻焦虑方面与聊天机器人用户组一样有效[52]。由于暴露和习惯化是治疗焦虑的关键组成部分，聊天机器人可能不是一个合适的媒介，因为该技术无法像治疗师那样积极地融合和鼓励这些治疗成分。在干预后和12周随访中，奥的斯也与使用者的个人幸福感和生活质量的显著改善有关。这些结果与大量文献一致，表明改善焦虑与更好的生活质量和福祉有关。封锁对心理健康和与生活质量相关的其他方面有重大影响。因此，这些措施改善的另一种解释可能是新西兰在研究过程中进入限制性较低的封锁警戒级别的结果。

一项关于促进移动医疗(mHealth)干预措施的障碍的系统回顾报告称，用户将干预措施融入其生活的能力影响了参与[53]。整合的重要性在本研究中得到了反映，在本研究中，使用Otis的高努力期望与其他活动竞争，导致遗忘或优先使用，如其他研究中所见[54，55]。Borghouts及其同事对奥的斯的系统评估结果反映了技术困难和内容交付这两个影响用户参与的主题[53]。在移动医疗干预中，技术困难是一个需要考虑的关键问题，因为它们往往是不可避免的。例如，技术不断更新以改进用户体验。然而，这些更新可能会导致系统崩溃和变慢，导致用户中断。干扰会严重影响用户对系统的信任和参与的动机，尤其是在讨论他们的心理健康时。最后，参与者发现奥的斯的短而多样的内容交付(文本、视频、音频和gif)很吸引人，这与其他评估内容交付对整体用户体验影响的研究一致[56]。尽管相对较高的参与度和报告的可接受性，参与者并不认为Otis是健康专业人员的替代品，这与先前的研究一致，表明在治疗健康焦虑方面，CBT和药物优于iCBT [57]。

在这项研究中，一个意想不到的发现是参与者对非人类聊天机器人化身的偏好。尽管之前的研究表明，拟人会被长相酷似人类的化身放大。58)，即使在没有真人化身的情况下，用户对奥蒂斯的反应也很社交。最近的一项研究报告称，与真人相比，当使用真实的数字化身时，用户的信任度和亲和力都较低，但不受聊天机器人是由人还是人工智能控制的影响[59]。尽管上述研究没有比较人类和非人类的虚拟形象，但其研究结果表明，外观对用户体验有显著影响。这项研究的参与者报告了不信任的感觉和对判断的担忧，就像他们对一个真实的人(如果奥蒂斯不是一个机器人人物)的感觉一样，因此成为接受健康焦虑干预的障碍。这些发现与之前的研究直接冲突，之前的研究表明，如果用户在与聊天机器人的互动中应用相同的社交规则，可能会改善用户对社交存在的感知[[60]。

一项似乎部分支持本研究结果的研究报告称，聊天机器人头像中有太多拟人化的特征会让人产生很高的期望，导致用户失望[61，从而支持了对功能的高期望会导致参与者感到失望和沮丧的观点。将奥的斯和其他聊天机器人升级为基于ai的聊天机器人，能够理解并更好地处理用户输入，可能会在未来满足用户的期望。在与“数字人类”合作时，应该考虑本研究和现有文献中提出的结果，“数字人类”旨在使数字交互更加个性化和逼真。应该考虑到高度拟人化的数字人类角色适合于哪些环境和人群。

限制

本研究的观察性设计限制了暗示因果关系的能力。此外，结果可能受到干预之外的心理输入和COVID-19限制措施变化等无法识别的变量的影响。尽管移动健康领域的大量试点和可行性研究是一个常见的批评，但随机对照试验的使用只提供了数字干预在特定时间点有效性的证据。试点和可行性研究反而加深了对将在不断发展的技术中实施的数字交互所涉及的因素的理解。样本主要是受过高等教育的新西兰欧洲人，因此限制了调查结果在人口中的普遍性。此外，定性结果解释中的偏见，定性研究的一个常见批评[62，是本研究的另一个局限性。

结论

综上所述，基于cbt的聊天机器人Otis可能是管理成人健康焦虑的可行干预手段，但不是治疗成人健康焦虑的可行干预手段。研究发现，尽管健康焦虑没有显著改善，但参与者报告称从干预中受益，这在总体焦虑、个人幸福感和生活质量方面的改善进一步证明了这一点。结果表明，心理健康聊天机器人是一种可行的补充治疗，可以缓解心理服务的压力。因此，随着技术的发展，未来的研究应该继续评估聊天机器人在这一领域的可行性。这项试点研究为理解数字交互、健康焦虑以及聊天机器人在心理健康保健中的潜力做出了独特的贡献。未来在该领域的研究应继续调查人与技术之间的“治疗关系”，以帮助移动健康的发展，从而促进心理健康服务的民主化。

利益冲突

没有披露。

‎

多媒体附件1

参与者引述了参与和接受奥的斯作为健康焦虑管理干预措施的情况。

DOCX文件，18kb

Looper KJ, Kirmayer LJ。社区人群的疑病症担忧。精神医学2001 5月17日;31(4):577-584。(CrossRef] [Medline］
Abramowitz JS, Deacon BJ, Valentiner DP。短期健康焦虑量表:非临床样本的心理测量特性和构念效度。Cognit Ther Res 2007 Feb 15;31(6):871-883 [免费全文] [CrossRef] [Medline］
马志刚，李志刚，李志刚，李志刚。对冠状病毒(COVID-19)的恐惧:2020年3月进行的一项在线研究中的预测因素。J焦虑障碍2020年8月;74:102258 [免费全文] [CrossRef] [Medline］
Taylor S, Asmundson GJG。治疗健康焦虑:一种认知-行为方法。纽约州纽约:吉尔福德出版社;2004.
惠顿MG, Abramowitz JS, Berman NC, Fabricant LE, Olatunji BO。H1N1(猪流感)大流行的焦虑心理预测。中国医药科学，2011年2月22日;36(3):210-218。(CrossRef］
美国精神病协会。精神疾病诊断与统计手册，第四版。华盛顿特区:美国精神病学协会;2000.
Hedman E, Lekander M, Karshikoff B, Ljótsson B, Axelsson E, Axelsson J.疾病回避框架下的健康焦虑:对疾病线索的反应的焦虑、厌恶和疾病感知的调查。《心理变态杂志》2016年10月;125(7):868-878。(CrossRef] [Medline］
博奥拉通吉，艾泽尔·恩，托马克·AJ, Ciesielski BG, Deacon B.安全行为对健康焦虑的影响:一项实验研究。2011年11月;49(11):719-728。(CrossRef] [Medline］
Salkovskis点。行为在维持焦虑和恐慌中的重要性:认知解释。行为心理学2009 6月16日;19(1):6-19。(CrossRef］
赫尔比格-朗S，彼得曼f容忍还是消除?安全行为对焦虑障碍的影响的系统回顾。临床心理学:科学与实践2010年9月17日(3):218-233。(CrossRef］
Ersoy K, Altin B, Bayram sarakkaya B, Güngörmüş Özkardaş O.新冠肺炎大流行中健康焦虑对自闭症儿童母亲和正常儿童母亲性格希望和心理幸福感的影响比较。社会科学研究2020;9(2):117-126 [免费全文］
李珊珊，郭立芳，马勇，梁志明。人群的躯体症状负担与健康焦虑及其相关因素。中华精神病学杂志2015年1月27日。(CrossRef] [Medline］
桑德兰M，纽比JM，安德鲁斯G.健康焦虑在澳大利亚:患病率，共病，残疾和服务使用。中华精神病学杂志2013年1月2日;202(1):56-61。(CrossRef] [Medline］
Abd-Alrazaq AA, Alajlani M, Alalwan AA, Bewick BM, Gardner P, Househ M.聊天机器人在心理健康方面的特征概述:范围审查。Int J Med Inform 2019年12月;132:103978。(CrossRef] [Medline］
Bickmore TW, Mitchell SE, Jack BW, paasch - orlow MK, Pfeifer LM, Odonnell J.医院抑郁症状患者对关系因子的反应。交互计算2010 july 01;22(4):289-298 [免费全文] [CrossRef] [Medline］
吴杰，张珊珊，金辉，金杰。基于移动应用程序的交互式认知行为疗法对恐慌症的疗效。Int J Med Inform 2020年8月;140:104171。(CrossRef] [Medline］
Tielman ML, Neerincx MA, Bidarra R, Kybartas B, Brinkman W.使用虚拟代理和虚拟故事重建创伤记忆的创伤后应激障碍治疗系统。J Med Syst 2017 Aug 11;41(8):125 [免费全文] [CrossRef] [Medline］
Bickmore TW, Puskar K, Schlenk EA, Pfeifer LM, Sereika SM。维持现实:抗精神病药物依从性的相关药物。与计算机交互2010 july;22(4):276-288。(CrossRef］
Ly KH, Ly A, Andersson G.促进心理健康的全自动对话代理:使用混合方法的试点随机对照试验。互联网Interv 2017 12月;10:39-46 [免费全文] [CrossRef] [Medline］
Cooper K, Gregory JD, Walker I, Lambe S, Salkovskis PM。健康焦虑的认知行为疗法:系统回顾和元分析。Behav。Cogn。心理杂志2017年2月23日;45(2):110-123。(CrossRef］
Olatunji BO, Kauffman BY, Meltzer S, Davis ML, Smits JA, Powers MB.疑病症/健康焦虑的认知行为疗法:治疗结果和调节因子的元分析。2014年7月;58:65-74。(CrossRef] [Medline］
Axelsson E, Hedman-Lagerlöf E.健康焦虑的认知行为疗法:临床疗效和健康经济结果的系统回顾和荟萃分析。2019年12月19(6):663-676。(CrossRef] [Medline］
Qualtrics XM。URL:https://www.qualtrics.com/[2022-10-01]访问
Craske MG, Roy-Byrne PP, Stein MB, Sullivan G, Sherbourne C, Bystritsky A.焦虑障碍的治疗:疗效到效果到实施。2009年11月;47(11):931-937 [免费全文] [CrossRef] [Medline］
Hedman E, Andersson E, Ljótsson B, Andersson G, Rück C, Lindefors N.基于互联网的认知行为治疗与认知行为群体治疗对社交焦虑障碍的成本-效果:来自随机对照试验的结果。2011年11月;49(11):729-736。(CrossRef] [Medline］
Abd-Alrazaq AA, Alajlani M, Ali N, Denecke K, Bewick BM, Househ M.患者对心理健康聊天机器人的看法和意见:范围审查。J Med Internet Res 2021年1月13日;23(1):e17828 [免费全文] [CrossRef] [Medline］
Salkovskis PM, Rimes KA, Warwick HMC, Clark DM.健康焦虑量表:健康焦虑和疑病症测量量表的开发和验证。精神医学2002 7月15日;32(5):843-853。(CrossRef] [Medline］
Alberts NM, Hadjistavropoulos HD, Jones SL, Sharpe D.短期健康焦虑量表:系统回顾和元分析。焦虑障碍杂志2013年1月27日(1):68-78。(CrossRef] [Medline］
Rode S, Salkovskis P, Dowd H, Hanna M.慢性疼痛临床就诊人员的健康焦虑水平。精神病学杂志2006年2月;60(2):155-161。(CrossRef] [Medline］
李志强，李志强，李志强，等。泌尿生殖医学诊所健康焦虑的患病率及服务意义。国际性病艾滋病杂志2004年8月;15(8):519-522。(CrossRef] [Medline］
Tang NKY, Wright KJ, Salkovskis PM。临床失眠并发慢性背痛的患病率及相关因素。J Sleep Res 2007 3月;16(1):85-95 [免费全文] [CrossRef] [Medline］
斯皮策RL，克伦克K，威廉姆斯JBW, Löwe B.评估广泛性焦虑障碍的简单措施:GAD-7。Arch Intern Med 2006年5月22日;166(10):1092-1097。(CrossRef] [Medline］
Fergus TA, Valentiner DP。不确定性的不耐受调节灾难性健康评估与健康焦虑之间的关系。中国医学杂志，2011年9月9日;35(6):560-565。(CrossRef］
诺尔AM，艾博年BJ，奥格尔斯比ME，艾伦NP，施密特NB。焦虑敏感性和对不确定性的不耐受是网络自诊症的潜在危险因素。《情感失调》2015年3月15日;174:64-69。(CrossRef] [Medline］
Carleton RN, Norton MPJ, Asmundson GJ。害怕未知:不确定性不耐受量表的一个简短版本。焦虑障碍杂志2007 01;21(1):105-117。(CrossRef] [Medline］
布尔K，杜加斯M.不确定度不可容忍量表:心理测量特性的英文版。行为研究与治疗2002年8月;40(8):931-945。(CrossRef］
Carson J, Prescott J, Allen R, McHugh S.冬天来了:英国Covid-19大流行的年龄和早期心理伴随因素。JPMH 2020年7月27日;19(3):221-230。(CrossRef］
de Albornoz SC,陈g .健康相关的生活质量和主观幸福感之间的关系在哮喘。J psychsom Res 2021年3月;142:110356。(CrossRef] [Medline］
Eichstaedt JC, Yaden DB, Ribeiro F, Adler A, Kern ML.生活方式与幸福感:在美国大样本中探索行为和人口统计学协变量。Intnl。J.福祉2020年9月30日;10(4):87-112。(CrossRef］
高玲，陈刚。心脏病患者主观幸福感的测量:与健康相关的生活质量仪器的关系与比较。Qual Life Res 2019年4月2日;28(4):1017-1028。(CrossRef] [Medline］
本森T，斯莱登J, Liles A, Potts HWW。个人幸福评分(PWS) - ONS4的简短版本:社会处方中的发展和验证。BMJ 2019年4月11日;8(2):e000394。(CrossRef］
贝克P，奥尔森LR, Kjoller M，拉斯穆森NK。衡量幸福而不是没有痛苦症状:SF-36心理健康子量表和世卫组织五种幸福量表的比较国际方法精神病学杂志2003年6月;12(2):85-91 [免费全文] [CrossRef] [Medline］
McDowell I.自我幸福感的测量。中华精神病学杂志2010,7(1):69-79。(CrossRef] [Medline］
Sischka PE, Costa AP, Steffgen G, Schmidt AF. WHO-5幸福指数-基于项目反应理论和对35个国家测量不变性分析的验证。情感障碍杂志2020年12月1日:100020。(CrossRef］
Topp CW， Østergaard SD, Søndergaard S, Bech P. WHO-5幸福指数:文献系统综述。《心理学报》2015;84(3):167-176 [免费全文] [CrossRef] [Medline］
变焦。URL:https://zoom.us/[2022-10-01]访问
IBM SPSS软件。IBM。URL:https://www.ibm.com/spss[2022-10-01]访问
Christensen H, Griffiths KM, Farrer L.对焦虑和抑郁的网络干预的依从性。J medical Internet Res 2009 Apr 24;11(2):e13 [免费全文] [CrossRef] [Medline］
Melville KM, Casey LM, Kavanagh DJ。放弃基于网络的心理障碍治疗。临床心理学杂志2010年11月;49(Pt 4):455-471。(CrossRef] [Medline］
王晓燕，王晓燕，王晓燕，等。坚持基于互联网和面对面的抑郁症认知行为疗法:一项荟萃分析。PLoS One 2014;9(7):e100674 [免费全文] [CrossRef] [Medline］
Rietz T, Benke I, Maedche A.企业协作系统中拟人化和功能性聊天机器人设计特征对用户接受度的影响。2019发表于:第14届世界信息技术国际会议;2019年2月24日至27日;,韦伯就已经在席根德国。
Fitzpatrick KK, Darcy A, Vierhile M.使用全自动对话代理(Woebot)为有抑郁和焦虑症状的年轻人提供认知行为治疗:一项随机对照试验。JMIR Ment Health 2017 Jun 06;4(2):e19 [免费全文] [CrossRef] [Medline］
鲍豪兹，艾凯，马克，德莱昂，施耐德，等。用户参与数字精神卫生干预的障碍和促进因素:系统审查。J Med Internet Res 2021 3月24日;23(3):e24387 [免费全文] [CrossRef] [Medline］
Donkin L, Glozier N.坚持在线心理干预的动机和动机:治疗完成者的定性研究。J Med Internet Res 2012 Jun 22;14(3):e91 [免费全文] [CrossRef] [Medline］
Simblett SK, Bruno E, Siddi S, Matcham F, Giuliano L, López JH, RADAR-CNS Consortium。患者对移动健康技术用于癫痫远程测量和管理的可接受性的观点:定性分析。癫痫行为学2019 Aug;97:123-129。(CrossRef] [Medline］
Sinha Deb K, Tuli A, Sood M, Chadda R, Verma R, Kumar S，等。印度为心理健康应用做好准备了吗?在低资源环境下，护理人员对基于智能手机的严重精神疾病管理解决方案的观点进行了定量-定性探索。PLoS One 2018 9月19日;13(9):e0203353 [免费全文] [CrossRef] [Medline］
Soucy JN, Hadjistavropoulos HD。管理严重健康焦虑的治疗可接受性和偏好:初级保健患者对互联网提供的认知行为疗法的看法《行为学实验精神病学》2017年12月;57:14-24。(CrossRef] [Medline］
李芳杰，李志刚，李志刚。当我的脸是界面的时候:一个实验比较，与自己的脸或别人的脸互动。1998年发表于:计算机系统中的人为因素SIGCHI会议;1998年4月18日至23日;加利福尼亚州洛杉矶[CrossRef］
Seymour M, Yuan L, Dennis AR, Riemer K.面向人工:了解更真实的数字人类的亲和力、可信度和偏好。2020年发表于:第53届夏威夷国际系统科学会议;2020年1月7日至10日;毛伊岛,嗨。(CrossRef］
邱磊。基于社会关系的信息系统推荐代理评估。管理信息系统学报2014年12月08日;25(4):145-182。(CrossRef］
Ben Mimoun MS, Poncin I, Garnier M.案例研究-具身虚拟代理:失败原因分析。零售与消费者服务杂志2012年11月;19(6):605-612。(CrossRef］
严谨性与定性研究。BMJ 1995 july 08;311(6997):109-112 [免费全文] [CrossRef] [Medline］

‎

人工智能:人工智能

方差分析:方差分析

认知行为疗法:认知行为疗法

济:数字健康干预

DSM:精神障碍诊断手册

GAD-7:广泛性焦虑障碍7项量表

直肠:基于互联网的认知行为疗法

IUS-12:不确定度量表的不耐受度

健康:移动健康

ONS4:国家统计局个人幸福领域

SHAI-18:短期健康焦虑量表

WHO-5:世界卫生组织五大幸福指数

A Mavragani编辑;提交10.03.22;SK Choi, P Shah, A Joseph, K Uludag, S El kefi同行评审;对作者07.08.22的评论;修订版本收到01.09.22;接受20.09.22;发表20.10.22

这是一篇开放获取的文章，根据创作共用署名许可协议(https://creativecommons.org/licenses/by/4.0/)的条款发布，允许在任何媒介上不受限制地使用、分发和复制，前提是正确引用了首次发表在JMIR Formative Research上的原创作品。必须包括完整的书目信息，https://formative.www.mybigtv.com上的原始出版物的链接，以及此版权和许可信息。

本文内容如下e-collection /主题问题:

用于健康焦虑管理的认知行为治疗聊天机器人(Otis):混合方法试点研究

用于健康焦虑管理的认知行为治疗聊天机器人(Otis):混合方法试点研究

原始论文

通讯作者:

摘要

关键字

介绍

方法

招聘

道德的考虑

程序

干预

措施

人口统计资料

结果测量

短期健康焦虑量表

广泛性焦虑障碍-7

不确定度短不容忍7级

个人幸福领域

世界卫生组织五项幸福指数

依从性

弃置原因

可接受性评价

奥的斯试点研究中使用的可接受性测量项目。

面试

统计分析

结果

摩擦

人口统计资料

评价结果

订婚

验收

讨论

主要研究结果

与之前工作的比较

限制

结论

利益冲突

参考文献

缩写