这是一篇根据创作共用署名许可协议(https://creativecommons.org/licenses/by/4.0/)发布的开放获取文章,允许在任何媒介上不受限制地使用、分发和复制,前提是正确引用了首次发表在JMIR Human Factors上的原创作品。必须包括完整的书目信息,https://humanfactors.www.mybigtv.com上的原始出版物的链接,以及此版权和许可信息。
增加身体活动(PA)水平与几种癌症的风险降低和生存率提高有关;然而,大多数美国人的PA水平低于推荐水平。使用交互式语音应答(IVR)系统来提供个性化的健康教育和咨询,可能是解决负担过重的农村地区缺乏运动和癌症差异的一种高覆盖、低成本的策略。然而,迄今为止,在这一领域进行的研究很少。
本研究的目的是设计、开发和测试一个IVR系统的可用性,旨在提高阿拉巴马州农村黑带的PA水平。
一个试点版本的IVR系统被用来评估最初的可行性和可接受性。我们进行了详细的离职面谈,以获取参与者的反馈,这有助于为大幅升级的内部IVR系统的开发提供信息。然后对改进后的IVR系统进行了顺序解释性混合方法评价。参与调查的农村县协调员和研究人员(N=10)对IVR系统功能的可用性进行了2周的测试,然后完成了系统可用性量表和定性半结构化访谈。
研究样本主要包括非洲裔美国人、妇女、农村县协调员和研究人员(N=10)。参与者在系统可用性量表上对IVR系统的评分为81分(SD 5),这意味着
可用性测试和从农村县协调员和研究人员那里收到的反馈有助于在大规模随机对照试验中使用之前对IVR系统进行最后一轮改进。这项研究强调了对所有数字健康干预措施进行可用性测试的重要性,以及它可以为干预措施带来的好处。
基于电话的自动化干预策略可能是克服阿拉巴马黑带促进体育活动(PA)和癌症控制的众多障碍的关键。阿拉巴马黑带是一个以土壤肥沃而得名的农村地区,但其人口久坐不动的生活方式和相关癌症差异的风险增加。
作为回应,我们开发了一种ivr递送的PA干预措施,目前正在阿拉巴马州6个农村黑带县的大型随机对照试验(RCT)中进行测试。本文描述了引导我们设计IVR系统的过程,以及在RCT开始之前进行的可用性测试的结果。
与任何干预措施,特别是数字健康干预措施一样,在实际部署干预措施之前,对所开发干预措施的可用性进行检查至关重要[
我们提出的研究旨在针对阿拉巴马州的农村黑带县,这些县的识字率和教育水平都很低[
家长研究(R01CA233550)是一项正在进行的RCT (N=240),比较了居住在阿拉巴马州6个农村县的缺乏运动的成年人中,深南部ivr支持的积极生活方式(DIAL)干预与候补对照[
随着参与者在干预过程中的进展,每周的通话次数逐渐减少(从0-3个月的每天通话,到4-6个月的每周两次,再到7-12个月的每周通话),并且通话内容根据干预的具体日期而有所不同。
之前的一项试点研究(R03CA177538)使用方便样本(N=63)测试了该IVR系统的beta版本[
在这个试点研究中使用的IVR系统是一个商业IVR系统,有几个限制。首先,所有的语音片段都由语音叙述者预先录制并上传。其次,系统仅通过参与者呼叫系统来工作,并没有为系统提供发起呼叫的方法。商业系统在动态定制问题方面也存在局限性,即随着电话的进行,使用早期的回答来构建新的问题。
为了响应这一试点研究的反馈,我们使用更先进的技术为母体RCT开发了一个完全自主开发的IVR系统。这个新系统托管在Linux服务器上,由Apache web服务器提供支持,使用Laravel框架(基于超文本预处理器的快速开发框架)编程,使用MySQL数据库存储数据,并连接到Twilio进行电话通话。
虽然该系统正在开发中,但我们与多个利益相关者团体(农村县协调员和来自阿拉巴马大学伯明翰分校奥尼尔综合癌症中心社区拓展和参与办公室的研究人员)进行了焦点小组讨论。对于焦点小组,我们使用Amazon Polly(文本转语音引擎)生成了3个干预消息的样本语音片段,并将这3个样本语音片段呈现给我们的利益相关者。Amazon Polly能够发出接近人类的声音,这导致利益相关者更喜欢Amazon Polly的声音而不是预先录制的人类声音。Amazon Polly语音的这种选择还允许在通话过程中使用不同的音调和性别的语音,并避免了每次对内容进行编辑时与人工叙述者重新录制消息库相关的大量时间和财务成本。
焦点小组参与者还提供了关于来电与外线来电、处理未接来电的首选程序以及其他支持策略的反馈。更具体地说,他们认为他们的社区成员和潜在参与者会喜欢双向通话的灵活性和便利性,以及在以后填写未接来电数据的选项。需要能够更改电话号码,并允许从新的(未注册的)号码来电。支持策略,如在现场数据收集和提供Fitbit设备时进行简短的咨询。
系统开发以一种灵活的方式进行,并定期向UAB奥尼尔综合癌症中心社区外展和参与办公室的农村协调员进行演示。他们对语音片段的速度、句子之间的停顿、句子中的停顿、电话的长度、电话中使用的语言的阅读水平以及内容的逻辑流程的反馈导致了大量的编辑。该系统包括一个参与者完成呼叫激励机制,每完成一个呼叫奖励参与者至少0.25美元。然而,当参与者完成之前的7个电话时,奖励金额变成0.50美元,当一个电话没有完成时,奖励金额下降到0.25美元。
开发阶段由核心项目人员(DP、MT、ST和VR)对修改后的系统进行试点测试,以确定和修复任何问题。已识别和修复的一些问题示例包括系统期望在5秒内响应、错误的反馈消息以及未按预定时间呼出。在此之后,将进行正式的可用性测试,具体内容如下所示。最后,基于可用性测试的结果,系统经过了另一轮迭代优化。所得系统的详细信息载于
本研究采用解释性的顺序混合方法设计来评估一个IVR电话咨询系统的可用性,该系统将扩展到阿拉巴马州6个农村县(Hale, Choctaw, Greene, Marengo, Dallas和Sumter)的身体不活跃的居民。在基线时进行人口统计学评估。在随访2周时进行系统可用性和半结构化访谈。
可用性测试的样本包括10名农村县协调员和隶属于UAB奥尼尔综合癌症中心社区外联和参与办公室的研究人员,他们后来在RCT研究的招募、评估和干预交付中发挥了关键作用,但尚未接触到新开发的IVR系统。
每位参与者都通过Zoom与DIAL项目经理或首席研究员完成了一对一的培训。在会议期间,与会者概述了可用性研究协议和IVR系统,完成了与研究团队的初始IVR通话,并提出了问题。
培训结束后,参与者开始佩戴研究提供的计步器或经过批准的个人活动监控器(即Fitbit或Apple Watch),并在两周内每天接听DIAL的IVR电话。参与者接受了所有三种类型的IVR呼叫:pa跟踪、目标设置和咨询电话。为了跟踪电话,参与者回答了PA问题(报告了计步器的使用情况,每天的步数,以及过去24小时内任何中等强度的PA),并收到了PA提示和反馈。每次通话追踪大约持续1分钟。在咨询电话中,参与者回答了PA问题和其他问题,包括PA自我效能、享受、结果预期和社会支持。此外,根据他们对这些问题的个人回答,他们收到了关于这些心理社会变量的量身定制的反馈。咨询电话每通大约10分钟。目标设定电话允许参与者设定自己的步骤目标,或者将他们当前的步骤目标在下一周增加500步。设定目标的电话每次大约持续5分钟。在两周的时间里,参与者每天接到一个电话,总共有一个目标设定电话,一个咨询电话和12个pa跟踪电话。
基线时评估了参与者的人口统计数据,包括年龄、性别、教育程度、种族和民族、家庭收入、就业、婚姻状况和在家生活的孩子数量。
在随访中,参与者通过Qualtrics XM (Qualtrics)在网上完成了系统可用性调查(10项),并结合了另外4项特定项目。所有14个项目都旨在评估参与者在使用电话咨询系统两周后对该系统的感觉。与会者对发言的反应是
本研究中收集的所有定量数据均进行描述性分析。所有定量分析均采用Microsoft Excel。
在接到电话并完成定量调查两周后,所有10名农村县协调员和研究人员都参加了通过Zoom进行的一对一半结构化访谈,了解他们的电话体验以及在实施RCT的IVR之前如何提高可用性。这份半结构化的访谈指南是由合著者(DP和SN)开发的,包括有关锻炼动机、对呼叫的喜好、可能激励或削弱个人积极性的特定呼叫功能、IVR呼叫的技术方面以及改进建议等问题。为确保一致性,所有访谈均由具有定性访谈专业知识和经验的研究团队(SN)的1名成员于2020年7月进行。SN没有参与更广泛的RCT或技术设计和开发的任何方面,只是作为可用性评估的中立评估者。
所有访谈都由专业转录服务逐字录音和转录。专题分析[
参与者特征显示在
可用性测试参与者的人口统计学特征(N=10)。
人口统计资料 | 值 | ||
年龄(年),平均值(SD) | 48.7 (18.6) | ||
|
|||
|
女 | 8 (80) | |
|
|||
|
黑人或非裔美国人 | 8 (80) | |
|
非西班牙裔或拉丁裔 | 1 (10) | |
|
其他 | 1 (10) | |
|
|||
|
一些大学 | 4 (40) | |
|
大学毕业生 | 3 (30) | |
|
研究生工作 | 3 (30) | |
|
|||
|
< 50000 | 5 (50) | |
|
≥50000 | 5 (50) | |
|
|||
|
单身(未婚) | 3 (30) | |
|
结婚了 | 4 (40) | |
|
离婚了 | 3 (30) | |
|
|||
|
没有一个 | 9 (90) | |
|
≥1 | 1 (10) |
在IVR系统使用两周后进行的可用性测试调查产生了积极的结果(
可用性测试调查结果(N=10)。
陈述和答案一个 | 参与者,n (%) | |||
|
||||
|
有些同意 | 7 (70) | ||
|
既不同意也不反对 | 3 (30) | ||
|
||||
|
强烈反对 | 7 (70) | ||
|
有点不同意 | 2 (20) | ||
|
有些同意 | 1 (10) | ||
|
||||
|
强烈同意 | 5 (50) | ||
|
有些同意 | 5 (50) | ||
|
||||
|
强烈反对 | 7 (70) | ||
|
有点不同意 | 3 (30) | ||
|
||||
|
强烈同意 | 3 (30) | ||
|
有些同意 | 4 (40) | ||
|
有点不同意 | 3 (30) | ||
|
||||
|
强烈反对 | 4 (40) | ||
|
有点不同意 | 3 (30) | ||
|
既不同意也不反对 | 2 (20) | ||
|
有些同意 | 1 (10) | ||
|
||||
|
强烈同意 | 4 (40) | ||
|
有些同意 | 6 (60) | ||
|
||||
|
强烈反对 | 4 (40) | ||
|
有点不同意 | 4 (40) | ||
|
既不同意也不反对 | 1 (10) | ||
|
有些同意 | 1 (10) | ||
|
||||
|
强烈同意 | 6 (60) | ||
|
有些同意 | 2 (20) | ||
|
既不同意也不反对 | 1 (10) | ||
|
有点不同意 | 1 (10) | ||
|
||||
|
强烈反对 | 5 (50) | ||
|
有点不同意 | 5 (50) | ||
|
||||
|
2 | 2 (20) | ||
|
6 | 1 (10) | ||
|
8 | 4 (40) | ||
|
9 | 2 (20) | ||
|
10 | 1 (10) | ||
|
||||
|
是的 | 7 (70) | ||
|
没有 | 3 (30) | ||
|
||||
|
女 | 9 (90) | ||
|
男女皆有 | 1 (10) | ||
|
||||
|
是的 | 4 (40) | ||
|
|
6 (60) | ||
|
|
苹果的手表 | 3 (30) | |
|
|
Fitbit激励 | 3 (30) |
一个请选择最能表达你在过去两周内使用电话咨询系统后对每一项陈述的感受的答案。
总共出现了5个主要主题:(1)对干预的喜欢或不喜欢,(2)对PA的障碍或促进因素,(3)技术困难,(4)通话质量,以及(5)对干预的改进建议。
当被问及他们喜欢DIAL干预的什么时,几名参与者表示,电话激励他们锻炼,并让他们负责任:
我没有那么积极,但在我打完这些电话后,我变得更积极,更有意识,我开始习惯这些电话,我期待着这些电话,我期待着激励技巧。
我想是因为它让我负起了责任。听到我完成了什么,没有完成什么,这种责任感会增加额外的价值,因为它几乎是在你面前放了一面镜子,说:“看。”有时很难对着镜子说:“这是我做过或没做过的事情。”
嘉宾亦对(新的)双向通话格式的灵活性表示赞赏:
有一件事我很喜欢,比如,如果我不打电话。我有机会打回去了。这很好。
你有不同的选择和不同的打电话时间,我认为这对那些忙碌的人来说是件好事。所以如果他们错过了电话,他们可以再打回来,或者系统会再打回来,但是如果他们需要改变他们的电话时间,他们就可以这样做。
最后,参与者期待着通话结束时的PA提示:
我认为最后的激励技巧很好。我已经认识他们了,但我听从了他们的意见。所以我认为它们对那些刚刚开始健康之旅的人是有好处的。
至于不喜欢,参与者表示担心具体的步骤反馈信息
谢谢你报告你的步数。你还没有达到DIAL每天10,000步的学习目标,但你正在朝着这个目标前进。在你达到目标之前,保持小幅增长。
参与者对这一反馈有强烈的反应,并将其与
如果每天听到“你没有完成一万步的目标”,你会有点沮丧。你没有达到目标。你没有达到目标。”
IVR呼叫完成的激励机制是另一个令人讨厌的因素,尤其是对农村县协调员来说:
我不认为25美分对激励人们继续接到电话有帮助。
动机是什么?这真的会让你觉得自己很没用。
其他参与者对这个想法持更开放的态度:
任何能给人们额外动力去做这件事的激励,我认为这是一个好主意……它并不多,但它给你一种感觉,“我做到了。我有25美分,我有50美分"这并不多,但这是知道在最后对你来说有些东西。
慢性疾病预防和管理是参与PA或IVR干预的重要激励因素:
我认为这取决于人们处于生活的哪个阶段,积极锻炼身体可能是出于这样的动机:“嘿,如果你锻炼,这种疾病可以得到控制或控制,甚至可能预防。”
社会支持也是鼓励PA启动和维持的关键,特别是在DIAL干预结束后:
是的,我认为如果他们有朋友或伙伴一起散步,他们就会开始或继续锻炼。我认为有人一起锻炼很重要。
我认为它的人际关系方面将非常重要。虽然不是一个人,但当与电话系统的联系和责任被移除时,我认为从其他来源获得信息非常重要,希望是其他参与者或参与者的家庭成员。
至于参与PA和完成IVR通话的障碍,与会者强调了缺乏时间和利益竞争:
有很多很多天我不想做任何体育活动。我想说实际上大多数时候。并不是因为它很乏味。因为我有很多事情要做,我一直在想,“哇。我要花一个小时来做这件事。”
参与者描述了在IVR呼叫中遇到的一些最初的技术困难,例如在错误的时间接收呼叫或使用
在7月4日假期期间,那个周末我没有接到任何电话。
最后,参与者学会了在IVR呼叫期间花时间输入响应:
如果你想加快速度,你知道你会按2,不行。它会给你一个错误。
参与者普遍表示
有些时候感觉进展得有点太快了,特别是当有多个选项,或者问题,或者提示是读或说的,然后马上就说了答案。我不知道,有时候是仓促的,感觉就像。
参与者表示,他们宁愿写
我觉得你可以给他们一张提示卡。就像一些提示。因为每次都不一样,只是简单介绍一下会发生什么。
与会者还建议,将调查的印刷材料随时提供给社区参与者,对于获取准确的数据是有益的和至关重要的:
我想打印出来会有帮助。只是一个表示“这是1的意思,这是100的意思。”因为,也许有时候我做的事情太多了。让我记住这个尺度是多少。如果有电话打进来,我当然不会点击过去,但这又一次分散了我的注意力。所以如果我正在回答一个问题,我会说,“哦,我的天哪。我应该选1个还是100个"我想打印出来的刻度或者放在我面前的东西可能会提醒我,因为有些时候我放1,有些时候我放99,这不是我的意思。但据我所知,我没有办法回到过去,擦掉我的答案。我不知道我是否在训练中错过了,但我只是想,“糟糕。” But that was just my short term memory, and knowing I needed to complete the call.
与会者表示,除了获得准确数据的好处外,拥有印刷材料还可以减轻因沮丧而产生的不遵守情况:
任何我们能帮忙的事情都会很有帮助。所以,如果我们能想出一些东西,为老一辈提供某种视觉辅助,那就太好了。我相信每个人都能使用电话,但你要确保他们不会混淆。因为一旦他们感到困惑,困惑有时会导致气馁。所以,你不想让他们混淆。所以,如果我们能想出某种形式的讲义,那就太好了。
参与者建议步数目标应适度,并应提醒社区参与者在研究期间逐渐增加步数:
循序渐进。我认为,如果你想看到有人达到10000个目标,那就从小处开始,比如看看他们现在的水平,看看参与者的平均水平是多少,然后从那里开始努力。最终,对于一些人来说,如果不对他们的日常生活进行重大改变,就很难实现10000个目标。但我认为,如果你一小步一小步地走,那么对一部分参与者来说,你可能不需要对每个人都这样做,但至少对某一组参与者来说,你可以得到一些改变,比如他们每天的步数增加,他们都达到了目标,我认为这可能是一个很好的激励因素。
它确实告诉我,试着为下次增加500步,但我觉得它应该更个性化,比如,“好吧,你已经完成了2000步,明天让我们试着完成2500步。”当他们第二天打电话来的时候,如果他们有2500美元,你就说:“太好了,你达到目标了。你觉得你能再加500吗?”我觉得应该是这样的。我不认为这条线应该是1万,因为这对一些人来说太多了。
与会者还提供了上述问题的解决方案与激励电话完成(例如,替代非货币激励和积分制度):
我可以告诉你,每打一个电话只收25美分一点也不激励人。是的。我不想直言不讳,但事实并非如此。这不是激励。每次电话结束时我赚了多少钱,这并不能激励我。现在,如果我每打一个电话都能获得积分,我可以在某种体育活动中兑换这些积分,比如网上商店。
我的意思是,价值可能仍然是3.75美元,但375点可能就像一份礼物。可能是计步器。它可能是一个小午餐袋,也可能是其他东西。人们可以使用手提袋。他们可以使用计步器。如果他们在锻炼,他们甚至可以使用杯子或杯子,或水瓶。但你能用3.75美元做什么呢?
最后,与会者讨论了增加步数的建议,并建议根据南方农村社区的情况进行个性化设计:
例如,告诉他们在广告时间站起来,绕着咖啡桌走两圈。这是可行的。它触手可及,走出去也不费多大力气。因为想想那些附近没有公园的人。我们让他们去最近的公园。嗯,最近的公园都没有。
告诉他们,好吧,绕着你的房子走两圈,或者走到邮箱前两圈,或者其他什么。去三个邮箱再回来。人们可能会说,“哦,是的,我能做到。我从没想过要这么做。”
创新的IVR系统有潜力克服障碍,在阿拉巴马州农村黑带地区达到推荐的PA水平[
IVR系统的可用性得分为81分,相当于e分
作为在RCT开始前进一步测试系统的一种手段,从事这项研究的核心研究人员小组开会讨论是否需要进一步的正式可用性测试。由于大多数报告的问题都与措辞或内容有关,因此决定不需要进一步的可用性测试。然而,研究人员的核心小组被列为IVR系统的试点用户。这些试点用户被安排在实际RCT参与者之前大约2-3周。这些研究人员每天都积极地测试系统,并将发现的任何问题报告给开发团队。这使得开发团队能够在任何RCT研究参与者遇到问题之前积极地解决问题。使用这种方法识别和修复的一些示例问题包括,当参与者从一个阶段(每日通话)转移到另一个阶段(每两周通话)时的问题,以及无法向参与者建议新的PA策略。我们的
我们的最终产品是一个全面的IVR系统,具有先进的功能,如精简呼叫、智能掉线处理和可分配语音性别。未来的研究应该研究这些特性的附加价值及其对这一有前途的技术的影响。
可用性测试期间、之前和之后的反馈用于迭代优化IVR系统。目前正在随机对照试验中使用的合成系统描述如下:
该系统设计用于处理复杂的呼叫计划,在干预和随机分组的不同阶段涉及不同类型的呼叫。
只有当与会者有未完成的未挂起通话时,系统才能接收呼入并智能呼出。
为了保护参与者的隐私,使用他们的电话号码和个人识别号码(PIN)来识别他们。当参与者使用他们注册的手机时,只需要输入密码。当与会者使用非注册电话时,需要输入注册电话号码和密码。这实现了用户体验和安全性之间的平衡。
新的参与者由研究经理在门户网站上注册,该经理为用户检索唯一的PIN。然后,研究经理能够打印PIN码和其他教学材料在教育装订的参与者。
全面实施未接来电策略,30分钟后系统会重新尝试呼叫。同样,如果没有响应,则该呼叫被标记为未完成,可以在第二天完成。
智能掉线策略也已实现,其中,如果参与者在通话中途掉线,用户在预设的时间内重新接通,参与者可以从他们回答的最后一个问题继续。
影响IVR系统可用性的一个最重要的方面是信息导航时间[
许多IVR系统需要大量的时间,因为确认消息,例如“您按了6,如果这是正确的,请按1或按2更改。”这些确认信息是必要的,因为参与者很容易不小心键入错误的数字;然而,这些确认信息几乎使通话时间增加了一倍。为了克服这个问题,在介绍环节中,我们教育用户在通话过程中随时按*来编辑最后的响应。
与会者可以随时呼叫IVR系统,也可以更改自己喜欢的接听时间。
最大化资讯的相关性[
最大化资讯容量[
在每次通话结束时,系统会宣布参与者获得的奖励点数,这些点数可以兑换为实际的货币奖励。在可用性测试之前,我们直接将分数称为分。然而,我们从可用性测试中了解到,参与者认为每个电话25美分让他们觉得自己的时间毫无价值。因此,我们重新编写了我们的呼叫内容,奖励点数而不是美分。
呼叫中语音叙述的性别可以设置为与参与者的性别相匹配,设置为相反的性别,或者设置为随机的。
这项研究有一些局限性。首先,在COVID-19大流行期间进行了可用性测试;因此,为了参与者的安全,所有调查和访谈都是远程进行的,参与者仅限于社区卫生顾问和工作人员。尽管这些社区卫生顾问与未来的参与者一样生活和工作在阿拉巴马州黑带地区的同一个农村县,但他们可能不能准确地代表将参加RCT研究的参与者的人口统计数据(如教育水平)。此外,我们的人口统计主要包括女性和非西班牙裔或拉丁裔人口。
然而,这个机会让农村县协调员在率先在自己的社区推广IVR系统之前,对IVR系统的内部工作方式有所熟悉和熟悉。因此,他们将更有准备地引导参与者使用IVR系统并回答他们的问题。此外,在这项技术的开发和改进中扮演如此关键的角色,可能会增强这些关键利益相关者和社区看门人的购买和所有权意识,并极大地改进最终产品。
本研究表明,所开发的IVR系统是可用的,并具有提高PA水平的潜力。研究结果揭示了参与者的首选语言、叙述语调、奖励和各种信息。这些见解对未来寻求开发基于ivr的干预措施的研究很有价值。
深南ivr支持的积极生活方式
交互式语音应答
体育活动
个人识别号码
随机对照试验
社会认知理论
阿拉巴马大学伯明翰分校
本研究由美国国家癌症研究所(R01CA233550)和美国国家心肺血液研究所培训计划(T32HL105349)部分资助。
MT领导了交互式语音应答系统的开发,因此没有参与系统的可用性测试。DP和SN不是交互式语音应答系统开发团队的成员,他们进行了可用性测试和访谈。
没有宣布。