这是一篇开放获取的文章,根据创作共用署名许可(http://creativecommons.org/licenses/by/2.0/)的条款发布,允许在任何媒介上无限制地使用、分发和复制,前提是正确引用最初发表在《医学互联网研究杂志》上的原创作品。必须包括完整的书目信息,//www.mybigtv.com/上的原始出版物的链接,以及此版权和许可信息。
传统的基于web的搜索引擎对于健康素养较低的人来说可能无法用于查找与健康相关的信息,从而使这一人群无法使用它们。
我们描述了一个对话式搜索引擎界面,旨在让健康状况和计算机素养较低的个人识别和了解互联网上的临床试验。
一项涉及89名参与者的随机试验将对话式搜索引擎界面(n=43)与国家癌症研究所临床试验数据库现有的传统基于关键字和方面的搜索引擎界面(n=46)进行了比较。每个参与者执行两项任务:为自己寻找临床试验,以及找到符合预先规定标准的试验。
结果表明,基于7点自我报告的满意度评分,所有参与者都对对话界面更满意(任务1:平均4.9,SD 1.8 vs平均3.2,SD 1.8,
会话代理可以用于提高基于网络的搜索的可访问性,特别是临床试验,并可以帮助减少招聘对弱势群体的偏见。
大多数美国成年人上网查找健康信息[
除了通用搜索引擎之外,还为特定种类的医疗保健信息开发了许多搜索引擎和接口。一个例子是临床试验搜索引擎,它从存储库或数据库中检索临床试验的描述[
传统的基于Web表单的搜索引擎用户界面(例如谷歌)通常只使用用户提供的关键字,而其他的则将关键字输入与多项选择选项结合起来,称为“基于面”的搜索界面[
在本文中,我们描述了一个基于web的临床试验搜索引擎的设计,我们设计它来减轻与低健康素养相关的障碍。搜索任务的框架是与一个动画角色的对话,使其尽可能熟悉和接近,并进行了一些额外的功能和简化,以帮助健康知识水平较低的用户导航整个临床试验搜索过程。我们进行了一项随机试验,将对话式搜索引擎与现有的传统基于web的搜索引擎进行比较。
对话搜索引擎支持的总体任务是根据初始人口统计标准,使用公开的信息,找到一个或多个用户有资格参加的癌症相关临床试验。搜索引擎索引来自美国国家癌症研究所(NCI)数据库的超过10,000个活跃试验(在进行这项工作时)[
基于我们为健康素养较低的患者开发多个健康咨询对话系统的经验[
整个搜索体验被构建为一个扩展的对话,在这个对话中,首先对用户进行询问,了解他们的需求和偏好,然后向用户展示候选试用,代理在整个过程中提供尽可能多的框架(通过教程、解释和建议)。鉴于临床试验描述对用户来说可能非常复杂和乏味,我们在搜索之前从用户那里获得尽可能多的信息,以试图确定最合适的试验,这是错误的。此外,我们设计的系统可以分阶段显示试验信息,只显示用户在每个评估点所需的详细信息。典型对话的整体流程如图所示
为了定义代理从用户那里引出的搜索标准,我们利用了可用性研究中的定性发现[
除了整体结构的交互作用所示
词典:NCI网站为用户提供医学术语词典;然而,该词典可作为独立于搜索引擎的模块在NCI网站上获得。在我们对该网站的用户研究中,我们发现查找定义经常分散用户的主要搜索任务。我们在搜索功能中集成了字典;虽然代理会向用户解释搜索结果,但角色会自动从文本中提取困难的术语,并提供解释。
大声朗读:用户可以要求代理大声朗读,并在必要时重复任何临床试验文本或定义。在大声说话时,代理会显示文本的可视化,使用户能够跟着阅读。
简化的标题:临床试验的标题可能很长,很复杂,很难记住。我们使用试验的阶段和类型以及试验的癌症类型简化了显示标题(例如,将“BFTZ2252在非小细胞肺癌受试者中给予Patanobib或Dopepaxel的研究”替换为“肺癌II期治疗试验”)。
教育模块:代理提供解释临床试验基础的几个概念,如自愿和风险,在搜索的适当点。
用户搜索条件确认:代理定期显示用户的搜索条件,并允许用户修改自己的选择。这是在最初的访谈之后,在每个匹配的临床试验被讨论之后,以及每当代理耗尽试验向用户展示时进行的。
查询细化:如果搜索没有返回结果,或者用户耗尽了索引的试验列表,代理会建议修改搜索条件的方法。
书签:用户可以保存临床试验的参考资料,以便在后续的搜索过程中进行回顾。
视图摘要:代理定期显示在搜索会话期间查看的试验列表,并突出显示带有书签的试验。
细节级别:每个临床试验描述都以3个级别的细节与相关显示器进行展示。用户最初只显示试用的标题和资格标准(参见
会话式代理搜索接口。
搜索会话中的典型对话流。
这项工作的总体目标是开发一个基于web的搜索界面,使健康状况不佳和计算机知识水平较低的人更容易使用。我们假设,与传统的基于关键字和方面的搜索引擎相比,对话式搜索界面将为所有用户带来更大的搜索成功和更高水平的满意度,但对于健康素养较低的个人来说,这种差异将尤其明显。
为了评估我们的系统,我们进行了一项受试者间随机试验,将我们的对话代理搜索引擎(“代理”)与NCI开发的传统基于面和关键字的搜索引擎(“对照”)进行比较([
我们要求参与者执行两个搜索任务。在任务1中,参与者被要求搜索一个他们暂时有资格参加并感兴趣的临床试验。在任务2中,他们被要求搜索具有特定资格标准(即年龄,癌症类型,试验类型,地理位置)的其他人的试验作为标准化测试,以便我们可以确定他们发现的任何试验是否符合指定的标准(
为了确保计算机和健康知识水平较低的参与者也能使用,我们设计了实验,使他们能够在实验室(对于那些没有计算机的人)或家中进行研究。实验软件首先为参与者提供了一个关于使用系统的简短教程,包括一个练习任务。然后显示第一个搜索任务。为了完成每个任务,参与者被重定向到另一个具有代理或NCI搜索引擎(
现在是你的第二个任务。请把它写下来。
我是罗莎。她是癌症患者。
< rosa >的图像
以下是关于Rosa的一些信息:
年龄:70岁。
癌症类型:乳腺癌。
她想要的试验类型:治疗试验。
她想要的审判地点:任何地方都行。
我们希望您使用上面的信息来寻找Rosa的临床试验。
一旦你找到了一个试验,请在屏幕右下方的“试验ID”框中输入它的ID号,然后点击“我找到了一个试验”按钮。另外,请在一张纸上写下协议ID号。
如果你花了一些时间寻找,但不认为你能找到一个试验,然后点击屏幕左下角说“我找不到一个试验”的按钮。
如果您已经准备好开始,请单击“I am ready”按钮。
控制条件的实验设置。
研究中使用的自我报告测量方法。
量表自述项目 | 锚1 | 锚7 |
1.你在多大程度上知道你想在试验中得到什么?(任务1) | 一点也不 | 完全 |
2.试验在多大程度上符合你的预期? | 一点也不 | 完全 |
3.你有多大可能报名参加你发现的试验?(任务1) | 不可能 | 很有可能 |
4.你觉得使用这个系统花了多少时间? | 太少 | 太多 |
5.你对临床试验搜索系统有多满意? | 一点也不 | 非常 |
6.你现在有多沮丧? | 一点也不 | 非常 |
7.你现在有多高兴? | 一点也不 | 非常 |
8.你自愿参加试验的压力有多大? | 没有压力 | 压力很大 |
9.你觉得系统提供了多少信息? | 没有足够的 | 太多 |
10.如果你想再进行一次试验,你有多大可能再次使用这个系统? | 不可能 | 很有可能 |
11.你有多大可能把这个系统推荐给其他正在寻找试验的人? | 不可能 | 很有可能 |
12.你有多相信从系统接收到的信息? | 一点也不 | 非常 |
参与者社会人口统计信息见
在最初的任务中,参与者被要求为自己找到一个临床试验。大多数参与者在开始这项任务时都不清楚自己想要什么,在1到7的范围内,他们对自己想要的东西的了解程度平均为2.8 (SD 1.9)。然而,药物组45%(19/42)和对照组31%(14/45)成功找到试验;两组间差异无统计学意义(χ21= 1.8,
亲自完成研究的人与在家完成研究的人的结果没有显著差异。
在第二项任务中,参与者被要求找到一个满足预先设定的标准的临床试验作为标准化任务。虽然制剂组中48%(20/42)和对照组中40%(18/45)声称发现了符合标准的试验(χ21= 0.5,
与任务1一样,与传统接口相比,使用代理进行搜索往往需要更长的时间(平均8.2,SD 5.3分钟vs平均6.4,SD 4.3分钟),但这并不具有统计学意义(
参与者社会人口。
变量 | 所有 |
代理 |
控制 |
|
|
性别(女性),n (%) | 48 (54) | 18 (42) | 30 (65) | 03 | |
年龄(年),平均值(SD) | 59.2 (9.8) | 58.6 | 59.7 | .59 | |
|
|
|
|
。45 | |
|
黑色的 | 41 (46) | 19 (44) | 22 (48) |
|
|
白色 | 48 (54) | 24 (56) | 24 (52) |
|
|
其他 | 0 (0) | 0 (0) | 0 (0) |
|
西班牙裔或拉丁裔,n (%) | 0 (0) | 0 (0) | 0 (0) | N/A | |
|
|
|
|
38 | |
|
<高中 | 15 (17) | 9 (21) | 6 (13) |
|
|
高中 | 10 (11) | 6 (14) | 4 (9) |
|
|
>高中 | 62 (71) | 27 (63) | 35 (78) |
|
已婚,n (%) | 40 (45) | 16 (32) | 24 (52) | .20 | |
|
|
|
|
|
|
|
意思是(SD) | 57 (15) | 56 (16) | 59 (15) | .35点 |
|
充足(≥60),n (%) | 65 (73) | 27 (64) | 38 (83) | 0。 |
研究地点(亲自),n (%) | 53 (60) | 27 (63) | 26 (57) | 正 | |
|
|
|
|
.64点 | |
|
从来没用过 | 7 (8) | 5 (12) | 2 (4) |
|
|
尝试一个 | 21 (24) | 10 (24) | 11 (24) |
|
|
经常使用 | 53 (61) | 24 (57) | 29日(64) |
|
|
专家 | 6 (7) | 3 (7) | 3 (7) |
|
|
|
|
|
获得 | |
|
从来没用过 | 15 (17) | 7 (17) | 8 (18) |
|
|
尝试一个 | 16 (18) | 8 (19) | 8 (18) |
|
|
经常使用 | 45 (52) | 22 (52) | 23日(51) |
|
|
专家 | 11 (13) | 5 (12) | 6 (13) |
|
|
|
|
|
点 | |
|
没有一个 | 16 (18) | 12 (29) | 4 (9) |
|
|
一个小 | 40 (46) | 16 (38) | 24 (53) |
|
|
大量 | 29 (33) | 13 (31) | 16 (36) |
|
|
专家 | 2 (2) | 1 (2) | 1 (2) |
|
以前参加过癌症临床试验(是),n (%) | 18 (21) | 7 (17) | 11 (24) | 点 | |
现在真的有兴趣参加试验了吗?(yes), n (%) | 44 (52) | 23日(56) | 21 (48) | 点 | |
你在多大程度上知道自己在试验中想要什么?一个意思是(SD) | 2.8 (1.9) | 2.7 (1.7) | 3.0 (2.1) | .60 |
一个锚1=我完全不知道;我很清楚。
初步研究结果。
测量 | 任务1 | 任务2 | ||||
|
代理 |
控制 |
|
代理 |
控制 |
|
完成任务,n (%)一个 | 37 (86) | 37 (80) | 算下来 | 36 (84) | 37 (80) | .79 |
声明发现一个试验,n (%)一个 | 19/42 (45) | 14/45 (31) | .19 | 20/42 (48) | 14/45 (40) | 点 |
找到一个正确的试验,n (%)一个 | - - - - - -b | - - - - - -b | - - - - - -b | 18/42 (43) | 14/45 (31) | 陈霞 |
运行时间(分钟),平均值(SD)c | 12.6 (9.2) | 9.0 (8.4) | 06 | 8.15 (5.3) | 6.4 (4.9) | 06 |
试验次数(自我报告),平均值(SD)c | 2.8 (3.0) | 3.8 (6.7) | 56 | 3.0 (3.1) | 4.9 (9.4) | 54 |
符合标准(自我报告;试验数百分比),平均值(SD)c, d | 56 (39) | 34 (35) | 06 | 64 (37) | 44 (41) | .09点 |
试验在多大程度上符合你的预期?(范围1 - 7),c意思是(SD) | 3.7 (1.8) | 2.7 (1.6) | . 01 | 4.8 (1.7) | 3.4 (1.9) | 〇〇 |
你有多大可能报名参加你发现的试验?(范围1-7),平均值(SD)c | 3.3 (1.7) | 2.9 (1.7) | . 21 | - - - - - -e | - - - - - -e | - - - - - -e |
你觉得使用这个系统花了多少时间?(范围1-7),平均值(SD)c | 4.3 (1.3) | 4.6 (1.8) | 收 | 4.2 (1.1) | 5.1 (1.7) | 03 |
你对临床试验搜索系统有多满意?(范围1-7),平均值(SD)c | 4.9 (1.8) | 3.2 (1.8) | <措施 | 4.8 (1.9) | 3.2 (1.7) | <措施 |
你现在有多沮丧?(范围1-7),平均值(SD)c | 2.1 (1.7) | 3.7 (2.2) | 措施 | 2.6 (1.9) | 3.8 (2.2) | . 01 |
你现在有多高兴?(范围1-7),平均值(SD)c | 5.1 (2.1) | 3.4 (1.9) | 措施 | 4.6 (1.8) | 3.1 (1.7) | 措施 |
你自愿参加试验的压力有多大?(范围1-7),平均值(SD)c | 1.2 (0.6) | 1.4 (1.1) | 获得 | - - - - - -e | - - - - - -e | - - - - - -e |
你觉得系统提供了多少信息?(范围1-7),平均值(SD)c | 4.2 (1.7) | 4.3 (1.8) | .98点 | - - - - - -e | - - - - - -e | - - - - - -e |
如果你想再进行一次试验,你有多大可能再次使用这个系统?(范围1-7),平均值(SD)c | 5.0 (2.1) | 4.1 (2.4) | 07 | - - - - - -e | - - - - - -e | - - - - - -e |
你有多大可能把这个系统推荐给其他正在寻找试验的人?(范围1-7),平均值(SD)c | 5.1 (2.2) | 4.5 (2.5) | 二十五分 | - - - - - -e | - - - - - -e | - - - - - -e |
你有多相信从系统接收到的信息?(范围1-7),平均值(SD)c | 5.7 (1.6) | 5.1 (1.9) | 13。 | - - - - - -e | - - - - - -e | - - - - - -e |
一个卡方检验。
b任务1涉及参与者寻找他们感兴趣的试验,所以没有办法客观地评估他们发现的试验是否“正确”。
cMann-Whitney
d符合标准的试验是一种主观的自我报告测量。
e任务2涉及参与者寻找符合假设患者标准的试验,因此询问与他们自己的参与有关的问题是没有意义的。
健康素养较低参与者的研究结果。
测量 | 任务1 | 任务2 | ||||
|
代理 |
控制 |
|
代理 |
控制 |
|
完成任务,n (%)一个 | 12 (80) | 8 (100) | 只要 | 12 (80) | 8 (100) | 只要 |
声明发现一个试验,n (%)一个 | 6/14 (43) | 1/8 (13) | .14点 | 5/14 (36) | 1/8 (13) | 。 |
找到一个正确的试验,n (%)一个 | - - - - - -b | - - - - - -b | - - - - - -b | 5/14 (36) | 0/8 (0) | 0。 |
运行时间(分钟),平均值(SD)c | 13.3 (11.4) | 8.2 (6.3) | 票价 | 6.8 (4.3) | 4.6 (4.3) | 二十五分 |
试验次数(自我报告),平均值(SD)c | 3.0 (3.4) | 0.9 (1.1) | 16 | 2.8 (3.2) | 1.5 (2.1) | 36 |
符合标准(自我报告;试验数百分比),平均值(SD)c, d | 74 (30) | 75 (35) | .89 | 80 (31) | 67 (58) | .92 |
试验在多大程度上符合你的预期?(范围1-7),平均值(SD)c | 4.1 (1.9) | 2.4 (1.4) | 06 | 5.3 (2.1) | 3.3 (2.0) | .04点 |
你有多大可能报名参加你发现的试验?(范围1-7),平均值(SD)c | 3.8 (1.1) | 3.6 (1.9) | 结果 | - - - - - -e | - - - - - -e | - - - - - -e |
你觉得使用这个系统花了多少时间?(范围1-7),平均值(SD)c | 3.8 (0.9) | 4.1 (2.5) | 点 | 3.9 (0.3) | 4.5 (2.3) | .86 |
你对临床试验搜索系统有多满意?(范围1-7),平均值(SD)c | 5.3 (1.6) | 2.9 (1.7) | . 01 | 5.7 (1.6) | 2.9 (1.4) | .002 |
你现在有多沮丧?(范围1-7),平均值(SD)c | 2.9 (2.0) | 4.8 (2.1) | . 01 | 2.3 (2.1) | 3.1 (1.9) | 酒精含量 |
你现在有多高兴?(范围1-7),平均值(SD)c | 5.5 (1.6) | 3.3 (2.7) | .04点 | 5.7 (1.7) | 2.6 (1.1) | 措施 |
你自愿参加试验的压力有多大?(范围1-7),平均值(SD)c | 1.1 (0.3) | 2.3 (2.2) | .10 | - - - - - -e | - - - - - -e | - - - - - -e |
你觉得系统提供了多少信息?(range -7),平均值(SD)c | 4.8 (1.5) | 4.3 (1.5) | . 21 | - - - - - -e | - - - - - -e | - - - - - -e |
如果你想再进行一次试验,你有多大可能再次使用这个系统?(范围1-7),平均值(SD)c | 5.5 (1.8) | 5.0 (2.4) | .74点 | - - - - - -e | - - - - - -e | - - - - - -e |
你有多大可能把这个系统推荐给其他正在寻找试验的人?(范围1-7),平均值(SD)c | 6.1 (1.9) | 5.1 (2.7) | 。45 | - - - - - -e | - - - - - -e | - - - - - -e |
你有多相信从系统接收到的信息?(范围1-7),平均值(SD)c | 6.3 (1.0) | 5.1 (2.1) | 点 | - - - - - -e | - - - - - -e | - - - - - -e |
一个卡方检验。
b任务1涉及参与者寻找他们感兴趣的试验,所以没有办法客观地评估他们发现的试验是否“正确”。
cMann-Whitney
d符合标准的试验是一种主观的自我报告测量。
e任务2涉及参与者寻找符合假设患者标准的试验,因此询问与他们自己的参与有关的问题是没有意义的。
在所有研究条件下,分析低健康素养和高健康素养参与者之间的差异,发现了一些显著差异。总体而言,与健康素养高的参与者相比,健康素养低的参与者更有可能表示他们阅读的试验满足他们的标准(任务1:74% vs 37%,
在我们将基于对话的代理搜索用户界面与传统的基于关键字和方面的搜索引擎界面进行比较时,参与者对代理更满意,并且认为代理比传统界面更善于找到符合他们标准的试验。与传统界面相比,参与者在与代理交互后感到更高兴,更少沮丧。
在我们的标准化任务(任务2)中,值得注意的是,没有一个健康素养较低的参与者能够使用传统的搜索引擎界面找到正确的临床试验,而36%(5/14)的参与者能够使用对话代理找到正确的临床试验。这些结果加强了我们早期的发现,即传统的搜索界面对于健康状况不佳或计算机知识水平较低的人来说是无法使用的[
与传统界面相比,会话界面确实需要更多的时间来使用:任务1长40%,任务2长27%(尽管这些差异在统计上不显著)。这有几个原因:听语音提示而不是阅读提示所需的时间,代理为获得搜索标准而进行的访谈,以及代理使用的社交对话、教程和其他“任务外谈话”来提高可接近性、参与性和理解力。然而,我们的目标用户群体显然很乐意花额外的时间在对话用户界面上以获得更好的结果;在浏览任务中,与使用传统界面的人相比,他们选择花几乎两倍的时间来寻找试用版。此外,他们在任务2中所花费的时间的主观印象表明,用户觉得会话代理界面实际上比传统界面花费的时间要少得多。
我们的研究除了参与者人数少之外,还有几个局限性。在我们的研究中,一些使用者(21%)以前曾参与过临床试验,因此不能代表癌症患者的一般人群,因为他们对临床试验的背景知识可能高于平均水平。然而,有试验经验的人被随机分配到两个试验组,所以两组在这方面应该是相等的。另一个局限性与使用REALM作为卫生知识普及的衡量标准有关。尽管这一工具成功地区分了参与者对我们干预的影响,但其他措施可能会提供更精细的能力,以深入研究电子和计算机素养的特定维度。尽管电子健康素养量表(eHEALS)是为此目的而设计的,但它是一种主观的自我报告测量方法[
一些研究已经调查了为低领域知识的用户使用标准的基于关键字的搜索界面[
其他研究调查了使用对话代理向健康素养较低的个人传达健康信息。比克莫尔等[
我们的研究结果表明,对于许多类型的应用程序,对话式的基于代理的搜索引擎界面可能是传统的基于Web表单的界面的一个很好的替代品,特别是对于那些针对低健康素养用户或计算机经验或技能有限的用户。
国家癌症研究所
成人医学素养的快速评估
感谢Barbara Barry、Ramesh Manuvinakurike、Juan Fernandez、Lazlo Ring和Maryam Aziz帮助开发该系统。这项工作由美国国立卫生研究院国家癌症研究所资助R01CA158219。
没有宣布。