发表在23卷第12名(2021): 12月

本文的预印本(早期版本)可在https://preprints.www.mybigtv.com/preprint/31737,首次出版
改善虚拟健康助手的用户体验:范围审查

改善虚拟健康助手的用户体验:范围审查

改善虚拟健康助手的用户体验:范围审查

审查

通讯作者:

瑞秋·G·柯蒂斯,心理学学士(荣誉),博士

联合健康和人力绩效

运动、营养和活动研究联盟

南澳大利亚大学

GPO邮箱2471

阿德莱德,5001

澳大利亚

电话:61 8 8302 2455

电子邮件:Rachel.Curtis@unisa.edu.au


背景:虚拟助理可用于提供创新的健康计划,以大规模和低成本提供有吸引力的、个性化的、方便的健康建议和支持。影响虚拟助手观感的设计特征,如视觉外观或语言特征,可能会极大地影响用户的体验和与助手的互动。

摘要目的:本综述旨在概述研究虚拟健康助手设计特征如何影响用户体验的实验研究,总结研究虚拟健康助手设计特征如何影响用户体验的实验研究成果,并在有足够证据的情况下为虚拟健康助手的设计提供建议。

方法:我们搜索了5个电子数据库(Web of Science、MEDLINE、Embase、PsycINFO和ACM数字图书馆),以确定使用实验设计来比较2个或更多版本的交互式虚拟健康助手的设计特征对成人用户体验的影响的研究。对数据进行描述性综合。对健康领域、设计特征和结果进行了分类,并使用描述性统计来总结研究主体。每项研究的结果被分类为阳性、阴性或无影响,并构建了设计特征和结果类别的矩阵来总结研究结果。

结果:除去重复的文章后,数据库搜索出6879篇文章。我们在综述中纳入了代表45项独特研究的48篇文章。最常见的健康领域是心理健康和身体活动。研究最常检查视觉设计或对话风格和关系行为类别中的设计特征,并评估个性、满意度、关系或使用意图类别中的结果。仅一项研究就检查了超过一半的设计特征。结果表明,同理心、关系行为和自我表露与更积极的用户体验相关。结果还表明,如果使用人形化身,逼真的渲染和医疗服装可能与更积极的用户体验有关;然而,还需要更多的研究来证实这一点。

结论:越来越多的科学证据研究了虚拟健康助手的设计特征对用户体验的影响。综上所述,数据表明,虚拟健康助手的外观和感觉确实会影响用户体验。显示同理心、显示非语言关系行为、披露自身个人信息的虚拟健康助手可以获得更好的用户体验。目前,证据基础广泛,研究规模小,异质性高。需要进一步的研究,特别是使用重复用户交互的纵向研究设计,以为虚拟健康助手的优化设计提供信息。

中国医学杂志,2016;23(12):e31737

doi: 10.2196/31737

关键字



背景

机器学习和人工智能的进步为提供自动化、量身定制、方便的医疗援助提供了希望,其复杂性和个性化达到了前所未有的水平,并已经在为医疗保健的转型做出贡献[1].从广义上讲,虚拟助手可以被定义为旨在模拟人类对话并根据用户输入提供个性化响应的数字服务。它们可以被编程为结构化对话或回答用户的问题。功能范围从简单的菜单或基于多项选择的助手,到更复杂的具有自然语言处理的虚拟助手,可以识别自由的语音或文本。目前,虚拟助理被广泛部署在基于网络的银行和服务环境中,可以回答消费者关于产品和服务的问题,从而减少对员工的依赖对需求.虚拟助手也越来越多地被设计用于各种健康应用,例如为抑郁和焦虑提供认知行为治疗[2],改善饮食和体育活动[3.],以及进行远程病人监察[4].尽管在保健方面使用虚拟助手的潜力令人兴奋,但如果技术不能满足用户的需求和偏好,在保健方面使用虚拟助手可能是无效的,甚至会产生意想不到的负面后果。

虚拟健康助手的用户体验可以定义为用户因使用或预期使用而产生的感知和反应(例如,情绪、信念、偏好和行为)[5].用户体验受到一系列因素的影响,包括表现形式、功能和交互行为[5].重要的是优化虚拟助手的设计,以提供积极的用户体验和促进粘性。越来越多的证据表明,设计特征会影响观感虚拟助手的视觉外观、交流方式、语言特征等都是设计的重要考虑因素,因为这些设计特征会显著影响用户对技术应用的心理和情感反应和参与度[67].此外,尽管一些设计决策可能不会影响成本(例如,虚拟角色应该是男性还是女性),但其他决策可能会对设计虚拟健康助手的成本产生重大影响(例如,虚拟角色是否应该带有面部表情)。了解这些设计特征如何影响用户体验将有助于最有效地使用有限的健康软件开发预算。

以前的文献提出了设计语音用户界面的一般准则[8]及为不同残疾人士而设的无障碍对话用户界面[9],以及用于教学等特定目的的虚拟助理[10]及车载辅助[11].优化设计技术可能取决于虚拟助手的目的[1213];因此,有必要提出专门针对健康的建议。虽然研究研究了评估虚拟助理在健康领域可用性的方法[14],在最大限度地提高虚拟健康助理的用户体验方面缺乏明确的指导方针。

ter Stal等人的文献综述为构建虚拟健康助手发展指南迈出了重要的第一步[15该研究旨在确定健康领域内具身对话代理(拥有动画头像的虚拟助手)的研究设计特征。该综述对现有文献进行了全面概述,结果表明语音和/或文本输出以及面部和凝视表情是最常被研究的设计特征。ter Stal等人的次要目标[15]是为了确定研究中使用的结果变量和设计特征的影响。作者得出结论,基于当时不成熟的证据,对于健康中具身对话代理的最佳设计特征没有共识。结果强调了未来研究的关键途径,包括需要对所有设计特征进行更多研究以推进该领域。值得注意的是,ter Stal等人[15包括使用任何研究设计的研究,以及参与者观看刺激但不一定与虚拟助理互动的研究。

目标

使用交互式虚拟健康助理的证据基础在规模和质量上都在迅速增长。特别是带有交互式虚拟助手的实验研究设计被越来越多地报道,这应该为设计特征对用户体验的影响提供更清晰的证据。范围审查方法提供了一种明确的、系统的方法来概述这一庞大而多样的文献,使用严格的方法来最大限度地减少偏见[16].在这项研究中,我们试图对虚拟健康助理的设计特征进行首次范围审查,以期收集有关设计特征对交互式虚拟健康助理的用户体验影响的最有力证据。具体而言,我们的范围检讨的目的如下:

  1. 提供所有实验研究的概述,研究虚拟健康助理的设计特征如何影响用户体验
  2. 总结研究虚拟健康助手的设计特征如何影响用户体验的实验研究结果
  3. 确定研究是否支持为虚拟健康助理的设计提出建议

收集关于设计特征如何影响虚拟健康助手的用户体验的现有证据,将有助于研究人员和软件开发人员就其软件的外观和感觉做出决策,并开发最友好和有效的虚拟健康助手。


本次评审是根据PRISMA-ScR(系统评审和元分析扩展范围评审的首选报告项目)检查表进行报告的[17].

合格标准

合格标准采用人口、干预、比较和结果框架(人口:成人;干预:虚拟健康助理;比较器:设计特点;结果:用户体验)[18].包括同行评审期刊上的原创研究文章和长篇会议论文。

人口

纳入成人样本(年龄≥18岁)的研究。

干预

其中包括对虚拟健康助理的研究。在这篇综述中,我们认为虚拟健康助理是针对健康消费者(普通人群或患者)的与任何身体或精神健康状况的预防、管理或治疗以及临床研究相关的任何虚拟助理。虚拟健康助手包括在任何电子设备(如智能手机、电脑和耳机)上工作的虚拟健康助手。绿野仙踪虚拟助手(用户认为他们正在与计算机自动的虚拟助手交互,但虚拟助手是由人类操作的[19])。

比较器

研究比较了≥2个版本的虚拟健康助手的设计特征。在本文中,我们将设计特征定义为影响虚拟助手功能的特征观感而不影响其核心内容、目的或功能。设计特征的例子包括视觉线索,例如虚拟健康助理是否有一个头像(即代表虚拟助理的图像)、语言风格和交互方式(即文本或语音)。包括受试者之间和受试者内部的实验设计。

结果

评估用户体验结果的研究也包括在内。在本综述中,我们定义了用户体验,包括对虚拟助理的自我报告评估或用户与虚拟助理的互动,这些评估表明了更积极或更消极的体验(例如,可信度、亲和力、乐趣和易用性)、影响、继续使用虚拟助理的意图,以及用户粘性的客观衡量(例如,与虚拟健康助理互动的频率、持续时间或性质)。只包括定量数据。

排除标准

论文、评论文章、会议摘要和儿童研究被排除在外。用于培训或教育医疗专业人员的虚拟助手,以及拥有实体身体的机器人被排除在外。如果参与者没有与虚拟健康助理互动,研究将被排除在外;也就是说,他们没有向系统提供任何输入。如果虚拟健康助手不是健康计划的主要组成部分,研究也被排除在外。如果他们只评估了一个版本的虚拟助手(即,没有比较者的非实验性研究设计),或者将虚拟助手与人类进行比较,那么这些研究就会被排除在外。与更积极或更消极的用户体验无关的因变量——例如,那些被用作操作检查(例如,参与者被要求确认一个现实风格的助理是否确实比卡通风格的助理看起来更现实)。

信息源和搜索策略

2020年6月4日对文献进行了跨学科检索,包括卫生和信息技术领域的5个电子数据库:Web of Science、MEDLINE、Embase、PsycINFO和ACM数字图书馆。虚拟助理的搜寻词及设计特征已纳入搜寻策略(表1).指定与之相关的虚拟助理的资格健康筛选时评估了用户体验结果和实验研究设计。搜索仅限于英文,不限制出版日期。检索了所收录研究的参考文献列表和该领域的其他关键论文,以确定进一步的研究(采珠)。

表1。搜索条件。
搜索类别 搜索条件
虚拟助手 会话代理*”“对话系统*””对话框系统*”“对话系统*”“援助技术*”“关系代理*”“虚拟代理*”“虚拟助理*”“体现代理*”chatbot *
设计特点 anthropomorphi *人性个性情感*同理心同情幽默幽默语言语言*沟通“口语化”的声音演讲《阿凡达》“证件照”面部图形*外观“视觉设计”动画接口按钮*菜单*emoji *表情符号*“人的因素”

证据选择和数据图表

每个资料库的搜寻结果均导入EndNote (Clarivate) [20.],其中副本被删除。根据标题和摘要筛选研究。符合资格标准的研究进展到全文筛查。然后对研究全文进行筛选,以确定最终的资格。文章由2个评分者中的1个进行筛选。评分者随机选出20篇文章,一式两份进行筛选,结果一致率为100%。开发了自订表格,并用于数据图表(多媒体附件1).提取的数据包括人口、样本量、年龄、性别、研究国家、文化背景、健康领域、虚拟助理的目的、虚拟助理的姓名、绿野仙踪设计、使用的设备、动画角色、输出模式、输入模式、交互是否被脚本化(参与者是否被告知该说什么)、交互持续时间、实验设计和研究结果。如果文章包含多项研究,则仅对符合资格标准的研究完成数据提取。如果一篇文章中包含多个符合条件的研究,则分别提取数据。如果测量了相关结果,但没有在实验条件之间进行统计比较,则联系作者以提供额外信息。

数据合成

汇总了纳入综述的所有研究的研究特征。当一项研究在多篇文章中报道时,文章被编译为一项研究,并注明主要参考文献,以及其他参考文献。为了促进不同研究设计的数据综合,构建了总体类别来描述健康领域、设计特征和结果。采用回顾性专题分析来确定相似的健康领域、设计特征和结果,以构建相关类别。数据提取完成后,编制所有报告的健康领域、设计特征和结果的列表。在熟悉数据后,第一作者使用归纳方法将它们分类为相似的类别(即,由没有预先分类的数据指导)。这些类别由资深作者审阅、改进并命名。

对数据进行描述性综合。描述性统计被用来总结研究的主体。构建了设计特征和结果类别的矩阵来总结研究结果。矩阵中的结果是根据文章中报告的统计结果得出的。在检查相互作用时(例如,在析因设计中或检查与参与者特征的相互作用),主要影响包括在矩阵中。研究可以报告特定结果类别中的1个或多个结果的结果。结果分为阳性、阴性和无影响。如果研究在单一结果类别中报告了多个结果,则如果所有多个结果均显示积极影响,则将其分类为阳性,如果多个结果均报告积极和不显著影响,则将其分类为混合阳性,如果所有多个结果均报告消极影响,则将其分类为阴性,如果多个结果均报告消极和不显著影响,则将其分类为混合阴性,如果多个结果均报告消极和不显著影响,则将其分类为无影响。

来自两项研究的作者提供了额外的数据,这些数据在实验组之间没有进行比较。独立样本t进行了测试(2尾),结果包括在矩阵中。共有4项研究未对相关实验条件进行统计分析;因此,这些研究仅包含在文本描述中。


概述

在剔除重复的文章后,搜索发现了6879篇文章。在6879篇文章中,根据标题和摘要筛选,6763篇(98.31%)被认为不合格。我们通过参考文献列表确定了另外30条记录。共有146篇文章(116/6879,1.69%来自数据库搜索,30篇来自参考文献列表)进行全文筛选。在146篇文章中,有98篇(67.1%)被认为不合格;81人(55.5%)没有检查交互式虚拟健康助手,8人(5.5%)没有比较≥2个虚拟健康助手之间的设计特征,4人(2.7%)没有报告用户体验结果,2人(1.4%)不是成人样本,1人(0.7%)没有报告原始研究,1人(0.7%)不是会议论文期刊,1人(0.7%)没有将虚拟健康助手作为项目的主要组成部分。在146篇文章中,最终48篇(32.9%)文章被纳入范围评审(图1).从48篇文章中,确定了45项独特的研究(5项研究在多篇文章中报道,而3篇文章包含多项研究)。

图1。PRISMA(系统评价和元分析的首选报告项目)流程图。VHA:虚拟健康助手。
查看此图

多媒体附件221-68]提供了综述中包括的所有研究的参与者特征和研究设计的概述。表2总结了研究主体的特点。研究中使用的虚拟助手被分为8个健康领域:体育活动(旨在增加锻炼)、营养(旨在改善饮食)、饮酒(旨在减少饮酒)、心理健康(例如,旨在改善情绪)、医疗信息或治疗(例如,讨论结肠直肠癌筛查)、性健康(例如,提供关于性传播感染的建议)、多种健康行为(例如,旨在改善运动和饮食),以及其他(例如,旨在预防腕管综合症)。在文献中总共检查了27个设计特征。这些被分为5类:视觉设计(如动画化身的现实主义、年龄和体型)、界面设计(如输入方式)、对话风格和关系行为(如移情、关系行为和个性)、视觉和对话设计的结合(如同时评估语言和背景场景的可变性)、文化和组织关联(如文化定制的论证和外观;看到表3有关设计特性的完整列表)。我们确定了140个结果变量,分为9类:虚拟助理人格特征(如可信和智能)、关系(如亲密度和关系亲密度)、易用性(如认知负荷和易用性)、满意度(如享受感、满意度和有用性)、情感(如积极和消极影响)、使用意图(如继续使用虚拟助理的意图)、投入度(如互动时长)、披露性(如自我披露细节和亲密度);看到多媒体以类别分类的完整结果列表)。结果评估最常用的李克特量表,服务器日志和对话记录用于评估参与性和披露性。

大多数研究是在美国进行的,近年来(即2017年至2020年)进行的研究数量更多。几位作者领导了多项研究(如Bickmore [25-272931],奎迪[3435], Olaffsson, [5354],戒指[56-58],周[6768])。大多数研究检查了对话风格和关系行为或视觉设计,并评估了性格、满意度、关系和使用意图等类别的结果。虚拟助理最常与心理健康和身体活动相关。那些研究多种健康行为的人经常同时检查身体健康和营养。大多数虚拟助手都有一个动画头像,使用语音输出和多项选择输入。大多数虚拟助手都是自动化的(没有使用向导盎司设计),参与者的输入没有脚本化。研究最常采用受试者间设计,在单次会议中有21至100名参与者进行,参与者被分配去评估一个版本的虚拟助手。参与者大多来自普通人群,女性比例高于男性。有关智能虚拟代理和人机交互的跨学科研究领域的研究最常发表在会议论文集上,与健康相关领域的研究较少发表。

表2。研究特点总结(N=45)。
研究特点 值,n (%)
一年

2017 - 2020 18 (40)

2013 - 2016 11 (24)

2009 - 2012 10 (22)

2005 - 2008 6 (13)
国家

美国 25 (56)

联合王国 4 (9)

其他 7 (16)

不可用 9 (20)
样本大小

1 - 6 (13)

21-50 16 (36)

51 - 100 14 (31)

101 - 200 5 (11)

201 - 500 4 (9)
持续时间

单一的会话 37 (82)

多个会话 8 (18)
健康领域

心理健康 11 (24)

体育活动 10 (22)

多种健康行为 7 (16)

医疗信息或治疗 6 (13)

营养 4 (9)

性健康 2 (4)

酒精消费 1 (2)

其他 4 (9)
设计类别一个

对话风格和关系行为 22 (49)

视觉设计 12 (27)

界面设计 6 (13)

文化和组织归属 5 (11)

结合视觉和对话设计 2 (4)
结果分类

个性 30 (67)

满意度 20 (44)

的关系 19 (42)

使用的目的 17 (38)

订婚 11 (24)

易用性 8 (18)

情感 7 (16)

信息披露 5 (11)
虚拟助手特性

动画《阿凡达》


是的b 31 (69)


没有 14 (31)

输出


演讲c 33 (73)


文本 11 (24)


不可用 1 (2)

输入


多项选择 26 (58)


演讲c 11 (24)


文本 7 (16)


不可用 1 (2)

绿野仙踪


没有 37 (82)


是的 8 (18)

脚本


没有 41 (91)


是的 4 (9)

一个N和为>45项研究和100%,因为2项研究检查了多个类别的设计特征。

b包括至少一项实验条件使用动画化身的研究。

c包括至少一个实验条件使用语音的研究。

表3。研究结果总结(N=41)。
设计特点 值,n (%) 结果(效果)


个性 的关系 易用性 满意度 情感 使用的目的 订婚 信息披露
视觉设计

动画角色(vs没有视觉呈现) 3 (7)
  • 混合负[48一个, (62
  • 无显著影响[51
混合负[48一个, (62 无显著影响[48一个 无显著影响[48一个, (5162 无显著影响[48一个, (51 无显著影响[48一个 - - - - - -b - - - - - -

现实(vs卡通) 4 (10)
  • 积极的(64
  • 混合负[57
  • 无显著影响[5762
无显著影响[62 无显著影响[64
  • 好坏参半[64
  • 无显著影响[62
- - - - - -
  • 积极的(64
  • 无显著影响[57c(2)研究
- - - - - - - - - - - -

人(对机器人) 1 (2) 混合负[62 混合负[62 - - - - - - 混合负[62 - - - - - - - - - - - - - - - - - - - - - - - -

年轻(vs年长) 1 (2) 无显著影响[64 - - - - - - 无显著影响[64 好坏参半[64 - - - - - - 无显著影响[64 - - - - - - - - - - - -

胖(苗条) 1 (2) 积极的(63 无显著影响[63 - - - - - - - - - - - - - - - - - - 无显著影响[63 - - - - - - - - - - - -

熟悉(vs陌生) 1 (2) 混合负[64 - - - - - - 无显著影响[64 混合负[64 - - - - - - 无显著影响[64 - - - - - - - - - - - -

医疗职业装(vs休闲装) 1 (2) 积极的(55 积极的(55 - - - - - - - - - - - - - - - - - - 积极的(55 - - - - - - - - - - - -

医务室(vs空房间) 1 (2) 好坏参半[55 无显著影响[55 - - - - - - - - - - - - - - - - - - 无显著影响[55 - - - - - - - - - - - -

镜头角度的可变性(vs无可变性) 3 (7)
  • 好坏参半[58
  • 无显著影响[58c(2)研究
- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - 无显著影响[58c(3)研究 - - - - - -
界面设计

语音输入(相对于文本或多项选择) 3 (7) 无显著影响[33 无显著影响[33 混合负[32 - - - - - - - - - - - - - - - - - - 积极的(52 - - - - - -

运动发起(vs用户发起) 1 (2) - - - - - - 积极的(56 - - - - - - - - - - - - 积极的(56 - - - - - - 无显著影响[56 - - - - - -

礼貌提醒铃声(vs .不礼貌) 1 (2) 积极的(25 - - - - - - - - - - - - - - - - - - - - - - - - 积极的(25 - - - - - - - - - - - -
对话风格和关系行为

共情和关系行为(vs无) 7 (17)
  • 积极的(4851
  • 好坏参半[31
  • 无显著影响[40d, (49
  • 好坏参半[48
  • 无显著影响[2749
无显著影响[48
  • 积极的(48
  • 好坏参半[273151
  • 无显著影响[49
  • 好坏参半[2739
  • 无显著影响[4851
  • 积极的(3148
  • 无显著影响[27
无显著影响[40 积极的(31

情绪表达(vs没有) 3 (7) 积极的(3443 无显著影响[343543 - - - - - - 无显著影响[43 无显著影响[34 - - - - - - - - - - - - - - - - - -

自我表露(vs没有) 3 (7)
  • 积极的(47e
  • 无显著影响[29
积极的(4447 - - - - - -
  • 积极的(47
  • 好坏参半[29
- - - - - - - - - - - - 积极的(2947
  • 好坏参半[47e
  • 积极的(44

人格(各种)f 3 (7)
  • 积极的(61
  • 无显著影响[36
  • 好坏参半[60
  • 无显著影响[36
  • 积极的(61
  • 无显著影响[36
无显著影响[36 无显著影响[36 无显著影响[3660 无显著影响[36 - - - - - -

会话记忆(vs无会话记忆) 2 (5)
  • 好坏参半[36
  • 无显著影响[23
好坏参半[36 无显著影响[36 无显著影响[2336 无显著影响[36 无显著影响[2336 无显著影响[2336 - - - - - -

幽默(vs没有) 1 (2) 好坏参半[36 无显著影响[36 无显著影响[36 好坏参半[36 无显著影响[36 无显著影响[36 无显著影响[36 - - - - - -

表情符号(vs无) 1 (2) 无显著影响[37 - - - - - - - - - - - - 无显著影响[37 - - - - - - - - - - - - 无显著影响[37 - - - - - -

说唱(vs无) 1 (2) 混合负[53 好坏参半[53 - - - - - - 无显著影响[53 - - - - - - 无显著影响[53 - - - - - - - - - - - -

参与者控制面部和声音表达(vs无) 1 (2) - - - - - - - - - - - - 无显著影响[26 好坏参半[26 - - - - - - - - - - - - - - - - - - - - - - - -

限制为积极的用户响应选项(与允许的消极响应相比) 1 (2) 无显著影响[54 无显著影响[54 - - - - - - 混合负[54 - - - - - - 无显著影响[54 - - - - - - - - - - - -
结合视觉和对话设计

拟人化(名称、静态头像和对话语言vs无) 1 (2) - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - 混合负[59

对话结构、语言和场景的可变性(vs无可变性) 1 (2) 积极的(29 - - - - - - - - - - - - - - - - - - - - - - - - 积极的(29 积极的(29 - - - - - -
文化和组织归属

有文化针对性的论证(vs .没有) 2 (5) 无显著影响[65 - - - - - - - - - - - - 积极的(50 - - - - - - - - - - - - - - - - - - - - - - - -

符合文化的外观(vs .没有) 3 (7) 无显著影响[6567 负(67 无显著影响[67 无显著影响[5067 - - - - - - 无显著影响[67 - - - - - - - - - - - -

与文化相适应的论证和场景相结合(vs没有) 1 (2) 无显著影响[68 无显著影响[68 无显著影响[68 无显著影响[68 - - - - - - 无显著影响[68 - - - - - - - - - - - -

病人助理(vs研究员或政府雇员) 1 (2) 好坏参半[66 - - - - - - - - - - - - 好坏参半[66 - - - - - - 积极的(66 - - - - - - - - - - - -

一个结果仅适用于无同情心的头像(有同情心的头像在没有头像的情况下有额外的对话)。

b没有研究检查了设计特征和结果的组合。

c文章中报道的多项研究都得到了类似的结果。

d在研究的不同时间点也报告了类似的结果[39].

e在研究的不同时间点也报告了类似的结果[46].

f表明人格的任何影响(没有一致的比较)。

表3根据检查的设计特征和测量的结果类别,总结研究结果。当一项研究的相同结果在多篇文章中被报道时,在多媒体附件2是使用。其他参考文献用于未在主要研究中报告的结果。总共有4项研究没有对相关实验条件进行统计分析比较;因此,这些研究没有被纳入表3

以下段落重点介绍了在表3并包括研究的叙述综合,这些研究没有在表3

视觉设计

大约7%(3/41)的研究考察了使用带有动画头像的虚拟助手与使用只有文本或语音但没有视觉表现的虚拟助手的用户体验是否存在差异[485162].结果一般不显著[485162],但使用动画角色会带来一些复杂的负面影响[4862].另一项研究没有包括在表3得出结论,拥有动画头像的虚拟助手比只有语音的助手更受欢迎;然而,这些分析包括了真实助手和虚拟助手[45].

大约22%(9/41)的研究考察了动画头像的外观,10%(4/41)的研究考察了使用更真实的人类头像的虚拟助手与使用更卡通的人类头像时用户体验的差异[576264].尽管使用更真实的角色会产生一些积极和混合的积极影响[64],更多影响不显著[576264], 1为负[57].2%(1/41)的研究检查了虚拟化身的种类,发现使用人类虚拟化身与使用机器人虚拟化身有多种负面影响[62].2%(1/41)的研究考察了年龄,研究发现,与使用年龄较大的虚拟形象相比,使用年轻外观的虚拟形象在满意度方面有好坏参半的积极影响,但对其他结果没有显著影响[64].2%(1/41)的研究考察了体型,研究发现,与苗条的化身相比,肥胖的化身对性格特征有积极影响,但对其他结果没有显著影响。63].2%(1/41)的研究考察了化身的熟悉程度,研究发现,与使用不熟悉的化身相比,使用看起来像参与者在会议开始时遇到的健康教练的化身会产生负面和不显著的影响[64].2%(1/41)的研究检查了化身的服装,这些研究发现,与休闲装相比,医疗专业服装的效果始终是积极的[55].

2%(1/41)的研究检查了化身背后的背景场景,结果发现,与代表一个空房间相比,代表一个医疗办公室对人格的影响好坏参半,但对其他测量结果没有显著影响[55].大约7%(3/41)的研究(全部在1篇论文中报道)检查了是否存在相机位置、距离和焦点与用户体验相关,但大多没有显著影响[58].

界面设计

大约7%(3/41)的研究检查了输入方式(用户是否使用语音、文本或多项选择进行交流)对用户体验的影响,并发现与其他方式相比,语音输入的积极影响、混合负面影响和不显著影响的组合[323352].一个基于菜单的虚拟助手被一项未包括在内的进一步研究检查表3,并得出结论,语音输入与电话按键输入在可用性上并无差异[42].

2%(1/41)的研究检查了虚拟助手和用户之间的对话是如何发起的,这些研究发现,与用户发起相比,自动运动发起具有积极和不显著的影响[56].2%(1/41)的研究检查了与用户开始对话时使用的铃声类型,结果发现,与不太礼貌的铃声相比,更礼貌的铃声会产生积极的影响。25].

会话风格与关系行为

大约17%(7/41)的研究考察了共情和关系行为——共情言语反馈和非言语行为,如面部表情和手势[27313940484951].虽然有些影响并不显著[2740484951],更多的效果是正面或混合正面,71%(5/7)的研究显示至少有一些正面效果[2731394851].大约7%(3/41)的研究检查了情绪表达——使用面部表情和声音来表达情绪——并发现了一些混合的积极影响[3443]但更不显著的影响[343543].大约7%(3/41)的研究检查了自我表露——虚拟助手是否会告诉用户关于自己的信息——发现了大部分积极的影响[294447].大约7%(3/41)的研究考察了性格[366061].虽然发现了一些正面和混合正面的影响[6061],大多数影响不显著[3660].

大约5%(2/41)的研究检查了对话记忆——虚拟助理是否记得先前对话中的信息——并发现了一些混合的积极效果[36]但大多数影响并不显著[2336].另一项研究没有包括在表3比较当虚拟助手没有回忆起以前的会话和当虚拟助手回忆起以前的会话时用户的第一次交互[38].作者得出的结论是,当虚拟助理回忆起他们的会话时,用户更加积极;然而,这些谈话不那么私人。

有2%(1/41)的研究考察了幽默,这些研究发现,与不包含幽默相比,包含幽默的大多数影响并不显著[36].2%(1/41)的研究检查了使用表情符号,发现使用表情符号与不使用表情符号没有显著影响[37].2%(1/41)的研究对说唱进行了检查,结果发现,与不包括说唱相比,包括说唱的混合正面影响、混合负面影响和不显著影响[53].2%(1/41)的研究检查了允许参与者控制虚拟助理的面部和声音表达,与不允许这种控制相比,发现了不显著的和混合的积极影响[26].大约2%(1/41)的研究检查了限制用户只对有关他们的信心和动机的问题做出积极的回答,而同时也提供消极的多项选择回答选项[54].研究发现,限制用户做出积极回应,会产生负面和中性的混合影响。一项未列入的进一步研究表3研究用户对基于用户眼神交流而改变行为的虚拟助手的评价是否比总是表现出专注或总是无聊或随机改变行为的虚拟助手更积极[41].作者得出的结论是,根据用户的眼神接触而改变似乎比随机改变行为更正常,但并没有证实改变行为比不变行为更正常的假设。

结合视觉和对话设计

2%(1/41)的研究考察了拟人化——使用名字、静态头像和对话语言——这些研究发现拟人化对用户的信息披露有负面影响[59].2%(1/41)的研究考察了对话结构(对话的顺序和使用的话语)和背景场景的可变性,这些研究发现,与没有可变性相比,可变性具有一致的积极作用[29].

组织与文化归属

大约10%(4/41)的研究考察了文化定制——将虚拟助理的文化与用户的文化相匹配[50656768].约有5%(2/41)的研究考察了虚拟助理辩论的文化剪裁(例如,讨论与文化相关的话题)[5065], 50%(1/2)的人认为有积极作用[50].约7%(3/41)的研究考察了虚拟助理的外表和家庭环境的文化剪裁,发现主要没有显著影响[506567].2%(1/41)的研究检查了文化定制背景场景和论证的结合,发现没有显著影响[68].2%(1/41)的研究考察了虚拟助理的组织隶属关系——虚拟助理自称是谁,以及背景场景中提供的上下文——发现,与虚拟助理作为进行研究的医疗团队成员或政府雇员相比,虚拟助理作为患者助理具有积极的影响[66].


主要研究结果

本研究旨在提供实验研究的概述,研究虚拟健康助理的设计特征如何影响用户体验。这是一个不断增长的科学研究领域,综合研究了高度多样化的健康领域、设计特征和结果。最常见的健康领域是身体活动和心理健康,与特定健康状况相关的虚拟助手相对较少。大约一半的研究被归类为检查对话风格和关系行为的设计,最常见的设计特征是共情和关系行为。最常见的测量结果是人格特征、满意度、人际关系和使用意图。

本研究亦旨在总结虚拟健康助理的设计特征如何影响用户体验的实验研究成果。一般来说,研究是零零碎碎的,很少有设计特征有足够的证据来得出关于它们对用户体验影响的结论。与此相反的2个设计特征是虚拟助理的共情、关系行为和自我表露,这些都是大量研究的焦点。研究表明,这三种(即共情、关系行为和自我表露)都与更积极的用户体验有关。越来越多证据表明,其他设计特征包括为虚拟形象提供更真实的人类表现,为虚拟形象提供医疗服装,这两者都可能与更积极的用户体验有关。最后,迄今为止的证据表明,使用动画头像(与没有头像相比)和文化剪裁可能不会影响用户体验;然而,还需要更多的研究来探索这些发现。

这项研究最明显的发现之一是,在虚拟健康助理中使用同理心和关系行为似乎对用户体验有积极影响。同理心可能有助于与虚拟助理建立信任和融洽关系。同理心与用户满意度相关的发现,与研究表明真实医疗服务提供者的同理心与患者满意度之间存在正相关的结果相一致[6970].结果并不一致为阳性;然而,这可能与虚拟助手之间的差异有关。例如,对于结果类别的人格特征,在5项研究共情和关系行为的研究中,3项(60%)研究显示使用动画角色产生积极影响,包括非语言关系行为[314851].相比之下,40%(2/5)的研究显示,纯文本助手没有任何影响[4049].这可能是因为用户并不期望只有文本的助手能表现出同理心;因此,同理心的存在与否对虚拟助理的评分没有影响。另外,当不存在非语言关系行为(如表情和手势)时,同理心的作用可能会减弱。

研究表明,使用自我披露(即提供关于自己的信息)的虚拟健康助理会带来更积极的用户体验。无论自传体信息是关于虚拟助理作为计算机代理的经历,结果都是相似的[44]或包括一些不可能真实的人类经历[2947].自我表露对人际关系的形成很重要。71],尽管研究表明,真正的咨询师的自我表露可能会对来访者对咨询师的看法产生积极或有害的影响[72].用户对虚拟健康助理的自传故事反应积极,这一发现支持了上述观点计算机是社会行动者范式,用户对计算机做出社交反应,尽管他们知道自己不是人。7374].

对动画化身真实性的研究显示出了一些积极的效果;然而,更多的是不显著的。的恐怖谷理论表明,那些看起来像人类但不完全像人类的机器人可能会引发消极的情绪反应,而且比那些明显不是人类的机器人更不讨人喜欢。75].然而,在这篇综述中,在真实的实验条件下使用照片逼真表示的研究[64显示出积极的影响。还需要更多的研究来检验虚拟化身的真实感如何影响虚拟健康助手的用户体验。

1项研究的结果表明,让虚拟角色穿上医用服装会带来更积极的用户体验[55].虽然需要更多的研究来证实这一发现,但这是一项大型研究(n=308),所有结果测量结果一致。有趣的是,虚拟角色的背景设置(医务室或空房间)只对3个结果类别中的1个产生了混合的积极影响[55].

研究表明,在游戏中加入动画角色对用户体验没有影响,甚至在某些情况下会产生负面影响。然而,仔细观察,这可能是因为研究中使用的虚拟角色的性质,也可能受到动画和其他虚拟助手特征之间交互的影响。例如,Lisetti等人[48]的研究表明,与纯文本虚拟助手相比,具有中性面部表情和没有同理心对话的动画虚拟助手的用户体验更差,而具有表现力和同理心的虚拟助手比纯文本虚拟助手的用户体验更好。Nguyen和Masthoff [51]报告了类似的发现;一个无同理心的动画虚拟助手和一个无同理心的纯文本虚拟助手产生了类似的用户体验;然而,同理心动画虚拟助手比纯文本虚拟助手能带来更好的用户体验。综上所述,用户似乎希望具有类似人类表现形式的虚拟助理具有同理心和类似人类的关系行为,当这一期望没有得到满足时,用户体验就会较差。

总的来说,这项研究并没有显示出文化定制可以改善虚拟健康助理的用户体验。值得注意的是,尽管75%(3/4)的研究包括在海外出生的参与者(在中国[68]、印度[50],或说西班牙语的拉丁美洲国家[65]),所有研究的参与者都住在美国。这可能表明,对于生活在美国的不同文化的人来说,文化剪裁是不需要的,尽管更多的研究可以证实这一发现。还需要进一步的研究来确定文化剪裁是否会影响其他文化背景下的用户体验。

优势与局限

这一范围审查是在综合有关设计特征对虚拟健康助手的用户体验的影响的文献方面最严格的尝试。它遵循PRISMA-ScR指南进行范围审查,并搜索了大量数据库。它使用最高水平的证据-实验研究,只使用交互式虚拟健康助手,参与者可以输入到系统中,检查了广泛的设计特征。但是,我们承认,使用特定的搜索词来捕获虚拟助手和设计特征可能会遗漏一些结果。也有可能在其他数据库中也有其他文献来源。此外,定性数据被排除。这使得一种基于统计显著性的结构化方法能够综合数据,但可能忽略了一些关于用户体验的重要观点。

虽然综述的广度是一个主要优势,但所包括研究的异质性使其难以综合和解释结果。虚拟助手的研究目的存在相当大的异质性。优化设计技术在不同的健康领域中可能有所不同。例如,虽然没有发现使用表情符号的整体影响,但使用纯文本和带有表情符号的文本之间的信心评级的差异取决于虚拟助理是在讨论身体还是精神健康。37].此外,一些健康状况没有在研究中反映出来,例如神经认知障碍,如痴呆症。测量结果也存在显著的异质性。最常见的测量结果是人格、满意度、关系和使用意图。很少有研究调查易用性、参与度或披露性。虽然界面设计可能在决定易用性方面起着关键作用,但其他设计特征(如角色的视觉外观)可能不会影响易用性。更多研究用户如何与虚拟助手互动(参与和披露),特别是使用客观衡量方法,可能会补充对虚拟助手和互动的主观评分。

文献的另一个局限性是,一些研究将一组相似的特征合并为一个条件,因此很难确定哪个特征可能会对用户体验产生影响。例如,对共情和关系行为的研究通常包括言语共情和非言语关系行为。此外,在大多数研究中,参与者都是在一次互动后对虚拟助理进行评估的。旨在促进健康行为改变或为健康状况提供支持的项目通常是为持续使用而设计的。还需要进一步研究设计特征如何随着时间的推移影响用户体验。大多数虚拟助手都有动画头像和语音输出;但是,超过一半的用户只能从预定义的响应选项中进行选择。限制用户输入需要更简单的编程,并消除当虚拟助手误解用户输入或无法对超出其编程知识范围的查询作出响应时发生错误的风险[76].自然语言处理使用户能够使用不受约束的文本或语音进行交流,并实现更自然的用户导向的交流。使用自然语言处理的虚拟助手已普遍应用于医疗保健[77随着人工智能的快速发展,它们可能会变得越来越复杂。应该对这些类型的虚拟健康助手的设计和用户体验进行更多的研究。

建议

研究表明,设计特征会影响虚拟健康助手的用户体验;因此,研究人员和软件开发人员应该在开发和测试过程中仔细考虑虚拟健康助手的外观和感觉。在此范围审查结果的基础上,以下关于设计虚拟健康助手和推进研究领域的建议可能对健康研究人员和软件开发人员有用:

  1. 设计虚拟健康助手来表达语言同理心,例如,理解用户的感受
  2. 设计虚拟健康助手,向用户披露自己的个人信息,例如,他们的过去和个人偏好的信息
  3. 考虑设计一个更逼真的人的化身,穿着医疗专业服装
  4. 如果设计一个动画虚拟健康助手,它应该显示非语言关系行为,例如情绪面部表情、手势和相互凝视
  5. 如果移情和关系行为无法结合在一起,考虑动画头像可能没有好处或成本效益
  6. 与目标用户一起进行形成性研究,并采用以用户为中心的设计方法,以确保软件满足用户的需求和偏好
  7. 进行进一步的系统研究,以复制和扩展先前的发现,特别是通过纵向研究设计,重复用户交互,客观参与结果,以及具有自然语言处理能力的虚拟助手

结论

虚拟健康助理可以按需提供健康信息和支持,并可能在未来应用于各种各样的目的,如提供公共卫生信息、健康教育、支持慢性疾病患者以及帮助健康的生活方式行为改变。这一范围审查审查了评估虚拟健康助理的设计特征如何影响用户体验的实验研究。这是一个快速发展的研究领域,但由于研究的异质性,很难综合和解释。尽管如此,某些设计特征对于改善用户体验还是很重要的。初步建议认为,对虚拟健康助理进行编程,使其表现出同理心,显示非语言关系行为,并透露有关自己的个人信息,可能会带来更积极的用户体验。在决定是否加入动画角色时,应考虑该角色是否能表现出同理心和非语言关系行为。未来的研究需要提高我们对虚拟健康助手的设计特征和用户体验之间关系的理解,特别是对重复用户交互的纵向研究设计。

致谢

CAM由医学研究未来基金新兴领袖基金(GNT1193862)支持。HTB由澳大利亚政府研究培训计划奖学金资助。资助者在研究设计、数据收集和分析、发表决定或手稿准备中没有任何作用。

作者的贡献

研资局和CAM构思和设计了这项研究。研资局进行资料库查册。RGC、BB进行筛选,RGC、BB、TF、CN、HTB、RV进行数据提取。研资局分析了数据并撰写了手稿。所有作者都对手稿进行了修改,并审核通过了最终版本。

利益冲突

没有宣布。

多媒体附件1

数据图表。

XLSX文件(Microsoft Excel文件),10kb

多媒体附件2

范围综述中纳入研究的特征。

DOCX文件,56 KB

多媒体

结果类。

DOCX文件,17kb

  1. Horgan D, Romao M, Morré SA, Kalra D.人工智能:文明的力量——以及更好的医疗保健。公共卫生基因组学2019;22(5-6):145-161 [免费全文] [CrossRef] [Medline
  2. Fitzpatrick KK, Darcy A, Vierhile M.使用全自动对话代理(Woebot)为有抑郁和焦虑症状的年轻人提供认知行为治疗:一项随机对照试验。JMIR Ment Health 2017 Jun 06;4(2):e19 [免费全文] [CrossRef] [Medline
  3. Maher CA, Davis CR, Curtis RG, Short CE, Murphy KJ。由人工智能虚拟健康教练提供的身体活动和饮食计划:概念验证研究。JMIR Mhealth Uhealth 2020年7月10日;8(7):e17558 [免费全文] [CrossRef] [Medline
  4. Cleres D, Rassouli F, Brutsche M, Kowatsch T, Barata F. Lena:一种基于语音的慢性阻塞性肺疾病患者远程监测的会话代理;2021年4月13日至17日;大学城,美国。在:第26届ACM智能用户界面会议论文集。2021年发表于:第26届ACM智能用户界面会议;2021年4月13日至17日;大学城,美国。[CrossRef
  5. 人-系统交互工效学。第11部分:可用性:定义和概念ISO。2018.URL:https://www.iso.org/obp/ui/#iso:std:iso:9241:-11:ed-2:v1:en[2021-11-29]访问
  6. Thüring M, Mahlke S.人与技术交互中的可用性,美学和情感。中华精神病学杂志2007 8月;42(4):253-264。[CrossRef
  7. Bhandari U, Chang K, Neben T.理解感知视觉美学对用户评价的影响:一个情感的角度。2019年1月;56(1):85-93。[CrossRef
  8. 设计语音用户界面:对话体验的原则。中国北京:奥莱利传媒有限公司;2016.
  9. 李斯特K,考夫兰T,伊涅斯托F, Freear N, Devine P.可访问的对话用户界面:设计的考虑因素。见:第17届国际全民网络大会论文集,2020年发表于:第17届国际全民网络大会论文集;2020年4月20日至21日;台北,台湾。[CrossRef
  10. 韦恩哈默N, Dolata M, Steigler S, Schwabe G.在数字导师的帮助下学习:影响学习过程的对话代理的设计方面。见:第53届夏威夷系统科学国际会议论文集,2020年发表于:第53届夏威夷系统科学国际会议;2020年1月;美国夏威夷。[CrossRef
  11. Strohmann T, Siemon D, Robra-Bissantz S.设计虚拟车载助手:创建令人信服的用户体验的设计指南。人工智能人机交互系统2019;11(2):54-78。[CrossRef
  12. Følstad A, Skjuve M, Brandtzaeg P.不同目的的聊天机器人:对聊天机器人的类型学来理解交互设计。在:互联网科学。可汗:施普林格;2019.
  13. Janssen A, Passlick J, Rodríguez Cardona D, Breitner MH.任何情境下的虚拟协助。总线Inf系统工程2020年4月06日;62(3):211-225。[CrossRef
  14. Holmes S, Moorhead A, Bond R, Zheng H, Coates V, Mctear M.医疗聊天机器人的可用性测试:我们可以使用传统方法来评估会话用户界面吗?2019年第31届欧洲认知人类工程学会议论文集发表于:第31届欧洲认知人类工程学会议;2019年9月10日至13日;英国贝尔法斯特。[CrossRef
  15. 张志刚,李志刚,张志刚。基于智能体的智能体设计研究进展。Int J Human computing Stud 2020 Jun;138:102409。[CrossRef
  16. Munn Z, Peters MD, Stern C, Tufanaru C, McArthur A, Aromataris E.系统性评价还是范围评价?对作者在系统评审方法和范围评审方法之间进行选择的指导。BMC Med Res methodo2018 11月19日;18(1):143 [免费全文] [CrossRef] [Medline
  17. 崔科,李丽丽,李丽娟,李丽娟,等。用于范围审查的PRISMA扩展(PRISMA- scr):检查表和解释。安实习医学2018年10月02日;169(7):467-473 [免费全文] [CrossRef] [Medline
  18. Richardson WS, Wilson MC, Nishikawa J, Hayward RS.构建良好的临床问题:基于证据的决策的关键。ACP J Club 1995; 23(3):A12-A13。[Medline
  19. Dahlbäck N, Jönsson A, Ahrenberg L.绿野仙踪研究-为什么和如何。基于知识的系统分析1993 Dec;6(4):258-266。[CrossRef
  20. 尾注的团队。尾注。EndNote X9版。费城,PA: Clarivate;2013.
  21. Amini R, Lisetti C, Yasavur U.行为改变健康干预的情感响应虚拟咨询师。在:推进设计科学的影响:从理论到实践。湛:施普林格国际出版;2014.
  22. Amini R, Lisetti C, Yasavur U, Rishe N.按需提供行为改变健康干预的虚拟健康顾问。发表于:IEEE医疗保健信息学国际会议论文集。2013年IEEE医疗保健信息学国际会议;2013年9月9日至11日;费城,美国宾夕法尼亚州。[CrossRef
  23. 与机器谈论健康:信息互动如何影响态度和认知?Hum commres 2016 9月15日;43(1):25-53。[CrossRef
  24. Bickmore T, Gruber A, Picard R.在自动化健康行为改变干预中建立计算机-患者工作联盟。患者教育计数2005 Oct;59(1):21-30。[CrossRef] [Medline
  25. Bickmore T, Mauer D, Crespo F, Brown T.劝导、任务中断与健康养生的依从性。见:说服性技术论文集,第二届说服性技术国际会议,说服性2007。2007年发表于:说服性技术,第二届说服性技术国际会议,说服性2007;2007年4月26-27日;帕洛阿尔托,加州,美国。[CrossRef
  26. Bickmore T, Ring L.个性化:由虚拟代理交付的最终用户编写健康叙事。见:智能虚拟代理,第10届国际会议,IVA 2010。2010发表于:智能虚拟代理,第10届国际会议,IVA 2010;2010年9月20-22日;费城,美国宾夕法尼亚州。[CrossRef
  27. 用关系代理安慰用户的实用方法。载于:计算机人工因素国际会议论文集。2007年发表于:CHI07:计算机人工因素国际会议;2007年4月28日至5月3日;圣何塞,加利福尼亚州,美国。[CrossRef
  28. 比克莫尔T,舒尔曼D,尹l .参与vs.欺骗:虚拟人与人类自传。见:智能虚拟代理,第九届国际会议,IVA 2009。2009发表于:智能虚拟代理,第九届国际会议,IVA 2009;2009年9月14-16日;荷兰的阿姆斯特丹。[CrossRef
  29. 肖曼,尹林。维持与关系代理的长期干预参与。应用Artif Intell 2010 july 01;24(6):648-666 [免费全文] [CrossRef] [Medline
  30. 比克莫尔T,皮卡德r。载于:中国计算机学会2004年计算人因会议论文集。2004年发表于:中国计算机学会2004年计算人因会议论文集;2004年4月24-29日;奥地利的维也纳。[CrossRef
  31. 比克莫尔TW,皮卡德RW。建立和维护长期的人机关系。ACM Trans Comput Hum Interact 2005 Jun 01;12(2):293-327。[CrossRef
  32. 陈娟,李志强,李志强。语音识别对消费者数字健康任务中问题解决和回忆的影响:受控实验室实验。J Med Internet Res 2020 Jun 01;22(6):e14827 [免费全文] [CrossRef] [Medline
  33. 周e,我能私下问你点事吗?在:CHI '19: 2019年CHI计算系统中人因会议论文集。2019年发表于:CHI '19: CHI计算系统中人因会议论文集;2019年5月4日至9日;英国苏格兰格拉斯哥。[CrossRef
  34. Creed C, Beale R.用户与情感营养教练的互动。交互计算2012 9月24日(5):339-350。[CrossRef
  35. Creed C, Beale R, Cowan B.具身代理的情绪表达在多次交互中的影响。交互计算2014年1月29日;27(2):172-188。[CrossRef
  36. 李志刚,李志刚。自动对话中的幽默、人际关系维护与人格匹配:一项对照研究。交互计算2008年5月;20(3):342-353。[CrossRef
  37. 王艳,王艳。表情符号在辅助健康教练系统会话界面交互中的作用。见:第12届EAI医疗普适计算技术国际会议论文集,2018年发表于:普适健康'18:第12届EAI医疗普适计算技术国际会议;2018年5月21日至24日;美国纽约。[CrossRef
  38. Ferland L, Koutstaal w,你今天过得怎么样?会话代理中用户建模的(非)预期的社会语言学效果。2020年CHI '20: CHI计算系统中人因会议论文集。2020年4月25日至30日;檀香山,嗨,美国。[CrossRef
  39. ganddeharioun A, McDuff D, Czerwinski M, Rowan K.为理解行为改变聊天机器人的情商。第八届情感计算与智能交互国际会议论文集,2019发表于:第八届情感计算与智能交互国际会议论文集;2019年9月3日至6日;英国剑桥。[CrossRef
  40. ganddeharioun A, McDuff D, Czerwinski M, Rowan K. EMMA:情感感知健康聊天机器人。第八届情感计算与智能交互国际会议论文集,2019发表于:第八届情感计算与智能交互国际会议论文集;2019年9月3日至6日;英国剑桥。[CrossRef
  41. 格里隆·H,塔尔曼·D.眼神接触是改变虚拟角色行为的触发因素。载于:虚拟康复学报。2008年发表于:虚拟康复;2008年8月25-27日;温哥华,卑诗省,加拿大。[CrossRef
  42. Grover A, Plauché M, Barnard E, Kuun C.使用语音对话系统获取艾滋病毒健康信息:触摸与语音。载于:信息与通信技术与发展国际会议论文集,2009年发表于:信息与通信技术与发展国际会议;2009年4月17日至19日;多哈,卡塔尔。[CrossRef
  43. Guadagno RE, Swinth KR, Blascovich J.具身代理和化身的社会评价。计算人类行为2011 11月;27(6):2380-2385。[CrossRef
  44. 人们喜欢高度公开自己的虚拟咨询师。种马健康技术信息2011;167:143-148。[Medline
  45. 金凯,李文杰,陈建平,陈建平,陈建平。基于计算机中介的用户体验研究。见:2019年IEEE人工智能和虚拟现实(AIVR)国际会议论文集。出席:2019 IEEE人工智能与虚拟现实国际会议(AIVR);2019年12月9日至11日;加利福尼亚州圣地亚哥[CrossRef
  46. Lee Y, Yamashita N, Huang Y.设计一个聊天机器人作为中介,以促进向真正的心理健康专业人员进行深度自我披露。Proc ACM Human Comput Interact 2020年5月28日;4(1):1-27。[CrossRef
  47. 李勇,山下宁,黄勇,傅伟。“我听到你了,我感觉到你了”:通过聊天机器人鼓励深入的自我表露。2020 CHI Conference on Human Factors In Computing Systems. 2020 CHI Conference on Human Factors In Computing Systems。2020年4月25日至30日;檀香山,嗨,美国。[CrossRef
  48. Lisetti C, Amini R, Yasavur U, Rishe n,我可以帮你改变!移情虚拟代理提供行为改变健康干预。ACM Trans Manage Inf Syst 2013 Dec 01;4(4):1-28。[CrossRef
  49. 刘波,孙达SS。机器应该表达同情和同理心吗?健康建议聊天机器人的实验。网络心理行为学网络2018年10月;21(10):625-636。[CrossRef] [Medline
  50. Murali P, khi A, Parmar D, Bickmore T.在设计文化定制虚拟代理时,论证比外观更重要。第19届自主代理和多代理系统国际会议论文集,2020年发表于:第19届自主代理和多代理系统国际会议论文集;2020年5月9日至13日;新西兰奥克兰。[CrossRef
  51. 阮海涛,刘志军。基于多模态共情反馈的共情计算机设计。见:第四届劝导技术国际会议论文集。2009发表于:第四届劝导技术国际会议;2009年4月26-29日;克莱蒙特,加州,美国。[CrossRef
  52. 诺维利,德罗斯,马佐塔。用户对具身会话代理的态度:交互模式的影响。《语用学》2010年9月42日(9):2385-2397。[CrossRef
  53. Olafsson S, Kimani E, Asadi R, Bickmore t,这是说唱。在:智能虚拟代理。可汗:施普林格;2017.
  54. Olafsson S, O'Leary T, Bickmore T.强迫的改变-对话代理促进行为改变的信心。见:第13届医疗普适计算技术国际会议记录,2019年发表于:第13届医疗普适计算技术国际会议记录;2019年5月20-23日;特兰托,意大利。[CrossRef
  55. Parmar D, Olafsson S, Utami D, Bickmore T.扮相:服装和环境对虚拟健康咨询师印象的影响。2018年第18届ACM智能虚拟代理国际会议论文集发表于:第18届ACM智能虚拟代理国际会议;2018年11月5日至8日;澳大利亚悉尼。[CrossRef
  56. Ring L, Shi L, Totzke K, Bickmore T.老年人的社会支持代理:家庭中的纵向情感计算。J Multimodal User Interfaces 2014 Jun 18;9(1):79-88。[CrossRef
  57. Ring L, Utami D, Bickmore t。在:智能虚拟代理。可汗:施普林格;2014.
  58. Ring L, Utami D, Olafsson S, Bickmore T.使用自动摄像机运动增加与虚拟代理的接触。在:智能虚拟代理。可汗:施普林格;2016.
  59. Sannon S, Stoll B, DiFranzo D, Jung M, Bazarova N.拟人化和交互性对对话代理的压力相关披露的影响。在:计算机支持的协作工作和社会计算,2018年发表于:CSCW '18:计算机支持的协作工作和社会计算;2018年11月3日至7日;泽西城,美国。[CrossRef
  60. 沙米希,蔡温斯基,马克·G,诺沃特尼·M,班尼特·G。兼容虚拟代理首选对话风格的探索性研究。在:智能虚拟代理。可汗:施普林格;2016.
  61. Smestad T, Volden F.聊天机器人的个性很重要:改善聊天机器人界面的用户体验。在:互联网科学。可汗:施普林格;2019.
  62. Straßmann C, Krämer NC, Buschmeier H, Kopp S.在与健康相关的交互中评估虚拟健康代理的外观和体现的年龄相关差异:实验实验室研究。J Med Internet Res 2020年4月23日;22(4):e13726 [免费全文] [CrossRef] [Medline
  63. 范维格特HC, Konijn E, Hoorn J, Veldhuis J.为什么胖界面字符是更好的电子健康顾问。见:第六届智能虚拟代理国际会议论文集,IVA 2006。2006年发表于:第六届智能虚拟代理国际会议,IVA 2006;2006年8月21-23日;CA,美国。[CrossRef
  64. 韦森,温克斯C, Halteren A.为慢性患者开发虚拟教练:相似度,熟悉度和现实主义影响的用户研究。见:第11届说服技术国际会议论文集-卷9638。2016年发表于:第十一届劝导技术国际会议;2016年4月5日至7日;奥地利的萨尔茨堡。[CrossRef
  65. 尹丽玲,陈晓明,陈晓明。语言与文化一致性对对话主体说服的影响。在:智能虚拟代理。柏林,海德堡:施普林格;2010.
  66. 张泽,陈晓明,张晓明。组织归属感感知及其对患者信任的影响:个体对话主体的角色建模。患者教育杂志2017年9月;100(9):1730-1737。[CrossRef] [Medline
  67. 周珊珊,毕克摩,帕斯卡-奥洛M,杰克B.代理用户对虚拟出院护士的一致性和满意度。在:智能虚拟代理。可汗:施普林格;2014.
  68. 周松,张震,毕克默。适应中国文化的有说服力会话代理。发表于:2017年文化与计算国际会议论文集。2017年9月10-12日;日本京都。[CrossRef
  69. 王浩,Kline JA, Jackson BE, Laureano-Phillips J, Robinson RD, Cowden CD,等。急诊医师自述共情与患者满意度之间的关系PLoS One 2018 9月13日;13(9):e0204113 [免费全文] [CrossRef] [Medline
  70. Hojat M, Louis DZ, Maxwell K, Markham FW, Wender RC, Gonnella JS。一个简单的仪器来衡量病人对初级保健医生的总体满意度。Fam Med 2011 Jun;43(6):412-417 [免费全文] [Medline
  71. Derlega V, Winstead B, Greene K.自我表露和开始亲密关系。在:恋爱开始手册。美国纽约:心理学出版社;2008.
  72. Audet CT, Everall RD.治疗师自我表露与治疗关系:来访者视角的现象学研究。英国《指导意见》2010年8月;38(3):327-342。[CrossRef
  73. Nass C, Steuer J, Tauber E.计算机是社会行动者。载于:计算机系统中人因因素SIGCHI会议论文集。1994年发表于:CHI' 94:计算机计算系统中人因因素会议;1994年4月24日至28日;波士顿,马萨诸塞州,美国。[CrossRef
  74. Nass C, Moon Y.机器和无脑:对计算机的社会反应。《社会问题》2000年1月;56(1):81-103。[CrossRef
  75. Mori M, MacDorman K, Kageki N.恐怖谷[来自野外]。IEEE机器人自动化杂志2012 Jun;19(2):98-100。[CrossRef
  76. McTear MF。语音对话技术。ACM计算研究2002年3月34日(1):90-169。[CrossRef
  77. Milne-Ives M, de Cock C, Lim E, Shehadeh MH, de Pennington N, Mole G,等。人工智能会话代理在医疗保健中的有效性:系统回顾。J Med Internet Res 2020年10月22日;22(10):e20346 [免费全文] [CrossRef] [Medline


PRISMA-ScR:系统评价和元分析的首选报告项目范围评价的扩展


R·库卡夫卡编辑;提交02.07.21;同行评议:A Mazeas, K Nalin, H Tanaka, R Raeside, V Stara, M Rampioni;对作者25.08.21的评论;修订本收到19.09.21;接受21.10.21;发表21.12.21

版权

©Rachel G Curtis, Bethany Bartel, Ty Ferguson, Henry T Blake, Celine Northcott, Rosa Virgara, Carol A Maher。最初发表于《医疗互联网研究杂志》(//www.mybigtv.com), 2021年12月21日。

这是一篇开放获取的文章,根据创作共用署名许可(https://creativecommons.org/licenses/by/4.0/)的条款发布,允许在任何媒介上无限制地使用、分发和复制,前提是正确引用最初发表在《医学互联网研究杂志》上的原创作品。必须包括完整的书目信息,//www.mybigtv.com/上的原始出版物的链接,以及此版权和许可信息。


Baidu
map