这是一篇开放获取的文章,根据创作共用署名许可协议(http://creativecommons.org/licenses/by/2.0/)发布,该协议允许在任何媒体上不受限制地使用、分发和复制,前提是在JMIR Human Factors上首次发表的原始作品被恰当引用。必须包括完整的书目信息,http://humanfactors.www.mybigtv.com上的原始出版物链接,以及版权和许可信息。
基于传感器的人体运动记录对于神经障碍运动症状的评估越来越重要,而不仅仅是康复目的。evaluate MS是一种运动记录和分析系统,用于利用深度感知计算机视觉对多发性硬化症(MS)患者的运动功能障碍进行自动化分类。它的目的是提供一个比目前可能的更一致和更细粒度的运动功能障碍测量。
在医疗专业人员和多发性硬化症患者中测试评估多发性硬化症的可用性和可接受性。
在3个中心开展了一项前瞻性混合方法研究。在1小时的培训课程后,12名卫生专业人员(6名神经学家和6名护士)使用evaluate MS捕获51名志愿者患者的标准化动作记录。定义了有效性、效率和可接受性的度量标准,并用于分析evaluate MS捕获的数据、每次检查的视频记录、反馈问卷和后续访谈。
所有卫生专业人员都能够使用evaluate MS完成记录,在4个指标(运动性能、横向定位和清晰的摄像机视角但不包括距离定位)中的3个指标上达到较高的标准化水平。结果不受患者身体或认知残疾水平的影响。在李克特量表问题和积极的访谈评论上得分较高,患者和医护人员都认为evaluate MS易于使用。在所有考虑的维度上,包括对未来使用的态度、(与卫生专业人员的)互动以及对evaluate MS的总体看法,evaluate MS都被患者高度接受,卫生专业人员也接受了evaluate MS,但由于需要改变患者互动风格而产生了更大的矛盾心理。在参与研究的中心之间,结果几乎没有变化,神经学家和护士之间也没有差异。
在典型的临床环境中,evaluate MS对患者和卫生专业人员都是可用和可接受的,生成的数据质量适合于临床分析。迭代设计过程似乎已成功地考虑到使一系列保健专业人员在新环境中只需最少培训就能使用evaluate MS的因素。该研究表明,通过对临床环境给予适当关注的设计方法,将泛在传感技术从研究转移到临床的潜力。
近年来,用于实际跟踪人体运动的鲁棒深度传感摄像机的发展正迅速被用于运动功能障碍的评估和康复。深度传感相机,如微软Kinect(微软,雷德蒙德,WA, USA),捕获的视频图像中每个像素都有三维位置。深度视频通过先进的计算机视觉和机器学习算法处理,可以量化人体运动,而不需要基于标记的运动捕捉或步态分析系统,这些系统既昂贵又繁琐。
深度传感已用于构建一系列医疗保健应用程序,包括外科图像导航期间的非接触交互[
深度感应的应用直到最近才扩展到运动功能障碍的评估。尽管与人类观察员相比,传感技术有潜力提高评估的可靠性和有效性[
作为一种中枢神经系统的慢性炎症性疾病,多发性硬化症会引起多种症状,或合并或单独出现。这些症状包括麻木、运动强度降低、小脑功能障碍以及认知能力下降。病程最常见的特征是复发,患者出现神经系统症状,随后出现长时间的缓解,症状可能会改善。随着时间的推移,疾病会进入进行性发展阶段,在此期间病情会稳步恶化。约15%的多发性硬化症患者在发病后病情持续恶化[
疾病病程的不可预测性使得追踪多发性硬化症的能力特别有用。目前采用一种基于临床检查的标准化评定工具,即扩展残疾状况评定量表(EDSS)来评估病情[
evaluate MS的目标是通过比目前可能的更一致和更细粒度的量化运动功能障碍的变化来解决这个问题。所示
医院环境固有的不可预测性以及对高度标准化数据的需求,使得从在实验室验证深度传感测量到在临床环境中创建一个可行的系统这一步骤变得非同小可[
evaluate MS的一个关键元素是物理设备和软件应用程序的设计,以支持在临床环境中高质量的数据捕获。本文提出的研究是对evaluate ms这些方面的可用性和可接受性的混合方法实证评估。它旨在回答以下问题:
医疗专业人员是否可以使用evaluate MS ?
患者和医疗专业人员是否接受MS评估?
神经科医生和护士在任何测量指标上有什么不同吗?
评估MS被用来记录指鼻测试,同时由健康专业人员监测。
evaluate MS是由一个多学科的研究团队开发的,该团队由人机交互、机器学习和照顾MS患者的健康专业人员组成。开发物理设备和软件应用程序用于支持运动的记录和分析,采用了4个阶段的迭代开发过程。它的设计借鉴了多学科团队会议、设计活动、对当前临床评估实践的观察,以及对健康志愿者和患者的用户测试。在提出最终的系统设计之前,我们首先提出在项目早期阶段注意到的问题和产生的设计需求。算法开发在其他地方报道[
对临床常规的观察发现了几个需要解决的问题。我们观察到一个神经学家可以用不同的方式指导同一个动作。例如,手指-鼻子测试可能首先把手伸到一边,在其他情况下,在接触鼻子之前把手伸到前面。临床医生也被观察到根据他们的能力调整给病人的指示。例如,当有能力的患者可能被要求用他们的腿来评估力量时,有一定程度残疾的患者将被要求将他们的腿推到临床医生的手上。
这种变异虽然对神经学家没有影响,但对于机器学习算法来说是有问题的,因为机器学习算法从统计学上评估患者的“已知”特征来自训练示例。如果运动表现的大量变化是由与疾病状态无关的因素引起的,分类能力就不可避免地下降。研究结果强调,不仅需要提供线索来规范动作,还需要为卫生专业人员提供酌情决定权,在必要时可以省略动作,在动作不正确时可以重复动作。
我们还注意到,目前的检查是临床医生和患者之间具体化的互动。临床医生站在病人面前演示要做的动作是很常见的。临床医生也可能通过触摸病人来指示如何做一个动作或使用哪一侧。最重要的是,出于安全考虑,临床医生可能不得不站在病人旁边。许多这种典型的交互都有可能干扰evaluate MS捕捉到的图像,要么是遮挡了摄像头的视野,要么是造成了区分病人和医生的挑战。与此同时,适当的患者-卫生专业人员互动对于确保患者感到安全和受到照顾非常重要。
尤其重要的是,临床检查是一件流动的事情。病人可以在做动作时移动很远的距离,比如单脚跳。病人可能会做一些小动作,调整他们的坐姿,这可能会导致肢体脱离摄像机的视野。在较小的房间里,需要调整家具,并在不同类型的测试(如坐和站的测试)之间多次移动相机,这可能会改变相机的视角和病人在该视图中的位置。随着所有这些移动,有必要实现标准的横向和深度定位,以促进视频的预处理。
最初的工作表明,evaluate MS需要支持捕获的以下方面:
规范的动作指导;
卫生专业人员记录运动的灵活接口;
促进患者与健康专业人员的互动,保持图像质量;而且
病人的精确定位。
评估MS,见
健康专业界面提供了许多导航选项。卫生专业人员可以播放运动指导视频,或开始测试。界面顶部的箭头使卫生专业人员可以跳过动作(如手指-鼻子测试)或动作的变化(如左侧,睁开眼睛)。动作可以通过向后跳来重复。每一页都包含一个按钮,它支持开始测试、记录移动或停止记录。底部的导航条直观地显示了哪些动作被捕获,哪些动作被跳过。这些都显示在上面的图片
通过一个易于操作的装置与“定位”功能相结合,提供精确的定位支持,如图中图所示
提供动作教学视频,规范动作表演。他们指导病人和健康专业人员,确切地知道如何完成所要求的动作。它们由简单的线条动画和本地化为3种语言的口头描述组成。动画的设计基于关于动作学习的心理学文献,强调表现的简单性[
根据教学视频改变了这种互动的性质,采取了一些方法来支持患者-健康专业人员的互动。首先,卫生专业人员界面的放置是为了鼓励卫生专业人员站在设备的一侧或后面,以避免遮挡摄像头的视野。第二,没有使用自动记录动作的方法,以便在考试中进行适当的停顿,以促进互动。
◇◇◇◇◇◇◇◇◇◇◇◇◇◇◇◇◇◇◇◇◇◇◇◇◇◇◇◇◇◇◇◇◇◇◇◇◇◇◇◇◇◇◇◇◇◇◇◇◇◇◇◇
界面截图:左侧为健康专业人员界面,右侧为患者界面。顶部,导航元件;中,定位特征;下面是运动教学视频。
移动协议包含11个动作描述
评估MS运动方案中的11个评估动作:躯干性共济失调、指鼻试验、指指试验、画方格、翻页、用杯子喝水、Romberg试验、当场翻身、单脚跳、正常行走、走钢索行走。
之前不熟悉evaluate MS的卫生专业人员在经过1小时的培训后被要求使用它来检查4名MS患者。培训内容包括标准化运动表现的重要性、运动协议和提高图像质量的特点。为了便于参考,所有的卫生专业人员都得到了一张“小抄”,上面有移动协议的详细内容
诊断为MS且EDSS评分在0到7之间的患者被纳入研究。在给予知情的书面同意后,患者被随机分配给一名健康专业人员。为尽量减少对病人的不便,研究人员邀请已在研究期间接受常规门诊检查的人士参与。一些病人接受了同样的运动检查[
完成完整的录音协议,重复或跳过必要的动作。
获得患者的标准化运动表现。
对MS进行充分的质量数据采集评估。
确保摄像镜头没有被医护人员挡住。
的
我们关注了两种类型
测试ISO可用性定义的方式在很大程度上取决于技术。我们已经明确了有效性、效率和满意度的具体指标,详见
描述用于每个特征的度量标准和所使用的数据源。
特征a、b | 度规 | 数据源 |
有效性 | 任务完成 | 视频 |
运动性能标准化 | 深度录音 | |
适当的定位 | 深度录音 | |
清晰的摄像头视图 | 深度录音 | |
任务的清晰度 | 问卷(第一季及第三季) | |
效率 | 完成时间 | 视频 |
感知到的效率 | 面试 | |
满意度 | 可接受性 | |
将来使用 | 愿意再次使用 | 调查问卷(Q2) |
交互 | 对待人际交往的态度 | 问卷调查(第四及第五季) |
患者-健康专业互动的明确变化 | 采访和视频 | |
感知 | 记录工具的描述及相关问题 | 患者问卷调查(Q6-Q9)和访谈 |
一个有效性、效率和满意度构成了“可用性”。
b未来的使用、交互和感知构成了“满足感”。
除了作为evaluate MS检查的一部分进行的深度记录外,所有评估都用单独的数字摄像机进行了视频记录,记录了卫生专业人员和患者在检查室中的互动方式。
在检查结束时,向患者发放了一份包含9个项目的问卷。问卷包含5个李克特量表式问题和4个自由回答问题。李克特量表问题是由人机交互(CM和AS)领域的研究人员基于两个关键的可用性构造开发的:易用性和对人机交互的影响。Q1和Q3分别询问了整个系统的易用性和它的教学方面。Q5和Q4询问了对人际交往的影响。Q2的重点是评估MS的可接受性,这是由未来使用的意愿决定的。积极和消极框架的问题得到了平衡。
医生提出了四个开放式问题,让病人有机会对他们的经历进行更广泛的评论。第一个实验要求患者用3个词描述另一个患者的MS评估。第二个和第三个问题集中在评估ms最有用和最没用的方面。第四个问题和最后一个问题为进一步的评论提供了空间。问卷由各自的临床团队翻译成德语和荷兰语,翻译的措辞在内部达成一致。在一个无法获得多名临床医生输入的诊所对患者进行了局部试点。
卫生专业人员在每次检查后都会得到一份类似的李克特量表类型的5项问卷。为了比较目的,这些问题旨在等同于患者问卷。在所有患者完成问卷后,专业人员还参加了15分钟的问询。这些问题类似于给患者的自由回答问题,但以面谈的形式进行,以便进行更广泛的讨论
为了评估结果是否适用于广泛的患者,记录了每个患者的EDSS和符号数字模式测试(SDMT)分数。通过详细的神经系统检查计算,EDSS被用于评估身体残疾。量表包括20个半级,从0(正常)至10(多发性硬化症导致死亡)[
一名技术研究员(KH)在整个研究过程中都在场,以管理问卷和访谈以及出现的任何技术问题。这个人没有干预检查本身的进行。临床研究人员(MDS、JB、SMS或CPK)也可用于患者或卫生专业人员的查询。
视频编码用于完成任务。如果所有的录音都被记录下来,并根据需要重复或跳过动作,研究人员不进行干预,那么任务就完成了。对系统崩溃的支持不被算作干预,因为evaluate MS仍处于原型阶段。
计算每位保健专业人员的第一个和最后一个病人的检查时间。“开始时间”由输入患者信息的第一次按键定义,“结束时间”由最终测试结束时产生的完成声音定义,四舍五入到最近的5秒。从卫生专业人员意识到有崩溃的时刻到他/她能够恢复的时间的总时间中减去崩溃。如果第一个或最后一个病人必须坐轮椅,或经卫生专业人员鉴定有严重的认知能力下降,从而大大改变了检查的时间(因为没有进行多个动作),则改用下一次检查。
为了检验卫生专业人员的第一个和最后一个病人的检查时间长度之间的统计差异,以及神经学家和护士之间的差异,我们使用Student
通过回顾深度视频计算出标准化运动性能的度量。所有的坐姿动作都被评分为正确的运动方向,例如,手指鼻子测试是在手臂朝向一侧而不是前方的情况下进行的,以及正确的重复次数(见
在机器学习算法中使用深度视频之前,在深度视频的预处理过程中数学推导出适当定位的度量。在横向定位的情况下,我们报告头部需要转置的像素数,以使其在图像中居中。我们认为任何在“平均”头部尺寸直径的一半以内的东西都是“良好的位置”,因为这将使头部容易被发现。在我们的样本中,头部的“平均”大小是56像素。它是通过测量100个随机选取的经过处理的手指鼻子测试视频在距离顶部四分之一高度处的分割面积来计算的。这应该等于大约眼睛水平。对于深度定位,我们报告与移动协议中指定的距离。在“平均”头部尺寸直径(18厘米)内的任何数值都被标记为良好的定位。这种方法解释了头部的自然运动。
将李克特量表调查数据制表,采用描述性统计。我们既考虑每个站点的答案,也考虑总体的答案;学生
第一个自由回答问题要求用3个词向另一个患者描述评估MS,这些词被分为以下3类:积极的(如,有趣),消极的(如,缓慢)和特征的(如,计算机系统)。为了更细致地了解患者如何看待评估MS,一名研究人员(CM)和两名视觉设计师将提供的单词分组到一个词云中。这些被一个有经验的视觉设计师融合成一个可视化。较大的单词表示重复次数较多的单词(数字显示在可视化图中)。在一行的两边的单词被认为是对比色的。没有从可视化中删除任何单词,以便观看者可以自己解释用来描述evaluate MS的那种语言。
对卫生专业人员的访谈进行编码,以便对标准化、患者-卫生专业人员交互和系统评论进行隐式或显式的讨论。这些主题是在第一次听取访谈后选定的,因为它们包含了数据,同时提供了对重要设计决策的回应。在听完访谈后观看相关的考试视频,进一步了解访谈内容。
我们招募了12名卫生专业人员作为样本。一半是神经学家,一半是护士。参与的卫生专业人员平均分布在2个国家的3个医院地点。他们的专长和多年的经验介绍在
共有51名患者被纳入研究。轻微的过度招募(建议样本n=48)旨在解决由于患者选择当天不参加而导致的退出;然而,所有被招募的患者都参与了研究。患者跨越了身体和认知残疾的广泛水平,以及年龄,如所见
卫生专业特点。
特征 | 神经学家(n = 6) | 护士(n = 6) |
年龄,平均(范围),年 | 36.5 (26-53) | 43.8 (27 - 61) |
性别(女性/男性) | 4/2 | 6/0 |
MS经验,平均(范围),年 | 4.3 (0.5 -15) | 2.7 (0.5 - 5) |
体检经验,平均(范围),年 | 3.4 (0.5 -15) | 0.8 (0 - 4) |
职业地位 | 1名顾问,2名主治医师,2名住院医师,1名医学生 | 4名研究护士,1名临床流行病学家和1名研究协调员 |
研究患者特征。
特征 | 总病人(n = 51) |
年龄,平均(范围),年 | 46.0 (23 - 73) |
性别(女性/男性) | 31/20 |
疾病持续时间,平均(范围),年 | 14.2 (0.5 -47) |
病程(CIS/RRMS/SPMS/PPMS)一个 | 1/37/7/6 |
EDSS,中位数(范围) | 3 (1 - 7) |
符号数字形态测验,中位数(范围) | 47 (13 - 79) |
一个CIS =临床孤立综合征;原发性进展性MS;复发缓解MS;继发性进行性MS。
在第一次检查后,所有卫生专业人员都能够在没有指导的情况下使用evaluate MS进行适当的检查。这包括定位evaluate MS,播放教学视频,捕获记录,或导航到不同的测试和子测试以重复或跳过一个动作。参与分析的研究者(CM/KH)都没有发现一致的任务错误。97.6%(405/415)的病例中,患者按照该方案进行了运动。大多数错误发生在画方块运动中,但不能归咎于特定的患者或卫生专业人员。摄像头的视野从未被阻挡。如
每个诊所和集合的可用性(有效性)度量。
度量(病人) | 诊所1 (n = 17) | 诊所2 (n = 18) | 诊所3 (n = 16) | 总(n = 51) | 百分比 |
任务完成 | 17/17 | 18/18 | 16/16 | 51/51 | One hundred. |
标准化运动性能 | 142/143 | 150/155 | 113/117 | 405/415 | 97.6 |
清晰的摄像头视图 | 17/17 | 18/18 | 16/16 | 51/51 | One hundred. |
患者侧位一致,只有1例(n=368)在28.5像素边缘外。记录工具与患者之间的距离一致性较差,134 (n=368)距离归一化距离大于18cm。有一个实质性的倾斜的视频是更远的距离比必要的距离,如图所示
问卷数据表明,患者和卫生专业人员都对使用的方便性和说明的清晰度给予了高分
“这个系统更容易向病人解释,他们也更有可能做对。(HP7:医生)
不同诊所之间有一些差异,诊所1的比率明显较低(
效度测量问卷数据。
|
|
诊所1 | 诊所2 | 诊所3 | 总计 | 理想的一个 |
病人 |
|
|
|
|
|
|
|
我明白了在学习考试中要做什么,意思(SD) | 6.3 (1.3) | 6.8 (0.4) | 6.7 (0.5) | 6.6 (0.9) | 7 |
|
记录系统给出的运动指令清晰,平均(SD)。 | 6.1 (1.4) | 6.6 (0.6) | 6.6 (0.5) | 6.4 (1.0) | 7 |
卫生专业人员 |
|
|
|
|
|
|
|
这个录音系统很容易使用,意思是(SD) | 5.0 (1.1) | 6.7 (0.6) | 5.4 (1.6) | 5.7 (1.4) | 7 |
|
记录系统给出的运动指令对患者来说是清晰的,平均值(SD) | 5.1 (1.4) | 6.2 (0.9) | 5.7 (1.2) | 5.7 (1.2) | 7 |
一个1表示“非常不同意”,7表示“非常同意”(李克特量表)。
偏离归一化点的频率直方图。横向偏差以像素表示(左),深度偏差以厘米表示(右)。
完成保健专业人员期末考试的平均时间为18:59(毫米:秒)。第一次考试与期末考试之间的平均记录时间明显缩短(
一些卫生专业人员特别强调了该记录工具的效率。没有人评论它效率低下。正如一位健康专家所说
“它之所以快,是因为它是结构化的。通常发生的情况是,病人开始解释事情,谈论问题,这需要更长的时间。如果你照着做,15-20分钟就能完成。它能让你把注意力集中在重要的事情上。(HP12:护士)
所有保健专业人员以及护士和医生第一次和最后一次考试的平均考试时间。
|
第一次考试平均(SD)时间(mm:ss) | 期末考试平均(SD) (mm:ss) |
卫生专业人员 | 26:55 (04:33) | 18:59 (02:50) |
医生 | 27:45 (04:28) | 18:52 (03:50) |
护士 | 26:06 (04:53) | 19:05 (01:41) |
患者不同意他们不希望他们的健康专业人员在未来使用该系统的声明,这表明它是可以接受的。卫生专业人士的看法则更加不同,但综合得分仍表明可以接受(
可接受度指标的问卷数据(未来使用)。
|
|
诊所1 | 诊所2 | 诊所3 | 总计 | 理想的一个 |
病人 |
|
|
|
|
|
|
|
我不希望我的健康专业人员在我以后的检查中使用记录系统,意思是(SD) | 2.5 (1.7) (n=17) | 2.0 (2.0) (n=18) | 1.5 (1.5) (n=16) | 2.0 (1.8) (n=51) | 1 |
卫生专业人员 |
|
|
|
|
|
|
|
我会在以后的考试中使用记录系统,意思是(SD) | 4.1 (1.4) (n=4) | 6.8 (0.7) (n=4) | 4.8 (1.2) (n=4) | 5.2 (1.6) (n=12) | 7 |
一个1表示“非常不同意”,7表示“非常同意”(李克特量表)。
这个录音工具既没有让病人也没有让医护人员感到尴尬。对于记录工具的教学方面,患者和卫生专业人员的矛盾情绪最高。这两个问题具有最高的可变性,有更多的患者提供中立的答案(
可接受度指标(交互)问卷数据。
|
|
诊所1 | 诊所2 | 诊所3 | 总计 | 理想的一个 | |
病人 |
|
|
|
|
|
|
|
|
我更喜欢我的健康专家演示动作,意思是(SD) | 2.5 (1.8) |
1.6 (1.2) |
2.7 (1.7) |
2.3 (1.6) |
1 | |
|
录音系统让我感到尴尬或不舒服,意思是(SD) | 1.8 (1.3) |
1.8 (1.7) |
1.1 (0.3) |
1.6 (1.4) |
1 | |
卫生专业人员 |
|
|
|
|
|
||
|
我更喜欢亲自给病人演示动作,意思是(SD) | 3.7 (1.7) |
2.3 (1.6) |
4.1 (1.0) |
3.4 (1.7) |
1 | |
|
录音系统让我感到尴尬或不舒服,意思是(SD) | 2.1 (0.2) |
1.4 (0.8) |
2.4 (1.4) |
2.0 (1.0) |
1 |
一个1表示“非常不同意”,7表示“非常同意”(李克特量表)。
神经学家对原型的早期测试表明,一些人认为evaluate MS取代了他们的角色,如下引语所述,并可能对可接受性提出问题:
“通常电脑告诉病人的一切都是你作为医生告诉病人的,所以交互性在某种程度上减少了,因为你让电脑说话……我习惯告诉病人我想让他们做什么,这样我就能看到我想看到的。医生不需要做什么。这是我的助手可以做的事。”(医生)
我们在这项研究中也发现了类似的情绪,只是表达方式不同。一名神经科医生对这种感觉进行了反思,认为这种感觉失去了与病人之间的身体联系,而这种联系通常是通过在检查过程中触摸病人而获得的。另一位神经学家谈到了她的节律被打乱,她说:“我有我的节律,只有我和病人之间的互动。这里我们有第三个成分…这是3p。”第三位神经学家谈到,由于evaluate MS占用了有限的楼层空间,患者无法在房间内自由活动。第四位神经学家谈到了医学创新过程的丧失,建议这项测试可以由助手完成。
尽管提到了这些最初的不适,但神经学家在使用evaluate ms时迅速适应了与患者的交流。几位神经学家注意到,他们一开始说的比他们需要说的多,但随着时间的推移,他们的口头语言减少了。有人说过,
“最后一批病人对指示理解得更好,所以我什么也没说,他们做得很好。(HP11:医生)
另一些人则认为,如果他们说话更频繁,考试就更私人。
“我觉得我解释得有点多余了……年代ometimes I just repeat what has already been said [by ASSESS MS]. I think sometimes the patient would have been able to just understand it just by listening. I personally think that it is somehow more personal if I say it again or point out what could have been important.” (HP6: Doctor)
在所有情况下,随着时间的推移,医生说话的次数都在减少,许多医生使用了大量的肢体语言,比如夸张的点头或微笑,以取代口头交流。从视频中可以看出,所有的医生都在第三个病人的时候发现了检查节奏。这通常是通过预先指导患者在需要标准化的动作方面获得的。
护士们对使用evaluate ms没有同样的感受,也没有提出类似的意见。她们对教学视频有不同的看法。大多数人都提到了视频在建议医生和病人做什么的双重作用。3名护士参与者的要求说明了这一点,他们要求在动作描述中口头包含协议信息,如“双脚放在地板上,将手臂向外抬起……”护士很容易在与病人的互动和评估MS之间找到平衡。
当被要求用3个词来描述评估MS时,患者和健康专业人员绝大多数都是积极的。在将患者用来描述评估MS的单个词制成表格后,78个词被发现是积极的(如简单),12个是消极的(如缓慢),29个是典型的(如计算机系统)。对卫生专业人员而言,积极词汇19个,消极词汇2个,特征词汇5个。
词汇云patients’评估MS描述性词汇。
evaluate MS是一个使用深度感知计算机视觉来支持MS患者运动功能障碍评估的系统。它旨在提供一个一致的、量化的运动能力指标,以实现比目前可能的更细粒度的疾病进展跟踪。evaluate MS旨在促进更标准化的数据捕获,以支持机器学习算法的运动分析,同时为临床环境中的患者和卫生专业人员所用和接受。我们的结果显示,患者和卫生专业人员都可以使用和接受它。3个参与中心的结果几乎没有变化,神经学家和护士之间没有差异。
研究表明,评估MS是可行的。它是有效的,因为所有的卫生专业人员都能够完成记录,具有高水平的标准化运动表现,横向定位,和清晰的相机视角。患者和医护人员都认为它易于使用,在李克特量表问题上得分很高,访谈中也提供了积极的评价。在患者人群中取得的变化表明,患者的身体(EDSS范围从1到7)或认知(SDMT从13到79)残疾水平不会改变工具的有效性。
评定MS唯一有问题的方面是距离定位。对视频的进一步观察表明,距离通常是通过房间里的物理地标(如墙壁)测量的,而不是屏幕上提供的距离。2号诊所的房间家具距离正确,便于对齐,其深度定位的一致性最高,将evaluate MS放置在书柜前进行坐姿练习,然后靠在书桌上进行站立练习。这表明,当一个新站点接受使用evaluate MS的培训时,应该在培训中回顾和强调房间的物理属性。
评估MS似乎也相当有效,平均时间低于20分钟,并随着使用而减少。因为检查没有包含完整的EDSS,所以不可能进行直接比较。完成时间的下限约为13分钟,这表明在进一步强调速度的情况下,测试可能会在更短的时间内完成。卫生专业人员认为它是有效的也很重要。
在所有考虑的方面,包括未来使用、(与卫生专业人员的)互动和认知,evaluate MS都是患者可以接受的。他们的得分几乎没有变化,大多数人都集中在李克特量表的一端,而极少数人则集中在另一端。这表明大多数人都有较高的接受度,少数人不会使用它,但几乎没有矛盾心理。反对它的人没有明确的模式,例如,按年龄或残疾程度划分。对新技术的态度的变化,包括负面看法,可以通过分期技术采用模型来预测[
卫生专业人员也接受了评估MS,但态度比较矛盾。1号诊所的得分似乎特别低,我们认为这是因为遇到了最技术性的问题,比如Kinect摄像头从应用程序中断开,需要监督技术研究员(KH)重新启动。有趣的是,这两位刚接触MS的专业人士用他们不知道的动作进行测试没有困难。然而,另外两名在任何医学领域都没有或几乎没有检查经验的卫生专业人员则感到更不舒服。对于没有考试经验的考生,也应提供考试技巧的培训。
在包括检查时间在内的任何定量指标分析中,神经科医生和护士之间没有差异。唯一的区别在于态度。神经学家最初发现使用这种半自动的、高度标准化的系统工作不舒服,而护士则欢迎该系统提供的支持。也就是说,神经学家使用他们的检查技能来预先预防潜在的错误动作,围绕实现标准化的动作表现建立一种互动。我们建议,evaluate MS特别适合神经学家以外的健康专业人士,但也足够灵活,可以被任何健康专业人士使用。
这些发现表明,评估MS的当前版本是可用的和可接受的。它可以部署到新的站点,并由一系列卫生专业人员使用,只需要1小时的培训。这与目前的工具形成了对比,例如EDSS,后者需要标准化的培训和临床神经学方面的经验背景。因此,evaluate MS具有廉价、广泛使用的潜力。
培训过程为健康专业人员如何理解evaluate ms提供了实质性的见解。最好的方法是提供一个简单的描述,说明机器学习如何作为一个比较新数据和它“见过”的过去患者的过程来工作。这意味着,如果一个病人“看起来”有特定的残疾水平,那么他们就会被贴上残疾的标签,不管这是因为他们实际上有那种程度的功能障碍,还是因为他们没有正确地完成一个动作。提供这一相当简单的评估MS如何工作的描述,激励着卫生专业人员试图获得标准化的数据。
我们还发现,通过让健康专业人员执行而不是看着它,对引入移动协议的方式进行了一个小小的改变,增加了信心。也就是说,移动协议是卫生专业人员学习曲线中最具挑战性的部分,可能没有在本文中以系统为导向的措施中捕捉到。有许多关于如何执行协议的问题,临床研究人员的可用性纠正检查之间的错误是受欢迎的。在考虑今后的培训时,应考虑是否有这样的人,并应考虑更强调运动,而不是使用系统。
可用性只是一般的规定,每个被评估的技术都需要特定的指标。我们本可以对evaluate MS的许多方面进行评估,但我们只关注那些我们认为对生产一个健康专业人员和数据工程师都可行的系统至关重要的方面。作为一种旨在实现与现状截然不同的新技术,无法进行直接的比较。因此,什么是“好的”结果是有争议的。例如,很难就可接受的位置或标准化运动的必要百分比提供一个确切的界限。也就是说,我们知道这些元素对系统是必不可少的,并希望继续增加这些数字。
对测量的选择符合evaluate MS的设计标准,但技术发展很快。例如,最初的Kinect已经不在市场上了,机器学习算法将继续发展。此外,评估MS只关注当前残疾测量的一部分,我们的一些结果(如标准化运动表现)只适用于坐姿运动。虽然本文提供的具体结果提供了对不太可能发生显著变化的使用和感知的洞察,但生成的数据的质量需要持续评估。需要新技术在引入变更时持续评估系统,以提供持续的可用性证据[
此外,没有对有严重视力或听力损失的参与者进行测试,尽管我们希望在这些情况下,如果需要额外的帮助,健康专业人员可以发挥调解作用。
有越来越多的计算机辅助和基于传感器的应用支持临床评估和多发性硬化症患者的康复。其中就包括社交游戏。
除了在康复方面取得的进展外,基于传感器的人体运动记录对于评估不同神经疾病的症状正变得越来越重要[
尽管在该领域进行了初步研究,但使用传感(视觉或其他)进行临床评估的应用尚未在临床环境中部署。这项研究表明,在设计过程中对临床环境的关注可以使这些新的医学方法成为现实。
深度感应计算机视觉已迅速被采用,形成一系列创新医疗保健应用的核心,用于临床评估和运动能力的康复。现在有越来越多的例子说明这种康复想法的商业化。然而,临床评估一直是一个更大的挑战,需要更高的测量精度,从而降低数据的可变性。的creation of ASSESS MS, as part of one of the first projects in this domain, shows that careful attention to deployment makes it possible to collect sensor data of a quality needed for clinical assessment. Moreover, it can be done in a way that is suitable to wide-scale deployment and acceptable to patients. These results open the door for greater development in depth-sensor-based assessment of movement disorders.
评估MS培训材料。
问卷和访谈材料。
标准化运动性能评定指南。
扩大残疾状况量表
多发性硬化症
符号数字形态测验
我们要感谢参与研究的患者和卫生专业人员的参与。具体来说,卡琳·斯特莱特,莫妮卡Käser,安德里亚·塞勒,韦莱娜·布拉特,西拉·勒尔斯,莉珊·巴尔克,蒂姆·阿勒曼,丹妮尔·萨维科尔,埃德维格·博利格,苏西·加耶夫斯基,杰林德·霍夫曼,雅各布·斯托金格。我们要感谢Michela Azzarito提供的视频编码工具。该研究由瑞士巴塞尔的诺华制药公司(CH-4002)资助,他们一直是该技术开发过程中的积极合作伙伴。研究人员没有受到任何限制。
CM、KH、AS在设计研究时采用了MDS、CPK、SMS、JB、FD的临床输入和PK、JFD、AC的技术输入。论文由CM、KH、MDS起草。BU和LK参与了这个项目的总领导。所有作者都参与了本文的修改。
CM、KH、PK、AC和AS都是微软研究院的员工。FD和JFD是诺华制药公司的员工。MDS、CPK、SMS、JB、BU和LK之间没有利益冲突。