本文的预印本(早期版本)可在以下网站获得<一个d一个t一个-test="preprint-link" aria-label="'Preprints (earlier versions) of this paper are available at preprints.www.mybigtv.com/preprint/'38211" href="//www.mybigtv.com/preprints/preprint/38211" target="_blank">https://preprints.www.mybigtv.com/preprint/38211,首次出版
一种无监督数据驱动的痴呆患者不良健康状况异常检测方法:队列研究

一种无监督数据驱动的痴呆患者不良健康状况异常检测方法:队列研究

一种无监督数据驱动的痴呆患者不良健康状况异常检测方法:队列研究

原始论文

1英国吉尔福德萨里大学视觉、语音和信号处理中心

2萨里和边境伙伴关系NHS基金会信托,吉尔福德,英国

3.护理研究和技术中心,英国伦敦帝国学院英国痴呆研究所

4英国吉尔福德萨里大学心理学院

通讯作者:

Nivedita Bijlani, BEng, MS

视觉、语音和信号处理中心

萨里大学

牡鹿山388号

吉尔福德,GU2 7XH

联合王国

电话:44 1483 300 800

传真:44 1483 300 803

电子邮件:<一个href="//www.mybigtv.com/aging/2022/3/mailto:n.bijlani@surrey.ac.uk">n.bijlani@surrey.ac.uk


背景:基于传感器的远程健康监测可用于及时发现痴呆症患者的健康恶化,对他们的日常生活影响最小。异常检测方法已广泛应用于各个领域,包括远程健康监测。然而,目前的方法受到噪声、多变量数据和低泛化能力的挑战。

摘要目的:本研究旨在开发一种基于在线、轻量级无监督学习的方法,利用痴呆症患者的活动变化来检测代表不良健康状况的异常。我们在2019年8月至2021年7月期间英国痴呆研究所从15个参与家庭收集的9363天真实数据集上,证明了它比最先进方法的有效性。我们的方法应用于家庭移动数据,以检测尿路感染(UTIs)和住院情况。

方法:我们提出并评估了一种基于上下文矩阵剖面(CMP)的解决方案,CMP是一种精确的、超快的基于距离的异常检测算法。使用通过被动红外传感器收集的每日家庭运动数据,我们生成了基于位置的传感器计数、持续时间和每个患者每小时运动模式变化的cmp。我们用两种方法计算归一化异常评分:结合单变量CMP和开发多维CMP。相对于基于角度的离群点检测、基于copula的离群点检测和异常轻量级在线检测,我们的方法进行了性能评估。我们使用多维CMP来发现和呈现与痴呆症患者的不良健康状况相关的重要特征。

结果:多维CMP平均产生84.3%的召回率,32.1个警报,或5.1%的警报率,在评估UTI和住院时,与基于copula和基于角度的离群点检测和轻量级异常在线检测器相比,提供了召回率和相对精度的最佳平衡。午夜至早上6点的浴室活动被证明是UTI异常指示的最重要的跨患者数字生物标志物,约占异常评分的30%。我们还演示了基于cmp的异常评分如何用于异常模式的跨患者视图。

结论:据我们所知,这是第一个将CMP适应于医疗保健场景中的连续异常检测的现实研究。CMP继承了矩阵概要的速度、准确性和简单性,提供了可配置性、去噪和检测模式的能力,以及对临床从业者的可解释性。通过开发多维CMP,我们解决了在多变量时间序列医疗保健数据中对异常评分的需求。CMP具有高灵敏度、低警报率、比最先进的方法更好的总体性能以及发现异常的数字生物标志物的能力,是一种具有临床意义的无监督异常检测技术,可扩展到痴呆症和其他医疗保健场景的多模态数据。

JMIR Aging 2022;5(3):e38211

doi: 10.2196/38211

关键字



背景

痴呆症是一种渐进的、不可逆转的大脑活动衰退,包括记忆、思维、定位、理解、计算、学习能力、语言和判断能力受损,超出了自然生物衰老所能预期的范围。世界卫生组织估计,全世界约有5500万人患有痴呆症,到2030年将增至7800万人,2050年将增至1.39亿人[1].管理照顾这一不断增长的人口会产生巨大的成本。阿尔茨海默氏症协会估计,英国痴呆症患者的护理费用为347亿英镑(400亿美元),到2040年将大幅上升至941亿英镑(1086亿美元)[2].痴呆症患者因跌倒伤害、败血症、肺炎和尿路感染(UTI)等可能可预防的疾病住院,给卫生系统带来巨大压力。为了尽量减少可预防的住院,对人工智能驱动的技术进行了大量投资,使痴呆症患者在舒适的家中生活时,能够远程监测和帮助他们的健康。

英国痴呆症研究所护理研究和技术中心在这方面做出了重大努力,其愿景是“使用以患者为中心的技术,帮助痴呆症患者在自己的家中生活得更好、更久”[3.].英国痴呆症研究所护理研究和技术中心的团队开发了一个基于传感器的远程健康监测平台,使临床医生能够早期干预,并使研究人员能够提高他们对痴呆症发生和发展的了解[4].该队列目前覆盖了102名痴呆症患者,他们与照顾者生活在自己的家中。数据收集始于2019年,将至少持续到2025年,每年有更多的参与者加入,使其成为全球最大、运行时间最长、最多样化和最独特的痴呆数据收集项目之一。传感器、框架、模型、临床监测工作流程、参与者应用程序和监测仪表板共同组成了一个名为Minder的数字平台(请参阅英国痴呆症研究所的网站[4)。

偶尔,痴呆症患者会出现行为和心理症状,如躁动、攻击、睡眠障碍、泌尿系统障碍、脱水和跌倒。泌尿道感染是老年人中诊断最多的感染,早期识别是预防进一步并发症的关键[56].泌尿道感染的诊断仍然存在问题,因为存在一系列非特异性症状,无症状菌尿的高流行率,以及寻求帮助的行为减少[7-9].

在家庭健康监测的背景下,“异常”可以简单地理解为正常数据中意外但显著的不规则,这是不利条件的指示。在海量的正常数据中很难发现异常。遗漏或错误分类异常的代价可能很高(例如,未能检测到UTI可能是灾难性的)。当前的医疗异常检测方法受到一个或多个现实问题的挑战:高维和多元数据;关于正常数据和异常数据之间的区别的信息很少,甚至没有;时间路线数据和低延迟预测的需求;病人的可变性;由于社交拜访、宠物、传感器问题和嘈杂的标签而产生的噪音和缺乏周期性;误报率高;高调优需求; and low explainability to clinical monitoring teams and caregivers [10].

我们工作的目的是开发一种临床有用的、领域不确定的、快速的、轻量级的、无监督的异常检测方法,用于真实世界的噪声卫生保健数据。我们考虑了个体的可变性,跨个体和领域的普遍性,以及以数字生物标志物发现的形式向临床医生和护理人员解释的可解释性。我们的工作做出了以下贡献:(1)它为上下文矩阵概要(CMP)提供了第一个用例,用于医疗保健中的自适应异常检测,特别是在现实世界的远程健康监测场景中;(2)开发了多维CMP模型,并利用该模型对异常患者天数进行识别和评分;(3)它证明了基于cmp的异常评分比最先进的方法的有效性;(4)利用家庭移动数据,利用CMP发现异常的生物标志物。

之前的工作

概述

异常检测方法可以大致分为统计、基于距离、基于重构、基于域或基于决策边界、信息论和基于图[11].文献中的许多方法使用了技术的组合,如可视化、基于知识的和机器学习方法。我们将重点介绍如何将其中一些技术应用于远程运行状况监视场景中的异常检测。

统计方法

统计阈值法是发现点异常的常用方法。美国国立卫生研究院资助的一项试点研究使用统计阈值法产生泌尿道感染警报,并为37名老年参与者提供早期干预,其中一些人患有阿尔茨海默病,他们居住在配有运动、压力和温度传感器的公寓里[12].Mori等人在研究中使用了基于聚类的技术[13],以检测不同活动的时间和持续时间是否异常。统计方法通常忽略异常事件的多元性质,并可能产生大量假阳性[14].

机器学习方法

利用Minder研究的早期数据,Enshaeifar等[15]使用马尔可夫链来建模活动序列,并使用熵值率来量化个人在日常生活中的模式规律性。他们使用训练集构建马尔可夫模型,使用验证集定义偏差的置信阈值[15].Novák等[16]检测异常,如长时间不活动,不寻常的存在,以及日常活动模式的变化,使用自组织地图的组合进行活动分类,然后使用马尔可夫模型进行下一次活动预测。马尔可夫方法的局限性包括无法处理并行活动、涉及相同事件但概率不同的活动以及可伸缩性问题[1718].

阿里弗格鲁和布查基亚[5]探索了卷积神经网络来捕捉活动的时间和空间表示,并检测与重复活动、睡眠中断和混乱相关的异常行为。将传感器数据切片到时间窗口,通过序列标记对活动进行标记,训练卷积神经网络,以检测正常日常生活序列的偏差。监督学习和可解释性是这种方法的一些局限性。

Akl等[19]使用信号处理和机器学习算法来检测老年人的轻度认知障碍。他们使用传感器提取传感器数据滑动窗口上的平均值、概率密度和测量轨迹,作为支持向量机和随机森林分类器的输入,以评估认知状态。该方法需要对认知状态进行数据标注训练,存在时间窗数据缺失的问题。

Jakkula等人[20.]考虑了基于时间关系的异常检测问题。他们基于时间逻辑表达了时间事件之间的关系,如之前、之后、相遇、重叠和包含,并使用这些来识别它们之间经常发生的关系。他们采用了基于概率的模型,该模型基于来自居民历史的先前证据,将低概率事件报告为异常。该研究承认,必须使用数百个传感器来识别粒度级别的时间关系。它还需要一个大的训练数据集,必须对其进行更新,以捕获不断变化的模式。

利用我们自己的远程监测研究的数据,巴勒莫等人[21开发了一个有监督的长短期记忆网络,利用环境、生理和睡眠数据来分析痴呆症患者躁动发作的风险。他们使用弱学习和标签增强来解决噪音和阶级不平衡。在Minder的另一项研究中,Li等人[22]采用半监督机器学习方法,利用环境和生理数据来预测患UTI的痴呆症患者的风险。卷积自编码器用于学习未标记传感器数据的表示。编码器用于从更小的正标记数据集中提取相应的特征,然后用于训练一个监督分类器——一个全连接层的概率神经网络。尽管该模型稳健且不断学习,但它使用拉格朗日近似逼近传感器数据,需要可解释性,并采用广义与患者特异性的方法来检测尿路感染。

在Paudel等人的研究中[23,作者使用无监督的基于图的异常检测来识别居住在智能家居中的老年居民的认知健康下降。他们将原始传感器日志文件中的运动传感器数据转换为单个活动图,并基于最小数据长度原则派生的规范模式进行异常检测[24].这项研究使用了整个队列的阈值,而不是用户自己的阈值。

视觉的方法

活动密度可视化是检测运动数据异常的另一种直观方法。Gupta等人的研究[25描述了如何使用无监督学习来发现来自被动红外(PIR)传感器的未标记数据中的活动模式。该方法采用统一流形逼近和投影方法对用户活动数据进行可视化跟踪,采用核密度估计方法自动提取传感器密集活动周期。尽管统一流形近似和投影图在告知患者和护理人员的日常互动方面很有用,但它们并不容易解释,而且这种方法不提供异常评分。热图还与深度学习技术一起使用,以确定躁动或尿路相关异常的概率。在Li等人的研究[26],通过位置编码对基于原始传感器数据的每小时热图进行编码,提取相关的时间步骤,然后将这些时间步骤传递到长短期记忆模型中提取相关数据,并传入基于注意力的模型中进行预测。这种方法使用监督学习,与深度学习模型一样,计算成本很高,需要足够的训练数据来进行精确的风险分析和预测

异常检测矩阵配置文件

基于矩阵剖面(MP)的异常检测在现实世界中的应用研究较少。林等人[27]使用了MP的早期版本来检测心电图时间序列中的不一致。最近,研究人员使用MP对IT运行时间序列中的基于web的异常检测[28].在Steenwinckel等人的研究[29],研究人员使用具有知识驱动算法的MP创建了一个可解释的系统,用于铁路领域的传感器监测。尼夫斯·阿文达诺等人[30.]使用MP和聚类进行基于web的异常检测和事件预测,基于声发射传感器中继冷成形生产线的机械状态信息。该方法对噪声、缺失值和不规则采样具有鲁棒性。

在2个策划的非医疗保健基于web的数据集中,CMP已被证明比MP更灵活和有效,在这些数据集中,作者展示了CMP如何用于检测MP检测到的异常之外的更微妙的异常[31].

图11132],我们通过评估调查文献中提出的每种技术的优缺点,总结了远程健康监测背景下每种技术的有效性。CMP克服了基于距离的方法的许多缺点,非常适合远程运行状况监视场景。

图1。异常检测技术用于远程健康监测的适用性[1132].CMP:上下文矩阵概要。
查看此图

MP和CMP初审

议员概述

在Yeh等人的研究中详细描述了MP [33],是一种无监督的、最先进的时间序列分析技术,可用于模式检测、异常检测、时间序列分割和变化点检测。它的快速性能来自于使用快速傅里叶变换z-归一化欧氏距离计算。该算法适用于静态数据和流值的增量建模,即使在非常大的多变量时间序列上也具有有限的减速。在本节中,我们将定义与智能家居环境中的异常检测相关的MP初步步骤。

议员描述

下院议员P时间序列的t是向量的z全子序列集合中每个子序列之间的-归一化欧氏距离一个与其对应的最近邻或最匹配一个(不包括普通匹配)。琐碎匹配是查询子序列周围的子序列集合,它们与查询子序列之间可能有非常小的欧氏距离。该边界通常设置为/ 2,是子序列的长度。

多维议员

一个k多维时间序列的-维MPt与维数d的元时间序列是存储z子序列与其最近邻居之间的-归一化欧氏距离(该距离使用k-维距离函数)[34].简单来说,该算法的工作原理如下:(1)将每个维度(时间序列通道)的MP存储在二维矩阵的后续行中k的平均值来计算-维MPk矩阵列中的最小值,(3)多维MP创建这样的行k(0≤k<)包含k维MP。关于实现,我们建议读者参考STUMPY库教程[35].

直接适用MP的问题概述于文本框1

矩阵概要(MP)直接应用的问题。

直接处理与MP有关的申请事宜

  • 原始MP是有噪声的,不能明确指出哪些不一致是真正的异常。
  • 对振幅变化不敏感,定位精度低[28].
  • MP考虑每个子序列进行比较,这意味着子序列的长度等于可以识别异常的粒度级别。两者必须解耦。
  • 当异常子序列接近另一个异常子序列[28].
  • MP是用来计算欧氏距离的。尽管这有很大的优点——复杂度与时间序列的长度成线性,易于实现,可索引,和参数自由——但它也会对噪声敏感,并在时间上显示失调[36].
文本框1。矩阵概要(MP)直接应用的问题。
CMP概述

CMP是一种新的柔性时间序列分析技术[31].CMP的动机来自于用于计算MP的距离矩阵计算。本节提供关于CMP的详细信息。

上下文窗口

它是单个时间段或感兴趣的区域中的子序列数量。给定一个病人数据集,使用3的上下文窗口和3的子序列长度(不省略子序列),病人数据将被分组到中所示的时间段图2

图2。上下文矩阵概要上下文或时间段是由一组子序列组成的时间块。这里显示的每个上下文都由3个子序列(上下文窗口=3)组成,每个子序列的长度为3天。我们将异常值分配给上下文而不是天数。
查看此图
背景(或时间段)

它是一个时间段,其大小等于上下文窗口,包含用户定义的长度的子序列。CMP中的一个单元格表示一个“上下文”或时间段。

CMP描述

它是MP的一个可配置的2D版本,用于跟踪时间序列中用户定义的区域中子序列的每个上下文之间的最小距离。首先,用户(可选)为给定的时间序列定义感兴趣的区域。然后它们确定子序列长度和上下文窗口大小。例如,对于子序列长度为3天和上下文窗口大小为3天的情况,时间序列被划分为上下文,如图2.CMP是通过比较z-归一化欧氏距离在一个上下文中的每个子序列和在另一个上下文中的每个子序列之间,并选择最小距离,在CMP中形成1个单元格。图3强调MP和CMP之间的区别。MP由距离矩阵中的列最小值组成,而CMP是通过在矩形区域取最小值来创建的。

将MP思想应用于数据块而不是单个子序列,可以聚合和降噪距离计算,并提取有用的模式。图4显示了我们的一个病人每晚上厕所的CMP。它作为活动的一致性和任何断点的可视化概述。

图3。矩阵配置文件与上下文矩阵配置文件。
查看此图
图4。每个单元格颜色编码了x轴和y轴上时间段之间的最小距离。绿色带表示异常活动或与其他时间段的最小距离一致较大。上下文矩阵概要文件围绕对角线对称。
查看此图
多维CMP

基于多维MP的原理,我们开发了多维CMP。一个k多维时间序列的-维CMPt与维数d是一个元时间序列,它存储一个上下文中任意子序列与另一个上下文中任意子序列之间的最小z归一化欧氏距离,该距离使用k-维距离函数,这在Yeh等人的研究中得到了解释[34].算法的工作原理如下。首先,我们将特定于特征的2D cmp进行堆叠,以获得3D数组。然后使用这个特征维对数组进行升序排序。这给出了每个上下文的最小距离值,按特征递增顺序排序。现在,我们将该方法应用于Yeh等人的研究[34]获取k维CMP。为k=0(即1D CMP),我们查询的第一行k维CMP。这为基于单个特征的每个上下文提供了最低最近邻距离。一个上下文的得分最低的特性可能与另一个上下文的得分最低的特性不同。同样的,对k=1(或2D CMP),我们查询的第二行k-维CMP,对于每个上下文,提供了基于2个特征的最低平均距离。同样,一个环境中得分最低的2个特性可能与另一个环境中的不同。的最大值k是特征的数量减1 (k是从零开始的)。

多维CMP (图5)是多维数据异常检测的关键。CMP比原来的MP (文本框2).

图5。多维上下文矩阵配置文件(CMP)的形成涉及到对特定特征的CMP进行堆叠,然后按距离顺序排列每个单元格(时间段)。最后形成多维CMP,这样第i行中的每个单元格都包含该单元格的i+1个最低距离的平均值。
查看此图
上下文矩阵配置文件(CMP)的优点。

CMP的优势

  • 它在上下文而不是子序列级别上比较距离,这对于去噪时间序列很重要。
  • 上下文大小是可配置的。此外,CMP允许定义特定的区域来检测模式和异常,并且不需要覆盖整个距离矩阵。
  • 除了欧几里得距离外,还可以使用其他距离度量方法。
  • CMP提供了一种可视化时间序列窗口区域和检测异常的直观方法。
  • 异常现象不容易被掩盖,即使在时间序列的其他地方发生了类似的异常。
文本框2。上下文矩阵配置文件(CMP)的优点。
使用CMP进行异常评分

我们使用异常检测管道(图6)描述于文本框3

图6。基于上下文矩阵配置文件(CMP)的异常检测管道。UTI:尿路感染。
查看此图
异常检测管线。

异常检测管道

  1. 我们决定了一个合适的上下文窗口。考虑到最大粒度、去噪、可解释性以及异常发生所需的时间,我们使用了3个上下文大小和3天的子序列长度。
  2. 对于每个患者时间序列,我们生成自连接的z赋范欧氏距离矩阵,然后根据上下文窗口设置生成上下文矩阵配置文件(MP)。
  3. 我们直接使用cmp,或者将它们改编为可视化和监视目的。
  4. 我们为每个上下文计算异常值。这是当前上下文和过去上下文之间的平均距离。对每个时间序列重复此步骤,以获得特定于特征的异常评分。
  5. 异常评分被用作针对特定健康事件训练的不同机器学习模型的输入。这将在以后的工作中进行探讨。
  6. 这些模型准备为每个时间段获得一个单值得分。我们评估了以下方法:
    • 结合基于得分总和、得分中位数、得分均值、得分最大值和基于熵的权重的特征异常得分(得分是基于使用逆加权的基础时间序列的熵进行组合的;更大的熵意味着使用该时间序列获得的异常评分的权重更低)。使用了两种类型的熵测量:
      • 近似熵(ApEn): ApEn近似精确的规律性统计量Kolmogorov-Sinai熵,并通过探索数据中的重复模式反映时间序列的可预测性。适用于有噪声的数据集[37].它依赖Heaviside函数来定义两个模式之间的相似性。ApEn生成一个从0(完全周期)到2(有噪声)的无单位数[38].
      • 模糊熵(FuzzyEn):这也使用Heaviside函数,尽管相似性是通过计算从0到1的隶属系数的模糊函数来评估的。因此,除了选择N(计算熵的长度)(子序列长度),和r(根据SDs数量的公差),FuzzyEn需要第四个参数,n,用于评估相似度的指数函数边界的梯度[39].FuzzyEn提供时间序列各部分之间的分级相似度,而不是二元相似度[37].
    • 基于多维CMP的评分:我们使用多维CMP为每个上下文生成多变量异常评分,使用两个不同的设置k
      • k=auto:在这里,我们考虑的最优值k在预测患者真正可能的异常时(图7).为此,我们在每个患者的多维CMP上使用肘部方法。具体来说,我们计算了每个的中位数距离k-维CMPs为患者,并采用“屈膝”算法自动找到的最优值k拐点发生的时间[40].然后我们选择这个最优值k从整体排k-维CMP,用于提取每个上下文的单值患者异常评分。一旦获得了“最优”的CMP,我们就用两种方法对每个上下文进行评分:
        • 距离加权多维CMP评分:一个上下文的异常评分被计算为其与前一个上下文的最近邻居距离的反加权平均值。因此,如果一个上下文距离被评分的当前上下文有3个跃点,那么在计算当前上下文的异常评分时,它的距离被赋予三分之一的权重。
        • 等加权多维CMP:一个上下文的异常得分是用它与前一个上下文的最近邻距离的简单平均值来计算的。
      • k=1:我们采用基于每个上下文的前2个特性的CMP。
    • 我们使用robust对单个上下文评分执行滑动窗口阈值(7天、14天、21天、30天、60天和90天窗口)z、IQR和基于分位数的方法来预测真正可能的异常并报告最佳结果。
    • 然后,根据数据集中可用的异常标签对预测的异常进行“软”验证,以计算召回率。
文本框3。异常检测管线。
图7。多变量异常评分。从多维上下文矩阵配置文件(CMP)开始,我们通过取每个维度得分的中位数为每个患者选择最佳维度,然后选择拐点处的维度。然后将此最优维度CMP用于基于距离的异常评分。
查看此图

数据集描述和预处理

数据集

我们研究的数据来自一项正在进行的现实世界远程医疗保健监测研究(文中提到的“Minder”研究)简介在英国英格兰,102名在家生活并由他们的护理员支持的痴呆症患者。其中51%(52/102)男性(平均年龄81.94,标准年龄6.34岁)和49%(50/102)女性(平均年龄80.80,标准年龄15.76岁)。移动数据通过安装在家庭不同部分的PIR传感器捕获——走廊、浴室、卧室、休息室和厨房——根据全天的移动被动触发。有门传感器,电器的智能插头,光和温度传感器,睡眠垫,以及生理数据记录器。在本研究中,我们只考虑PIR数据,因为它们在队列中丢失最少,最可靠,可用性最好。目前,痴呆症患者或他们的护理人员每天会自我报告一到两次生理数据,而且有更大的缺失,这将需要归因。这一群体的睡眠数据很少。

在我们的研究中,我们关注了15名至少有一次临床证实的UTI发生率的痴呆患者。其中53%(8/15)男性(平均年龄85.13,标准年龄5.57岁)和47%(7/15)女性(平均年龄82.86,标准年龄6.79岁)。在这15例患者中,7例(47%)也经历过≥1次住院事件。总共,我们有31个UTI和10个住院标签,涵盖9363个患者日,约占整个数据集的0.44%(41/9363)。临床监测团队使用患者的尿液样本进行验证后,手动标注UTI标签。但值得注意的是,老年患者常出现非典型症状,这使得区分无症状菌尿与有症状尿路感染具有挑战性[6].而且,泌尿道感染的开始时间和症状持续时间也没有明确定义。住院事件列表是根据全科医生的信息整理的。它包括住院日期,在一些但不是所有情况下,包括住院原因。

预处理
每日聚集

通过PIR运动传感器捕获的家庭运动数据首先每天聚合,以减少噪音,因为每小时的计数在一天到第二天可能变化很大,高粒度和变化使异常不易识别。我们忽略了来自同一传感器的连续发射事件,考虑第一个发射事件计算前一个位置的持续时间,最后一个发射事件计算当前位置的持续时间。在第一次和最后一次发射之间,同一传感器的任何连续发射都被忽略,从而减少冗余和噪声。

工程特性

为了捕捉不同类型的运动相关信息,我们计算了在文本框4获取不同位置的日常活动数据——浴室、卧室、厨房、休息室和走廊。

刺激功能。

特性及描述

  • 位置计数:这是每个位置的每日传感器发射计数。
  • 位置清晨计数:这是在当天午夜到早上6点之间的传感器发射计数。
  • 位置深夜计数:这是前一天下午6点到午夜之间的传感器发射计数。
  • 位置持续时间:这是每天在每个位置花费的总分钟数。
  • 位置小时运动变化:这是前一天某个位置的传感器小时分布与当天该位置的传感器小时分布之间的瓦瑟斯坦距离;Wasserstein距离越大,每小时模式的变化越大;该测量方法对患者家庭的不同运动密度具有鲁棒性。瓦瑟斯坦距离或“地球移动器”距离是衡量近似的单一可解释的度量最少的工作需要在两个概率分布之间移动,其中“功”可以粗略地定义为分布的质量移动的多少和它必须移动的距离的乘积[41].与L2、Kullback-Leibler散度和Jensen-Shannon散度等其他测量方法不同,Wasserstein距离对几何形状非常敏感[42].
文本框4。刺激功能。
特征选择

类似于Skubic等人的研究[43,我们应用了在文本框5选择异常检测的特征。

简化的功能列表包括浴室沃瑟斯坦距离、走廊沃瑟斯坦距离、休息室沃瑟斯坦距离、浴室清晨和傍晚活动、厨房清晨和傍晚活动、卧室清晨和傍晚活动、卧室活动持续时间和浴室活动持续时间。

选择异常检测特征的方法。

异常检测特征选择方法

  • 领域知识:通过Pevný [44]表明,只使用解释异常的特征的检测器比使用所有特征的检测器具有相同或更好的性能。不规律的浴室活动可能强烈提示尿路感染[45],因此,我们捕捉了浴室活动的每日变化。同样,睡眠紊乱、躁动和走神是痴呆症患者的常见特征[4647].因此,我们在卧室、走廊、厨房和休息室活动的每小时分布中包含了每天的变化。这些特征有助于捕捉不同地点不同寻常的昼夜活动,并遵循临床研究人员在一项类似研究中提出的建议,该研究支持用行为生物标志物建模健康下降[43].
  • 使用来自我们的患者队列的交叉验证数据,使用显著在线不一致技术来寻找与尿路感染和住院的最高中位数回忆值相关的共同特征[48].
  • 根据特征之间的相关性,我们剔除了多余的变量。
  • 我们还消除了公共空间的持续时间相关功能,如走廊、客厅和厨房,在这些地方很难区分患者和护理人员的活动。
  • 对不同家庭活动水平差异具有鲁棒性的变量被保留了下来。
文本框5。选择异常检测特征的方法。

实验

我们对从正在进行的Minder研究中选取的15名患者的家庭移动数据进行了实验,该研究共有31个UTI和10个住院标签,共9363个患者日。所有实验都在64位Intel i7-8700K中央处理器上运行,3.7 GHz Windows 10机器,32 GB RAM。

我们的实验设置列在表1.对于每个异常评分模型,我们对窗口大小、IQR阈值、鲁棒性的每种组合进行了实验z阈值、分位数和报告阈值的最佳结果。

表1。本研究考虑的实验参数。
设置
上下文窗口 3.
子序列长度(天) 3.
用于滑动窗口阈值设定的窗口大小(天) 7 14 21 30 60 90
差阈值 1.0和1.2
健壮的z阈值 1.65, 1.8, 3和4
分位数的阈值 0.95 0.96 0.97 0.98
Entropy-based方法

N(数据大小) 500

r (SD公差) 0.2

M(子序列长度) 7
用于标签验证的软缓冲区(实际标签的天数) −10 ~ +7

模型评价

我们使用来自15名患者的数据来评估基于多维cmp的异常评分,相对于单变量方法和文献中其他3种流行的、无参数和可解释的现代方法:基于角度的离群点检测(ABOD)、基于copula的离群点检测(COPOD)和轻量级在线异常检测(LODA)。为了适合在无监督的流场景中使用,我们只使用每个时间点的历史数据。

ABOD测量由相应距离加权的数据点的角度(余弦)谱的方差。ABOD的工作原理是,如果一个点的观测角谱很小,其他点将只定位在特定的方向上。这意味着这个点位于一些被组合在一起的点集合之外,这意味着这个点是一个离群值[49].COPOD的灵感来自于多变量数据分布建模的copula。COPOD首先构造一个经验联结,然后使用它来预测每个给定数据点的尾部概率,以确定其“极端”的水平。COPOD产生的离群值分数衡量的是一个点相对于数据集中其他点的可能性。该方法输出“维度离群图”,提供对给定离群点的离群子空间或特征的洞察[50].LODA由k一维直方图,每个直方图近似于投影到单个投影向量上的输入数据的概率密度。投影向量的作用是使单个直方图多样化,这使得集成系统能够提高单个检测器的性能。LODA的复杂度与训练样本的数量和输入空间的维数呈线性关系[44].

我们使用3个阈值标准的评分(文本框6).

为了确定基于cmp的异常评分在识别痴呆患者的真实远程监测数据中的异常时的竞争力,我们报告了在文本框7每种型号。

如果预测日期在标记的异常日期的软缓冲区内,则假定异常被正确识别。为了透明度,我们同时报告了平均回忆和患者智慧回忆。从临床角度来看,这一指标是模型有效性的直接指标。

当在模型之间进行选择时,临床医生可能会选择平均召回率较高的模型,因为在我们的场景中,错误警报的成本和不便远远小于错过真实异常的成本。

分数的阈值标准。

分数阈值划分标准

  • 鲁棒z阈值法或中值绝对偏差法受离群值的影响较小,用于计算修正的z以偏离中位数的SD单位量化异常评分[51].
  • Tukey或IQR阈值分割利用滑动窗口异常评分的IQR作为阈值分割的依据。任何大于第三个四分位数+的值x倍IQR视为异常,其中xIQR阈值是多少表1
  • 基于分位数的阈值分割使用异常分数的固定百分位作为阈值分割的基础表1
文本框6。分数的阈值标准。
模型评估。

模型评价措施

  • >33%回忆的患者数量:鉴于平均患者只有3个被证实的异常,我们根据有多少患者的异常被正确识别超过三分之一来对模型进行排名。这使得该模型是只对一小部分患者有效还是对整个队列有效都是透明的。
  • 平均回忆率:这是15名患者的平均回忆率,其中回忆率=数据集中的真阳性或所有已知异常。
  • 检测到的平均异常数:为尽量减少向临床监测团队发出的错误警报,越低越好。
  • 平均召回率与异常率的比值提高:根据Pimentel等人的研究[11],新颖性检测的有效性取决于检测率和虚警率。最好的模型将显示出高召回率和低数量的异常。
  • 精度:在这里,精度没有什么意义,因为异常值可能来自不同类型的健康指标、传感器故障、访客、宠物活动或患者或护理人员罕见的不寻常活动,这些在我们的数据集中没有标记。尽管我们仍然报告这个度量,但是跨方法的相对精度更有意义。
文本框7。模型评估。

数字生物标志物

数字生物标记是消费者产生的生理和行为测量,通过连接的数字工具收集,可用于解释、影响或预测健康结果[52].美国食品和药物管理局-美国国立卫生研究院对传统生物标记物的“生物标记物、终点和其他工具”分类将其用途分为以下几类:敏感性或风险确定、诊断用途以发现和确认感兴趣疾病的存在、监测疾病状况、预后用途以确定疾病的可能性、复发或进展、预测性使用和通过接触医疗产品或制剂测量反应[53].我们设想这些异常的生物标记物可用于确定易感性,并有助于UTI或其他不良临床事件的诊断、预后和预测。

多维CMP的创建涉及到组合特定于特征的CMP的中间步骤,这样每个上下文都按照特征相关的最近邻距离升序排列。这意味着,如果我们简单地跟踪有序堆叠CMP中每个上下文的有序特性集,我们就可以在其每个维度中发现最常见的贡献特性。第0维的模态特征将是与患者异常评分相关的最重要的生物标志物。第一个维度的模态特征将是第二个最重要的生物标志物,以此类推。随后,通过查看整个队列的有序堆叠cpmp,我们可以确定广义顶k重要的生物标志物。

伦理批准

本研究获得了东南海岸萨里郡国家卫生服务研究伦理委员会(卫生研究局)的伦理批准;技术综合健康管理研究伦理委员会参考文献:16/LO/1802;综合研究应用系统ID: 211318。


模型评价

我们报告了每种类型的单变量和多元模型的最佳结果(表2).

所有模型都能正确识别研究中三分之二患者的三分之一以上的已知异常。其中,具有等权重上下文(在窗口大小=7天时)的多维CMP健壮z= 1.65,k=1) 100%(15/15)患者>召回率为33%。其他基于cmp的方法显示,93%(14/15)的患者有类似的回忆。这突出了对多维CMP作为该队列异常检测工具的强大支持。

在我们的研究中,我们还测量了在624个平均患者日中,每个模型产生了多少异常。如图所示,任何基于cmp的模型所引发的警报的最大数量仅约为34或5.4%(34/624)的患者天数。我们表现最好的CMP模型发出了大约32个警报,平均为5.1%(32/624)的患者天数。注意,在我们的数据集中,平均每个患者有3个标记异常;然而,正如前面所强调的,注释的异常只包括UTI和住院,我们的模型被设计用来捕捉任何异常活动。

当将平均召回率与检测到的异常总数一起查看时,可以提供性能的整体视图,因为通过识别异常数量非常多的异常,很容易获得性能最佳的模型。总体上最好的模型是一个显示高召回,但提出的异常数量较低的模型。很明显,在窗口大小=7天的情况下,具有等权重上下文的多维CMP是健壮的z= 1.65,k=1提供了最均衡的性能,在624天的患者旅程中平均只发出32个警报。ABOD的召回率相对较低,而LODA和COPOD的召回率较高,但比我们性能最好的模型提高了警报次数。

表2。模型性能(N=15)。
模型 >患者33%回忆,n (%) 异常升高,平均值 召回率(%),平均值 精度,%一个
LODAb(w = 7;差1.2) 14 (93) 37.8 85.7 6.2
CMP之和c分数(w = 7;0.97分位数) 14 (93) 33.1 84.7 7.0
CMP评分平均值(w=7;0.97分位数) 14 (93) 33.1 84.7 7.0
等加权多维CMP (w=7;k= 1;健壮的z= 1.65) 15 (100) 32.1 84.3 7.2
COPODd(w = 7;0.95分位数) 13 (87) 36.8 79.1 5.9
ABODe(w = 21;0.95分位数) 13 (87) 30.0 77.7 7.1
距离加权多维CMP (w=14;k= 0;健壮的z= 1.65) 14 (93) 33.7 76.7 6.2
ApEnf-加权CMP评分(w=7;0.97分位数) 12 (80) 29.1 69.9 6.8
CMP评分的中位数(w=7;0.97分位数) 12 (80) 30.8 68.4 6.1
模糊熵加权CMP评分(w=7;0.97分位数) 10 (67) 27.7 65.5 6.5
CMP评分最大值(w=7;0.97分位数) 10 (67) 24.8 57.9 6.4

一个我们前面已经提到,在这种情况下,更有意义的是查看方法之间的相对精度,而不是绝对精度。

bLODA:异常的轻量级在线检测器。

cCMP:上下文矩阵概要。

dCOPOD:基于copula的离群点检测。

eABOD:基于角度的离群点检测。

f近似熵。

数字生物标志物

如前所述,患者的多维CMP可用于发现异常的重要数字生物标志物。在图8,我们显示了显著特征对整个队列异常评分的贡献的大小。

我们发现,清晨(午夜至早上6点)的浴室活动是异常评分的最大单一因素,差异很大,该队列的中位数约为30%。这证实了文献中的发现,即不寻常的浴室活动是尿路感染的一个临床显著特征[1254,它包含了我们标记数据集中四分之三的异常。患者水平的调查显示,这是60%(9/15)患者的首要生物标志物。深夜(下午6点到午夜)上厕所的活动也有12%的贡献。这两个因素都与睡眠中断有关,这在痴呆症患者中很常见。清晨不正常的卧室和厨房活动也是异常得分的重要原因之一,这表明痴呆患者出现的走神和睡眠紊乱。

多维CMP还提供了对患者特异性异常的直观洞察。图9显示2例患者的异常评分,按异常评分中位数排列。

对于患者JYN9,不寻常的清晨厨房活动是异常活动的主要生物标志物,在异常评分中我们也看到了最大的差异。对于SFAV患者,不寻常的卧室活动是他们异常评分的最大贡献者。这些数字显示了2例患者不同的异常模式,可能是第一例患者的躁动和徘徊,而第二例患者的睡眠中断和随时间变化的卧室活动。我们可以设想一个异常检测仪表板,为临床医生提供这样的洞察,使他们能够根据需要进行针对性的干预。

我们还可以使用标准化异常评分来查看跨患者视图(图10),其中我们使用患者自身最优值看到多变量异常评分的跨队列变化k维分数。研究患者的认知评分差异会很有趣。

图8。最重要的异常数字生物标志物。清晨上厕所的活动对整体异常评分的贡献中位数最大,约为30%。
查看此图
图9。2例患者的单因素异常评分分布。
查看此图
图10。所有患者的多变量异常评分分布。
查看此图

主要研究结果

痴呆患者异常的早期识别为重大健康事件发生前的早期干预提供了机会窗口。这意味着改善了健康状况,降低了保健费用,继续保持独立,提高了生活质量[43].在这项研究中,我们开发了一种mp驱动的异常检测方法,并评估了其在基于传感器的痴呆症患者远程监测的现实研究中的使用。我们开发了多维CMP来根据传感器数据建模患者的家庭活动,并使用时间段内活动之间的平均欧氏距离作为生成单个异常评分的基础。基于cmp的方法克服了传统基于距离的异常检测技术由于噪声、高报警率和识别局部新颖性等问题。我们的实验表明,基于多维cmp的异常检测比其他类似的快速、现代、准确和无参数的无监督异常检测技术具有更好的性能。它非常适用于具有噪声和不完整标记特征的现实世界远程监测数据,此外,它是操作监测的可视化工具,也有助于发现个性化和队列范围内的数字生物标志物。每个居民的个性化模型来自他们自己的传感器数据模式[43].这些方面使得基于cmp的异常检测具有临床意义,可解释,并立即可用,节省了临床医生注解患者活动的宝贵时间。CMP是域未知的,可以很容易地扩展到不同类型的医疗保健数据和域。据我们所知,我们的工作是CMP在医疗保健异常检测中的第一个真实用例。

我们选择的实验参数与临床相关。选择3的上下文窗口和3的子序列长度,以获得最大粒度、抗噪声性和对UTI等异常的适用性,其中3天模式比更细粒度的每日分析更有可能抛出异常行为;通常需要3至8天出现尿路感染[55].可以很容易地配置上下文窗口和子序列长度,以调查不同粒度级别的异常,例如7天、2周或1个月。同样,我们使用7天、14天、21天、30天、60天和90天的窗口来阈值异常评分。这样的时间段遵循典型的人类行为模式,很容易被临床医生理解。IQR的阈值,稳健z选择基于分位数的阈值和熵参数来反映文献中广泛使用的值。标签验证的软缓冲(实际异常标签的−10天到+7天)反映了由于噪声和人工标记的不准确性导致的标签薄弱问题,UTI的发展和临床诊断需要的时间,以及早期发现异常的需要。道和基奥[56]对弱标记数据使用了类似的评估技术。我们选择ABOD、COPOD和LODA与基于cmp的方法进行比较,因为它们同样是高性能、无参数、可解释、无监督的异常检测技术,与流数据场景(如远程健康监控)相关。

我们的评估方法也设计得简单、透明和有临床意义。一种好的方法必须具有较高的跨队列平均敏感性,同时对个体患者也具有较高的敏感性,同时提高最小的警报。因此,我们报告了总体灵敏度、患者敏感性、异常增加的平均数量,以及异常增加的召回率,这提供了一个全面的性能度量。尽管我们报告了每个模型的精度,但必须注意的是,我们只考虑了两种类型的标签——uti和住院——而我们的模型识别了家庭移动数据中的所有类型的异常,其中许多无法使用现有的标记数据进行验证。因此,我们预期绝对精度较低,而相对精度在我们的研究中提供了更好的跨模型性能指标。此外,5%的警报率是一个可以接受的低比率,因为这些警报可能对痴呆症患者的健康产生重要影响。这也是Rantz等人所采用的方法[12],我们的临床护理团队已经每周与病人进行检查。

我们的结果表明,对于性能最好的模型,阈值化的最佳滑动窗口大小是7到14天(即1-2周)。这在直觉上是有道理的,因为人类行为的“异常”可以被认为是他们最近例行程序的中断。Skubic等人的研究也证实了这一点[43],临床医生建议为传感器数据比较和阈值设定2周移动基线,以平衡捕捉突然和逐渐的健康变化。短滑动窗口的另一个优点是对患者特征和环境条件的变化具有鲁棒性。然而,ABOD技术是高度敏感的,需要足够的数据来捕获真正的异常值,并且在至少21天的回溯时间内表现最佳。这种增加样本以获得更好性能的ABOD行为在Domingues等人的研究中也得到了验证[57].

我们有三个惊人的观察。首先,在平衡队列范围的敏感性和升高的异常方面表现最好的模型是基于k=1(即,它只考虑患者的前两个特征)。这意味着基于患者活动的可靠异常检测模型可以是简单、轻量级、易于解释和推广的。其次,通过简单的聚合(即特征特异异常评分的和和平均值)将特征特异cmp组合而来的单变量模型既实现了高召回率,又实现了低报警量。事实上,它们在性能上更接近于表现最好的多元CMP模型,而不是更成熟的高性能模型,如LODA、ABOD和COPOD,以及其他结合单变量得分(如熵加权得分)的复杂方法。这再次表明,简单的、可解释的模型可以推广并具有竞争性地执行。第三,令人惊讶的是,等量加权的时间段评分方法比距离加权的时间段评分方法获得了更好的回忆。我们期望通过强调最近的时间段而不是过去的时间段,我们可能会得到一个异常值,它反映了当前时间段中真正的异常。然而,在这项研究中,情况似乎并非如此。我们的目标是探索对以前的时间段进行加权的不同方法,以确认这种行为是由于使用了特定的距离加权逻辑还是更普遍的发现。

数字生物标记物是我们方法中非常有用的产物。它们告诉我们在特定时期是什么样的家庭活动导致了异常现象。此外,纵观患者的时间轴,我们可以找到最常见的单一活动或特征,在整个时间段内对异常评分贡献最大(即,他们异常行为的数字生物标记)。我们发现,整个队列范围内,清晨(午夜至清晨6点)的浴室活动是异常行为最常见的数字生物标志物(9/15,60%的患者),其次是深夜的浴室活动和清晨的卧室和厨房活动。这些发现在定量上验证了对痴呆症患者的观察性研究,这些研究观察到焦虑、在不寻常的时间徘徊和不寻常的上厕所活动,特别是清晨和深夜上厕所活动,特别是在经历UTI的痴呆症患者中[1420.4546].最后,我们的方法可以提供在时间段、患者和队列水平上异常的数字生物标记的排名。这一结果使得基于cmp的异常评分独立地用于临床监测和数字生物标志物的查询和验证。

这项工作与基于Minder研究的已有发表的研究之间有一些显著的区别。首先,已发表的作品使用了各种有监督和半监督机器学习方法来检测或预测目标健康状况,如躁动和UTI(一项研究使用无监督学习通过聚类分离异常运动模式)。因此,这些模型使用来自临床验证的患者子集的数据进行训练,以在其轨迹中具有特定的健康状况。相比之下,我们的工作评估了一种轻量级、无监督和无参数的方法来检测基于家庭活动数据的一般异常。它不需要训练数据,但通过来自经历过一次或多次尿路感染和住院事件的患者的数据进行验证。第二,现有的研究除了家庭活动外,还结合了患者的生理数据和家用电器使用情况。我们目前只使用家庭移动数据。第三,现有的研究要么依赖于固定的训练数据,要么依赖于定期刷新的训练数据,而我们的方法被设计为在流环境中工作,这意味着我们的每日检测和警报算法使用患者时间轴中的信息直到当天。第四,我们的算法是患者数据驱动的,而不是队列数据驱动的。这意味着我们通过考虑算法对个体患者数据的性能来评估平均回忆率。 In contrast, published work takes a cohort-wide or patient-blind approach to assess algorithm performance. These factors should be collectively considered when comparing our work with other Minder-based research.

基于cmp的方法非常适合异常检测应用程序,在这些应用程序中,数据和标签的特征是真实世界的噪声,监督学习所需的带注释的训练数据可能由于资源限制或在流数据场景中不可用,以及正常数据和异常数据之间的区别不明确。这包括在各种工业、城市和卫生保健环境中基于传感器的远程健康监测。基于cmp的方法擅长缩小和关注可配置时间尺度上的时间模式。它还在设计时考虑到了个性化,这使得它与医疗保健特别相关,在医疗保健中,相似的异常或相同的疾病的模式可能在不同的个体中表现不同。对于可解释性是操作监视团队的关键的情况,它是理想的。

基于cmp的方法对于优先考虑敏感性而不是可解释性的应用程序来说可能并不理想。对于具有良好定义、易于理解的模式的数据,例如心电图数据,或者噪声水平较低或正常和异常数据之间的区别已被清楚理解的数据,它也不是最佳工具。最后,需要用特征约简方法增强CMP管道,以扩展到高维数据。

限制

本文提出的异常检测方法的一个局限性是没有考虑跨传感器的相关性。这将在未来使用可解释机器学习的研究中进行调查。其次,我们的研究忽略了前门和后门的传感器数据。这一遗漏是有意的,因为我们感兴趣的是检测由室内家庭活动的显著变化引起的异常,而不是那些由室外情况引起的异常。此外,前门和后门的打开和关闭很难归因于痴呆症患者。第三,为了提高基于被动感知的异常检测模型的鲁棒性,需要一种将患者与其他家庭成员区分开来的系统。第四,为了实现比1个“上下文”更细的粒度和更低的延迟,基于cmp的异常检测模型应该配置为每小时摄取数据或以高于1天的分辨率摄取数据。第五,我们假设单一时间窗口中的异常可以确定一个复杂的健康事件。然而,宠物和访客的存在也可能导致异常。为了解决这一问题,我们不仅需要区分患者和护理人员,而且需要在后续时间窗口中监测异常,以高置信度将异常与健康变化联系起来。 Finally, we will require a larger sample size to further validate our approach.

结论及未来工作

在本研究中,我们开发了一种基于CMP的新型轻量级无监督异常检测管道,并对其在基于传感器的痴呆症患者远程健康监测中的应用进行了评估。我们以新颖的方式组合了单变量CMP评分,开发了多变量CMP,并通过滑动窗口阈值识别异常患者天数进行了测试。我们证明了基于cmp的异常评分在无监督异常检测方面比其他可比方法更加有效和可推广。具体而言,基于7天滑动窗口并使用前2个贡献患者特定特征的多维CMP显示84.3%的回忆,在平均患者时间线624天内只有32次警报。此外,我们展示了如何使用CMP来发现和解释时间段、患者和队列水平异常的数字生物标志物。我们的研究收集了15名有泌尿道感染和住院事件的痴呆症患者的9363天,研究表明,在我们的队列中,每天凌晨和晚些时候不寻常的上厕所活动是异常的一个显著的生物标志物。这有助于定量验证痴呆患者类似行为的观察性研究。

我们未来的工作将集中在以下领域:将生理数据添加到异常评分管道中,开发CMP作为一种工具,对数据中的模式和异常进行有效的可视化监控,并适应除了欧氏距离之外的其他距离指标,在更大的患者队列和不同类型的异常上验证CMP,并使用机器学习方法使用基于CMP的评分对不同类型的异常进行分类。我们还将研究季节效应,并将我们的方法与其他相关的异常检测方法进行比较。我们计划将我们的模型集成到Minder平台中,在检测到异常时发出警报,使监测团队能够调查底层传感器数据,并及时为患者提供干预。被验证为正确的警报将被记录在患者时间轴中,并用于监视我们的模型的操作准确性。

致谢

这项研究得到了英国痴呆症研究所的支持多媒体附件1查看完整的确认列表)。作者还希望感谢Dieter De Paepe的创作和帮助使用Python系列距离矩阵库,并感谢Philip Evans教授(萨里大学视觉、语音和信号处理中心的医疗辐射成像教授)的有益讨论。

数据可用性

访问完整的数据集需要伦理批准,由于家庭监测数据的敏感性以及隐私和安全要求,目前无法获得。要查询完整的数据集,必须向帝国理工学院英国痴呆研究所护理研究与技术中心的机器智能小组负责人Payam Barnaghi教授发送一份带有意向和使用声明的请求。

利益冲突

没有宣布。

多媒体附件1

英国痴呆研究所的确认名单。

PDF档案(adobepdf档案),51kb

  1. 痴呆。世界卫生组织2021年9月2日。URL:<一个t一个rget="_blank" href="https://www.who.int/news-room/fact-sheets/detail/dementia">https://www.who.int/news-room/fact-sheets/detail/dementia[2021-12-01]访问
  2. 为媒体提供关于痴呆症的事实。阿尔茨海默氏症协会。URL:<一个t一个rget="_blank" href="https://www.alzheimers.org.uk/about-us/news-and-media/facts-media">https://www.alzheimers.org.uk/about-us/news-and-media/facts-media[2021-12-01]访问
  3. 英国痴呆研究所护理研究与技术中心,帝国理工学院。URL:<一个t一个rget="_blank" href="https://www.imperial.ac.uk/uk-dri-care-research-technology">https://www.imperial.ac.uk/uk-dri-care-research-technology[2022-09-14]访问
  4. 英国痴呆研究所护理研究与技术。URL:<一个t一个rget="_blank" href="https://ukdri.ac.uk/centres/care-research-technology">https://ukdri.ac.uk/centres/care-research-technology[2021-12-01]访问
  5. 用卷积神经网络检测痴呆患者的异常行为。Artif Intell Med 2019年3月94:88-95。[<一个t一个rget="_blank" href="https://dx.doi.org/10.1016/j.artmed.2019.01.005">CrossRef] [<一个href="https://www.ncbi.nlm.nih.gov/entrez/query.fcgi?cmd=Retrieve&db=PubMed&list_uids=30871686&dopt=Abstract" target="_blank">Medline]
  6. Rowe TA, Juthani-Mehta M.老年人尿路感染。老龄化健康2013年10月9日(5):519-528 [<一个href="https://europepmc.org/abstract/MED/24391677" target="_blank">免费全文] [<一个t一个rget="_blank" href="https://dx.doi.org/10.2217/ahe.13.38">CrossRef] [<一个href="https://www.ncbi.nlm.nih.gov/entrez/query.fcgi?cmd=Retrieve&db=PubMed&list_uids=24391677&dopt=Abstract" target="_blank">Medline]
  7. 加瓦兹G, Delerce E, Cambau E, François P, coryer B, de Wazières B,等。75岁以上住院老年患者尿路感染的诊断标准:一项多中心横断面研究2013年5月;43(5):189-194。[<一个t一个rget="_blank" href="https://dx.doi.org/10.1016/j.medmal.2013.02.006">CrossRef] [<一个href="https://www.ncbi.nlm.nih.gov/entrez/query.fcgi?cmd=Retrieve&db=PubMed&list_uids=23622951&dopt=Abstract" target="_blank">Medline]
  8. Marques LP, Flores JT, Barros Junior OD, Rodrigues GB, Mourão C, Moreira RM。社区老年妇女尿路感染的流行病学和临床方面。巴西传染病2012年9月16日(5):436-441 [<一个href="https://linkinghub.elsevier.com/retrieve/pii/S1413-8670(12)00129-8" target="_blank">免费全文] [<一个t一个rget="_blank" href="https://dx.doi.org/10.1016/j.bjid.2012.06.025">CrossRef] [<一个href="https://www.ncbi.nlm.nih.gov/entrez/query.fcgi?cmd=Retrieve&db=PubMed&list_uids=22975174&dopt=Abstract" target="_blank">Medline]
  9. 总在勒。无症状菌尿。感染疾病临床2003年6月;17(2):367-394。[<一个t一个rget="_blank" href="https://dx.doi.org/10.1016/s0891-5520(03)00008-4">CrossRef]
  10. Ahmad S, Lavin A, Purdy S, Agha Z.流数据的无监督实时异常检测。神经计算2017 11月262:134-147。[<一个t一个rget="_blank" href="https://dx.doi.org/10.1016/j.neucom.2017.04.070">CrossRef]
  11. 皮门特尔,克利夫顿,塔拉森科。新事物检测综述。信号处理2014 Jun;99:215-249。[<一个t一个rget="_blank" href="https://dx.doi.org/10.1016/j.sigpro.2013.12.026">CrossRef]
  12. Rantz M, Skubic M, Koopman R, Phillips L, Alexander G, Miller S,等。使用传感器网络检测老年人的尿路感染。2011年IEEE第13届电子健康网络、应用与服务国际会议论文集;2011年6月13-15日;哥伦比亚,密苏里州,美国。[<一个t一个rget="_blank" href="https://dx.doi.org/10.1109/health.2011.6026731">CrossRef]
  13. Mori T, Fujii A, Shimosaka M, Noguchi H, Sato T.基于累积家庭传感器数据的典型行为模式提取与异常检测算法。见:《未来一代通信与网络学报》(FGCN 2007)。2007年发表于:未来一代通信和网络(FGCN 2007);2007年12月06-08日;韩国济州岛(韩国)。[<一个t一个rget="_blank" href="https://dx.doi.org/10.1109/FGCN.2007.226">CrossRef]
  14. Hoque E, Dickerson R, Preum S, Hanson M, Barth A, Stankovic J. Holmes:用于日常家庭活动的综合异常检测系统。发表于:2015传感器系统分布式计算国际会议论文集;2015年6月10-12日;福塔雷萨,巴西。[<一个t一个rget="_blank" href="https://dx.doi.org/10.1109/dcoss.2015.20">CrossRef]
  15. Enshaeifar S, Zoha A, Markides A, Skillman S, Acton ST, Elsaleh T,等。使用家用传感器和机器学习技术对痴呆症患者的日常生活活动进行健康管理和模式分析。PLoS One 2018;13(5):e0195605 [<一个href="https://dx.plos.org/10.1371/journal.pone.0195605" target="_blank">免费全文] [<一个t一个rget="_blank" href="https://dx.doi.org/10.1371/journal.pone.0195605">CrossRef] [<一个href="https://www.ncbi.nlm.nih.gov/entrez/query.fcgi?cmd=Retrieve&db=PubMed&list_uids=29723236&dopt=Abstract" target="_blank">Medline]
  16. Novák M, Bi?一个s M, Jakab F. Unobtrusive anomaly detection in presence of elderly in a smart-home environment. In: Proceedings of the 2012 ELEKTRO. 2012 Presented at: 2012 ELEKTRO; May 21-22, 2012; Rajecke Teplice, Slovakia. [<一个t一个rget="_blank" href="https://dx.doi.org/10.1109/elektro.2012.6225617">CrossRef]
  17. 李宏,张强,段鹏。智能环境中活动识别的一遍神经网络方法。2008第七届智能控制与自动化世界大会论文集。2008年6月25-27日;中国重庆。[<一个t一个rget="_blank" href="https://dx.doi.org/10.1109/wcica.2008.4592901">CrossRef]
  18. Singla G, Cook DJ, Schmitter-Edgecombe M.识别智能环境中多个居民的独立和联合活动。J Ambient Intell Humaniz Comput 2010 Mar 01;1(1):57-63 [<一个href="https://europepmc.org/abstract/MED/20975986" target="_blank">免费全文] [<一个t一个rget="_blank" href="https://dx.doi.org/10.1007/s12652-009-0007-1">CrossRef] [<一个href="https://www.ncbi.nlm.nih.gov/entrez/query.fcgi?cmd=Retrieve&db=PubMed&list_uids=20975986&dopt=Abstract" target="_blank">Medline]
  19. 阿l A, Taati B, Mihailidis A.老年人轻度认知障碍的自主不突发性检测。IEEE生物工程学报2015年5月;62(5):1383-1394。[<一个t一个rget="_blank" href="https://dx.doi.org/10.1109/tbme.2015.2389149">CrossRef]
  20. 杨晓明,杨晓明,杨晓明。基于时间模式的智能家居异常检测方法。2007第三届IET智能环境国际会议论文集2007年9月24-25日;乌尔姆。[<一个t一个rget="_blank" href="https://dx.doi.org/10.1049/CP:20070390">CrossRef]
  21. Palermo F, Li H, Capstick A, Fletcher-Lloyd N, Zhao Y, Kouchaki S,等。设计一个临床适用的深度复发模型,利用家庭监测数据识别痴呆患者的神经精神症状。出来了。预印本于2021年10月19日发布在网上[<一个href="https://doi.org/10.1145/1541880.1541882" target="_blank">免费全文]
  22. 李浩,Enshaeifar S, Skillman S, Markides A, Kenny M, Sharp D,等。痴呆症患者尿路感染风险分析的半监督机器学习模型。SSRN j 2020。[<一个t一个rget="_blank" href="https://dx.doi.org/10.2139/ssrn.3682493">CrossRef]
  23. paul R, Eberle W, Holder L.基于图形的智能家居老年患者活动异常检测方法。伦敦:CSREA出版社;2018.
  24. 李志刚,李志刚。用图形表示的数据的异常检测。Intell数据分析2007年11月09;11(6):663-689。[<一个t一个rget="_blank" href="https://dx.doi.org/10.3233/ida-2007-11606">CrossRef]
  25. Gupta P, McClatchey R, Caleb-Solly P.使用无监督学习方法从未标记的智能家居传感器数据跟踪用户活动的变化。神经计算应用2020年1月25日;32(16):12351-12362。[<一个t一个rget="_blank" href="https://dx.doi.org/10.1007/s00521-020-04737-6">CrossRef]
  26. Li H, Rezvani R, Kolanko M, Sharp D, Wairagkar M, Vaidyanathan R,等。一个分析痴呆患者躁动和尿路感染风险的注意模型。出来了。预印本于2021年1月18日发布在网上[<一个href="https://arxiv.org/abs/2101.07007" target="_blank">免费全文] [<一个t一个rget="_blank" href="https://dx.doi.org/10.48550/arXiv.2101.07007">CrossRef]
  27. 林杰,基奥E,傅安,范洪辉。近似于魔法:发现不寻常的医疗时间序列。第18届IEEE基于计算机的医疗系统研讨会论文集(CBMS'05)。2005年参加第18届IEEE计算机医疗系统研讨会(CBMS’05);2005年6月23-24日;都柏林,爱尔兰。[<一个t一个rget="_blank" href="https://dx.doi.org/10.1109/cbms.2005.34">CrossRef]
  28. 兰松,陈锐,赵伟。基于在线矩阵剖面的IT操作序列异常检测。出来了。预印本于2021年8月27日发布在网上[<一个href="https://arxiv.org/abs/2108.12093" target="_blank">免费全文] [<一个t一个rget="_blank" href="https://dx.doi.org/10.48550/arXiv.2108.12093">CrossRef]
  29. Steenwinckel B, De Paepe D, Vanden Hautte S, Heyvaert P, Bentefrit M, Moens P,等。FLAGS:一种融合专家知识和机器学习的方法,用于传感器数据流的自适应异常检测和根本原因分析。未来一代计算系统2021年3月;116:30-48。[<一个t一个rget="_blank" href="https://dx.doi.org/10.1016/j.future.2020.10.015">CrossRef]
  30. 陈晓峰,陈晓峰,陈晓峰,等。冷成形加工过程中的异常检测与事件挖掘。2020年10月10日;115(3):837-852。[<一个t一个rget="_blank" href="https://dx.doi.org/10.1007/s00170-020-06156-2">CrossRef]
  31. De Paepe D, Vanden Hautte S, Steenwinckel B, De Turck F, Ongenae F, Janssens O,等。一个支持上下文序列分析的广义矩阵概要框架。工程应用Artif Intell 2020年4月;90:103487。[<一个t一个rget="_blank" href="https://dx.doi.org/10.1016/j.engappai.2020.103487">CrossRef]
  32. Chandola V, Banerjee A, Kumar V.异常检测。ACM计算Surv 2009 july;41(3):1-58 [<一个href="https://doi.org/10.1145/1541880.1541882" target="_blank">免费全文] [<一个t一个rget="_blank" href="https://dx.doi.org/10.1145/1541880.1541882">CrossRef]
  33. 叶超,朱勇,Ulanova L, Begum N,丁勇,道H,等。矩阵概要I:时间序列的所有对相似连接:一个统一的视图,包括主题,不和谐和shapelets。见:2016年IEEE第16届数据挖掘国际会议论文集。2016年参加:2016 IEEE第十六届数据挖掘国际会议(ICDM);2016年12月12-15日;西班牙巴塞罗那。[<一个t一个rget="_blank" href="https://dx.doi.org/10.1109/icdm.2016.0179">CrossRef]
  34. 叶志刚,王晓燕,王晓燕。矩阵剖面VI:有意义多维母题的发现。见:2017年IEEE国际数据挖掘会议论文集。出席:2017 IEEE国际数据挖掘会议(ICDM);2017年11月18-21日;新奥尔良,洛杉矶,美国。[<一个t一个rget="_blank" href="https://dx.doi.org/10.1109/ICDM.2017.66">CrossRef]
  35. 多维母题发现。又粗又短。URL:<一个t一个rget="_blank" href="https://stumpy.readthedocs.io/en/latest/Tutorial_Multidimensional_Motif_Discovery.html">https://stumpy.readthedocs.io/en/latest/Tutorial_Multidimensional_Motif_Discovery.html#Multi-dimensional-Matrix-Profiles[2021-12-01]访问
  36. 王曦,Mueen A,丁浩,Trajcevski G, Scheuermann P, Keogh E.时间序列数据表示方法与距离度量的实验比较。2012年2月10日;26(2):275-309。[<一个t一个rget="_blank" href="https://dx.doi.org/10.1007/s10618-012-0250-5">CrossRef]
  37. González C, Jensen E, Gambús P, Vallverdú M.熵测量作为描述符识别脑电图信号中的呼吸暂停。熵(巴塞尔)2019 6月18日;21(6):605 [<一个href="https://www.mdpi.com/resolver?pii=e21060605" target="_blank">免费全文] [<一个t一个rget="_blank" href="https://dx.doi.org/10.3390/e21060605">CrossRef] [<一个href="https://www.ncbi.nlm.nih.gov/entrez/query.fcgi?cmd=Retrieve&db=PubMed&list_uids=33267319&dopt=Abstract" target="_blank">Medline]
  38. Pincus SM, Gladstone IM, Ehrenkranz RA。一种用于医疗数据分析的规律性统计。临床监测杂志1991 10月7(4):335-345。[<一个t一个rget="_blank" href="https://dx.doi.org/10.1007/bf01619355">CrossRef]
  39. 孟德斯诺斯,李晓东,李晓东。基于力板的人体平衡评价的熵量测量参数选择。见:2018年世界医学物理和生物医学工程大会。新加坡:施普林格;2018.
  40. Satopaa V, Albrecht J, Irwin D, Raghavan B.在干草堆中寻找“膝盖”:检测系统行为中的膝盖点。在:2011第31届分布式计算系统国际会议论文集2011第31届分布式计算系统国际会议论文集2011年6月20-24日;明尼阿波利斯,明尼苏达州,美国。[<一个t一个rget="_blank" href="https://dx.doi.org/10.1109/icdcsw.2011.20">CrossRef]
  41. 王尔德H, Knight V, Gillard J, Smith K.基于Wasserstein距离的分段分析和队列参数恢复:对慢性阻塞性肺疾病患者管理数据的研究。出来了。2020年8月10日网上预印本发布[<一个href="https://arxiv.org/abs/2008.04295" target="_blank">免费全文] [<一个t一个rget="_blank" href="https://dx.doi.org/10.48550/arXiv.2008.04295">CrossRef]
  42. Yan Y, Duffner S, Phutane P, Berthelier A, Blanc C, Garcia C,等。基于二维Wasserstein损失的鲁棒面部标记检测。模式识别2021年8月;116:107945。[<一个t一个rget="_blank" href="https://dx.doi.org/10.1016/j.patcog.2021.107945">CrossRef]
  43. Skubic M, Guevara RD, Rantz M.使用内置传感器数据进行嵌入式健康评估的自动健康警报。医学杂志2015;3:1-11。[<一个t一个rget="_blank" href="https://dx.doi.org/10.1109/jtehm.2015.2421499">CrossRef]
  44. Pevný T. Loda:异常的轻量级在线探测器。Mach Learn 2015 7月21日;102(2):275-304。[<一个t一个rget="_blank" href="https://dx.doi.org/10.1007/s10994-015-5521-0">CrossRef]
  45. Rantz MJ, Skubic M, Koopman RJ, Alexander GL, Phillips L, Musterman K,等。加速老年人疾病迹象识别的自动化技术。J Gerontol Nurs 2012年4月38日(4):18-23 [<一个href="https://europepmc.org/abstract/MED/22420519" target="_blank">免费全文] [<一个t一个rget="_blank" href="https://dx.doi.org/10.3928/00989134-20120307-01">CrossRef] [<一个href="https://www.ncbi.nlm.nih.gov/entrez/query.fcgi?cmd=Retrieve&db=PubMed&list_uids=22420519&dopt=Abstract" target="_blank">Medline]
  46. D'Agata E, Loeb MB, Mitchell SL.评估养老院晚期痴呆患者疑似尿路感染的挑战。J Am Geriatr Soc 2013 Jan 11;61(1):62-66 [<一个href="https://europepmc.org/abstract/MED/23311553" target="_blank">免费全文] [<一个t一个rget="_blank" href="https://dx.doi.org/10.1111/jgs.12070">CrossRef] [<一个href="https://www.ncbi.nlm.nih.gov/entrez/query.fcgi?cmd=Retrieve&db=PubMed&list_uids=23311553&dopt=Abstract" target="_blank">Medline]
  47. Ijaopo EO。痴呆症相关躁动:非药物干预的回顾和药物治疗的风险和收益分析。Transl Psychiatry 2017 Oct 31;7(10):e1250 [<一个href="https://doi.org/10.1038/tp.2017.199" target="_blank">免费全文] [<一个t一个rget="_blank" href="https://dx.doi.org/10.1038/tp.2017.199">CrossRef] [<一个href="https://www.ncbi.nlm.nih.gov/entrez/query.fcgi?cmd=Retrieve&db=PubMed&list_uids=29087372&dopt=Abstract" target="_blank">Medline]
  48. Avogadro P, Palonca L, Dominoni MA。时间序列在线异常搜索:在线重大不一致。Knowl Inf Syst 2020 Mar 09;62(8):3083-3106。[<一个t一个rget="_blank" href="https://dx.doi.org/10.1007/s10115-020-01453-4">CrossRef]
  49. 高维数据中基于角度的离群点检测。见:第14届ACM SIGKDD知识发现与数据挖掘国际会议论文集。2008年发表于:KDD08:第十四届ACM SIGKDD知识发现与数据挖掘国际会议;2008年8月24日至27日;美国内华达州拉斯维加斯。[<一个t一个rget="_blank" href="https://dx.doi.org/10.1145/1401890.1401946">CrossRef]
  50. 李志,赵颖,Botta N, Ionescu C,胡欣。COPOD:基于copula的离群点检测。见:2020年IEEE国际数据挖掘会议论文集。发表于:2020 IEEE国际数据挖掘会议(ICDM);2020年11月17-20日;索伦托,意大利。[<一个t一个rget="_blank" href="https://dx.doi.org/10.1109/icdm50108.2020.00135">CrossRef]
  51. 扎克。统计。2021年4月5日。URL:<一个t一个rget="_blank" href="https://www.statology.org/modified-z-score/">https://www.statology.org/modified-z-score/[2021-12-01]访问
  52. 王涛,Azad T, Ranan R.数字生物标记对医疗保健的新兴影响。RockHealth.org。2016年1月31日。URL:<一个t一个rget="_blank" href="https://rockhealth.com/reports/the-emerging-influence-of-digital-biomarkers-on-healthcare/">https://rockhealth.com/reports/the-emerging-influence-of-digital-biomarkers-on-healthcare/[2021-12-01]访问
  53. 黄瑞瑞,李立根,温丕宇,Alexander BM。FDA NIH生物标记物、终点和其他工具(BEST)神经肿瘤学资源。神经肿瘤2018年8月02;20(9):1162-1172 [<一个href="https://europepmc.org/abstract/MED/29294069" target="_blank">免费全文] [<一个t一个rget="_blank" href="https://dx.doi.org/10.1093/neuonc/nox242">CrossRef] [<一个href="https://www.ncbi.nlm.nih.gov/entrez/query.fcgi?cmd=Retrieve&db=PubMed&list_uids=29294069&dopt=Abstract" target="_blank">Medline]
  54. 泌尿系感染的流行病学:发病率、发病率和经济成本。Am J Med 2002 july;113(1):5-13。[<一个t一个rget="_blank" href="https://dx.doi.org/10.1016/s0002-9343(02)01054-9">CrossRef]
  55. 戴维斯是CP,希尔是小WC。尿路感染(UTI)会传染吗?RxList。2022年1月8日。URL:<一个t一个rget="_blank" href="https://www.rxlist.com/is_a_urinary_tract_infection_uti_contagious/article.htm">https://www.rxlist.com/is_a_urinary_tract_infection_uti_contagious/article.htm[2021-12-01]访问
  56. 矩阵剖面V:一种将领域知识融入母题发现的通用技术。在:第23届ACM SIGKDD国际会议关于知识发现和数据挖掘的论文集。20172017年8月13日至17日;加拿大哈利法克斯。[<一个t一个rget="_blank" href="https://dx.doi.org/10.1145/3097983.3097993">CrossRef]
  57. 王晓燕,李晓燕,李晓燕。一种基于算法的离群值检测方法。Pattern recognition 2018 Feb;74:406-421。[<一个t一个rget="_blank" href="https://dx.doi.org/10.1016/j.patcog.2017.09.037">CrossRef]


ABOD:基于角度的离群点检测
CMP:上下文矩阵概要
COPOD:基于copula的离群点检测
LODA:轻量级异常在线检测器
议员:矩阵简介
PIR:被动红外
泌尿道感染:尿路感染


王俊杰、梁涛编辑;提交23.03.22;G Abebe, R Zhao的同行评议;对作者21.06.22的评论;修订版收到04.07.22;接受30.07.22;发表19.09.22

版权

©Nivedita Bijlani, Ramin Nilforooshan, Samaneh Kouchaki。最初发表于JMIR Aging (https://aging.www.mybigtv.com), 19.09.2022。

这是一篇开放获取的文章,根据创作共用署名许可协议(https://creativecommons.org/licenses/by/4.0/)发布,该协议允许在任何媒体上不受限制地使用、分发和复制,前提是原始作品首次发表在《JMIR Aging》上,并被适当引用。必须包括完整的书目信息,https://aging.www.mybigtv.com上的原始出版物链接,以及版权和许可信息。


Baidu
map