卡塔尔世界杯8强波胆分析|卡塔尔世界杯4强波胆分析

晶澳

JMIR老化

2561 - 7605

卡塔尔世界杯8强波胆分析

加拿大多伦多

v5i3e38211

36121687

10.2196/38211

原始论文

痴呆症患者不良健康状况的无监督数据驱动异常检测方法:队列研究

王

京

梁

蒂芙尼

Abebe

Girmaw

赵

Runchen

Bijlani

Nivedita

大麻,女士 1

视觉、语音和信号处理中心萨里大学

雄鹿山388号

吉尔福德，GU2 7XH

联合王国 44 1483 300 803 44 1483 300 800 n.bijlani@surrey.ac.uk

https://orcid.org/0000-0001-9862-4732

Nilforooshan

拉明

医学博士MRCPsych 2 3. 4

https://orcid.org/0000-0001-9801-183X

Kouchaki

Samaneh

理学士、理学硕士、博士 1 3.

https://orcid.org/0000-0002-5870-4030

1 视觉、语音和信号处理中心萨里大学

吉尔福德

联合王国 2 萨里和边境合作NHS基金会信托

吉尔福德

联合王国 3. 护理研究及技术中心英国痴呆症研究所帝国理工学院

伦敦

联合王国 4 心理学院萨里大学

吉尔福德

联合王国

通讯作者:Nivedita Bijlani n.bijlani@surrey.ac.uk

Jul-Sep 2022

19 9 2022

5 3.

e38211

23 3. 2022 21 6 2022 4 7 2022 30. 7 2022

©Nivedita Bijlani, Ramin Nilforooshan, Samaneh Kouchaki。最初发表于JMIR Aging (https://aging.www.mybigtv.com)， 19.09.2022。

2022

这是一篇根据创作共用署名许可协议(https://creativecommons.org/licenses/by/4.0/)发布的开放获取文章，允许在任何媒介上不受限制地使用、分发和复制，前提是正确引用了首次发表在JMIR Aging上的原创作品。必须包括完整的书目信息，https://aging.www.mybigtv.com上的原始出版物的链接，以及此版权和许可信息。

背景

基于传感器的远程健康监测可用于及时发现痴呆症患者的健康恶化，对其日常生活的影响最小。异常检测方法已广泛应用于各个领域，包括远程健康监控。然而，目前的方法受到噪声、多变量数据和低泛化的挑战。

客观的

本研究旨在开发一种在线的、轻量级的、基于无监督学习的方法，利用痴呆症患者的活动变化来检测代表不良健康状况的异常。我们在2019年8月至2021年7月期间，英国痴呆症研究所从15个参与家庭收集了9363天的真实数据集，证明了其优于最先进方法的有效性。我们的方法应用于家庭运动数据，以检测尿路感染(UTIs)和住院情况。

方法

我们提出并评估了一种基于上下文矩阵轮廓(CMP)的解决方案，这是一种精确、超快的基于距离的异常检测算法。利用被动红外传感器收集的每日汇总的家庭运动数据，我们生成了每个患者的位置传感器计数、持续时间和每小时运动模式变化的cmp。我们通过两种方式计算了标准化异常评分:结合单变量CMP和开发多维CMP。相对于基于角度的离群点检测、基于copula的离群点检测和轻量级在线异常检测，我们的方法进行了性能评估。我们使用多维CMP来发现和呈现与痴呆症患者不良健康状况相关的重要特征。

结果

多维CMP平均产生84.3%的召回率和32.1个警报，或5.1%的警报率，在评估UTI和住院时，与基于copula和基于角度的离群点检测和异常的轻量级在线检测器相比，提供了召回率和相对精度的最佳平衡。午夜至早上6点的厕所活动被证明是泌尿道感染异常的最重要的跨患者数字生物标志物，约占异常评分的30%。我们还演示了如何基于cmp的异常评分可用于异常模式的跨患者视图。

结论

据我们所知，这是第一个将CMP应用于医疗保健场景中的连续异常检测的真实世界研究。CMP继承了矩阵剖面的速度、准确性和简单性，提供了可配置性、降噪和检测模式的能力，以及对临床从业者的可解释性。我们通过开发多维CMP解决了在多变量时间序列医疗保健数据中异常评分的需求。CMP具有高灵敏度、低警报率、比最先进的方法更好的整体性能以及发现异常的数字生物标记物的能力，是一种具有临床意义的无监督异常检测技术，可扩展到痴呆症和其他医疗保健场景的多模态数据。

上下文矩阵概要多维异常检测异常值检测基于传感器的远程健康监测痴呆无监督学习

简介背景

痴呆症是一种广泛的大脑活动的进行性和不可逆转的衰退，包括记忆、思考、定向、理解、计算、学习能力、语言和判断受损，超出了自然生物衰老的预期。世界卫生组织估计，全世界约有5500万人患有痴呆症，到2030年将增至7800万人，到2050年将增至1.39亿人[ 1］．管理照顾这一不断增长的人口会产生巨大的成本。阿尔茨海默氏症协会认为，英国痴呆症患者的护理费用为347亿英镑(400亿美元)，到2040年将大幅上升至941亿英镑(1086亿美元)[ 2］．由于摔倒损伤、败血症、肺炎和尿路感染(UTI)等可能可预防的疾病而住院的痴呆症患者给卫生系统带来巨大压力。为了最大限度地减少可预防的住院治疗，对人工智能驱动的技术进行了大量投资，使痴呆症患者在舒适的家中生活时，能够远程监测和协助他们的健康。

英国痴呆症研究所护理研究和技术中心在这一方向上做出了重大努力，其愿景是“使用以患者为中心的技术，帮助痴呆症患者在自己家中生活得更好、更久”[ 3.］．英国痴呆症研究所护理研究和技术中心的团队开发了一种基于传感器的远程健康监测平台，使临床医生能够早期干预，并使研究人员能够提高他们对痴呆症发病和发展的理解[ 4］．该队列目前涵盖了102名痴呆症患者，他们与照顾他们的人生活在自己的家中。数据收集从2019年开始，将至少持续到2025年，每年有更多的参与者加入，使其成为全球规模最大、运行时间最长、最多样化和独特的痴呆症数据收集项目之一。传感器、框架、模型、临床监测工作流程、参与者应用程序和监测仪表板共同构成了一个名为Minder的数字平台(请参阅英国痴呆症研究所的网站[ 4]以获取更多资料)。

痴呆症患者偶尔会出现行为和心理症状，如躁动、攻击性、睡眠障碍、泌尿系统障碍、脱水和摔倒。UTI是老年人中诊断最多的感染，早期发现是预防进一步并发症的关键[ 5， 6］．尿路感染的诊断仍然存在问题，因为存在一系列非特异性症状，无症状菌尿的高患病率，寻求帮助的行为减少[ 7- 9］．

在家庭健康监测的背景下，“异常”可以简单地理解为正常数据中意外但显著的不规则，这表明存在不利条件。在大量正常数据中很难发现异常。异常丢失或错误分类的代价可能很高(例如，未能检测到UTI可能是灾难性的)。当前的医疗异常检测方法受到一个或多个现实世界问题的挑战:高维和多元数据;关于正常数据和异常数据之间的区别的信息很少或没有;时间过程数据和低延迟进行预测的需求;病人的可变性;由于社交访问、宠物、传感器问题和噪音标签而产生的噪音和缺乏周期性;误报率高;高调优需求; and low explainability to clinical monitoring teams and caregivers [ 10］．

我们的工作目标是开发一种临床有用的、领域不可知的、快速的、轻量级的、无监督的异常检测方法，用于真实世界的噪声医疗保健数据。我们考虑了个体可变性、个体和领域之间的普遍性，以及以数字生物标志物发现的形式对临床医生和护理人员的解释性。我们的工作做出了以下贡献:(1)它提供了上下文矩阵配置文件(CMP)在医疗保健中的自适应异常检测的第一个用例，特别是在现实世界的远程健康监测场景中;(2)开发多维CMP，用于异常患者天数的识别和评分;(3)它证明了基于cmp的异常评分方法的有效性;(4)它使用CMP发现异常的生物标记物，使用家庭运动数据。

之前的工作概述

异常检测方法可以大致分为统计、基于距离、基于重建、基于域或基于决策边界、基于信息论和基于图[ 11］．文献中的许多方法使用了诸如视觉、基于知识和机器学习方法等技术的组合。我们将重点介绍如何将其中一些技术应用于远程运行状况监视场景中的异常检测。

统计方法

统计阈值是发现点异常的常用方法。美国国立卫生研究院资助的一项试点研究使用统计阈值生成UTI警报，并为37名老年参与者提供早期干预，其中一些患有阿尔茨海默病，居住在配备运动、压力和温度传感器的公寓中[ 12］．Mori等人在研究中使用了基于聚类的技术[ 13]，以侦测不同活动的时间和持续时间是否异常。统计方法通常忽略了异常事件的多变量性质，并可能产生大量假阳性[ 14］．

机器学习方法

利用我们Minder研究的早期数据，Enshaeifar等人[ 15他们使用马尔可夫链来模拟活动序列，并使用熵率来量化个人日常生活模式的规律性。他们使用训练集来构建马尔可夫模型，并使用验证集来定义偏差的置信阈值[ 15］．Novák等[ 16]检测异常，如长时间不活动，不寻常的存在，以及日常活动模式的变化，使用自组织地图进行活动分类，然后使用马尔可夫模型进行下一次活动预测。马尔可夫方法的局限性包括无法解决并行活动，涉及不同概率的同一事件的活动，以及可伸缩性问题[ 17， 18］．

Arifoglu和Bouchachia [ 5]探索了卷积神经网络来捕捉活动的时间和空间表示，并检测与重复活动、睡眠中断和混乱相关的异常行为。传感器数据被分割成时间窗口，活动通过序列标记进行标记，以训练可以检测正常日常生活序列偏差的卷积神经网络。监督学习和可解释性是这种方法的一些局限性。

Akl等[ 19]使用机器学习算法的信号处理来检测老年人的轻度认知障碍。他们使用传感器在传感器数据的滑动窗口上提取平均值、概率密度和测量轨迹，作为支持向量机和随机森林分类器的输入，以评估认知状态。这种方法需要对认知状态进行训练数据标注，并且在时间窗口中存在数据缺失的问题。

雅库拉等[ 20.]考虑了基于时间关系的异常检测问题。他们表达了基于时间逻辑的时间事件之间的关系，如之前、之后、相遇、重叠和包含，并使用这些来识别它们之间经常发生的关系。他们采用基于概率的模型，基于居民历史上的先前证据，将低概率事件报告为异常。该研究承认，必须使用数百个传感器来识别颗粒级的时间关系。它还需要一个庞大的训练数据集，必须更新以捕捉变化的模式。

使用我们自己的远程监测研究数据，Palermo等人[ 21他开发了一个有监督的长短期记忆网络，利用环境、生理和睡眠数据分析痴呆症患者躁动发作的风险。他们使用弱学习和标签增强来解决噪音和类别不平衡。在Minder的另一项研究中，Li等人[ 22]采用半监督机器学习方法，利用环境和生理数据预测痴呆症患者感染泌尿道感染的风险。卷积自编码器用于学习未标记传感器数据的表示。编码器用于从较小的正标记数据集中提取相应的特征，然后用于训练有监督的分类器-具有完全连接层的概率神经网络。尽管该模型是稳健的，并且不断学习，但它使用拉格朗日近似逼近传感器数据，需要可解释性，并采用广义的与患者特定的方法来检测UTIs。

在Paudel等人的研究中[ 23]，作者使用无监督的基于图形的异常检测来识别生活在智能家居中的老年居民的认知健康下降。他们将运动传感器数据从原始传感器日志文件转换为单个活动图，并根据最小数据长度原则派生的规范模式进行异常检测[ 24］．这项研究使用了整个队列的阈值，而不是用户自己的阈值。

视觉的方法

活动密度的可视化是检测运动数据异常的另一种直观方法。Gupta等人的研究[ 25]描述了如何使用无监督学习来发现来自被动红外(PIR)传感器的未标记数据中的活动模式。在这项工作中，用户活动数据通过均匀流形近似和投影进行可视化和跟踪，而核密度估计用于自动提取密集传感器活动周期。尽管均匀流形近似和投影图在告知患者与护理人员的日常互动方面是有用的，但它们不容易解释，而且这种方法不提供异常评分。热图还与深度学习技术结合使用，以确定躁动或utii相关异常的概率。在Li等人的研究中[ 26]，通过位置编码对基于原始传感器数据的小时热图进行编码，提取相关时间步长，然后将其传递到长短期记忆模型中提取相关数据，并将其传递到基于注意力的模型中进行预测。这种方法使用监督学习，与深度学习模型一样，计算成本很高，需要足够的训练数据来进行准确的风险分析和预测．

用于异常检测的矩阵概要

基于矩阵剖面(Matrix Profile, MP)的异常检测在实际应用中的研究很少。林等[ 27]使用MP的早期版本来检测心电图时间序列中的不一致。最近，研究人员使用MP在IT操作时间序列中进行基于web的异常检测[ 28］．Steenwinckel等人的研究[ 29]，研究人员使用具有知识驱动算法的MP创建了一个可解释的系统，用于铁路领域的传感器监测。尼夫斯·阿文达诺等[ 30.]使用MP和聚类进行基于网络的异常检测和事件预测，基于声发射传感器，传递冷成形生产线机械条件的信息。该方法对噪声、缺失值和不规则采样具有鲁棒性。

在2个策划的非医疗保健基于web的数据集中，CMP已被证明比MP更灵活和有效，其中作者展示了CMP如何用于检测除了MP检测到的异常之外的更微妙的异常[ 31］．

在图1［ 11， 32]，我们通过评估调查文献中提出的每种技术的优点和缺点，总结了远程健康监测背景下每种技术的有效性。CMP克服了基于距离的方法的许多缺点，非常适合远程运行状况监视场景。

图1

用于远程健康监测的异常检测技术的适用性[ 11， 32］．CMP:上下文矩阵概要。

方法 MP和CMP预赛议员概述

Yeh等人在研究中详细描述了MP [ 33]，是一种无监督的、最先进的时间序列分析技术，可用于模式检测、异常检测、时间序列分割和变化点检测。它的快速性能源于快速傅里叶变换对 z-归一化欧氏距离计算。该算法适用于静态数据和流值的增量建模，即使是非常大的多变量时间序列也具有有限的减速。在本节中，我们将定义与智能家居环境中的异常检测相关的MP初步工作。

议员描述

下院议员 P时间序列 t是向量吗 z全子序列集中每个子序列之间的-归一化欧氏距离一个与其对应的最近邻或最接近的匹配一个(不包括琐碎匹配)。琐碎匹配是围绕查询子序列的子序列集，它们与查询子序列之间的欧氏距离可能非常小。这个边界通常设置为米/ 2, 米是子序列的长度。

多维议员

一个 k多维时间序列的-维MP t与维数 d是一个元时间序列，存储 z每个子序列与其最近邻居之间的-归一化欧氏距离(该距离使用 k-维距离函数)[ 34］．简单来说，该算法的工作原理如下:(1)它将每个维度(时间序列通道)的MP存储在二维矩阵的后续行中;(2) k的平均值来计算-维MP k矩阵列中的最小值，(3)多维MP创建这样一行 k(0≤ k< 米)包含 k维MP。为了实现，我们建议读者参考STUMPY库教程[ 35］．

中概述了直接应用MP的问题文本框1．

矩阵概要(MP)直接应用的问题。

与MP相关的直接应用程序问题

原始的MP是有噪声的，并没有给出一个明确的指示，哪些不一致是真正的异常。

对振幅变化不敏感，定位精度低[ 28］．

MP考虑每个子序列与其他子序列进行比较，这意味着子序列的长度等于可以识别异常的粒度级别。两者必须解耦。

当一个异常子序列接近另一个异常子序列时，它可以被掩盖[ 28］．

MP是用来计算欧几里得距离的。虽然这有很大的优势-复杂度与时间序列的长度线性，易于实现，可索引，无参数-但它也可能对噪声敏感，并在时间上表现出失调[ 36］．

CMP概述

CMP是一种新的基于MP的灵活的时间序列分析技术[ 31］．CMP的动机来自于用于计算MP的距离矩阵计算。介绍CMP的详细信息。

上下文窗口

它是在单个时间段或感兴趣的区域中的子序列数。给定一个患者数据集，使用上下文窗口为3和子序列长度为3(不省略子序列)，患者数据将被分组到中所示的时间段图2．

图2

上下文矩阵配置文件上下文或时间段是由一组子序列组成的时间块。这里显示的每个上下文由3个子序列组成(context window=3)，每个子序列的长度为3天。我们将异常分数分配给上下文，而不是天数。

背景(或时间段)

它是一个单独的时间段，其大小与上下文窗口相等，并包含用户定义的长度子序列。CMP中的一个单元格表示一个“上下文”或时间段。

CMP描述

它是MP的一个可配置的2D版本，用于跟踪时间序列中用户定义区域中子序列的每个上下文之间的最小距离。首先，用户(可选地)为给定的时间序列定义感兴趣的区域。然后它们确定子序列长度和上下文窗口大小。例如，对于子序列长度为3天和上下文窗口大小为3天的子序列，将时间序列划分为上下文，如图2．CMP是通过比较 z一个上下文中的每个子序列与另一个上下文中的每个子序列之间的-标准化欧几里得距离，并选择最小距离，在CMP中形成1个cell。图3强调了MP和CMP之间的区别。MP由距离矩阵中的列最小值组成，而CMP是通过在矩形区域上取最小值来创建的。

将MP思想应用于数据块而不是单个子序列，可以聚合和去噪距离计算并提取有用的模式。图4显示了我们一位患者深夜上厕所时的CMP。它可以作为活动一致性和任何断点的可视化概述。

图3

矩阵配置文件与上下文矩阵配置文件。

图4

每个单元格颜色表示x轴和y轴上时间段之间的最小距离。绿色带表示异常活动或与其他时间段持续较大的最小距离。上下文矩阵配置文件围绕对角线对称。

多维CMP

基于多维多维模型的基本原理，我们开发了多维CMP模型。一个 k多维时间序列的-维CMP t与维数 d是一个元时间序列，它存储一个上下文中的任何子序列与另一个上下文中的任何子序列之间的最小z归一化欧几里德距离，该距离使用 k-维距离函数，这在Yeh等人的研究中得到了解释[ 34］．算法工作原理如下:首先，我们将特征特定的2D cmp进行堆叠以获得3D数组。然后使用该特征维对数组进行升序排序。这为每个上下文提供了按特征递增顺序排序的最小距离值。现在，我们将该方法应用于Yeh等人的研究[ 34]以取得 k维CMP。为 k=0(即1D CMP)时，查询的第一行 k维CMP。这为基于单个特征的每个上下文提供了最低的最近邻居距离。一个上下文的最低得分特性可能与另一个上下文的最低得分特性不同。同样的,对 k=1(或2D CMP)时，我们查询 k-维CMP，对于每个上下文，基于2个特征提供最低平均距离。同样，一个上下文的两个最低得分特征可能与另一个上下文的特征不同。的最大值 k是特征的数量减1 ( k是从零开始的)。

多维CMP ( 图5)是多维数据异常检测的关键。CMP比原来的MP ( 文本框2)．

图5

多维上下文矩阵剖面(CMP)的形成涉及到对特定特征的CMP进行堆叠，然后按照距离的顺序排列每个单元格(时间段)。最后形成多维CMP，使得第i行的每个单元格包含该单元格的i+1个最低距离的平均值。

上下文矩阵配置文件(CMP)的优势。

CMP的优势

它比较上下文的距离，而不是子序列级别的距离，这对于时间序列去噪很重要。

上下文大小是可配置的。此外，CMP允许定义特定区域来检测模式和异常，并且不需要覆盖整个距离矩阵。

除了欧几里得距离外，还可以使用其他距离度量。

CMP提供了一种直观的方式来可视化时间序列窗口区域和检测异常。

异常现象不容易被掩盖，即使在时间序列的其他地方又发生了类似的异常现象。

CMP异常评分

我们使用异常检测管道( 图6)载于文本框3．

图6

基于上下文矩阵概要(CMP)的异常检测管道。UTI:尿路感染。

异常检测管道。

异常检测管道

我们决定了一个合适的上下文窗口。我们使用的上下文大小为3，子序列长度为3天，考虑到最大粒度、去噪、可解释性和异常发生所需的时间。

对于每个患者时间序列，我们生成用于自连接的z赋范欧氏距离矩阵，然后根据上下文窗口设置生成上下文矩阵配置文件(MP)。

我们直接使用cmp或将其用于可视化和监测目的。

我们计算每个上下文的异常分数。这是当前上下文和过去上下文之间的平均距离。对每个时间序列重复此步骤，以获得特征特定的异常评分。

异常分数被用作针对特定健康事件训练的不同机器学习模型的输入。这将在今后的工作中加以探讨。

对模型进行准备，以获得每个时间段的单值得分。我们评估了以下方法:

基于分数的和、分数的中位数、分数的平均值、分数的最大值和基于熵的加权来组合特定特征的异常分数(这些分数是基于使用逆加权的底层时间序列的熵来组合的;更大的熵意味着从使用该时间序列获得的异常评分的权重更低)。使用了两种类型的熵度量:

近似熵(ApEn): ApEn近似于精确的规则统计量Kolmogorov-Sinai熵，并通过探索数据中的重复模式来反映时间序列的可预测性。适用于有噪声的数据集[ 37］．它依赖Heaviside函数来定义2个模式之间的相似性。ApEn生成一个从0(完全周期)到2(有噪声)的无单位数[ 38］．

模糊熵(FuzzyEn):它也使用Heaviside函数，尽管相似性是由一个计算隶属度系数从0到1的模糊函数来评估的。因此，除了选择 N(计算熵的长度)，米(子序列长度)，和 r(sd的数量公差)，FuzzyEn需要第四个参数， n，用于评估相似性的指数函数边界的梯度[ 39］．FuzzyEn提供了时间序列各部分之间的分级相似度，而不是二进制相似度[ 37］．

基于多维CMP的评分:我们使用多维CMP为每个上下文生成多变量异常评分，使用2个不同的设置 k：

k=auto:这里我们考虑的是的最优值 k当预测患者真实可能的异常时( 图7)．为此，我们在每个患者的多维CMP上使用肘部方法。具体来说，我们计算了每一个的中位数距离 k-维CMPs为患者，并使用“膝关节”算法自动找到最优值 k拐点发生的时间[ 40］．然后我们选择这个最优 k从整体来看 k-维CMP，用于提取每个上下文的单值患者异常评分。一旦获得了“最佳”CMP，我们用两种方式对每个上下文进行评分:

距离加权多维CMP评分:一个上下文的异常评分是通过其与之前上下文的最近邻居距离的逆加权平均来计算的。因此，如果一个上下文距离被评分的当前上下文有3跳，那么在计算当前上下文的异常评分时，它的距离被赋予三分之一的权重。

等加权多维CMP:一个上下文的异常得分被计算为它与以前上下文的最近邻居距离的简单平均。

k=1:我们采用基于每个上下文的前2个特征的CMP。

我们使用稳健的方法对单个上下文评分执行滑动窗口阈值(7天、14天、21天、30天、60天和90天窗口) z， IQR和基于分位数的方法来预测真实可能的异常并报告最佳结果。

然后根据数据集中可用的异常标签对预测的异常进行“软”验证，以计算召回率。

图7

多元异常评分。从多维上下文矩阵剖面(CMP)开始，我们通过取每个维度得分的中位数，然后选择在拐点处的维度，为每个患者选择最佳维度。然后，该最优维度CMP用于基于距离的异常评分。

数据集描述和预处理数据集

我们研究的数据来自一个正在进行的现实世界远程医疗监测研究(“Minder”研究中提到简介section)对英国英格兰102名在家生活并由护理人员支持的痴呆症患者进行了研究。其中包括51%(52/102)男性(平均年龄81.94岁，标准差6.34岁)和49%(50/102)女性(平均年龄80.80岁，标准差15.76岁)。运动数据是通过安装在家里不同地方的PIR传感器捕获的——走廊、浴室、卧室、休息室和厨房——这些传感器是根据一天中的运动被动触发的。有门传感器，电器智能插头，光和温度传感器，睡眠垫，以及生理数据记录仪。在本研究中，我们只考虑PIR数据，因为它们在整个队列中丢失最少，最可靠，可用性最好。生理数据目前是由痴呆症患者或他们的照顾者每天自我报告一到两次，并且有更大的遗漏，这将需要归因。这一群体的睡眠数据很少。

在我们的研究中，我们重点研究了15名至少有一次临床验证的UTI发病率的痴呆症患者。其中包括53%(8/15)男性(平均年龄85.13，标准差5.57岁)和47%(7/15)女性(平均年龄82.86，标准差6.79岁)。在这15例患者中，7例(47%)也经历了≥1次住院事件。总的来说，我们在9363个患者日中有31个UTI和10个住院标签，约占整个数据集的0.44%(41/9363)。UTI标签由临床监测小组使用患者尿样验证后手动标注。但值得注意的是，老年患者常出现非典型症状，使无症状菌尿与有症状UTI的鉴别具有挑战性[ 6］．此外，UTI的开始时间和症状持续时间也不明确。住院事件列表是根据全科医生的信息整理的。其中包括住院日期，以及在某些情况下(但并非所有情况下)住院原因。

预处理每日聚集

通过PIR运动传感器捕获的家庭运动数据首先每天聚合以减少噪音，因为每小时的计数每天变化很大，高粒度和变化使异常不太容易识别。我们忽略了来自同一传感器的连续发射事件，考虑第一个发射事件计算前一个位置的持续时间，最后一个发射事件计算当前位置的持续时间。在第一次和最后一次发射之间，忽略来自同一传感器的任何连续传感器发射，从而减少冗余和噪声。

工程特性

为了捕捉不同类型的运动相关信息，我们计算了中概述的特征文本框4对于不同位置的日常活动数据——浴室、卧室、厨房、休息室和走廊。

刺激功能。

特点及描述

位置计数:这是每个位置的传感器发射的每日计数。

位置清晨计数:这是当天从午夜到早上6点之间传感器发射的计数。

位置深夜计数:这是前一天下午6点到午夜之间传感器发射的计数。

位置持续时间:这是每天在每个位置花费的总分钟数。

位置小时移动变化:这是前一天某地点传感器小时分布与当天传感器小时分布之间的Wasserstein距离;Wasserstein距离越大，时型变化越大;该措施是稳健的不同运动密度的患者家庭。瓦瑟斯坦距离或“地球移动器”距离是衡量近似的一个可解释的度量最少的工作需要在两个概率分布之间移动，其中“功”可以松散地定义为分布的质量移动量和必须移动的距离的乘积[ 41］．与L2、Kullback-Leibler散度和Jensen-Shannon散度等其他测量方法不同，Wasserstein距离对几何形状很敏感[ 42］．

特征选择

类似于Skubic等人的研究[ 43]，我们应用了中概述的方法文本框5选择进行异常检测的特征。

简化的特征列表包括浴室Wasserstein距离、走廊Wasserstein距离、休息室Wasserstein距离、浴室清晨和傍晚活动、厨房清晨和傍晚活动、卧室清晨和傍晚活动、卧室活动持续时间和浴室活动持续时间。

异常检测特征的选择方法。

异常检测特征选择方法

领域知识:通过Pevný学习[ 44]表明，只使用解释异常的特征的探测器比使用所有特征的探测器具有相同或更好的性能。不规律的浴室活动可能强烈提示尿路感染[ 45]，因此，我们捕捉了浴室活动的日常变化。同样，睡眠障碍、躁动和徘徊是痴呆症患者的共同特征[ 46， 47］．因此，我们将卧室、走廊、厨房和休息室活动的小时分布的每日变化包括在内。这些特征有助于捕捉不同地点不同寻常的白天和夜间活动，并遵循临床研究人员在一项类似研究中的建议，该研究支持用行为生物标志物建模健康下降[ 43］．

使用来自我们患者队列的交叉验证数据，使用显著在线不一致技术来寻找与尿路感染和住院的最高中位回忆值相关的共同特征[ 48］．

我们根据特征之间的相关性消除了冗余变量。

我们还消除了公共空间的持续时间相关特征，如走廊、客厅和厨房，在这些地方，目前还很难区分病人和护理人员的活动。

对家庭活动水平差异有显著影响的变量被保留了下来。

实验

我们对15名患者的家庭运动数据进行了实验，这些患者是从正在进行的Minder研究中挑选出来的，在总共9363个患者日中有31例UTI和10个住院标签。所有实验都在64位英特尔i7-8700K中央处理器上运行，3.7 GHz Windows 10机器，32 GB RAM。

我们的实验设置列在表1．对于每个异常评分模型，我们尝试了窗口大小、IQR阈值、鲁棒性的每种组合 z阈值和分位数阈值并报告得到的最佳结果。

表1

本研究考虑了实验参数。

设置			值
上下文窗口			3.
子序列长度(天)			3.
用于滑动窗口阈值的窗口大小(天)			7 14 21 30 60 90
差阈值			1.0和1.2
健壮的 z阈值			1.65, 1.8, 3, 4
分位数的阈值			0.95 0.96 0.97 0.98
Entropy-based方法
	N(数据大小)	500
	r (SD公差)	0.2
	M(子序列长度)	7
标签验证软缓冲(实际标签前后天数)			−10 ~ +7

模型评价

我们使用来自15名患者的数据来评估基于多维cmp的异常评分，相对于单变量方法和文献中其他3种流行的、无参数的、可解释的现代方法:基于角度的异常值检测(ABOD)、基于copula的异常值检测(COPOD)和轻量级在线异常检测(LODA)。为了适合在无监督的流场景中使用，我们只使用每个时间点的历史数据。

ABOD测量由相应距离加权的数据点的角度(余弦)谱的方差。ABOD的工作原理是，如果一个点的观测角度的光谱很小，那么其他点将只位于特定的方向。这意味着该点位于一些分组在一起的点集合之外，这意味着该点是一个离群值[ 49］．COPOD的灵感来自于用于建模多元数据分布的copulas。COPOD首先构造一个经验copula，然后使用它来预测每个给定数据点的尾部概率，以确定其“极端”水平。由COPOD产生的离群值分数测量了一个点相对于数据集中其他点的可能性。该方法输出一个“维度离群值图”，提供对给定离群点的离群子空间或特征的洞察[ 50］．LODA包含的集合 k一维直方图，每个直方图近似于输入数据投影到单个投影向量上的概率密度。投影向量的作用是使单个直方图多样化，这使得集成系统能够提高单个检测器的性能。LODA的复杂度与训练样本的数量和输入空间的维数呈线性关系[ 44］．

我们使用3个阈值标准进行评分( 文本框6)．

为了确定基于cmp的异常评分在识别痴呆症患者真实世界远程监测数据中的异常时具有多大的竞争力，我们报告了所示的测量方法文本框7对于每个模型。

如果预测日期在异常标记日期的软缓冲区内，则假定异常被正确识别。为了透明度，我们同时报告了平均召回率和患者召回率。从临床角度来看，这一指标是模型有效性的直接指标。

当在模型之间进行选择时，临床医生可能会选择平均召回率较高的模型，因为在我们的场景中，虚假警报的成本和不便远远小于错过真实异常的成本。

分数的阈值标准。

分数的阈值划分标准

鲁棒 z阈值法或中值绝对偏差法受异常值的影响较小，用于计算修正后的值 z以偏离中位数的SD单位来量化异常评分的分数[ 51］．

Tukey或IQR阈值是利用滑动窗口中异常得分的IQR值作为阈值的依据。任何大于第三个四分位数的值+ x次IQR视为异常，其中 xIQR阈值从哪里来表1．

基于分位数的阈值分割使用异常分数的固定百分位数作为阈值分割的基础表1．

模型评估。

模型评价措施

>回忆率33%的患者数量:考虑到平均每位患者只有3个经验证的异常，我们根据正确识别出超过1 / 3异常的患者数量对模型进行了排名。这使得该模型是只对一小部分患者有效还是对整个队列有效都是透明的。

平均召回率:这是15名患者的平均召回率百分比，其中召回率=数据集中的真阳性或所有已知异常。

检测到的平均异常数:为了尽量减少对临床监测团队的错误警报，越低越好。

根据Pimentel等人的研究[ 11]，新颖性检测的有效性取决于检出率和误报率。最好的模型将展示高召回率和低数量的异常。

精度:在这里, 精度没有什么意义，因为异常值可能来自不同类型的健康指标、传感器故障、访客、宠物活动或患者或护理人员的罕见异常活动，这些在我们的数据集中没有标记。尽管我们仍然报告这个度量，但方法之间的相对精度更有意义。

数字生物标志物

数字生物标志物是消费者产生的生理和行为测量，通过连接的数字工具收集，可用于解释、影响或预测健康结果[ 52］．美国食品和药物管理局-国家卫生研究院“生物标记物、终点和其他工具”对传统生物标记物的分类将其使用分为以下几类:易感性或风险确定，用于检测和确认感兴趣病症存在的诊断用途，监测病症状态，用于确定病症可能性、复发或进展的预后用途，预测用途，以及通过接触医疗产品或制剂测量反应[ 53］．我们设想这些异常的生物标记物将用于易感性的确定，并协助诊断、预后和预测UTI或其他不良临床事件。

多维CMP的创建涉及结合特定于特征的CMP的中间步骤，以便每个上下文按照特征的最近邻居距离的升序排列。这意味着，如果我们简单地跟踪有序堆叠CMP中每个上下文的有序特征集，我们就可以发现它的每个维度中最常见的贡献特征。第0维的模态特征将是与患者异常评分相关的最重要的生物标志物。第一维度的模态特征将是第二重要的生物标志物，以此类推。随后，通过查看整个队列的有序堆叠cmp，我们可以确定广义顶部 k重要的生物标志物。

伦理批准

本研究获得了东南海岸萨里郡国家卫生服务研究伦理委员会(卫生研究管理局)的伦理批准;技术综合健康管理研究伦理委员会参考文献:16/LO/1802;综合研究应用系统ID: 211318。

结果模型评价

我们报告了每种类型的单变量和多变量模型的最佳结果( 表2)．

所有模型都能正确识别研究中三分之二患者的三分之一以上的已知异常。其中，具有等权重上下文的多维CMP(在窗口大小=7天时)具有鲁棒性 z= 1.65, k=1) 100%(15/15)的患者的回忆率为>33%。其他基于cmp的方法显示，高达93%(14/15)的患者有类似的回忆。这突出了对多维CMP作为异常检测工具的强大支持。

我们还测量了在我们的研究中，在624个平均患者日中，每个模型引起了多少异常。如图所示，任何基于cmp的模型提出的最大警报数量仅约为34或5.4%(34/624)的患者日。我们表现最好的CMP模型发出了大约32个警报，平均为5.1%(32/624)的患者日。注意，在我们的数据集中，平均每个患者有3个标记异常;然而，正如前面所强调的，注释的异常只包括UTI和住院，我们的模型旨在捕捉任何异常活动。

平均召回率与检测到的异常总数一起查看时，提供了性能的整体视图，因为通过识别异常数量非常多，很容易获得性能最佳的模型。总的来说，最好的模型是一个高召回率，但提出的异常数量很少的模型。结果表明，在窗口大小为7天的情况下，具有等加权上下文的多维CMP具有鲁棒性 z= 1.65, k=1提供了最佳的平衡性能，在624天的患者旅程中平均仅发出32个警报。ABOD的召回率相对较低，而LODA和COPOD的召回率较高，但比我们表现最好的模型产生的警报数量更多。

表2

模型性能(N=15)。

模型	>患者回忆率33%，n (%)	异常升高，平均值	召回率(%)，平均值	精度,%^一个
LODA^b(w = 7;差1.2)	14 (93)	37.8	85.7	6.2
CMP的总和^c分数(w = 7;0.97分位数)	14 (93)	33.1	84.7	7.0
平均CMP得分(w=7;0.97分位数)	14 (93)	33.1	84.7	7.0
等加权多维CMP (w=7; k= 1;健壮的 z= 1.65)	15 (100)	32.1	84.3	7.2
COPOD^d(w = 7;0.95分位数)	13 (87)	36.8	79.1	5.9
ABOD^e(w = 21;0.95分位数)	13 (87)	30.0	77.7	7.1
距离加权多维CMP (w=14; k= 0;健壮的 z= 1.65)	14 (93)	33.7	76.7	6.2
ApEn^f-加权CMP评分(w=7;0.97分位数)	12 (80)	29.1	69.9	6.8
CMP得分中位数(w=7;0.97分位数)	12 (80)	30.8	68.4	6.1
模糊熵加权CMP评分(w=7;0.97分位数)	10 (67)	27.7	65.5	6.5
CMP评分最大值(w=7;0.97分位数)	10 (67)	24.8	57.9	6.4

^一个我们在前面提到过，在这种情况下，查看方法之间的相对精度而不是绝对精度更有意义。

^bLODA:轻量级在线异常检测器。

^cCMP:上下文矩阵概要。

^dCOPOD:基于copula的离群值检测。

^eABOD:基于角度的离群点检测。

^fApEn:近似熵。

数字生物标志物

如前所述，患者的多维CMP可用于发现异常的重要数字生物标志物。在图8，我们显示了显著特征对整个队列异常评分的贡献的量级。

我们发现，清晨(午夜至早上6点)上厕所是导致异常评分的最大单一因素，该队列的中位数约为30%。这证实了文献中的发现，不寻常的浴室活动是尿路感染的临床显著特征[ 12， 54]，其中包括我们标记数据集中四分之三的异常。患者水平的调查显示，这是60%(9/15)患者的顶级生物标志物。深夜(下午6点至午夜)上厕所也有12%的贡献。这两个因素都与睡眠中断有关，这在痴呆症患者中很常见。清晨不寻常的卧室和厨房活动也是异常得分的重要因素之一，这表明痴呆患者中出现的徘徊和睡眠紊乱。

多维CMP还提供了对患者特异性异常的直观见解。图9显示2例患者的异常评分，按异常评分中位数排序。

对于患者JYN9，不寻常的清晨厨房活动是异常活动的主要生物标志物，我们也看到异常评分的最大方差。对于SFAV患者，不寻常的卧室活动是他们异常评分的最大因素。这些数字显示了2例患者的不同异常模式，可能是第一名患者的躁动和徘徊，第二名患者的睡眠中断和随时间变化的卧室活动。我们可以设想一个异常检测仪表板，为临床医生提供这样的洞察，使他们能够根据需要进行针对性的干预。

我们还可以使用标准化异常评分来查看跨患者视图( 图10)，其中我们使用患者自己的最优值来观察多变量异常评分的跨队列变化 k维分数。研究患者认知得分的差异会很有趣。

图8

最重要的异常数字生物标志物。清晨上厕所活动对整体异常评分的中位数贡献最大，约为30%。

图9

2例患者单因素评分异常分布。

图10

所有患者的多变量异常评分分布。

讨论主要研究结果

痴呆症患者异常的早期识别为在重大健康事件发生之前进行早期干预提供了一个机会窗口。这意味着改善健康状况，减少医疗费用，继续保持独立，提高生活质量[ 43］．在这项研究中，我们开发了一种mp驱动的异常检测方法，并评估了其在现实世界中基于传感器的痴呆症患者远程监测研究中的使用。我们开发了多维CMP来根据传感器数据对患者家庭活动进行建模，并使用时间段内活动之间的平均欧几里得距离作为生成单个异常评分的基础。基于cmp的方法克服了传统基于距离的异常检测技术的问题，即噪声、高警报率和局部新颖性识别导致的退化。我们的实验表明，基于多维cmp的异常检测比其他类似的快速、现代、准确和无参数的无监督异常检测技术表现得更好。它非常适合于以噪声和不完整标记为特征的现实世界远程监测数据，并且还可以作为操作监测的可视化工具，也有助于发现个性化和队列范围的数字生物标志物。每个居民的个性化模型来自于他们自己的传感器数据模式[ 43］．这些方面使得基于cmp的异常检测具有临床意义，可解释，并立即可用，从而解放了临床医生不得不注释患者活动的宝贵时间。CMP是域不可知的，可以轻松扩展到不同类型的医疗保健数据和域。据我们所知，我们的工作是CMP在医疗异常检测中的第一个真实用例。

我们选择的实验参数与临床相关。上下文窗口为3，子序列长度为3，以获得最大粒度、抗噪声性和对异常(如UTI)的适用性，其中3天模式比更粒度的每日分析更有可能产生异常行为;尿路感染通常需要3至8天才会出现[ 55］．可以轻松配置上下文窗口和子序列长度，以调查不同粒度级别的异常，例如7天、2周或1个月。同样，我们使用7天、14天、21天、30天、60天和90天的窗口来阈值异常评分。这样的时间段遵循典型的人类行为模式，很容易被临床医生理解。IQR的阈值，鲁棒性 z并选择基于分位数的阈值和熵参数来反映文献中广泛使用的值。标签验证的软缓冲(实际异常标签的−10天到+7天)反映了由于噪音而导致的弱标记问题和由于人工标记而导致的不准确问题，UTI发展和临床诊断所需的时间，以及早期发现异常的需要。道及基奥[ 56]对弱标记数据使用了类似的评估技术。我们选择ABOD、COPOD和LODA与基于cmp的方法进行比较，因为它们同样是与流数据场景(如远程健康监控)相关的高性能、无参数、可解释、无监督异常检测技术。

我们的评估方法也设计得简单、透明和有临床意义。一个好的方法必须表现出高的跨队列平均敏感性，同时对个体患者也有高的敏感性，同时发出最小的警报。因此，我们报告了总体敏感性、患者敏感性、异常升高的平均数量以及召回率与异常升高的比率，这提供了一个全面的性能测量。虽然我们报告了每个模型的精度，但必须指出的是，我们只考虑了2种类型的标签——uti和住院——而我们的模型识别了家庭移动数据中的所有类型的异常，其中许多无法使用现有的标记数据进行验证。因此，在我们的研究中，较低的绝对精度是预期的，而相对精度提供了更好的跨模型性能指示。此外，5%的警报率是一个可以接受的低率，因为这些警报可能对痴呆症患者的健康产生重要影响。这也是Rantz等人采取的方法[ 12]，我们的临床护理团队已经每周与患者进行检查。

我们的结果表明，对于性能最佳的模型，阈值的最佳滑动窗口大小为7至14天(即1-2周)。这很容易理解，因为人类行为的“异常”可以被视为他们最近日常生活中的一个突破。这在Skubic等人的研究中也得到了临床验证[ 43]，临床医生建议采用2周移动基线进行传感器数据比较和阈值设置，以平衡捕捉突然和逐渐的健康变化。短滑动窗口具有对患者特征和环境条件的变化具有鲁棒性的额外优势。然而，ABOD技术高度敏感，需要足够的数据来捕捉真正的异常值，并且在最少21天的回溯时间内表现最佳。这种增加样品以获得更好的ABOD性能的行为也在Domingues等人的研究中得到了验证[ 57］．

我们有三个惊人的发现。首先，在平衡队列范围的敏感性和引起的异常方面表现最佳的模型是基于的 k=1(即，它只考虑一个病人的前2个贡献特征)。这意味着基于患者活动的可靠异常检测模型可以是简单、轻量级、易于解释和可推广的。其次，通过简单聚合(即特定特征异常得分的总和和平均值)将特定特征cmp组合而成的单变量模型实现了高召回率和低警报量。事实上，它们在性能上更接近于表现最好的多元CMP模型，而不是更成熟的高性能模型，如LODA、ABOD和COPOD，以及其他复杂的结合单变量评分的方法，如熵加权评分。这再次表明，简单的、可解释的模型可以泛化并具有竞争力。第三，令人惊讶的是，等加权时间段评分方法比距离加权时间段评分方法获得了更好的回忆。我们期望通过强调最近的时间段而不是过去的时间段，我们可能会得到一个异常值，它反映了当前时间段的真实异常。然而，在这项研究中，情况似乎并非如此。我们的目标是探索对之前时间段进行加权的不同方法，以确认这种行为是因为所使用的特定距离加权逻辑还是更普遍的发现。

数字生物标记是我们方法中非常有用的产物。它们告诉我们在特定时期是什么样的家庭活动导致了这种异常。此外，通过查看患者的时间轴，我们可以找到在整个时间段内对异常评分贡献最频繁的单一最常见的活动或特征(即异常行为的数字生物标志物)。我们发现整个队列中，清晨(午夜至早上6点)的浴室活动是异常行为最常见的数字生物标志物(9/15,60%的患者)，其次是深夜的浴室活动和清晨的卧室和厨房活动。这些发现定量地验证了对痴呆症患者的观察性研究，这些研究观察到躁动、在不寻常的时间徘徊和不寻常的浴室活动，特别是在经历UTI的痴呆症患者中，特别是在清晨和深夜的浴室活动中[ 14， 20.， 45， 46］．最后，我们的方法可以提供在时间段、患者和队列水平上异常的数字生物标志物的排名。这一结果使得基于cmp的异常评分独立用于临床监测和数字生物标志物的查询和验证。

这项工作与现有发表的基于Minder研究的研究之间有一些显著的区别。首先，已发表的作品使用了各种监督和半监督机器学习方法来检测或预测目标健康状况，如躁动和UTI(一项研究使用了无监督学习通过聚类分离异常运动模式)。因此，这些模型使用来自临床验证的患者子集的数据进行训练，这些患者在其轨迹中具有特定的健康状况。相比之下，我们的工作评估了一种轻量级、无监督、无参数的方法来检测基于家庭活动数据的一般异常。它不需要训练数据，而是根据经历过一次或多次尿路感染和住院事件的患者的数据进行验证。其次，现有的研究除了家庭活动外，还纳入了患者的生理数据和家用电器的使用。我们目前只使用家庭移动数据。第三，现有的研究依赖于固定的训练数据或定期刷新的训练数据，而我们的方法被设计为在流环境中工作，这意味着我们的每日检测和警报算法使用截至当天的患者时间轴中的信息。第四，我们的算法是患者数据驱动的，而不是队列数据驱动的。这意味着我们通过考虑算法在单个患者数据上的表现来评估平均召回率。 In contrast, published work takes a cohort-wide or patient-blind approach to assess algorithm performance. These factors should be collectively considered when comparing our work with other Minder-based research.

基于cmp的方法非常适合异常检测应用程序，其中数据和标签以真实世界的噪声为特征，监督学习所需的注释训练数据可能由于资源限制或流数据场景而不可用，以及正常数据和异常数据之间的区别不明确。这包括在各种工业、城市和医疗保健环境中基于传感器的远程健康监测。基于cmp的方法擅长缩小和关注可配置时间尺度上的时间模式。它还在设计时考虑到了个性化，这使得它特别适用于医疗保健，在医疗保健中，相似的异常模式或相同的疾病可能在不同的个体中表现不同。对于可解释性是操作监控团队的关键的情况，它是理想的。

基于cmp的方法对于优先考虑敏感性而不是可解释性的应用程序可能并不理想。对于具有明确定义的、易于理解的模式的数据，例如心电图数据，或者噪声水平较低或正常和异常数据之间的区别很清楚的数据，它也不是最佳工具。最后，CMP管道需要使用特征缩减方法进行扩充，以便扩展到高维数据。

限制

本文提出的异常检测方法的一个局限性是没有考虑传感器间的相关性。这将在未来使用可解释机器学习的研究中进行调查。其次，我们的研究忽略了前门和后门的传感器数据。这一遗漏是故意的，因为我们感兴趣的是检测由室内家庭活动的重大变化引起的异常，而不是由户外情况引起的异常。此外，前门和后门的打开和关闭也很难归因于痴呆症患者。第三，需要一种区分患者与其他家庭成员的系统，以提高基于被动感知的异常检测模型的鲁棒性。第四，为了实现比1个“上下文”更细的粒度和更低的延迟，应该将基于cmp的异常检测模型配置为每小时或以高于1天的分辨率摄取数据。第五，我们假设单个时间窗口中的异常可以确定复杂的健康事件。然而，宠物和访客的出现也可能导致异常。为了解决这个问题，我们不仅需要区分患者和护理人员，而且还需要一种在后续时间窗口监测异常的方法，以高可信度将异常与健康变化联系起来。 Finally, we will require a larger sample size to further validate our approach.

结论及未来工作

在本研究中，我们开发了一种基于CMP的新型轻量级无监督异常检测管道，并将其用于基于传感器的痴呆症患者远程健康监测。我们以新颖的方式组合了单变量CMP评分，开发了多变量CMP，并对其进行了测试，以通过滑动窗口的阈值识别异常患者天数。我们证明了基于cmp的异常评分比其他无监督异常检测的可比方法更有效和可推广。具体而言，基于7天滑动窗口并使用前2个贡献患者特定特征的多维CMP显示84.3%的召回率，在平均624天的患者时间轴上仅显示32次警报。此外，我们还展示了CMP如何用于发现和解释时间段、患者和队列水平异常的数字生物标志物。我们从15名患有UTI和住院事件的痴呆症患者中收集了9363天的研究，结果表明，在一天的早期和晚期，不寻常的浴室活动是我们队列中异常的一个突出生物标志物。这有助于定量验证痴呆患者类似行为的观察性研究。

我们未来的工作将集中在以下领域:将生理数据添加到异常评分管道中，开发CMP作为数据中模式和异常的有效可视化监控工具，并适应除欧几里得距离外的其他距离指标，在更大的患者队列和不同类型的异常上验证CMP，并使用机器学习方法使用基于CMP的评分对不同类型的异常进行分类。我们还将研究季节影响，并将我们的方法与其他相关异常检测方法进行比较。我们计划将我们的模型集成到Minder平台中，在检测到异常时发出警报，使监测团队能够调查底层传感器数据，并及时为患者提供干预。被验证为真实的警报将被记录在患者时间轴上，并用于监控模型的操作准确性。

多媒体附件1

英国痴呆症研究所的致谢名单。

缩写

ABOD

基于角度的离群点检测

CMP

上下文矩阵概要

COPOD

基于copula的离群值检测

LODA

轻量级在线异常检测器

国会议员

矩阵简介

PIR

被动红外

泌尿道感染

尿路感染

这项研究得到了英国痴呆症研究所的支持多媒体附件1以获取完整的确认列表)。作者也要感谢Dieter De Paepe编写和协助使用Python系列距离矩阵库，并感谢Philip Evans教授(萨里大学视觉、语音和信号处理中心医学放射成像教授)进行有益的讨论。

数据可用性

访问完整的数据集需要伦理批准，由于家庭监测数据的敏感性以及隐私和安全要求，目前还无法获得。要查询完整的数据集，必须向帝国理工学院英国痴呆症研究所护理研究和技术中心机器智能组负责人Payam Barnaghi教授发送一份意图和使用声明。

没有宣布。

痴呆

世界卫生组织 2021 9 2

2021-12-01

https://www.who.int/news-room/fact-sheets/detail/dementia

关于痴呆症的媒体事实

阿尔茨海默氏症协会<一个ccess-date> 2021-12-01

https://www.alzheimers.org.uk/about-us/news-and-media/facts-media

英国痴呆症研究所护理研究与技术中心，伦敦帝国理工学院<一个ccess-date> 2022-09-14

https://www.imperial.ac.uk/uk-dri-care-research-technology

英国痴呆研究所护理研究与技术<一个ccess-date> 2021-12-01

https://ukdri.ac.uk/centres/care-research-technology

Arifoglu

Bouchachia

一个

使用卷积神经网络检测痴呆症患者的异常行为

Artif Intell医院 2019 03 94 88 95

10.1016 / j.artmed.2019.01.005

30871686

s0933 - 3657 (18) 30061 - 7

罗

助教

Juthani-Mehta

米

老年人尿路感染

老年健康 2013 10 9 5 519 28

10.2217 / ahe.13.38

24391677

PMC3878051

Gavazzi

Delerce

Cambau

弗朗索瓦

Corroyer

de Wazieres

馥香

Paccalin

米

Gaillat

75岁以上住院老年患者尿路感染的诊断标准:一项多中心横断面研究

医学感染 2013 05 43 5 189 94

10.1016 / j.medmal.2013.02.006

23622951

s0399 - 077 x (13) 00062 - 0

品牌

弗洛勒斯

巴罗斯初级

罗德里格斯

Mourao

Moreira

社区老年妇女尿路感染的流行病学和临床研究

感染疾病 2012 09 16 5 436 41

10.1016 / j.bjid.2012.06.025

22975174

s1413 - 8670 (12) 00129 - 8

总在

勒

无症状菌尿

北美感染疾病诊所 2003 6 17 2 367 94

10.1016 / s0891 - 5520 (03) 00008 - 4

艾哈迈德

年代

拉文

一个

Purdy

年代

大官

流数据的无监督实时异常检测

Neurocomputing 2017 11 262 134 47

10.1016 / j.neucom.2017.04.070

皮门特尔

妈

克利夫顿

达

克利夫顿

Tarassenko

新颖性检测综述

信号处理 2014 06 99 215 49

10.1016 / j.sigpro.2013.12.026

Rantz

米

Skubic

米

•库普曼

菲利普斯

亚历山大

米勒

年代

格瓦拉

利用传感器网络检测老年人的尿路感染

2011年IEEE第13届电子医疗网络、应用和服务国际会议论文集 2011

2011年IEEE第十三届电子医疗网络、应用和服务国际会议

2011年6月13-15日

哥伦比亚，密苏里州，美国

10.1109 / health.2011.6026731

森

藤井裕久

一个

Shimosaka

米

野口勇

佐藤

基于家庭传感器累积数据的典型行为模式提取与异常检测算法

下一代通信与网络研究论文集(FGCN 2007) 2007

下一代通讯及网络(FGCN 2007)

2007年12月06-08日

韩国济州岛(南)

10.1109 / FGCN.2007.226

霍克

迪克森

Preum

年代

汉森

米

巴斯

一个

斯坦科维奇

霍姆斯:一个全面的异常检测系统的日常家庭活动

2015传感器系统分布式计算国际会议论文集 2015

2015传感器系统分布式计算国际会议

2015年6月10-12日

福塔雷萨、巴西

10.1109 / dcoss.2015.20

Enshaeifar

年代

Zoha

一个

·马凯兹

一个

斯基尔曼

年代

阿克顿

圣

Elsaleh

娜斯

米

Ahrabian

一个

肯尼

米

克莱因

年代

Rostill

Nilforooshan

Barnaghi

使用家庭传感器和机器学习技术对痴呆症患者的日常生活活动进行健康管理和模式分析

《公共科学图书馆•综合》 2018 13 5 e0195605

10.1371 / journal.pone.0195605

29723236

玉米饼- d - 17 - 39663

PMC5933790

诺瓦克

米

双性恋?作为

米

Jakab

智能家居环境中老年人在场时不引人注目的异常检测

2012年ELEKTRO会议记录 2012

2012年“电镀

2012年5月21-22日

Rajecke Teplice，斯洛伐克

10.1109 / elektro.2012.6225617

李

张

问

段

一种用于智能环境中活动识别的单次神经网络方法

2008年第七届世界智能控制与自动化大会论文集 2008

2008年第七届世界智能控制与自动化大会

2008年6月25-27日

中国重庆

10.1109 / wcica.2008.4592901

Singla

烹饪

Schmitter-Edgecombe

米

识别智能环境中多个居民的独立和联合活动

J环境智能人工计算 2010 03 01 1 1 57 63

10.1007 / s12652 - 009 - 0007 - 1

20975986

PMC2958106

阿克勒说道

一个

Taati

Mihailidis

一个

老年人轻度认知障碍的自主非突发性检测

IEEE跨生物医学工程 2015 5 62 5 1383 94

10.1109 / tbme.2015.2389149

20.

Jakkula

烹饪

克兰德尔

一个

用于智能家居异常检测的时间模式发现

2007年第三届IET智能环境国际会议论文集 2007

2007年第三届IET智能环境国际会议

2007年9月24-25日

乌尔姆

10.1049 / CP: 20070390

巴勒莫

李

Capstick报道

一个

Fletcher-Lloyd

赵

Kouchaki

年代

Nilforooshan

锋利的

Barnaghi

设计一个临床适用的深度复发模型，利用家庭监测数据识别痴呆症患者的神经精神症状

出来了。预印本于2021年10月19日在线发布

李

Enshaeifar

年代

斯基尔曼

年代

·马凯兹

一个

肯尼

米

锋利的

Rostill

Nilforooshan

Barnaghi

痴呆症患者尿路感染风险分析的半监督机器学习模型

SSRN J 2020

10.2139 / ssrn.3682493

Paudel

Eberle

持有人

基于图的智能家居中老年患者活动异常检测 2018

伦敦

CSREA新闻

Eberle

持有人

以图形表示的数据中的异常检测

Intell数据分析 2007 11 09 11 6 663 89

10.3233 /艾达- 2007 - 11606

古普塔

McClatchey

Caleb-Solly

使用无监督学习方法从未标记的智能家居传感器数据跟踪用户活动的变化

神经计算应用 2020 01 25 32 16 12351 62

10.1007 / s00521 - 020 - 04737 - 6

李

Rezvani

Kolanko

米

锋利的

Wairagkar

米

Vaidyanathan

Nilforooshan

Barnaghi

一个注意力模型来分析痴呆患者躁动和尿路感染的风险

出来了。预印本于2021年1月18日在线发布

10.48550 / arXiv.2101.07007

林

基奥计划

傅

一个

范

魔术的近似值:发现不寻常的医学时间序列

第18届IEEE计算机医疗系统研讨会论文集(CBMS'05) 2005

第18届IEEE计算机医疗系统研讨会(CBMS'05)

2005年6月23-24日

爱尔兰都柏林

10.1109 / cbms.2005.34

局域网

年代

陈

赵

基于在线矩阵剖面的IT运行序列异常检测

出来了。预印本于2021年8月27日在线发布

10.48550 / arXiv.2108.12093

Steenwinckel

De Paepe

Vanden Hautte

年代

Heyvaert

Bentefrit

米

摩恩

Dimou

一个

Van Den Bossche

De Turck

范Hoecke

年代

Ongenae

FLAGS:通过融合专家知识和机器学习，对传感器数据流进行自适应异常检测和根本原因分析的方法

未来一代计算系统 2021 03 116 30. 48

10.1016 / j.future.2020.10.015

30.

Nieves阿根廷

Caljouw

Deschrijver

范Hoecke

年代

冷成形制造过程异常检测与事件挖掘

Int J Adv制造技术 2020 10 10 115 3. 837 52

10.1007 / s00170 - 020 - 06156 - 2

De Paepe

Vanden Hautte

年代

Steenwinckel

De Turck

Ongenae

詹森

范Hoecke

年代

一个支持上下文序列分析的广义矩阵概要框架

工程应用Artif Intell 2020 04 90 103487

10.1016 / j.engappai.2020.103487

Chandola

巴纳吉

一个

库马尔

异常检测

ACM计算调查 2009 07 41 3. 1 58

10.1145/1541880.1541882

叶

朱

Ulanova

女王

丁

道

席尔瓦

Mueen

一个

基奥计划

矩阵配置文件I:时间序列的所有对相似度连接:一个统一的视图，包括母题，不一致和形状

2016 IEEE第16届数据挖掘国际会议论文集 2016

2016 IEEE第16届数据挖掘国际会议(ICDM)

2016年12月12日至15日

西班牙巴塞罗那

10.1109 / icdm.2016.0179

叶

Kavantzas

基奥计划

矩阵概要VI:有意义的多维主题发现

2017 IEEE数据挖掘国际会议论文集 2017

2017 IEEE数据挖掘国际会议(ICDM)

2017年11月18日至21日

美国，洛杉矶，新奥尔良

10.1109 / ICDM.2017.66

多维母题发现

斯达姆<一个ccess-date> 2021-12-01

https://stumpy.readthedocs.io/en/latest/Tutorial_Multidimensional_Motif_Discovery.html#Multi-dimensional-Matrix-Profiles

王

Mueen

一个

丁

Trajcevski

本篇报告

基奥计划

时间序列数据表示方法与距离度量的实验比较

数据最小知道盘 2012 2 10 26 2 275 309

10.1007 / s10618 - 012 - 0250 - 5

冈萨雷斯

詹森

Gambus

Vallverdu

米

熵测量作为描述符来识别脑电图信号中的呼吸暂停

熵(巴塞尔) 2019 06 18 21 6 605

10.3390 / e21060605

33267319

e21060605

PMC7515089

平卡斯

格莱斯顿

即时通讯

Ehrenkranz

类风湿性关节炎

用于医学数据分析的规律性统计

临床监护计算 1991 10 7 4 335 45

10.1007 / bf01619355

蒙特西诺斯

Castaldo

Pecchia

基于力板的人体平衡评价熵测量参数的选择

2018年世界医学物理和生物医学工程大会 2018

新加坡

施普林格

Satopaa

阿尔布雷希特

欧文

Raghavan

在干草堆中寻找“膝盖”:检测系统行为中的膝盖点

2011第31届分布式计算系统国际会议论文集 2011

2011第31届国际分布式计算系统研讨会

2011年6月20-24日

明尼阿波利斯，明尼苏达州，美国

10.1109 / icdcsw.2011.20

王尔德

骑士

吉拉德

史密斯

分割分析和通过Wasserstein距离恢复排队参数:慢性阻塞性肺疾病患者管理数据的研究

出来了。预印本于2020年8月10日在线发布

10.48550 / arXiv.2008.04295

严

伯

年代

Phutane

Berthelier

一个

布兰科

加西亚

酒庄

二维Wasserstein损失的鲁棒面部标志检测

模式Recognit 2021 08 116 107945

10.1016 / j.patcog.2021.107945

Skubic

米

格瓦拉

理查德·道金斯

Rantz

米

使用家庭传感器数据进行嵌入式健康评估的自动化健康警报

IEEE翻译英健康医学杂志 2015 3. 1 11

10.1109 / jtehm.2015.2421499

Pevny

Loda:轻量级在线异常检测器

马赫学习 2015 7 21 102 2 275 304

10.1007 / s10994 - 015 - 5521 - 0

Rantz

乔丹

Skubic

米

•库普曼

亚历山大

菲利普斯

Musterman

回来

澳元

妈

Galambos

格瓦拉

理查德·道金斯

米勒

自动化技术加速老年人疾病迹象的识别

老年护理 2012 04 38 4 18 23

10.3928 / 00989134-20120307-01

22420519

PMC3366277

D 'Agata

勒布

米切尔

评估老年痴呆症晚期养老院居民疑似尿路感染的挑战

美国老年医学会 2013 01 11 61 1 62 6

10.1111 / jgs.12070

23311553

PMC3545416

Ijaopo

痴呆相关躁动:非药物干预的回顾和药物治疗的风险和收益分析

Transl精神病学 2017 10 31 7 10 e1250

10.1038 / tp.2017.199

29087372

tp2017199

PMC5682601

阿伏伽德罗

Palonca

Dominoni

妈

时间序列中的在线异常搜索:显著的在线不一致

Knowl Inf系统 2020 03 09 62 8 3083 106

10.1007 / s10115 - 020 - 01453 - 4

Kriegel

舒伯特

米

Zimek

一个

高维数据中基于角度的离群点检测

第14届ACM SIGKDD知识发现和数据挖掘国际会议论文集 2008

KDD08:第14届ACM SIGKDD知识发现和数据挖掘国际会议

2008年8月24日至27日

美国内华达州拉斯维加斯

10.1145/1401890.1401946

李

赵

博塔携手

Ionescu

胡

COPOD:基于copula的离群值检测

2020年IEEE数据挖掘国际会议论文集 2020

2020 IEEE数据挖掘国际会议(ICDM)

2020年11月17日至20日

索伦托,意大利

10.1109 / icdm50108.2020.00135

扎克

Statology 2021 4 5

2021-12-01

https://www.statology.org/modified-z-score/

王

自由

Ranan

数字生物标志物对医疗保健的新影响

RockHealth.org 2016 1 31

2021-12-01

https://rockhealth.com/reports/the-emerging-influence-of-digital-biomarkers-on-healthcare/

贾克纳

南

黄

变化中

利贡

吉隆坡

温

亚历山大

神经肿瘤学中的FDA、NIH生物标志物、终点和其他工具(BEST)资源

神经肿瘤防治杂志 2018 08 02 20. 9 1162 72

10.1093 / neuonc / nox242

29294069

4774039

PMC6071649

Foxman

尿路感染的流行病学:发病率、发病率和经济成本

Am J医学 2002 07 113 1 5 13

10.1016 / s0002 - 9343 (02) 01054 - 9

戴维斯

Shiel小

尿路感染(UTI)会传染吗?

RxList 2022 1 8

2021-12-01

https://www.rxlist.com/is_a_urinary_tract_infection_uti_contagious/article.htm

道

基奥计划

矩阵剖面V:将领域知识纳入母题发现的通用技术

第23届ACM SIGKDD知识发现和数据挖掘国际会议论文集 2017

KDD '17:第23届ACM SIGKDD知识发现和数据挖掘国际会议

2017年8月13日至17日

加拿大哈利法克斯

10.1145/3097983.3097993

domingue

Filippone

米

Michiardi

Zouaoui

离群点检测算法的比较评价:实验与分析

模式Recognit 2018 02 74 406 21

10.1016 / j.patcog.2017.09.037