这是一篇开放获取的文章,根据创作共用署名许可(https://creativecommons.org/licenses/by/4.0/)的条款发布,允许在任何媒介上无限制地使用、分发和复制,前提是正确引用最初发表在《医学互联网研究杂志》上的原创作品。必须包括完整的书目信息,//www.mybigtv.com/上的原始出版物的链接,以及此版权和许可信息。
研究表明,某些眼部疾病的发生有昼夜规律。利用基于网络的搜索数据等新的信息来源来了解更多关于这种模式的信息,可以提高对患者眼睛相关疾病和健康状况的理解,更好地为临床和远程眼科护理的时机提供信息,并提高针对服务不足人群的基于网络的公共卫生运动的准确性。
为了调查我们的假设,即公众可能会在一天或一周的不同时间持续搜索不同的眼科疾病,我们使用与结膜炎等眼科疾病相关的搜索数据进行了一项观察性研究。我们评估了搜索量是否反映了每天或每周的模式,以及这些模式是否彼此不同。
我们设计了一项研究,分析和比较眼睛相关和控制搜索词的小时搜索数据,使用具有趋势和周期性术语的时间序列回归模型去除异常值,然后估计日影响。我们计划了一个谷歌趋势设置,从美国10个州提取2018年全年的数据。研究对象是互联网搜索,参与者是使用我们选择的研究术语在谷歌的搜索引擎上搜索的人群。我们的主要结果指标包括周期性的每小时和每星期的基于网络的搜索模式。对于统计分析,我们考虑
不同的日(
在网上搜索各种眼睛状况的频率可以根据一天或一周的时间显示循环模式。进一步研究了解这些变化的原因可能有助于补充目前临床对眼科症状表现的理解,并提高患者信息和护理干预的及时性。
信息流行病学是卫生信息学中一个相对年轻的学科,研究电子媒介,特别是互联网或人群中信息的分布和决定因素的科学,目的是为公共卫生和政策提供信息[
谷歌趋势已成为预测疾病发生和爆发的信息流行病学研究的流行工具,以至于提出了旨在加强这种分析有效性的标准化方法,并开发了常用的数据获取工具[
与人类健康相关的谷歌趋势搜索兴趣的循环模式,通常是季节性的,但也有字母程度上是每日的,是一个广泛研究的领域。临床研究已确定人类健康状况的周期性发生,包括昼夜眼相关疾病,研究结果可促进时间预防和时间治疗护理[
我们查询了谷歌Trends结膜炎术语和其他常见眼部疾病和治疗方法,以便进行比较。搜索词包括“结膜炎”、“眼睛模糊”、“白内障”、“红眼病”、“干眼症”、“水眼”、“青光眼”、“隐形眼镜”、“visine”和“lasik”。一个积极的控制术语,可能会表现出每小时和每星期的变化(“醉酒”)。数据是使用我们开发的Python (Python软件基金会)脚本获得的
使用每个搜索词的小时RSV作为结果变量,我们对趋势进行了Serfling回归调整,如下所示[
由于在单一时间出现的离群值可能会产生对日系数的偏差估计,因此我们包含了额外的术语来控制潜在的离群值(妨害术语)。我们可能会包含大量不同长度的此类术语,通过使用交叉验证的LASSO(最小绝对收缩和选择算子)来避免不可识别性,从而只选择少量此类术语[
对于统计分析,在对这些有害项进行模型选择后,使用普通最小二乘估计来估计趋势系数、离群值和三角系数。根据三角系数和截距,我们估计了圆形中值出现时间和幅均值比(与我们之前的分析相似,并使用R [R统计计算基础]包“圆形”)[
对于数据可视化,对每个术语过滤后的时间序列数据的平均小时结果进行归一化,以便在极图中进行可视化比较(R包“ggplot”[
2018年美国10个州的平均每小时循环模式。
这项研究获得了加州大学旧金山分校机构审查委员会的批准(14-14743)。
总的来说,我们发现每个搜索词都表现出周期性的搜索兴趣日模式(
为了可视化每一项的循环日模式,每天每个时间点的平均RSV用标准化的24小时极坐标图表示(见方法)
从2018年起,美国10个州加起来每个工作日的平均每小时循环模式。
相对搜索值的周期性日或周特征。
搜索条件 | 圆形中位数一个 | Amplitude-to-mean比率 | |||||
|
工作日 | 周末 | 差异,小时 | 工作日b | 周末 | 区别c | |
“模糊的眼睛” | 00:39 (00:18, 00:59) | 01:09 (00:40, 01:37) | 0 - 2 | 0.37 (0.33, 0.47) | 0.42 (0.39, 0.59) | 0.02(-0.04至0.08) | |
“白内障” | 15:28(15:11、15:45) | 18:35 (17:12, 20:15) | 2 - 4 | 0.26 (0.24, 0.3) | 0.18 (0.15, 0.25) | -0.05(-0.08到-0.02) | |
“结膜炎” | 06:11 (06:02, 06:21) | 05:54 (05:46, 06:03) | 0 - 2 | 0.62 (0.59, 0.66) | 0.77 (0.72, 0.84) | 0.04(0至0.07) | |
“隐形眼镜” | 23:16 (22:59, 23:32) | 02:29 (01:57, 03:02) | 2 - 4 | 0.43 (0.41, 0.47) | 0.38 (0.35, 0.43) | -0.03(-0.06到-0.01) | |
“干眼症” | 02:13 (02:07, 02:20) | 03:38 (03:28, 03:48) | 0 - 2 | 0.61 (0.58, 0.66) | 0.85 (0.79, 0.95) | 0.12(0.08至0.17) | |
“青光眼” | 13:24(13:14、13:34) | 00:13 (21:41, 02:52) | 4 - 6 | 0.38 (0.36, 0.41) | 0.15 (0.12, 0.19) | -0.15(-0.17到-0.13) | |
“激光” | 11:51 (11:33, 12:09) | 06:00 (05:10, 06:51) | 4 - 6 | 0.28 (0.25, 0.31) | 0.24 (0.2, 0.28) | -0.03(-0.06到-0.01) | |
“红眼” | 04:35 (04:33, 04:38) | 05:38 (05:33, 05:43) | 0 - 2 | 1.6 (1.56, 1.64) | 1.08 (1.04, 1.11) | -0.26(-0.29到-0.24) | |
“visine” | 00:37 (00:17, 00:56) | 00:37 (00:08, 01:04) | 0 - 2 | 0.41 (0.35, 0.5) | 0.43 (0.38, 0.55) | 0.03(-0.03至0.09) | |
“水汪汪的眼睛” | 01:49 (01:41, 01:56) | 03:50 (03:35, 04:07) | 2 - 4 | 0.67 (0.63, 0.74) | 0.48 (0.45, 0.58) | -0.07(-0.12到-0.03) |
一个工作日和周末的每个项的平均过滤和去趋势循环中值时间(和95% CI)。我们发现,度量日变化系数的ci排除了零,这表明日变化具有统计学意义(
b峰值到低谷除以平均值来归一化标量差。日平均幅均值比值越大,日变化规律越明显。
c允许比较工作日和周末的日周期幅均值比(即周期强度的比较),提供工作日和周末幅均值比之间的平均差值(和95% CI)。负值表示工作日周期强度更强,正值表示周末周期强度更强。大于0的值表示工作日和周末之间的差异较大。这一列是振幅差除以周末和工作日平均值,而不是前两列之间的差。
从2018年起,美国10个州的工作日(实线)和周末(虚线)的平均每小时循环模式。
在平滑和去趋势之后,得到的数据集用于所有后续的统计分析和数据可视化。所有项的结果显示在
所有季节的日循环模式均在工作日和周末显著(
与常见眼部疾病和治疗相关的基于网络的搜索行为模式显示出显著的独特的周期性日变化。这表明,利用信息流行病学方法,如本研究中所展示的方法,可以为我们了解不同的眼病可能对患者造成最大或最小干扰或关注的昼夜时间增加信息。这可能有助于增强我们对眼部疾病的传统理解,这种理解主要是基于在典型临床时间内评估患有眼科疾病的患者。我们观察到,在典型门诊时间之外发生的特征在眼科疾病相关搜索词之间可能有所不同。例如,“红眼病”在短时间的工作日早晨显示出更大的日振幅-均值比,而其他术语,如“干眼病”在周末有更大的振幅-日模式,与“红眼病”相比,更强的信号出现在更广泛的晚上到早上的时间段。
对于一些单独的搜索词,我们还发现该词在工作日和周末的日搜索模式存在显著差异。这表明,信息流行病学方法可以对一周中的特定日子以及这些日子中的几个小时提供新的理解,在这些日子里,特定的眼科疾病对患者的影响最大。这种方法可以补充正在进行的研究,以了解眼部疾病的标准临床时间以外的症状和条件的严重程度或治疗的关键时间或天数,正如对其他疾病的研究一样[
我们的研究有可能出现异常值、偏差和混杂因素。例如,一个孤立的事件,比如一个名人患了结膜炎,可能会在新闻报道的时候引发对“红眼病”的不寻常搜索。类似地,停电等事件可能会引发搜索模式的临时变化。此外,众所周知,媒体报道会影响对covid -19相关词汇的搜索[
尽管有这些限制,我们还是找到了支持我们模型的证据。例如,在我们的分析中确定的结果通常反映了已知临床理解的组成部分。从深夜到清晨,观察到“眼睛干涩”和“眼睛模糊”的每小时RSV增加,这与症状的临床报告一致[
在这项研究中,我们从基于网络的每小时搜索模式中建立证据,表明与各种眼科症状和条件相关的基于网络的信息搜索行为存在明显的日和周模式。通过分析补充数据源(如使用基于网络的搜索数据),未来可能会确定对临床眼病表现、卫生和临床外患者健康维护行为的更精确的时间理解。这反过来又可以改进日常眼病监测和眼科远程医疗资源分配时间、及时的医疗保健信息和临床干预的方法。
最小绝对收缩和选择算子
相对搜索量
这项工作得到了来自美国国立卫生研究院国家眼科研究所(NIH-NEI)的拨款1R01EY024608-01A1 (Lietman, PI),美国国立卫生研究院国家眼科研究所(NIH-NEI)的拨款EY002162(视力研究核心拨款- ullian, PI),美国国立卫生研究院国家眼科研究所(NIH-NEI)的拨款EY013124和EY021558 (Chodosh, PI),以及来自预防失明研究(McLeod, PI)的无限制拨款。发起人或资助机构在本研究的设计或实施中没有任何作用。
没有宣布。