这是一篇开放获取的文章,根据创作共用署名许可(http://creativecommons.org/licenses/by/2.0/)的条款发布,允许在任何媒介上无限制地使用、分发和复制,前提是正确引用最初发表在《医学互联网研究杂志》上的原创作品。必须包括完整的书目信息,//www.mybigtv.com/上的原始出版物的链接,以及此版权和许可信息。
替代数据源越来越多地用于增强传统的公共卫生监测系统。例如非处方药销售和旷工。
我们试图确定餐厅餐桌供应的增加是否与疾病发病率的增加有关,特别是流感样疾病(ILI)。
餐厅的餐桌可用性是通过在线餐厅餐桌预订网站OpenTable监测的。研究人员每天搜索22个不同时段(午餐时间为上午11点至下午3点半,晚餐时间为下午6点至11点半)有2人桌的餐厅。在美国,我们调查了波士顿、亚特兰大、巴尔的摩和迈阿密的餐厅的餐桌供应情况。在墨西哥,我们研究了坎昆、墨西哥城、普埃布拉、蒙特雷和瓜达拉哈拉的餐桌供应情况。使用互相关联函数将餐厅就餐的时间序列与美国和墨西哥州和国家层面的谷歌流感趋势和ILI进行比较。
在不同的采样时间和地区,我们观察到了餐馆使用的差异。我们还注意到流感活动数据和餐厅就餐数据之间的时间序列趋势的相似性。在某些情况下,餐厅使用数据和ILI趋势之间的显著相关性超过70%。
本研究介绍并展示了餐厅使用数据对事件监控的潜在价值。
全球采用互联网和移动电话技术已证明对收集和传播数据很有用。使用这些技术的各种新数据流已被探索作为增强传统公共卫生疾病监测系统的工具。除了向公众和公共卫生专业人员传播信息外,这些新系统通常旨在改进对疫情的发现和监测。例子包括搜索查询量[
与学校缺勤、非处方药物销售和电话分诊服务数据量类似,在线餐厅预订网站的利用也可以作为事件监视的工具。研究指出,在美国,外出就餐的比例有所增加[
所有餐厅使用数据均来自OpenTable [
从2012年9月4日到2013年4月30日,每天在午餐和晚餐的固定时间,我们进行搜索,以确定有2人桌的餐厅的数量。为了适应地区和饮食习惯的差异,我们将午餐时间定义为11:00 am-3:30 pm,晚餐时间定义为6:00 -11:30 pm。根据OpenTable的政策,客户可以在预约时间前30分钟取消预约。因此,我们搜索了在我们感兴趣的时间前15分钟还有空位的餐厅。所以,如果是下午2点的预订,我们会在每天下午1点45分搜索可用的桌子。此外,我们还搜索了在整点和半点半还有空位的餐厅。这导致在美国和墨西哥的10个研究区域中,每天有20个不同的搜索次数。在美国,波士顿(马萨诸塞州)、亚特兰大(佐治亚州)、巴尔的摩(马里兰州)和迈阿密(佛罗里达州)的餐厅的餐桌供应情况进行了调查。在墨西哥,我们监测了坎昆(Quintana Roo)、墨西哥城(Distrito Federal)、普埃布拉(Puebla)、蒙特雷(Nuevo Léon)、瓜达拉哈拉(哈利斯科)和整个墨西哥的餐厅供应情况。由于每天在指定时间收集数据,我们的观察形成了可用性的时间序列曲线。 Monitoring 10 regions at 20 search times resulted in 200 distinct time series.
通过使用最近2012-2013年严重流感季节的数据,我们验证了流感活动的增加与餐厅可用座位增加有关的假设。由于系统中的餐厅数量随时间变化,所以我们关注的是拥有可用餐桌的餐厅的比例。对于每个地区,可用餐桌的餐厅比例定义为同一时间可用餐桌的餐厅数量
在哪里
在美国和墨西哥的城市,午餐(上午11:00 -下午3:30)和晚餐(下午6:00-11:30)有空位的餐厅的平均比例。
采样时间 | 区域,平均值(SD) | |||||||||
|
美国 | 墨西哥 | ||||||||
|
亚特兰大 | 迈阿密 | 波士顿 | 巴尔的摩 | 墨西哥城 | 坎昆 | 瓜达拉哈拉 | 蒙特雷 | 普埃布拉 | 墨西哥 |
上午11 | 0.598 (0.032) | 0.668 (0.033) | 0.595 (0.021) | 0.575 (0.029) |
|
|
|
|
|
|
11点半 | 0.594 (0.032) | 0.666 (0.033) | 0.595 (0.020) | 0.572 (0.028) |
|
|
|
|
|
|
下午12点 | 0.592 (0.035) | 0.665 (0.035) | 0.592 (0.021) | 0.572 (0.028) | 0.876 (0.054) | 0.638 (0.090)一个 | 0.896 (0.065) | 0.841 (0.067) | 0.982 (0.088) | 0.777 (0.050) |
12:30 | 0.590 (0.033) | 0.665 (0.035) | 0.591 (0.022)一个 | 0.573 (0.029) | 0.878 (0.055) | 0.638 (0.089)一个 | 0.9 (0.065) | 0.849 (0.068) | 0.982 (0.085) | 0.78 (0.050) |
下午一点 | 0.589 (0.036) | 0.664 (0.034)一个 | 0.595 (0.022) | 0.573 (0.029) | 0.876 (0.054) | 0.638 (0.089)一个 | 0.903 (0.064) | 0.855 (0.070) | 0.981 (0.088) | 0.78 (0.049) |
下午1:30 | 0.614 (0.034) | 0.677 (0.032) | 0.628 (0.023) | 0.626 (0.029) | 0.876 (0.054) | 0.641 (0.089) | 0.904 (0.066) | 0.869 (0.072) | 0.984 (0.087) | 0.781 (0.048) |
下午2点 | 0.604 (0.035) | 0.684 (0.034) | 0.624 (0.024) | 0.622 (0.035) | 0.876 (0.054) | 0.641 (0.089) | 0.896 (0.070) | 0.87 (0.067) | 0.983 (0.092) | 0.781 (0.047) |
下午两点半 | 0.729 (0.045) | 0.758 (0.041) | 0.771 (0.034) | 0.836 (0.040) | 0.867 (0.054) | 0.689 (0.092) | 0.881 (0.070) | 0.888 (0.072) | 0.992 (0.092) | 0.779 (0.046) |
下午三点 | 0.906 (0.049) | 0.765 (0.048) | 0.887 (0.035) | 0.877 (0.042) | 0.855 (0.063) | 0.693 (0.092) | 0.859 (0.074) | 0.891 (0.069) | 0.99 (0.094) | 0.771 (0.046) |
下午3:30 | 0.899 (0.051) | 0.863 (0.041) | 0.889 (0.038) | 0.894 (0.043) | 0.829 (0.075) | 0.821 (0.121) | 0.836 (0.078) | 0.893 (0.071) | 0.988 (0.099) | 0.763 (0.050) |
下午6点 | 0.884 (0.051) | 0.876 (0.046) | 0.846 (0.042) | 0.877 (0.046) | 0.833 (0.056) | 0.89 (0.130) | 0.858 (0.074) | 0.912 (0.074) | 0.99 (0.100) | 0.773 (0.049) |
下午6:30 | 0.880 (0.051) | 0.871 (0.047) | 0.847 (0.040) | 0.875 (0.044) | 0.815 (0.056) | 0.891 (0.132) | 0.835 (0.075) | 0.892 (0.079) | 0.97 (0.107) | 0.757 (0.048) |
下午7点 | 0.884 (0.053) | 0.869 (0.048) | 0.860 (0.041) | 0.879 (0.045) | 0.807 (0.058) | 0.891 (0.133) | 0.829 (0.080) | 0.877 (0.079) | 0.961 (0.106) | 0.749 (0.052) |
7:30 | 0.888 (0.052) | 0.871 (0.048) | 0.874 (0.043) | 0.882 (0.045) | 0.782 (0.056) | 0.89 (0.131) | 0.813 (0.076) | 0.847 (0.080) | 0.911 (0.097) | 0.725 (0.049) |
下午8点 | 0.887 (0.054) | 0.873 (0.047) | 0.874 (0.044) | 0.879 (0.045) | 0.775 (0.055) | 0.891 (0.131) | 0.813 (0.076) | 0.839 (0.078) | 0.911 (0.098) | 0.719 (0.049) |
8:30, | 0.882 (0.051) | 0.869 (0.047) | 0.871 (0.043) | 0.872 (0.045) | 0.748 (0.056) | 0.89 (0.131) | 0.799 (0.078) | 0.827 (0.084) | 0.89 (0.091) | 0.699 (0.048) |
下午9点 | 0.863 (0.050) | 0.864 (0.047) | 0.858 (0.043) | 0.845 (0.056) | 0.74 (0.055) | 0.889 (0.13) | 0.786 (0.082) | 0.799 (0.092) | 0.891 (0.088) | 0.69 (0.048) |
上午9点 | 0.818 (0.066) | 0.838 (0.052) | 0.835 (0.045) | 0.802 (0.076) | 0.694 (0.065) | 0.884 (0.131) | 0.736 (0.095) | 0.759 (0.093) | 0.881 (0.089) | 0.654 (0.050) |
晚上10点 | 0.682 (0.163) | 0.779 (0.089) | 0.721 (0.127) | 0.656 (0.170) | 0.674 (0.077) | 0.883 (0.134) | 0.688 (0.095) | 0.691 (0.096) | 0.865 (0.089) | 0.634 (0.058) |
晚上10:30 | 0.539 (0.229)一个 | 0.677 (0.143) | 0.598 (0.217) | 0.520 (0.233)一个 | 0.599 (0.077) | 0.814 (0.148) | 0.619 (0.078) | 0.635 (0.098) | 0.85 (0.097) | 0.571 (0.065) |
下午11点 |
|
|
|
|
0.546 (0.08) | 0.774 (0.178) | 0.563 (0.067) | 0.582 (0.071) | 0.776 (0.102) | 0.525 (0.067) |
11:30 |
|
|
|
|
0.501 (0.117)一个 | 0.717 (0.183) | 0.527 (0.068)一个 | 0.551 (0.091)一个 | 0.705 (0.189)一个 | 0.483 (0.097)一个 |
一个可用性比例最低的采样次数。
餐桌供应因用餐时间(午餐和晚餐)和城市而异。在某些城市,餐厅供应最低的时间可能代表人们更喜欢的用餐时间。在首选用餐时间观察到的趋势也应该最受用餐季节偏差的影响。此后,我们将可用性最低的时间称为“最优选”,将可用性最高的时间称为“最不优选”。人们最喜欢和最不喜欢的用餐时间因地区而异。使用
我们计算了代表ILI活动和餐厅使用的数据之间的300个相关性。显著相关(
如前所述,在基准期间,所有地区的餐厅在晚上10:30-11:30之间提供晚餐的比例最低。如在
我们提出了一个样本图,展示了一个案例,其中餐厅餐桌可用性的趋势似乎与迈阿密估计ILI活动的趋势相似
显著交叉相关(
国家/城市 | 数据源 | |||||||||
|
谷歌流感趋势 | 州伊犁 | 泛美卫生组织 | |||||||
|
时间 |
|
时间 |
|
时间 |
|
||||
|
|
落后0 | Lag1 |
|
落后0 | 延迟1 |
|
落后0 | 延迟1 | |
|
|
|
|
|
|
|
|
|
|
|
|
迈阿密 | 晚上10:30 | 55.06 | 58.19 | 晚上10:30 | 56.77 |
|
|
|
|
|
|
晚上10点 | 53.04 |
|
|
|
|
|
|
|
|
|
上午9点 |
|
54.56 |
|
|
|
|
|
|
|
|
下午9点 | 55.73 | 65.85 |
|
|
|
|
|
|
|
巴尔的摩 | 7:30 |
|
63.60 | 下午3:30 | 63.67 |
|
|
|
|
|
|
8:30, |
|
49.93 | 下午7点 |
|
70.27 |
|
|
|
|
|
下午8点 |
|
62.75 |
|
|
|
|
|
|
|
亚特兰大 | 下午3:30 | 69.74 | 46.54 | 12:30 | 74.27 |
|
|
|
|
|
|
下午三点 | 70.15 |
|
|
|
|
|
|
|
|
|
下午6:30 | 67.25 |
|
|
|
|
|
|
|
|
|
下午6点 | 59.85 |
|
|
|
|
|
|
|
|
|
7:30 | 55.81 | 46.60 |
|
|
|
|
|
|
|
|
下午7点 | 69.01 |
|
|
|
|
|
|
|
|
|
8:30, | 66.12 | 46.40 |
|
|
|
|
|
|
|
|
下午8点 | 60.35 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
墨西哥城 | 11:30 |
|
36.43 |
|
|
|
|
|
|
|
蒙特雷 | 12:30 | 51.19 | 47.43 |
|
|
|
|
|
|
|
墨西哥 |
|
|
|
|
|
|
晚上10:30 |
|
39.83 |
|
|
|
|
|
|
|
|
晚上10点 |
|
41.57 |
|
|
|
|
|
|
|
|
下午11点 |
|
41.76 |
|
|
|
|
|
|
|
|
11:30 |
|
39.33 |
迈阿密与谷歌流感趋势数据相比,晚上10:00有座位的餐厅比例的趋势。(A)餐厅餐桌供应与谷歌流感趋势曲线;(B)黄土平滑曲线,捕捉可用性的总体趋势。
与不同地区流感活动的各种估计趋势相比,有座位的餐馆比例的趋势。(A)谷歌晚上7:30巴尔的摩的流感趋势和餐厅餐桌供应情况;(B, C)马里兰州的估计流感样疾病(ILI)百分比和巴尔的摩下午7:00和3:30的餐厅餐桌可用性;(D, E)谷歌亚特兰大下午3:00和6:30的流感趋势和餐厅餐桌供应情况;(F)下午12:30佐治亚州的估计ILI %和亚特兰大餐厅的餐桌可用性;(G-I)泛美卫生组织(PAHO) %流感阳性,墨西哥餐厅在晚上10点、10点半和11点分别有空位。
在本文中,我们介绍了一种易于访问的基于internet的数据流—在线餐厅预订—并演示了它在事件监视方面的潜在价值。更具体地说,我们观察到餐厅餐桌可用性与谷歌流感趋势以及美国和墨西哥城市和国家层面的流感活动数据之间存在显著相关性。在大多数情况下,当所有数据都具有相同的地理分辨率时,餐馆使用和流感活动测量之间的关联更强。例如,迈阿密的餐馆消费与谷歌流感趋势数据之间的相关性强于佛罗里达州的ILI数据与迈阿密餐馆消费数据之间的相关性。在不同地理分辨率(如城市、州、国家)下测量的已知ILI趋势变化至少部分解释了这一趋势[
虽然可能有用,但该研究和数据来源存在一些固有的限制,阻碍了对该系统潜力的充分探索。局限性包括区分季节变化和可能由疾病相关事件引起的变化。此外,关于取消预订的数据是最合适的。然而,这些数据目前不可用。这个问题可以通过与餐馆建立合作关系来很容易地解决,这样就可以通过调查系统记录取消订单的情况和原因。此外,OpenTable上只列出了每个地区的餐厅样本。
尽管存在这些局限性,但这一初步分析表明,监测餐厅餐桌可用性和取消的趋势可能有助于检测社会混乱,包括与疾病相关的事件。此外,与缺勤率、非处方药物销售和电话分类服务数据量等传统上难以获取的数据不同,预约使用数据可以很容易地从预约网站获得。互联网在全球的普及也表明,这些数据源在未来可以很容易地获得。如果有必要,这些新的数据来源可以作为促进疾病事件进一步调查的踏脚石。使用这些数据所作的观察可以通过与其他疾病监测替代来源的趋势进行比较来进一步调查,特别是在关于疾病活动的官方报告延迟的情况下。此外,可以使用集成建模方法将该数据源与更传统的流行病情报数据流融合在一起。
自回归综合移动平均
互相关函数
情报高级研究项目活动
流感样疾病
泛美卫生组织
我们感谢Sumiko Mekaru关于数据分析的建议。这项工作部分由内政部国家商业中心(DoI/NBC)的情报高级研究项目活动(IARPA)的研究拨款支持,合同号为D12PC000337。美国政府被授权为政府目的复制和分发再版,尽管其上有任何版权注释。本文所包含的观点和结论仅代表作者的观点和结论,不应被解释为必然代表IARPA、DoI/NBC或美国政府的官方政策或背书(无论是明示的还是暗示的)。
所有作者都构思并设计了这项研究。Elaine O Nsoesie分析了这些数据。所有作者都起草、编辑并批准了论文的最终版本。赞助者在这份手稿的设计、分析和写作中没有任何作用。
没有宣布。