发表在第八卷第九期(2022年):9月

这是一个成员出版物剑桥大学

本文的预印本(早期版本)可在https://preprints.www.mybigtv.com/preprint/39033,首次出版
监测英国家庭外食品的营养成分:数据库开发和案例研究

监测英国家庭外食品的营养成分:数据库开发和案例研究

监测英国家庭外食品的营养成分:数据库开发和案例研究

原始论文

医学研究委员会流行病学处,剑桥大学,联合王国剑桥

通讯作者:

黄玉如,MHS

医学研究理事会流行病学处

剑桥大学

285号,代谢科学研究所

剑桥生物医学校区

剑桥,cb20qq

联合王国

电话:44 01223 330315

电子邮件:Yuru.Huang@mrc-epid.cam.ac.uk


背景:从网站上手工转录营养成分数据需要大量的人力资源,而且容易出错。因此,在英国,在家做饭的食物的营养成分数据有限。这些数据对于了解和监测户外食品环境至关重要,有助于政策制定。从公开来源自动收集数据提供了一种潜在的低资源解决方案来解决这一差距。

摘要目的:在本文中,我们描述了英国第一个家庭食品纵向营养数据库,MenuTracker。由于从2022年4月起,英国将要求大型连锁店在菜单上显示卡路里信息,我们还旨在确定哪些连锁店在2021年11月在线报告了它们的营养信息。在一个演示MenuTracker实用性的案例研究中,我们估算了菜单中超过推荐能量和营养摄入量的食物比例(例如,每餐>600千卡)。

方法:从2021年3月开始,我们每季度整理了大型连锁餐厅销售的菜单产品的营养成分数据。大型连锁餐厅被定义为拥有250名或更多员工(受新卡路里标签政策影响)或属于销售额排名前100的餐厅。我们用Python开发了脚本,以自动化从商业网站收集数据的过程。使用各种技术来收集网络数据,并从PDF格式的营养表中提取数据。

结果:自动化的Python程序减少了大约85%的手工工作,每波数据收集总共节省了500小时。截至2022年1月,MenuTracker拥有来自88家大型户外食品连锁店在2021年4个不同时间点(即3月、6月、9月和12月)的76,405条记录。在构建数据库的过程中,我们发现四分之一(24.5%,256/1043)的大型连锁店在2021年11月在线提供了他们的营养信息,这些连锁店可能会受到英国卡路里菜单标签法规的约束。在这些连锁店中,24.7%(16,391/66,295)的菜单项目超过了英国政府建议的每道菜的最大热量不超过600千卡一顿简单的饭菜.饱和脂肪为46.4%(29411 / 63416),总脂肪为34.7%(21,964/63,388),碳水化合物为17.6%(11,260/64,051),糖为17.8%(11,434/64,059),盐为35.2%(22,588/64,086)。此外,菜单上超过最大值的菜品占0.7% ~ 7.1%每天这些营养素的推荐摄入量。

结论:MenuTracker是一个有价值的资源,利用数据科学技术的力量来使用在线公开数据。研究人员、政策制定者和消费者可以使用MenuTracker来了解和评估从户外食品店获得的食物。开发中使用的方法可以在网上找到,也可以在其他地方建立类似的数据库。

JMIR公共卫生监测2022;8(9):e39033

doi: 10.2196/39033

关键字



在世界范围内,外出做饭的消费量正在增加。在美国,外出就餐占食品支出的一半以上。1],西班牙为34% [2]和27%的新西兰[3.].在英国,2018/2019年度家庭以外的食品支出占总食品支出的比例为28% [4].除了外出就餐,在线外卖服务的迅速发展也促进了在家之外准备食物的消费。在一项国际研究中,15%的受访者表示曾使用过在线快递[5].经常食用在家里准备的食物是一个公共健康问题,因为这些食物通常富含能量、盐、饱和脂肪和糖[6-11].经常食用这些食物与较高的BMI和心血管疾病风险增加有关[1213].

外出就餐的频率越来越高,这使得这些连锁店提供的食物成为提高人们饮食质量的重要途径。在国际上,决策者正在制定政策,促进更健康的户外选择。目标是改善外出就餐环境,确保“健康的选择是简单的选择”[1415].例如,在英国,政府推出了强制性卡路里菜单标签政策,作为更广泛的肥胖战略的一部分[16-18].该法案要求从2022年4月6日起,拥有250名或以上员工的大型户外食品连锁店在其销售的大部分食品的菜单上添加卡路里标签[1719].这项政策的效果可能不仅是帮助消费者做出明智的选择,而且还会激励户外连锁店重新制定或提供更健康的产品。20.].

尽管在政策上取得了进展,但关于在家做饭的食物的营养成分的数据有限。正如世界卫生组织最近的一份报告所强调的那样,缺乏质量数据阻碍了对家庭外食品环境的监测,为政策制定和评估带来了障碍和挑战[2].关于英国的卡路里标签政策,需要建立一个家庭外食品的纵向营养数据库,以调查这一政策对菜单的直接影响(例如,更健康的菜单选项)以及对人口饮食摄入量的总体影响。除了帮助政策评估外,户外食品的营养成分数据还可以通过纳入目前很少包括的特定品牌信息,改善流行病学研究中的营养摄入量估计[21].

许多餐厅会在网上发布菜单上的营养信息,这些信息对研究很有价值。在美国,一个纵向餐厅营养数据库MenuStat于2013年建立,使用的信息来自餐厅网站[22].它已被证明是一种宝贵的资源,供研究人员增进对餐厅食物环境的了解[2324],评估餐厅食物随时间的变化[25-28],并评估美国卡路里菜单标签政策的潜在影响[29].在其他地方,新西兰也收集了家庭外食品和饮料的类似营养数据[30.]、澳洲[31],以及加拿大[32].然而,据我们所知,这些数据库的营养数据是由研究人员手动收集的,可能因此,它们没有定期更新,如果有的话。手工收集餐厅的营养数据需要大量的人力资源,而且容易出错。

网页抓取,或从网站自动提取数据,提供了一种有效、可靠和灵活的替代手工转录网站数据的方法[3334].在英国,已经使用网络抓取建立了大型超市销售的包装食品的纵向营养数据库- fooddb [33].然而,关于户外食品的营养数据仍然有限,这主要是由于户外连锁店网站上营养信息的呈现方式和内容存在差异。

这项研究介绍了MenuTracker,第一个纵向营养数据库,每季度更新一次,由英国大型户外食品连锁店准备的食物。在未来,我们将使用该数据库来描述和描述户外食物营养成分随时间的变化,以评估卡路里菜单标签政策的影响,并可能改善营养流行病学研究中的营养摄入量估计。在这篇论文中,我们的目标是描述MenuTracker及其数据收集方法,识别在线营养信息呈现中的差距,并演示MenuTracker在食品和营养研究中的示例应用。


概述

自2021年3月以来,我们每季度从英国大型食品企业(可能受卡路里标签政策影响)的网站上整理了菜单上产品的营养成分数据。我们使用网页抓取技术和PDF提取工具自动收集数据。在该数据的示例应用中,我们检查了菜单项超过英国人口推荐能量和营养摄入量的比例。

户外食物链纳入标准

“户外食物链”被定义为购买食物或饮料的人可以立即食用的任何连锁店[18].图1显示了MenuTracker中户外食物链的包含标准。实际上,MenuTracker使用了两个采样帧。抽样框架一——主要的抽样框架——是一个与英国卡路里菜单标签政策潜在相关(即可能提供食物)的企业列表。在本研究中,我们使用术语“企业”来指代母公司,使用术语“连锁店”来指代属于企业的品牌。我们于2020年10月从英国国家统计局(ONS)获得了这份名单。该清单包含了所有具有标准行业分类(SIC)代码,表明他们可能提供食品的企业(例如,“SIC 47.11:以食品、饮料或烟草为主的非专业商店的零售”)及其员工人数。包含的SIC代码的完整列表可以在多媒体附件1.然后,我们筛选了员工人数在250人以上的企业,并对它们进行了审查,以确定哪些企业在网上提供了营养信息。如果一家企业下有多个连锁店,则对每个连锁店进行审查,以确定在线营养信息的可用性。例如,Mitchells & Butlers旗下有10多家不同的连锁店,包括sizzle bars、Vintage Inns、Harvester、Ember Inns和Toby Carvery。每个连锁店都被审查,如果该连锁店在线提供营养信息,就包括在内。抽样框架二——补充抽样框架——包含了基于销售额排名前100的英国餐厅。2013年销售数据由Technomic提供,Technomic是一家专门从事食品服务行业的市场研究公司[35].这份前100家食品企业的名单补充了我们的主要抽样框架,以捕捉英国所有可能有资格进行卡路里标签的大型食品企业。我们对列出的每一家企业都进行了审查,以确定它们是否在网上提供了营养信息,因此它们将被包括在内。这两份清单每年都会被审查,以检查在线提供营养信息的链条的变化。

图1。户外食物链纳入标准。标准工业分类。
查看此图

菜单及菜单项纳入标准

所有带有在线营养信息的户外菜单项目都包括在数据收集中。在本文中,我们用“营养信息”来指代“能量和营养信息”。菜单项数据是在它们出现在网站上时收集的。我们收集了户外食品连锁店的名称、菜单项目名称、菜单部分、项目描述、份量和营养信息。此外,成分说明、过敏原和饮食信息(例如,素食者)如果在同一页或同一PDF文档中可用,则被提取出来。

当不同地点的菜单不同时(例如,Weatherspoon在不同地点有不同的食物菜单),在伦敦列出的第一个地点被选择来代表户外连锁店。如果该连锁店在伦敦没有分店,则随机选择一个地点。链的相同位置用于不同的数据收集波。当一家户外连锁店有不同的菜单(如“核心”或“配送”)时,使用主菜单(如“核心菜单”或“主菜单”)。除了主菜单之外,还包括儿童菜单和相关的促销菜单。如果营养文件最近一次更新是在3年以上,则被视为无效。只有1家餐厅被排除在外。

还包括不同大小的菜单项和不同定制选项的饮料。例如,有多种牛奶选择的饮料(如燕麦牛奶、豆浆或全脂牛奶)被输入为个人记录,以及不同大小的披萨(如个人、中号、大号或XXL)。然而,高度可定制的菜单项,如自己做卷饼可以导致大量可能的组合。我们收集了这些工具的默认自定义。如果没有默认的自定义,则收集每个菜单项的膳食组件,并为未来的链接分配一个项目ID。

数据收集

在MenuTracker数据收集之前,我们在一个试点研究中收集了四波数据,这在其他地方已经详细描述过[3637].使用上面描述的采样帧,我们使用自动化的Python脚本从2021年3月开始为MenuTracker收集数据。该代码库于2020年10月至2021年2月开发。包括连锁店直接在网页上或在单独的可下载PDF文件中提供营养信息。尽管这些信息在网页上的显示方式有所不同(例如,一些信息显示在单独的项目页面上,而另一些则显示为与项目页面分开的营养表),但网络抓取的基本原理是相同的。因此,我们可以为所有“网页”描述网络抓取方法,而不管营养信息是如何呈现的(图2).

对于以非屏幕可读PDF格式显示的营养信息,我们首先使用adobeacrobat中的“扫描和OCR”工具将PDF转换为屏幕可读。然后,我们使用Python包Tabula或Camelot从pdf中提取数据表。这两个包的设计都支持从pdf文件中提取表格,Camelot允许更多的用户定制,Tabula提供更稳定的用户界面来选择表格边界。包的选择取决于这些包输出的质量。在这两个包中,都有两种表解析方法,“流”和“点阵”。“流”解析方法根据行范围和表区域估计列数。它在没有明确边界和线条的PDF表格中表现更好。“格”解析方法基于表行定义表。它在具有清晰线段的PDF表中表现更好。对于每一家连锁店,我们在数据提取中随机选择一个菜单项,并与网站上的数据进行比较,以确保准确性。 We also checked all outliers for energy and nutrient values (eg, top/bottom 5%) in extracted data against websites.

使用不同的数据抓取方法从网页中获取营养信息。对于简单的、非javascript渲染的网页,我们使用Python中的Scrapy框架来提取数据。Scrapy是一个功能强大且高度可定制的网页抓取框架。然而,Scrapy框架本身不能从JavaScript渲染的网站收集数据。在这些例子中,我们在Scrapy框架中使用了Selenium WebDriver。有一些网站通过应用程序编程接口(API)请求加载营养数据。为信息检索构建了API,实现了软件之间的数据传输。例如,当一个网页正在加载时,web服务器通过API从公司的数据库/服务器请求数据。对于通过API加载营养信息的网站(通过检查Chrome中的开发人员工具识别),我们使用Python Request库直接提取数据。

我们遵守英国国家统计局的安全网络抓取政策,以最大限度地减少我们对网站所有者的提取负担[38].此外,我们在版权允许的范围内工作。英国政府关于版权的指导方针概述了一些例外情况,包括限制将版权作品用于非商业研究[39].脚本每季度检查一次,并进行更新,以适应网站结构可能发生的任何变化,因为之前的刮擦。最新的脚本可以在GitHub上公开获得[40].

图2。餐厅营养信息格式和数据收集工具。API:应用程序编程接口;OCR:光学字符识别。
查看此图

数据清理和标准化

为了解决必胜客和棒约翰等大型披萨连锁店制作的披萨的分量信息不一致的问题,我们计算了“大”、“家庭”、“共享”或“中”三份披萨的能量和营养价值,以及“小”或“个人”一份披萨的整个披萨。这与英国领先的披萨连锁店达美乐(Domino ' s)在其披萨上展示营养信息的方式一致。我们还节省了披萨食品的原始能量和营养价值。

每个户外食物链的领域名称也被标准化了。例如,“糖”、“糖含量”和“糖”都被标准化为“糖”。营养值中的运算符在转换为数值之前也被删除。例如,对于保守估计,“<0.05”被替换为“0.05”。有“-”或空格的营养值被设置为缺失。所有的逐字文本(包括操作员)存储在每个餐厅的数据收集文件夹中。

经过标准化和数据清理,我们将每个季度的数据收集整理成一个主文件。

能量和每日营养素摄入量

对于我们的MenuTracker数据示例应用,我们估计了2021年菜单项目超过英国每餐推荐和每日参考摄入量的比例。成人每日参考摄取量为能量2000千卡,总脂肪少于70克,饱和脂肪少于20克,碳水化合物260克,总糖90克,盐少于6克[41].能量和营养素的参考摄入量是根据平均运动量的普通女性计算的。英国政府建议成年人午餐或晚餐的热量不超过600千卡[42].虽然没有具体的每顿饭其他营养成分的建议,建议任何膳食成分不应超过每日参考摄入量的30%,以符合英国政府的指导方针[43].因此,我们设置每顿饭总脂肪、饱和脂肪、碳水化合物、糖和盐的建议摄入量为每日参考摄入量的30%,与推荐能量成比例。我们使用了2021年收集的所有MenuTracker记录进行分析。


在大型户外食品连锁店中卡路里信息的可用性

2020年10月,共有1043家员工人数在250人或以上的企业被确定。这可能高估了可能符合英国卡路里标签政策的企业数量(例如,并非SIC 91.03中所有的“历史遗迹、建筑和类似的旅游景点”都提供食品)。在这1043家企业中,256家(24.5%)在2021年11月提供了其菜单项目(在家制作的食物)的营养信息。作为其他企业的特许经营商经营的公司(n=196)通常提供与特许经营商相同的菜单。因此,除非主连锁店未被捕获,否则不会收集加盟商的数据(n=3;塔可钟英国)。

在2021年3月,共有82个独特的链使用主采样框架在线提供营养信息。补充抽样框架增加了3个额外的食品连锁品牌(即棒约翰、保罗和本杰瑞)。总共有85条不同的链。

数据收集自动化

在我们的试点研究中,2018年,一名研究人员估计需要36个工作日来收集和转录42个户外食物链的数据[44].通过使用Python编写的自动化程序,我们能够在大约10个工作日内收集到大约85个食物链的数据。与2018年的手工抄写相比,这减少了85%的小时数,总计约500小时。

描述性统计

表1在2021年3月、6月、9月和12月,MenuTracker分别收录了85个、83个、79个和81个户外连锁品牌。截至2021年3月,所有包括的连锁店的列表可以在多媒体附件2.入选的食品连锁店的数量各不相同,一些户外食品连锁店从2021年开始停止在网上提供营养信息。一些连锁店没有为菜单上列出的每一道菜提供营养信息。在菜单上有卡路里信息的菜品中(占所有菜品的86.1-87.6%),脂肪、饱和脂肪、碳水化合物、糖和盐的信息占大多数(94.6-97.5%)。然而,只有36.7%-42.4%的含有卡路里信息的食物提供了食用分量信息,其中大约一半的食物提供了纤维含量信息。

表1。MenuTracker 2021年数据汇总统计。

2021年3月 2021年6月 2021年9月 2021年12月
out -home连锁店 85 83 79 81
菜单项,n 18005年 19310年 19392年 19698年
项目级的可用性

能源、n 15766年 16678年 16882年 16969年

脂肪,n (%)一个 15244 (96.7) 15785 (94.6) 16069 (95.2) 16290 (96.0)

饱和脂肪,n (%)一个 15261 (96.8) 15774 (94.6) 16028 (94.9) 16353 (96.4)

碳水化合物,n (%)一个 15183 (96.3) 16021 (96.1) 16308 (96.6) 16539 (97.5)

糖,n (%)一个 15233 (96.6) 16028 (96.1) 16279 (96.4) 16519 (97.3)

蛋白质,n (%)一个 15160 (96.2) 15777 (94.6) 16078 (95.2) 16194 (95.4)

盐,n (%)一个 15179 (96.3) 16009 (96.0) 16357 (96.9) 16541 (97.5)

纤维,n (%)一个 8167 (51.8) 8367 (50.2) 8750 (51.8) 8229 (48.5)

每份重量,n (%)a、b 6348 (40.3) 6721 (40.3) 7153 (42.4) 6235 (36.7)

一个提供卡路里信息的每种食物的百分比。

b直接提供食用分量信息的项目或者是否可以通过每份营养物质和营养密度来计算信息。

菜单上超过每餐和每日参考摄入量的食物比例

图3,任何营养素超过允准量的最大比例是饱和脂肪,其中46.4%(29,411/63,416)的菜单项超过每餐推荐量,7.1%(4523/63,416)超过每日参考摄入量。菜单中盐、总脂肪、能量、糖、碳水化合物超过每餐推荐量的比例分别为35.2%(22,588/64,086)、34.7%(21,964/63,388)、24.7%(16,391/ 66295)、17.8%(11,434/64,059)和17.6%(11,260/64,051)。超过每日参考摄入量的可比数据为:能量0.7%(497/66,295),总脂肪3.6%(2258/63,388),碳水化合物0.1%(75/64,051),糖0.4%(245/64,059),盐4.2%(2722/64,086)。详细的比例由不同的数据收集波可以在多媒体

图3。菜单项能量和营养分布。
查看此图

调查结果摘要

在这项研究中,我们描述了MenuTracker,这是英国第一个由户外连锁店制作的食物的纵向营养数据库,他们在网上提供了这些信息。截至2021年12月,MenuTracker包括来自80多家大型户外连锁店的76,405份菜单项记录,这些记录收集于4个时间点。该数据库是半自动的,并带有时间戳。在构建数据库的过程中,我们发现,截至2021年11月,在英国可能受卡路里菜单标签政策约束的企业中,只有不到四分之一的企业在其网站上展示了菜单项的能量信息。在网上提供营养信息的连锁店中,很大一部分菜单项目没有相关的份量或营养密度信息。使用MenuTracker数据,我们发现数据库中超过三分之一的食物饱和脂肪、总脂肪或盐含量高,四分之一的食物能量高。

调查结果的解释

数据库的唯一性

MenuTracker数据为膳食公共卫生和营养研究以及该领域的政策制定提供了宝贵的资源。由于它定期更新,数据有时间戳,因此研究人员和政策制定者可以跟踪英国户外食物环境的营养成分变化。所含营养数据均直接从各连锁食品官网系统采集,确保准确性。在其他潜在的未来应用中,MenuTracker将使热量菜单标签的评估,家庭外食物环境的评估,以及营养流行病学研究中营养估计的改进成为可能。在英国的政策背景下,很少有肥胖政策提出了评估计划,MenuTracker数据可能有助于政策评估[45].

手工收集营养成分数据是劳动密集型的。在2018年和2019年,我们小组的研究人员每年都会手工转录MenuTracker数据。自动化代码库减少了85%的手工工作时间,使我们能够继续每季度收集MenuTracker数据。我们目前有资源继续收集MenuTracker数据,至少到2023年春季。

英国的户外食物链营养报告

在英国,自2022年4月6日起,强制卡路里标签政策现已生效[19].在这项研究中,我们发现2021年11月,不到四分之一的潜在合格企业在其网站上公布了卡路里信息。这与英国2018年的一项研究基本一致,当时只有17%的大型连锁店在店内提供卡路里标签[46].然而,我们计算出的百分比可能被低估了,因为其中一些户外商店可能不受卡路里菜单标签政策的限制(例如,仅限季节性食品),或者他们可能根本不提供食物。尽管如此,我们的研究结果强调了在法规生效之前,户外连锁店在营养报告方面的差距,这可能表明该行业不愿主动提供这一信息。

值得注意的是,对于在网上公布营养成分的户外食品连锁店,大约60%的产品缺少营养密度(如每100克千卡热量)信息(或可以计算的每份重量)。由于大多数自愿减少计划(如盐和糖)根据营养密度设定目标,这可能会禁止对这些计划的监测和评估[4748].此外,这些信息对于识别菜单项目的重新配方(菜单标签法规的一个关键潜在影响)至关重要,因为营养成分的任何整体变化都可能是由重新配方或份量的变化引起的。如果没有份量指标,就无法区分这些可能性。强制声明食用分量(以及卡路里信息)可以对针对户外食品零售部门的干预措施进行更全面的评估。

MenuTracker用例示例

在这项研究中,我们演示了一个MenuTracker数据的示例应用程序。我们使用MenuTracker数据来估计菜单中能量和营养含量过高的食物的比例。菜单食物超过每餐能量建议的比例,与英国先前报导的情况大致相同[67].我们的研究结果也引起了人们对其他营养成分高的家庭食物的关注,如饱和脂肪和盐。我们的数据再次表明,在2021年,由大型户外连锁店制作的食物富含能量和糖等营养物质(应限制摄入)。

在最近的一篇论文中,我们证明了使用MenuTracker来监测家庭外食物营养成分随时间变化的可行性[36].在其他地方,我们使用了美国MenuStat(相当于MenuTracker)数据,对离家外的食物的营养成分进行了国际比较[49].MenuTracker的这些应用证明了它作为研究工具的强大功能。

局限性和未来发展方向

虽然大多数MenuTracker数据收集已经自动化,但在每一波数据收集中仍然需要手动检查和修改代码。这种需求源于两个主要问题:从PDF文档中提取数据的挑战和不断变化的网站结构。PDF转换工具不完善,有时无法正确识别表边界,这就需要手动检查结果。网站结构和设计也会发生变化,这需要更新某些元素的路径或重写脚本。目前,我们每个季度都会监控网站结构的变化,以确保代码库在每个数据波中正常工作。然而,随着越来越多的连锁店开始在他们的网页上提供营养信息,以及PDF转换工具的进步,完全自动化可能在未来实现。另外,随着卡路里标签规定扩展到Just Eat和Deliveroo等第三方配送平台,与80个单独的网站相比,从这些配送平台收集卡路里信息的资源密集度会更低。在未来,我们可能会过渡到以这种方式获取卡路里信息。然而,目前在这些平台上仍无法获得其他营养素的信息,这意味着这种转变将导致信息广度的丧失。

MenuTracker本身并不是没有局限性。MenuTracker专注于大型户外食品连锁店,不包括来自小型连锁店或独立企业的能量和营养信息。然而,英国政府估计,这些大型连锁店占所有户外食品和饮料销售额的50% [18].此外,MenuTracker专注于连锁店官方网站上的在线菜单,这些菜单可能与店内或配送平台上的实体菜单不同。这一点可能很重要,因为在2019冠状病毒病大流行期间,全球在线送餐服务的使用有所增加[5051].未来的研究需要了解来自连锁店官方网站的在线菜单、店内菜单和送货服务网站菜单之间的潜在差异。此外,与没有提供营养信息的连锁店和菜单项相比,这些连锁店和菜单项可能也有不同的特点。未来的研究还可以探索哪种类型的连锁店和菜单项目更有可能拥有完整的能量和营养信息。

另一个限制与我们的采样框架有关。我们获得的食品企业名单是2020年10月的,从那以后,企业很可能既被添加到名单中,也被删除了。为了减轻这种担忧,我们将每年审查这份清单。然而,仍有可能新的大型企业随后没有被包括在MenuTracker中。此外,只有四分之一符合卡路里标签政策的企业在网上提供了营养信息,这削弱了MenuTracker的市场覆盖率。由于卡路里标签政策现已生效,MenuTracker将扩大到包括开始提供相关信息的新的户外食品连锁店——尽管这可能仅限于能量信息。此外,MenuTracker依赖于连锁店自我报告的营养信息,这可能并不完全准确。然而,我们相信这些大型连锁店有提供准确营养信息的动机。最后,连锁网站上提供的营养信息可能已经过时了。如果没有提供时间戳,我们很难确定何时以及如何获得每个连锁店的营养信息。

除了包含新业务和可能从交付平台获得数据外,MenuTracker未来还将受益于用于菜单项分类和自动链接的机器学习模型的开发。这将允许随着时间的推移跟踪特定类别(例如食品和饮料)的能量和营养成分,同时为每一波数据节省数百小时的手动标记。我们在最近的论文中尝试了一个记录链接过程,用于跟踪同一组菜单项随时间的能量和营养变化[36].我们计划改进这项技术,并在现有和未来的MenuTracker数据中实现记录链接。

结论

使用数据科学技术,我们建立了MenuTracker,这是一个有价值的数据库,供研究人员和政策制定者了解和评估英国大型连锁店提供的食品,这些连锁店在线提供这些信息。在构建数据库时,我们发现只有不到四分之一的可能符合卡路里标签政策的连锁店在网上提供了营养信息,2021年很大一部分菜单项目缺少份量信息。这可能会给监测户外食品环境带来挑战。这项研究也增加了越来越多的证据,表明在英国,在家准备的食物含有高饱和脂肪、总脂肪和盐。开发中使用的方法可以在网上找到,也可以在其他地方建立类似的数据库。

致谢

本文由英国研究与创新基金MC_UU_00006/7资助。出于开放获取的目的,作者已对出现的任何作者接受的手稿版本应用了创作共用署名(CC BY)许可。YH由盖茨剑桥奖学金资助。DRZT由国家卫生研究所、公共卫生研究学院授予的博士奖学金(授予PD-SPH-2015-10025)支持。没有资助者参与研究设计;数据的收集、分析和解释;手稿:手稿的写作;或者是提交稿件发表的决定。

数据可用性

代码库在GitHub上公开可用[40].所有分析代码也可根据要求提供。分析中使用的匿名数据集可应要求提供。我们的数据只允许用于非商业目的。

作者的贡献

YH和JA对研究进行了概念化。YH开发了数据库,进行了形式化分析,并撰写了原始草案。ME对研究样本框架的回顾做出了贡献。JA和TB监督研究。TB、ME、DRZT、TRPB和JA对论文进行了评审和编辑。TRPB审查了代码。所有作者都阅读并批准了最终的手稿。

利益冲突

没有宣布。

多媒体附件1

用于选择可能提供食品的企业的标准工业分类代码。

DOCX文件,21 KB

多媒体附件2

2021年3月,MenuTracker中包含的链条。

DOCX文件,17kb

多媒体

根据数据收集波,菜单项超过每餐和每日参考摄入量的比例。

DOCX文件,15 KB

  1. 张志强,张志强,张志强,等。美国人的饮食习惯:外出就餐。经济Inf牛市2018:172。
  2. 户外食品行业——在一个不受监管的市场中呈指数级增长。世界卫生组织,2021年。URL:https://www.euro.who.int/en/health-topics/disease-prevention/nutrition/news/news/2021/9/the-out-of-home-food-sector-exponential-growth-in-an-unregulated-market[2021-12-09]访问
  3. 新西兰人越来越喜欢外卖和外出就餐。统计新西兰。2020年8月13日。URL:https://www.stats.govt.nz/news/kiwis-growing-taste-for-takeaways-and-eating-out[2021-06-18]访问
  4. 国家统计:家庭食品2018/19。GOV.UK。2020.URL:https://www.gov.uk/government/statistics/family-food-201819/family-food-201819[2021-09-24]访问
  5. 李志强,李志强,李志强,等。使用在线食品配送服务订购离家准备的食品和相关的社会人口特征:一项横断面、多国分析。国际环境与公共卫生2020年7月17日;17(14):5190 [免费全文] [CrossRef] [Medline
  6. Robinson E, Jones A, Whitelock V, Mead BR, Haynes A.(以上)在英国主要连锁餐厅就餐:主餐能量含量的观察性研究。英国医学杂志2018年12月12日;363:k4982 [免费全文] [CrossRef] [Medline
  7. Muc M, Jones A, Roberts C, Sheen F, Haynes A, Robinson e。对英国主要连锁餐厅的开胃菜、配菜和甜点的能量含量进行了观察性研究。BMJ公开赛2019 10月07日;9(10):e029679 [免费全文] [CrossRef] [Medline
  8. Jaworowska A, Blackham T, Stevenson L.独立小餐馆提供的外卖食品的营养成分。Proc Nutr Soc 2011 10月14日;70(OCE4):E166。[CrossRef
  9. 贾worowska A, Blackham TM, Long R, Taylor C, Ashton M, Stevenson L,等。英国外卖食品的营养成分。中国食品科学2014年9月2日;44(5):414-430。[CrossRef
  10. Jaworowska A, Blackham T, Davies IG, Stevenson L.外卖和快餐的营养挑战和健康影响。Nutr Rev 2013 5月;71(5):310-318。[CrossRef] [Medline
  11. 贾沃洛斯卡A,布莱克汉T,史蒂文森L,戴维斯IG。英国热外卖食品含盐量的测定。Appetite 2012 Oct;59(2):517-522。[CrossRef] [Medline
  12. 杜勇,荣胜,孙勇,刘波,吴勇,Snetselaar L,等。离家吃饭的频率与全因和特定原因死亡的风险之间的关联。中国营养与营养杂志,2015年9月27日,第1期。[CrossRef] [Medline
  13. Braithwaite I, Stewart AW, Hancox RJ, Beasley R, Murphy R, Mitchell EA, ISAAC第三阶段研究组。儿童和青少年的快餐消费和身体质量指数:一项国际横断面研究。BMJ公开赛2014年12月08日;4(12):e005813 [免费全文] [CrossRef] [Medline
  14. 英国公共卫生部。鼓励提供更健康的“户外”食品。GOV.UK。2017.URL:https://www.gov.uk/government/publications/encouraging-healthier-out-of-home-food-provision[2021-02-15]访问
  15. 阿什M,格拉夫S,斯派特C.改变位置:政策使健康的选择成为容易的选择。公共卫生2011年12月;125(12):889-895。[CrossRef] [Medline
  16. 英国卫生和社会保障部(Department of Health and Social Care)将在咖啡馆、餐馆和外卖店的菜单上引入卡路里标签。GOV.UK。2021.URL:https://www.gov.uk/government/news/calorie-labelling-on-menus-to-be-introduced-in-cafes-restaurants-and-takeaways[2021-06-02]访问
  17. 卫生和社会保障部。外出部门的卡路里标签:实施指南。GOV.UK。2021.URL:https://www.gov.uk/government/publications/calorie-labelling-in-the-out-of-home-sector/calorie-labelling-in-the-out-of-home-sector-implementation-guidance[2021-01-06]访问
  18. 卫生和社会保障部。在户外供应的食物和饮料的卡路里标签。GOV.UK。2018.URL:https://www.gov.uk/government/consultations/calorie-labelling-for-food-and-drink-served-outside-of-the-home[2021-02-15]访问
  19. 卫生和社会保障部。新的卡路里标签规定生效,以改善国民健康。GOV.UK。2022.URL:https://www.gov.uk/government/news/new-calorie-labelling-rules-come-into-force-to-improve-nations-health[2022-04-15]访问
  20. 罗宾逊E,马蒂L,琼斯A,怀特M,史密斯R,亚当斯J.食物和饮料的卡路里标签会改善公众健康吗?英国医学杂志2021年1月20日;[CrossRef] [Medline
  21. 了解更多关于24小时膳食召回和食物记录的食物成分数据库。膳食评估入门。URL:https://dietassessmentprimer.cancer.gov/learn/recall-record.html[2022-03-17]访问
  22. 尼德曼S,伦纳德E,克拉普J.餐馆营养报告和影响监测。食品成分分析2017年12月;64:73-77。[CrossRef
  23. Alexander E, Rutkow L, Gudzune KA, Cohen JE, McGinty EE。2017年美国连锁餐厅的健康状况。J Acad Nutr Diet 2020 Aug;120(8):1359-1367。[CrossRef] [Medline
  24. Jarlenski M, Wolfson J, Bleich S.美国快餐店菜单中提供的宏量营养素成分2016年10月;51(4):e91-e97。[CrossRef] [Medline
  25. 沃尔夫森JA,莫兰AJ,雅伦斯基议员,布莱奇SN。美国大型连锁餐厅菜单中钠含量的趋势《美国医学杂志》2018年1月;54(1):28-36。[CrossRef] [Medline
  26. Moran AJ, Block JP, Goshev SG, Bleich SN, Roberto CA.美国连锁餐厅儿童菜单中营养成分的趋势。美国预防医学杂志2017年3月;52(3):284-291 [免费全文] [CrossRef] [Medline
  27. 布莱奇SN,沃尔夫森JA,雅伦斯基议员。大型连锁餐厅的卡路里变化:新菜单项目减少,但有改进空间。Am J Prev Med 2016年1月;50(1):e1-e8 [免费全文] [CrossRef] [Medline
  28. 布莱奇SN,索托MJ,邓恩CG,莫兰AJ,布洛克JP。2012-2018年美国大型连锁餐厅的卡路里和营养趋势。PLoS One 2020;15(2):e0228891 [免费全文] [CrossRef] [Medline
  29. 张锋,李志强,李志强,等。估计卡路里菜单标签对美国南部一家大型餐厅特许经营中购买的卡路里的影响:准实验研究。英国医学杂志2019 10月30日;367:l5837 [免费全文] [CrossRef] [Medline
  30. 刘志强,刘志强,刘志强,等。新西兰快餐的份量、能量和钠含量的五年趋势:2012年至2016年。植物学报2018 july 09;17(1):65 [免费全文] [CrossRef] [Medline
  31. Wellard-Cole L, Goldsbury D, Havill M, Hughes C, Watson WL, Dunford EK,等。监测澳大利亚新南威尔士州引入菜单标签后快餐营养成分的变化:一项观察性研究。公共卫生杂志2018年4月21日(6):1194-1199。[CrossRef] [Medline
  32. 加拿大食品供应。阿贝实验室,2022年。URL:https://labbelab.utoronto.ca/projects/the-canadian-food-supply/[2022-03-17]访问
  33. Harrington RA, Adhikari V, Rayner M, Scarborough P.大数据时代的营养成分数据库:foodDB,一个全面的,实时的数据库基础设施。BMJ公开赛2019年6月27日;9(6):e026652 [免费全文] [CrossRef] [Medline
  34. 食品价格研究的网络抓取。Br Food 2019 11月12日;121(12):3350-3361。[CrossRef
  35. 英国连锁餐厅百强报告。Technomic》2014。URL:https://www.technomic.com/available-studies/industry-reports[2020-12-02]访问
  36. 黄Y, Theis D, Burgoine T, Adams J. 2018年至2020年英国大型连锁餐厅菜单项目能量和营养含量的趋势:一项观察性研究。BMJ公开赛2021年12月30日;11(12):e054804。[CrossRef
  37. Theis DRZ, Adams J.英国受欢迎的连锁餐厅提供的菜单上的能量和营养成分的差异,与没有自愿菜单标签:一项横断面研究。公共科学学报2019;14(10):e0222773 [免费全文] [CrossRef] [Medline
  38. 网页抓取政策。英国国家统计局,2022年8月24日。URL:https://www.ons.gov.uk/aboutus/transparencyandgovernance/datastrategy/datapolicies/webscrapingpolicy[2022-08-24]访问
  39. 知识产权局。版权的例外。GOV.UK。2021.URL:https://www.gov.uk/guidance/exceptions-to-copyright[2022-03-17]访问
  40. 黄宇。GitHub。2022.URL:https://github.com/YuruHuang/MenuTracker[2022-03-17]访问
  41. 食品标签。NHS。2020.URL:https://www.nhs.uk/live-well/eat-well/food-guidelines-and-food-labels/how-to-read-food-labels/[2022-08-24]访问
  42. 英国公共卫生部。减少过多卡路里摄入的计划公布。GOV.UK。2018.URL:https://www.gov.uk/government/news/plans-to-cut-excess-calorie-consumption-unveiled[2021-12-16]访问
  43. 桑德斯P,桑德斯A,米德尔顿J.生活在“脂肪沼泽”:暴露于多种来源的容易获得的,廉价的,能量密集的快餐在一个贫困的社区。中国生物医学杂志2015年6月14日;113(11):1828-1834。[CrossRef] [Medline
  44. 多利RZT。英国MenuStat:英国连锁餐厅提供的食品和饮料营养含量数据库的建立和能量含量的横断面分析。剑桥:剑桥大学;2018.
  45. Theis DRZ, White M.英国的肥胖政策合适吗?1992-2020年政府战略和政策分析。米尔班克Q 2021 Mar;99(1):126-170 [免费全文] [CrossRef] [Medline
  46. Robinson E, Burton S, Gough T, Jones A, Haynes A.英国外出就餐千卡标签的选择点:对主要连锁店的描述性研究。BMC公共卫生2019 5月28日;19(1):649 [免费全文] [CrossRef] [Medline
  47. 英国公共卫生部。减盐:2024年的目标。GOV.UK。2020.URL:https://www.gov.uk/government/publications/salt-reduction-targets-for-2024[2021-08-10]访问
  48. 英国公共卫生部。减糖和更广泛的重新配方。GOV.UK。2018.URL:https://www.gov.uk/government/collections/sugar-reduction[2022-08-24]访问
  49. 黄Y, Burgoine T, Theis DR, Adams J. 2018年美国和英国大型连锁餐厅菜单中能量和营养成分的差异。公共卫生Nutr 2022年6月1日-9日。[CrossRef] [Medline
  50. 网上送餐。Statista》2022。URL:https://www.statista.com/outlook/dmo/eservices/online-food-delivery/worldwide#global-comparison[2022-07-04]访问
  51. Ellison B, McFadden B, Rickard B, Wilson N.研究COVID-19大流行期间的食品购买行为和食品价值。应用经济前景政策2020年11月04日;43(1):58-72。[CrossRef


API:应用程序编程接口
国家统计局:英国国家统计局
SIC:标准工业分类


Y Khader编辑;提交05.05.22;同行评议:S Hua, Y Yang;对作者27.06.22的评论;订正版本收到22.07.22;接受29.07.22;发表08.09.22

版权

©Yuru Huang, Thomas Burgoine, Michael Essman, Dolly R Z Theis, Tom R P Bishop, Jean Adams。最初发表于JMIR公共卫生与监测(https://publichealth.www.mybigtv.com), 2022年9月8日。

这是一篇根据创作共用署名许可协议(https://creativecommons.org/licenses/by/4.0/)发布的开放获取文章,允许在任何媒介上不受限制地使用、分发和复制,前提是正确引用了首次发表在JMIR公共卫生和监测上的原创作品。必须包括完整的书目信息,https://publichealth.www.mybigtv.com上的原始出版物的链接,以及此版权和许可信息。


Baidu
map