发表在2卷第一名(2021): Jan-Dec

本文的预印本(早期版本)可在https://preprints.www.mybigtv.com/preprint/22446,首次出版
追踪COVID-19大流行期间的广告曝光:开发公共谷歌广告数据集

追踪COVID-19大流行期间的广告曝光:开发公共谷歌广告数据集

追踪COVID-19大流行期间的广告曝光:开发公共谷歌广告数据集

原始论文

1网络科学研究所,南安普顿大学,英国南安普顿

2卡塔尔计算研究所,哈马德·本·哈利法大学,卡塔尔多哈

*所有作者贡献相同

通讯作者:

Reham Al Tamime博士

网络科学研究所

南安普顿大学

海菲尔德校区32号楼

大学路

南安普顿,SO17 1BJ

联合王国

电话:44 (0)2380599599

电子邮件:rat1g15@soton.ac.uk


背景:COVID-19大流行对经济、政府、企业,最重要的是对人民健康产生了重大影响。为了控制新冠肺炎的蔓延,全球各地都实施了严格的封锁措施。这些封锁措施导致了大量恐慌性抢购,对卫生用品和其他杂货的需求增加。

摘要目的:在本文中,我们描述了一个来自谷歌广告的数据集,该数据集研究了在COVID-19大流行期间,人们在浏览网页时向他们展示的广告。我们正在向研究界提供数据集。

方法:我们于2020年3月28日开始持续收集数据,利用开发人员工具的网络请求检索谷歌广告数据。我们列出了一份与恐慌性抢购有关和无关的物品清单。然后,我们根据人们积极研究或计划谷歌广告的内容来捕获这些项目作为目标标准。谷歌广告数据已经使用其他目标标准(如国家、性别和父母身份)进行了过滤。

结果:自从我们的收藏开始以来,我们每月都积极维护和更新我们的存储库。我们总共发布了超过4116个数据点。本文还提供了基本的统计数据,揭示了不同国家、性别和父母身份的谷歌广告数据的变化。

结论:我们希望这个谷歌广告数据集可以增加我们对COVID-19疫情期间广告曝光的了解。特别是,这个数据集可以引导进一步的研究,看看广告曝光、上网时间和健康结果之间的关系。

JMIR Data 2021;2(1):e22446

doi: 10.2196/22446

关键字



截至2019年12月,中国武汉市首次报告了肺炎病例。几天后,中国当局透露,他们在几例肺炎病例中发现了一种新型冠状病毒(后来被命名为SARS-CoV-2,导致COVID-19的病毒)[1].随着中国COVID-19病例和死亡人数持续增加,世界卫生组织于2020年1月底宣布疫情已构成国际关注的突发公共卫生事件[2].新型冠状病毒继续在中国境外传播,到达意大利、伊朗、美国和许多其他国家。这促使世卫组织重新评估病毒的威胁,并于2020年3月初宣布疫情为全球大流行[3.].

随着形势的发展,世界各国政府采取了不同的措施来控制COVID-19的传播[4].这些举措包括采取封锁措施,以确保社交距离和减少身体接触。这项措施包括暂停学校和大学,取消活动,停止大多数商业活动。与此同时,政府还建议人们采取一定的预防措施,如经常洗手,使用洗手液,在公共场所戴口罩。

尽管日益严重的COVID-19大流行正在造成重大生命损失,影响经济和生计,但建议人们不要恐慌[5].尽管如此,人们的恐慌还是显而易见的,他们冲到超市囤积罐头汤和洗手液等物品。6].与covid -19相关的恐慌性购买表明,在人们试图适应呆在家里工作的过程中,出现了新的行为和购物习惯。

我们描述了一个数据集,提供了在实施封锁措施以遏制COVID-19传播期间谷歌广告数据变化的快照(多媒体附件1).谷歌广告使企业、机构和开发人员能够创建、管理和针对潜在受众的广告活动;受众被定义为“具有特定兴趣、意图和人口统计信息的一群人”[7].谷歌承诺广告商帮助他们在谷歌展示网络上找到潜在的受众。谷歌显示网络覆盖“全球90%的互联网用户,包括数百万个网站、新闻页面、博客和Gmail和YouTube等谷歌网站”[8].因此,谷歌广告上的广告商可以通过获得每周印象的估计数量(即广告在谷歌显示网络上的搜索结果页面或其他网站上显示的次数)来估计其活动的覆盖范围。这些印象可以通过受众的兴趣和习惯、他们积极研究的内容、他们如何与企业、地理、语言和其他人口统计属性进行过滤。请注意,谷歌显示网络上显示的广告与谷歌搜索结果中显示的广告是分开的。因此,我们的谷歌广告数据集揭示了在COVID-19大流行期间,当观众浏览网页时,与向他们展示广告相关的印象数量。这些印象是随着时间的推移而产生的,并按国家、性别和父母身份分类。

之前的工作使用谷歌Trends [9]调查全球公众意识的数据[10]、资讯需求[11],以及对COVID-19的兴趣[12].此外,谷歌Trends数据被用于监测公众的不安情绪[13]和实施封锁措施后的福祉[14].然而,之前的工作并没有使用谷歌广告数据来提供关于COVID-19大流行期间广告暴露情况的见解。虽然谷歌趋势数据只能根据地理位置、时间和搜索词进行过滤,但谷歌广告数据可以根据其他标准进行过滤,如受众正在积极研究的内容、地理位置、语言、性别、父母状况和其他人口统计属性。因此,我们从2020年3月28日开始收集谷歌广告的印象数。在这里,我们描述了用于检索数据的数据收集方法,并提供了初步的分析。这些数据主要可用于跟踪COVID-19大流行期间的广告曝光情况,并有可能用于研究广告曝光、浏览不同网页的时间与健康结果之间的关系。


浏览器开发工具

在这项研究中,我们测量了谷歌广告的印象数。印象数的定义是广告显示的频率[15].广告每在谷歌或谷歌显示网络上出现一次,就被算作一次印象[15].例如,一个人花了一些时间在珠宝网站上浏览订婚戒指并比较价格。在访问了这家珠宝店的网站后,他被加入了这家珠宝店的再营销名单,在网上浏览时,他看到了订婚戒指的广告。每次戒指广告出现在他访问的网站上,都被算作一次印象。

在访问显示谷歌广告的印象数的页面之前,我们必须创建一个新的活动。谷歌广告允许用户为一个新的活动选择不同的目标,如销售、潜在客户、网站流量、品牌知名度和影响力。因此,我们将活动的目标定为Brand Awareness and Reach。此外,谷歌广告允许创建不同类型的活动,如显示网络或视频。我们选择了Display Network活动来检索该研究的印象数;例如,在英国,那些说英语、对教育感兴趣的女性目标受众的印象数量是9亿(图1).使用网络监控工具(作为开发工具套件的一部分,内置在现代浏览器中),我们从相应的网络请求中获取了新谷歌广告活动的展示次数。这些网络请求可以通过在右击页面元素后使用元素检查来实现,然后选择Inspect或Inspect element (图2).检查网页上的元素有助于找到API,然后直接向API发送POST请求。提出这些POST请求是为了自动检索每个国家(加拿大、英国、美国)的印象数,以及以下参数:女性、男性、男性和女性、性别未知、父母、非父母、父母身份未知。然而,每次发出POST请求时,每个相关(如洗手液)和不相关物品(如配件)的id都会手动更改。每月收集一次印象数,从2020年3月28日开始,4月28日恢复,5月28日再次收集,直到2020年9月28日。用户不需要购买广告来收集展示次数,因为谷歌广告展示网络上的信息主要是免费提供给希望更好地定位广告的广告商。

图1。谷歌广告(显示网络广告)。
查看此图
图2。检查网页元素后的网络请求。
查看此图

抢购物品

为了捕捉与抢购有关的物品,我们依靠Vox的可打印指南,在疫情爆发期间准备在家避难。16].这些物品包括肥皂、急救箱、罐头食品和布洛芬。此外,我们还收集了与抢购无关的项目,如教育、就业、健康和运动与健身(表1).在谷歌广告的“受众正在积极研究或计划什么”的标题下,我们添加了每个项目作为目标标准。虽然市场内受众下已经存在不相关的项目,但我们不得不在谷歌广告上的自定义意图受众下添加相关项目。已经检索了受众对与恐慌购买相关或无关的项目感兴趣的印象数量。

表1。与抢购有关或无关的物品。
项目类型 示例项目
抢购相关项目(自定义意向受众) 肥皂,一次性手套,消毒湿巾,洗手液,罐头食品,冷冻食品,急救箱,布洛芬,扑热息痛,体温计,戴奎尔/奈奎尔/苏达菲,补液,感冒和流感
与抢购无关的物品(市场内受众) 教育、就业、健康、服装及配件、工艺美术用品、美容产品及服务、汽车及车辆、商业服务、计算机及周边设备、消费电子产品、活动门票、金融服务、礼品及场合、运动及健身、旅游

国家、性别和父母身份

在新谷歌广告活动页面上选择了受众积极研究或计划的与抢购相关或无关的项目后,印象数量按性别(女性、男性和未知性别)和父母状况(父母,非父母,未知父母状况)进行了分类。此外,还检索了位于美国、英国和加拿大的讲任何语言的观众的印象数。


我们收集的数据为多媒体附件1我们打算在GitHub上每月更新一次[17].印象数存储在文件夹中,指示从谷歌广告检索数据的年份和月份(年-月)。相应地,在每个文件夹下,还有另外两个文件夹(RELATED和unrestricted)。第一个文件夹用于存储与观众对抢购感兴趣相关的商品的印象检索,而第二个文件夹用于存储与观众对抢购感兴趣无关的商品的印象检索。在访问每个项目的文件夹(如Cold和flu)后,会出现两个包含展示次数的CSV文件。第一个CSV文件(所有性别类别)存储按国家和性别分列的印象,而第二个CSV文件(所有父母类别)存储按国家和父母状态分列的印象。迄今为止,数据收集共产生了4116个数据点(1911个与观众对恐慌性购买的兴趣相关的项目,2205个与COVID-19疫情期间观众对恐慌性购买的兴趣无关的项目)。下面的方程说明了数据点是如何计算的:

总数据点=(性别数据点+父母状况数据点)×(与抢购相关或无关的物品数量)×(月份数)


概述

我们对COVID-19大流行期间印象数量的变化进行了初步分析。该分析显示了在COVID-19大流行期间,不同国家、性别、父母身份和时间的观众对抢购相关商品的兴趣相关的印象数量。我们的讨论是基于对2020年3月、4月和5月发布的印象进行的分析。

国家层面的分析

我们跟踪了不同国家(美国、英国和加拿大)在COVID-19大流行期间与观众对恐慌性购买相关商品的兴趣相关的印象数量。如图3,我们可以观察到,在美国、英国和加拿大,观众对特定恐慌性购买相关商品的兴趣产生的印象数量高于他们对其他商品的兴趣。例如,观众对洗手液的兴趣比他们对罐装或冷冻食品等其他产品的兴趣产生了更多的印象。与观众对洗手液感兴趣相关的印象数量在4月份飙升,5月份再次下降。不出所料,考虑到美国的人口规模,美国的印象数量高于英国和加拿大。

图3。随着时间的推移和不同国家的印象数量。
查看此图

性别

然后,随着时间的推移,我们研究了与抢购相关的印象的性别差异。在抢购洗手液和肥皂方面,谷歌广告中女性观众在3月、4月和5月的印象数均高于男性观众(图4).但在一次性手套抢购方面,3、4、5月份谷歌广告中男性观众的印象数高于女性观众。

图4。随着时间的推移,恐慌性购买相关印象的性别差异。
查看此图

父母的地位

随着时间的推移,我们研究了父母身份在恐慌性购买相关印象方面的差异。如图5,我们可以观察到,在3月份,家长观众对恐慌性购买洗手液和肥皂的印象数量高于非家长观众。这种情况在4月和5月发生了变化,当时非父母观众倾向于有更多与抢购洗手液和肥皂有关的印象。

图5。随着时间的推移,父母地位的差异对恐慌性购买的相关印象。
查看此图

谷歌广告印象用例

每次你的广告在谷歌显示网络上显示时,与恐慌性购买相关的印象数都会被统计。这表明,我们数据集中的印象数量可用于研究COVID-19大流行期间广告的曝光或呈现情况。如前所述,较高的印象数对应着观众花费更多的浏览时间。这可能会导致进一步的研究,研究在COVID-19大流行期间,浏览网页的次数和时间对健康结果的影响。这将建立在之前的研究的基础上,之前的研究表明,上网时间与孤独感呈正相关,与生活满意度呈负相关。18].鉴于我们的数据集中的印象数量是按性别和父母身份进行分类的,这就提供了一个机会来观察在线花费时间的差异以及男性和女性观众之间以及父母和非父母观众之间在健康结果方面的任何差异。

限制

我们的数据集有几个限制。首先,只检索了三个国家(美国、英国和加拿大)的印象数。其次,谷歌广告没有提供文档来解释他们的算法是如何估计展示次数的。例如,目前还不清楚在特定网页上显示的广告数量或人们浏览特定网页的时间是否会影响印象。同样,“积极研究或计划某事”之类的属性在用户停止研究或计划后还能保留多久也不清楚。第三,我们的研究只考虑了加拿大讲英语的观众,因此需要更适当的统计评估来比较加拿大讲法语和讲英语的观众之间的分布相似性。第四,我们的数据收集始于2020年3月底,因此我们错过了在1月和2月的重大发展期间收集印象。最后,这项工作没有观察到印象的每日波动,因为数据收集是按月进行的。此外,这项研究捕获了使用谷歌的人,但需要注意的是,不是每个人都使用谷歌,这些人不会被考虑在这项研究中。

未来的工作

尽管这项工作有局限性,但我们将继续收集美国、英国和加拿大以外国家的印象数。目前,我们已经将所讲的语言设置为“所有语言”。比较我们数据集中每个国家使用的不同语言的印象数量是有用的。例如,在加拿大比较法语的印象数和英语的印象数是有用的。

利益冲突

没有宣布。

多媒体附件1

与Covid-19期间恐慌购买相关或无关的商品的AdWords印象数数据集。

ZIP文件(ZIP Archive), 815 KB

  1. 泰勒DB。冠状病毒大流行的时间轴。纽约时报,2020年。URL:https://www.nytimes.com/article/coronavirus-timeline.html[2021-08-31]访问
  2. COVID-19国际关注的突发公共卫生事件(PHEIC)全球研究与创新论坛。世界卫生组织2020年。URL:(https://www.who.int/who-documents-detail-redirect/covid-19-public-health-国际关注的突发)-国际关注的突发公共卫生事件-global-research-and-innovation-forum[2020-06-09]访问
  3. 世卫组织时间线- COVID-19。世界卫生组织2020年4月27日URL:https://www.who.int/news-room/detail/27-04-2020-who-timeline---covid-19[2020-06-09]访问
  4. Regencia T, Siddiqui U, Uras U.美国冠状病毒死亡人数超过11万人:实时更新半岛电视台,2020年6月07日。URL:https://www.aljazeera.com/news/2020/06/global-Coronavirus-death-toll-nears-400000-live-updates-200606234426549.html[2021-08-31]访问
  5. 从COVID-19中康复的医生说,不要惊慌,但要保持安全。半岛,2020年5月27日。URL:https://thepeninsulaqatar.com/article/27/05/2020/Don%E2%80%99t-panic-but-stay-safe -says-doctor-who——recovered-from-COVID-19[2021-08-31]访问
  6. 图表外:澳大利亚人是全球恐慌性抢购的领导者,击败了英国和意大利。《卫报》2020年6月3日。URL:https://www.theguardian.com/world/2020/jun/03/off-the-chart-australians-were-world-leaders-in-panic-buying- beating-uk-and-italy[2020-06-09]访问
  7. 关于受众定位。谷歌广告帮助。URL:https://support.google.com/google-ads/answer/2497941?hl=en[2021-08-31]访问
  8. 展示活动。谷歌广告。URL:https://ads.google.com/home/campaigns/display-ads/[2021-08-31]访问
  9. 谷歌趋势。URL:https://trends.google.com[2021-08-31]访问
  10. 胡东,楼旭,徐震,孟N,谢强,张敏,等。需要采取更有效的战略来加强公众对COVID-19的认识:来自谷歌趋势的证据。J Glob Health 2020 july;10(1):011003 [免费全文] [CrossRef] [Medline
  11. 斯特泽莱奇,李祖恩。基于谷歌趋势的武汉冠状病毒疫情信息流行病学研究。iJOE 2020四月08;16(04):139。[CrossRef
  12. 自韩国、意大利和伊朗爆发COVID-19疫情以来,全球对冠状病毒的第二波兴趣:谷歌趋势研究。Brain behaviour Immun 2020 Aug;88:950-951 [免费全文] [CrossRef] [Medline
  13. 侯赛因,福阿德,苏东。谷歌搜索趋势在传染病管理中风险沟通的应用——以台湾新冠肺炎疫情为例国际传染病杂志;2020年7月;95:221-223 [免费全文] [CrossRef] [Medline
  14. Brodeur A, Clark A, Fleche S, Powdthavee N. Covid-19,封锁与福祉:来自谷歌趋势的证据。SSRN 2020年5月14日:13204 [免费全文] [CrossRef
  15. 印象:定义。谷歌广告帮助。URL:https://support.google.com/google-ads/answer/6320?hl=en[2021-08-31]访问
  16. 一页纸,可打印的指南,准备在家里避难。Vox 2020年3月19日。URL:https://www.vox.com/future-perfect/2020/3/19/21177527/Coronavirus-guide-shelter-at-home-preparedness[2020-06-09]访问
  17. Altamime R, Weber I.谷歌Ads Covid-19数据集。GitHub。2020.URL:https://github.com/raltamime/COVID-19-[2020-06-11]访问
  18. Stepanikova I, Nie NH, He X.家庭上网时间、孤独感与生活满意度:来自面板时间日记数据的证据。人类行为中的计算机2010年5月;26(3):329-338。[CrossRef

G·艾森巴赫(G Eysenbach)编辑;提交12.07.20;D Chartash, E Andrikopoulou, M Fahimi同行评审;对作者08.10.20的评论;修订版本收到02.12.20;接受01.08.21;发表14.09.21

版权

©Reham Al Tamime, Ingmar Weber。最初发表于JMIR Data (https://data.www.mybigtv.com), 14.09.2021。

这是一篇开放获取的文章,根据创作共用署名许可协议(http://creativecommons.org/licenses/by/4.0/)的条款发布,允许在任何媒体上无限制地使用、分发和复制,前提是正确引用了首次发表在JMIR Data上的原创作品。必须包括完整的书目信息,https://data.www.mybigtv.com/上的原始出版物的链接,以及此版权和许可信息。


Baidu
map