发表在第2卷第1号(2021):1 - 12月

本文的预印本(早期版本)可在以下网站获得https://preprints.www.mybigtv.com/preprint/22446,首次出版
跟踪COVID-19大流行期间的广告曝光:开发公共谷歌广告数据集

跟踪COVID-19大流行期间的广告曝光:开发公共谷歌广告数据集

跟踪COVID-19大流行期间的广告曝光:开发公共谷歌广告数据集

原始论文

1网络科学研究所,南安普顿大学,英国南安普顿

2卡塔尔计算研究所,哈马德·本·哈利法大学,卡塔尔多哈

*所有作者贡献相同

通讯作者:

Reham Al Tamime博士

网络科学研究所

南安普顿大学

海菲尔德校区32号楼

大学路

南安普顿,SO17 1BJ

联合王国

电话:44 (0)2380599599

电子邮件:rat1g15@soton.ac.uk


背景:COVID-19大流行对经济、政府、企业,最重要的是对人民健康产生了重大影响。为了控制新冠病毒的传播,全球各地都采取了严格的封锁措施。这些封锁措施导致了大量恐慌性抢购,并增加了对卫生产品和其他食品杂货的需求。

摘要目的:在本文中,我们描述了一个来自谷歌Ads的数据集,该数据集研究了COVID-19大流行期间人们浏览网页时的广告呈现。我们正在将数据集提供给研究界。

方法:我们从2020年3月28日开始进行数据收集,利用Developer Tools的网络请求检索谷歌广告数据。我们列出了与恐慌性抢购相关和无关的物品清单。然后,我们根据人们在谷歌广告上积极研究或计划的内容,获取这些项目作为目标定位标准。谷歌广告数据已使用其他目标定位标准(如国家、性别和父母身份)进行过滤。

结果:自从我们的集合开始以来,我们每月都积极地维护和更新我们的存储库。我们总共发布了超过4116个数据点。本文还提供了基本统计数据,揭示了谷歌广告数据在不同国家、性别和父母状态下的变化。

结论:我们希望这一谷歌广告数据集可以增加我们对COVID-19疫情期间广告曝光的了解。特别是,这个数据集可以引导进一步的研究,看看广告暴露、浏览网页的时间和健康结果之间的关系。

JMIR数据2021;2(1):e22446

doi: 10.2196/22446

关键字



截至2019年12月,中国武汉市首次报告了肺炎病例。几天后,中国当局透露,他们在几例肺炎病例中发现了一种新型冠状病毒(后来被命名为SARS-CoV-2,导致COVID-19的病毒)[1].随着中国COVID-19病例和死亡人数持续增加,世界卫生组织于2020年1月底宣布疫情构成国际关注的突发公共卫生事件[2].新型冠状病毒继续在中国境外传播,到达意大利、伊朗、美国和许多其他国家。这促使世卫组织重新评估该病毒的威胁,并于2020年3月初宣布疫情为全球大流行[3.].

随着形势的发展,世界各国政府采取了不同的措施来控制COVID-19的传播[4].这些举措包括采取封锁措施,以确保社交距离和减少身体接触。这一措施包括学校和大学停课,取消活动,停止大多数商业活动。与此同时,政府也建议人们采取一定的预防措施,如勤洗手,使用洗手液,在公共场所戴口罩。

尽管日益严重的COVID-19大流行正在造成重大生命损失,影响经济并破坏生计,但建议人们不要恐慌[5].尽管如此,当人们冲向超市囤积罐头汤和洗手液等物品时,他们的恐慌是显而易见的。6].与covid -19相关的恐慌性购买表明,在人们试图适应在家工作时,新的行为和购物习惯出现了。

我们描述了一个数据集,它提供了在实施封锁措施以遏制COVID-19传播期间谷歌Ads数据变化的快照(多媒体附件1).谷歌广告使企业、机构和开发人员能够创建、管理和针对潜在受众的广告活动;受众被定义为“具有特定兴趣、意图和人口统计信息的群体”[7].谷歌承诺广告商帮助他们在谷歌显示网络上找到潜在受众。谷歌显示网络覆盖了"全球90%的互联网用户,包括数百万个网站、新闻页面、博客和Gmail和YouTube等谷歌网站" [8].因此,谷歌广告上的广告商可以通过获得每周印象的估计次数(即广告在谷歌显示网络上的搜索结果页面或另一个站点上显示的次数)来估计其活动的覆盖范围。这些印象可以根据观众的兴趣和习惯、他们积极研究的内容、他们如何与企业、地理位置、语言和其他人口统计属性进行过滤。请注意,在谷歌显示网络上显示的广告与作为谷歌搜索结果一部分显示的广告是分开的。因此,我们的谷歌广告数据集揭示了在COVID-19大流行期间向观众浏览网页时展示广告的印象数量。这些印象是随着时间的推移而产生的,并按国家、性别和父母身份进行了分类。

以前的工作使用谷歌趋势[9调查全球公众意识的数据[10,信息需求[11以及对COVID-19的兴趣[12].此外,谷歌Trends的数据已被用于监测公众的不安情绪[13]和实施封锁措施后的福祉[14].然而,之前的工作没有使用谷歌广告数据来提供关于COVID-19大流行期间广告暴露情况的见解。虽然谷歌趋势数据只能根据地理位置、时间和搜索词进行过滤,但谷歌广告数据可以根据其他标准进行过滤,如观众正在积极研究什么、地理位置、语言、性别、父母状况和其他人口统计属性。因此,我们从2020年3月28日开始收集谷歌广告的印象数。在这里,我们描述用于检索数据的数据收集方法,并提供初步分析。这些数据主要可用于跟踪COVID-19大流行期间的广告暴露情况,并可能用于研究广告暴露、浏览不同网页的时间和健康结果之间的关系。


浏览器开发人员工具

在这项研究中,我们测量了谷歌广告上的印象数量。印象数量的定义是广告显示的频率[15].广告每在谷歌或谷歌显示网络上出现一次,就被计算为一次印象[15].例如,假设一个人花了一些时间在珠宝网站上浏览订婚戒指并比较价格。在访问了这家珠宝店的网站后,他被列入了这家珠宝店的再营销名单,在网上浏览时,他看到了订婚戒指的广告。每次戒指广告出现在他访问的网站上,都被算作一次印象。

在访问显示谷歌广告上的印象数的页面之前,我们必须创建一个新的活动。谷歌广告允许用户为一个新的活动选择不同的目标,如销售、潜在客户、网站流量和品牌知名度和覆盖范围。因此,我们将本次活动的目标定为“品牌意识和影响力”。此外,谷歌广告允许创建不同类型的活动,如显示网络或视频。我们选择了Display Network活动来获取这项研究的印象数量;例如,在英国,针对那些说英语、对教育感兴趣的女性的目标受众的印象是9亿(图1).使用一个网络监控工具(内置在现代浏览器中,作为开发人员工具套件的一部分),我们从相应的网络请求中获取新的谷歌广告活动的印象数。这些网络请求可以通过右键单击页面元素后使用元素检查来实现,然后选择Inspect或Inspect element (图2).检查web页面上的元素有助于找到API,然后直接向API发送POST请求。这些POST请求是为了自动检索每个国家(加拿大、联合王国、美国)的印象数和以下参数:女性、男性、男性和女性、未知性别、父母、非父母、未知父母身份。然而,每个相关的(如洗手液)和不相关的项目(如配件)的id在每次POST请求时都被手动更改。从2020年3月28日开始,每月收集一次印象数,4月28日恢复,5月28日再次收集,直到2020年9月28日。用户不需要购买广告来收集印象数量,因为谷歌ads的显示网络的信息主要是免费提供给希望更好地定位广告的广告商。

图1。谷歌广告(显示网络活动)。
查看此图
图2。检查网页上的元素后的网络请求。
查看此图

抢购物品

为了捕捉与恐慌性抢购有关的物品,我们依靠Vox的可打印指南,在疫情爆发期间准备在家避难[16].这些物品包括肥皂、急救箱、罐头食品和布洛芬。此外,我们还收集了与恐慌性购买没有直接关系的项目,如教育、就业、健康和体育与健身(表1).在谷歌广告“受众正在积极研究或计划什么”的标题下,我们添加了每个项目作为目标标准。虽然不相关的项目已经存在于市场受众下,但我们必须在谷歌广告的自定义意图受众下添加相关项目。已经检索了观众对与恐慌性购买相关或不相关的项目的兴趣的印象数量。

表1。与恐慌性抢购有关或无关的物品。
项目类型 示例项目
与恐慌性购买相关的项目(自定义意向受众) 肥皂,一次性手套,消毒湿巾,洗手液,罐头食品,冷冻食品,急救箱,布洛芬,扑热息痛,温度计,DayQuil/NyQuil/Sudafed,补液,感冒和流感
与恐慌性购买无关的物品(市场内受众) 采购产品:教育,就业,健康,服装和配件,工艺品用品,美容产品和服务,汽车和车辆,商业服务,电脑和周边产品,消费电子,活动门票,金融服务,礼物和场合,运动和健身,旅游

国家、性别和父母身份

在选择与恐慌购买相关或无关的项目后,观众正在积极研究或计划在新的谷歌广告活动页面上,印象数量按性别(女性、男性和未知性别)和父母状态(父母、非父母、未知父母状态)进行分类。此外,还检索了来自美国、英国和加拿大的说任何语言的观众的印象数量。


我们的数据收集可通过多媒体附件1并且我们打算每月在GitHub上更新它[17].印象的数量存储在文件夹中,显示从谷歌广告检索数据的年份和月份(年-月)。相应地,在每个文件夹下,还有另外两个文件夹(RELATED和unnecessary)。第一个文件夹用于存储检索到的与观众恐慌购买兴趣相关的商品的印象,而第二个文件夹用于存储检索到的与观众恐慌购买兴趣无关的商品的印象。在访问每个项目的文件夹(如Cold和flu)后,会有两个包含印象数的CSV文件。第一个CSV文件(所有性别类别)存储按国家和性别分列的印象,而第二个CSV文件(所有父母类别)存储按国家和父母状态分列的印象。迄今为止,数据收集共产生4116个数据点(1911个是与观众恐慌性购买兴趣相关的项目,2205个是与COVID-19疫情期间观众恐慌性购买兴趣无关的项目)。下面的等式说明了如何计算数据点:

总数据点=(性别数据点+父母状况数据点)×(与恐慌性购买相关或不相关的物品数量)×(月数)


概述

我们对COVID-19大流行期间印象数量的变化进行了初步分析。分析显示了在新冠肺炎大流行期间,观众对恐慌性购买相关商品的兴趣相关的印象数量,包括国家、性别、父母状况和时间。我们的讨论基于对2020年3月、4月和5月发布的印象进行的分析。

国家层面的分析

我们跟踪了不同国家(美国、英国和加拿大)在COVID-19大流行期间与观众对恐慌性购买相关物品的兴趣相关的印象数量。如图3,我们可以观察到,在美国、英国和加拿大,观众对特定的恐慌性购买相关物品的兴趣产生了更多的印象,使他们对其他物品感兴趣。例如,观众对洗手液的兴趣比他们对罐头或冷冻食品等其他产品的兴趣产生了更多的印象。与观众对洗手液感兴趣相关的印象数量在4月份激增,5月份再次下降。不出所料,考虑到美国的人口规模,美国的印象数量高于英国和加拿大。

图3。随着时间的推移和不同国家的印象数量。
查看此图

性别

然后,我们研究了与恐慌购买相关的印象随时间的推移的性别差异。在恐慌性购买洗手液和肥皂方面,谷歌广告中的女性观众在3月、4月和5月的印象数高于男性观众(图4).但在一次性手套恐慌性购买方面,3、4、5月谷歌广告上的男性观众的印象数高于女性观众。

图4。恐慌性购买相关印象随时间的性别差异。
查看此图

父母的地位

我们研究了父母身份在恐慌性购买相关印象上的差异。如图5,我们可以观察到,在3月份,家长观众比非家长观众对恐慌性购买洗手液和肥皂的印象数量更高。这种情况在4月和5月发生了变化,当非家长观众倾向于有更多的印象与恐慌性购买洗手液和肥皂有关。

图5。父母身份在恐慌性购买相关印象上随时间的差异。
查看此图

谷歌广告印象用例

每次你的广告在谷歌显示网络的网站上显示时,都会统计与恐慌张购买相关的印象数量。这表明,我们数据集中的印象数量可以用来衡量COVID-19大流行期间广告的曝光或呈现情况。如前所述,印象数量越多,用户浏览游戏的时间就越长。这可能导致进一步的研究,着眼于在COVID-19大流行期间,印象数量和浏览网页的时间对健康结果的影响。这将建立在之前的研究的基础上,即花在上网上的时间与孤独感呈正相关,与生活满意度呈负相关。18].鉴于我们数据集中的印象数量是按性别和父母身份分类的,这就提供了一个机会来观察男性和女性观众之间花在网上的时间的差异以及由此产生的健康结果的差异,以及父母观众和非父母观众之间的差异。

限制

我们的数据集有几个限制。首先,只检索了三个国家(美国、英国和加拿大)的印象数量。其次,谷歌广告公司没有提供文档来解释他们的算法是如何估算印象数量的。例如,目前还不清楚在特定网页上显示的广告数量或人们浏览特定网页的时间是否会影响印象的计算。同样,我们也不清楚“积极研究或计划[某物]”这类属性在用户停止研究或计划后还能保留多久。第三,我们的研究只考虑了加拿大说英语的观众,因此需要更适当的统计评估来比较加拿大说法语和说英语的观众之间的分布相似性。第四,我们的数据收集始于2020年3月下旬,因此我们错过了在1月和2月主要事态发展期间收集印象。最后,这项工作没有观察到印象的每日波动,因为数据收集是按月进行的。此外,这项研究的对象是那些使用谷歌的人,但非常重要的是要意识到不是所有人都使用谷歌,这些人不会被考虑在这项研究中。

未来的工作

尽管这项工作有局限性,但我们将继续为美国、英国和加拿大以外的其他国家收集印象数量。目前,我们已将所使用的语言设置为“所有语言”。比较我们数据集中每个国家使用的不同语言的印象数量是有用的。例如,比较在加拿大对法语的印象次数和对英语的印象次数是有用的。

利益冲突

没有宣布。

多媒体附件1

与2019冠状病毒病期间恐慌性购买相关和不相关的商品的印象数量的AdWords数据集。

ZIP文件(ZIP档案),815 KB

  1. 泰勒DB。冠状病毒大流行的时间轴。纽约时报,2020年。URL:https://www.nytimes.com/article/coronavirus-timeline.html[2021-08-31]访问
  2. 2019冠状病毒病国际关注的突发公共卫生事件全球研究与创新论坛。世界卫生组织,2020年。URL:(https://www.who.int/who-documents-detail-redirect/covid-19-public-health-国际关注的突发)-国际关注的突发公共卫生事件-global-research-and-innovation-forum[2020-06-09]访问
  3. 世卫组织时间线- COVID-19。2020年4月27日世界卫生组织。URL:https://www.who.int/news-room/detail/27-04-2020-who-timeline---covid-19[2020-06-09]访问
  4. Regencia T, Siddiqui U, Uras U.美国冠状病毒死亡人数超过11万人:实时更新半岛电视台,2020年6月07日。URL:https://www.aljazeera.com/news/2020/06/global-Coronavirus-death-toll-nears-400000-live-updates-200606234426549.html[2021-08-31]访问
  5. 从COVID-19中康复的医生说,不要恐慌,但要保持安全。半岛酒店,2020年5月27日URL:https://thepeninsulaqatar.com/article/27/05/2020/Don%E2%80%99t-panic-but-stay-safe -says-doctor-who——recovered-from-COVID-19[2021-08-31]访问
  6. 出乎意料的是:澳大利亚人是恐慌性购买的世界领导者,超过了英国和意大利。卫报,2020年6月03日。URL:https://www.theguardian.com/world/2020/jun/03/off-the-chart-australians-were-world-leaders-in-panic-buying- beating-uk-and-italy[2020-06-09]访问
  7. 关于受众定位。谷歌广告帮助。URL:https://support.google.com/google-ads/answer/2497941?hl=en[2021-08-31]访问
  8. 展示活动。谷歌广告。URL:https://ads.google.com/home/campaigns/display-ads/[2021-08-31]访问
  9. 谷歌趋势。URL:https://trends.google.com[2021-08-31]访问
  10. 胡东,娄旭,徐铮,孟N,谢强,张敏,等。需要采取更有效的战略来加强公众对COVID-19的认识:谷歌趋势的证据。J Glob Health 2020年7月;10(1):011003 [免费全文] [CrossRef] [Medline
  11. Strzelecki A, Rizun M.利用中国武汉冠状病毒流行趋势的信息流行病学研究。iJOE 2020 4月08;16(04):139。[CrossRef
  12. 自韩国、意大利和伊朗爆发COVID-19以来,全球对冠状病毒的第二波兴趣:一项谷歌趋势研究。Brain Behav Immun 2020 Aug;88:950-951 [免费全文] [CrossRef] [Medline
  13. 胡斯纳依因,福阿德,苏东瀛。谷歌搜索趋势在传染病管理风险沟通中的应用:以台湾COVID-19疫情为例。国际传染病杂志2020年7月;95:221-223 [免费全文] [CrossRef] [Medline
  14. Brodeur A, Clark A, Fleche S, Powdthavee N. Covid-19、封锁和福祉:来自谷歌趋势的证据。SSRN 2020 5月14日13204 [免费全文] [CrossRef
  15. 印象:定义。谷歌广告帮助。URL:https://support.google.com/google-ads/answer/6320?hl=en[2021-08-31]访问
  16. Piper K.一本一页的可打印指南,帮助你准备在家里避难。2020年3月19日。URL:https://www.vox.com/future-perfect/2020/3/19/21177527/Coronavirus-guide-shelter-at-home-preparedness[2020-06-09]访问
  17. Altamime R, Weber I.谷歌Ads Covid-19数据集。GitHub。2020.URL:https://github.com/raltamime/COVID-19-[2020-06-11]访问
  18. 聂宁华,何旭。家庭上网时间、孤独感与生活满意度:来自面板时间日志数据的证据。计算机与人类行为2010年5月26(3):329-338。[CrossRef

G·埃森巴赫编辑;提交12.07.20;D Chartash, E Andrikopoulou, M Fahimi的同行评议;对作者08.10.20的评论;修订版收到02.12.20;接受01.08.21;发表14.09.21

版权

©Reham Al Tamime, Ingmar Weber。最初发表于JMIR数据(https://data.www.mybigtv.com), 14.09.2021。

这是一篇开放获取的文章,根据创作共用署名许可协议(http://creativecommons.org/licenses/by/4.0/)发布,该协议允许在任何媒体上不受限制地使用、分发和复制,前提是在JMIR Data上首次发表的原始作品被适当引用。必须包括完整的书目信息,https://data.www.mybigtv.com/上的原始出版物链接,以及版权和许可信息。


Baidu
map