卡塔尔世界杯8强波胆分析|卡塔尔世界杯4强波胆分析

JFRgydF4y2Ba

JMIR表格规定gydF4y2Ba

形成性研究gydF4y2Ba

2561 - 326 xgydF4y2Ba

卡塔尔世界杯8强波胆分析

加拿大多伦多gydF4y2Ba

v6i5e36238gydF4y2Ba

35389357gydF4y2Ba

10.2196/36238gydF4y2Ba

原始论文gydF4y2Ba

COVID-19接触者追踪应用程序的全球用户级感知:使用自然语言处理的数据驱动方法gydF4y2Ba

MavraganigydF4y2Ba

孤挺花gydF4y2Ba

帕特尔gydF4y2Ba

洗手间gydF4y2Ba

常gydF4y2Ba

格瓦拉魏gydF4y2Ba

AmritphalegydF4y2Ba

Sudhir西塔拉姆gydF4y2Ba

艾哈迈德gydF4y2Ba

卡希夫gydF4y2Ba

博士学位gydF4y2Ba 1gydF4y2Ba

https://orcid.org/0000-0002-0931-9275gydF4y2Ba

阿拉姆gydF4y2Ba

FirojgydF4y2Ba

博士学位gydF4y2Ba 2gydF4y2Ba

https://orcid.org/0000-0001-7172-1997gydF4y2Ba

QadirgydF4y2Ba

JunaidgydF4y2Ba

博士学位gydF4y2Ba 3.gydF4y2Ba

https://orcid.org/0000-0001-9466-2475gydF4y2Ba

QolomanygydF4y2Ba

BasheergydF4y2Ba

博士学位gydF4y2Ba 4gydF4y2Ba

https://orcid.org/0000-0002-3270-7225gydF4y2Ba

汗gydF4y2Ba

伊姆兰gydF4y2Ba

MScgydF4y2Ba 5gydF4y2Ba

https://orcid.org/0000-0001-6945-5044gydF4y2Ba

汗gydF4y2Ba

TalhatgydF4y2Ba

MScgydF4y2Ba 5gydF4y2Ba

https://orcid.org/0000-0001-6278-8786gydF4y2Ba

SulemangydF4y2Ba

默罕默德gydF4y2Ba

MScgydF4y2Ba 5gydF4y2Ba

https://orcid.org/0000-0002-0370-8878gydF4y2Ba

说gydF4y2Ba

奈gydF4y2Ba

MScgydF4y2Ba 5gydF4y2Ba

https://orcid.org/0000-0001-8666-442XgydF4y2Ba

哈桑gydF4y2Ba

Syed ZohaibgydF4y2Ba

MScgydF4y2Ba 6gydF4y2Ba

https://orcid.org/0000-0002-3830-9869gydF4y2Ba

居尔gydF4y2Ba

AsmagydF4y2Ba

博士学位gydF4y2Ba 7gydF4y2Ba

https://orcid.org/0000-0003-1621-5447gydF4y2Ba

HousehgydF4y2Ba

MowafagydF4y2Ba

博士学位gydF4y2Ba 1gydF4y2Ba

https://orcid.org/0000-0002-3648-6271gydF4y2Ba

Al-FuqahagydF4y2Ba

阿拉巴马州gydF4y2Ba

博士学位gydF4y2Ba 1gydF4y2Ba

信息和计算技术司gydF4y2Ba 科学与工程学院gydF4y2Ba 哈马德·本·哈利法大学gydF4y2Ba

拉斯维加斯的建筑gydF4y2Ba

教育城gydF4y2Ba

多哈回合谈判gydF4y2Ba

卡塔尔gydF4y2Ba 974 50694322gydF4y2Ba aalfuqaha@hbku.edu.qagydF4y2Ba

https://orcid.org/0000-0002-0903-1204gydF4y2Ba

1gydF4y2Ba 信息和计算技术司gydF4y2Ba 科学与工程学院gydF4y2Ba 哈马德·本·哈利法大学gydF4y2Ba

多哈回合谈判gydF4y2Ba

卡塔尔gydF4y2Ba 2gydF4y2Ba 卡塔尔计算研究所gydF4y2Ba 哈马德·本·哈利法大学gydF4y2Ba

多哈回合谈判gydF4y2Ba

卡塔尔gydF4y2Ba 3.gydF4y2Ba 计算机科学与工程系“，gydF4y2Ba 工程学院gydF4y2Ba 卡塔尔大学gydF4y2Ba

多哈回合谈判gydF4y2Ba

卡塔尔gydF4y2Ba 4gydF4y2Ba 网络系统部gydF4y2Ba 内布拉斯加大学gydF4y2Ba

科尔尼,不gydF4y2Ba

美国gydF4y2Ba 5gydF4y2Ba 计算机系统工程系“，gydF4y2Ba 工程技术大学gydF4y2Ba

白沙瓦gydF4y2Ba

巴基斯坦gydF4y2Ba 6gydF4y2Ba 整体系统部gydF4y2Ba SimulaMetgydF4y2Ba

奥斯陆gydF4y2Ba

挪威gydF4y2Ba 7gydF4y2Ba 统计处gydF4y2Ba 沙希德·贝娜齐尔·布托女子大学gydF4y2Ba

白沙瓦gydF4y2Ba

巴基斯坦gydF4y2Ba

通讯作者:Ala Al-FuqahagydF4y2Ba aalfuqaha@hbku.edu.qagydF4y2Ba

5gydF4y2Ba 2022gydF4y2Ba

11gydF4y2Ba 5gydF4y2Ba 2022gydF4y2Ba

6gydF4y2Ba 5gydF4y2Ba

e36238gydF4y2Ba

6gydF4y2Ba 1gydF4y2Ba 2022gydF4y2Ba 31gydF4y2Ba 1gydF4y2Ba 2022gydF4y2Ba 6gydF4y2Ba 2gydF4y2Ba 2022gydF4y2Ba 16gydF4y2Ba 3.gydF4y2Ba 2022gydF4y2Ba

©Kashif Ahmad, Firoj Alam, Junaid Qadir, Basheer Qolomany, Imran Khan, Talhat Khan, Muhammad Suleman, Naina Said, Syed Zohaib Hassan, Asma Gul, Mowafa Househ, Ala Al-Fuqaha。最初发表于JMIR Formative Research (https://formative.www.mybigtv.com)， 11.05.2022。gydF4y2Ba

2022gydF4y2Ba

这是一篇开放获取的文章，根据创作共用署名许可协议(https://creativecommons.org/licenses/by/4.0/)的条款发布，允许在任何媒介上不受限制地使用、分发和复制，前提是正确引用了首次发表在JMIR Formative Research上的原创作品。必须包括完整的书目信息，https://formative.www.mybigtv.com上的原始出版物的链接，以及此版权和许可信息。gydF4y2Ba

背景gydF4y2Ba

为控制COVID-19感染率，全球已采用接触者追踪方法。为了实现这一目标，一些移动应用程序已经被开发出来。然而，人们越来越关注这些应用程序的工作机制和性能。文献已经提供了一些有趣的探索性研究，通过分析来自不同来源的信息，如新闻和用户对应用程序的评论，来研究社区对应用程序的反应。然而，据我们所知，目前还没有一种解决方案可以自动分析用户的评论并提取所引发的情绪。我们相信，这样的解决方案与用户友好的界面相结合，可以作为一种快速监控工具来监控应用程序的有效性，并在不经过密集的参与式设计方法的情况下立即进行更改。gydF4y2Ba

客观的gydF4y2Ba

在本文中，我们旨在通过提出一个情绪分析框架来自动分析用户对COVID-19接触追踪移动应用程序的评论，分析人工智能和NLP技术在自动提取和分类用户情绪极性方面的有效性。我们还旨在提供一个大规模的带注释的基准数据集，以促进该领域未来的研究。作为概念的证明，我们还基于提出的解决方案开发了一个web应用程序，它有望帮助社区快速分析应用程序在该领域的潜力。gydF4y2Ba

方法gydF4y2Ba

我们提出了一个管道，从人工注释开始，通过众包研究，最后开发和训练人工智能(AI)模型，用于自动分析用户评论的情绪。详细地，我们收集并注释了大规模的用户对COVID-19接触者追踪应用程序的评论数据集。我们使用经典和深度学习方法进行分类实验。gydF4y2Ba

结果gydF4y2Ba

我们在3个不同的任务中使用了8种不同的方法，平均F1分数高达94.8%，表明所提出的解决方案是可行的。众包活动产生了一个由34,534个手工注释的评论组成的大规模基准数据集。gydF4y2Ba

结论gydF4y2Ba

现有文献大多依赖于人工或探索性分析用户对应用程序的评论，冗长且耗时。在现有的研究中，通常只分析较少应用的数据。在这项工作中，我们展示了人工智能和自然语言处理技术在分析和分类用户情绪极性方面提供了良好的结果，自动情绪分析可以帮助更准确、更快速地分析用户的反应。我们还提供了一个大规模的基准数据集。我们相信，所提供的分析、数据集和建议的解决方案与用户友好的界面相结合，可以作为一种快速监控工具，用于分析和监控在紧急情况下部署的移动应用程序，从而导致应用程序的快速变化，而无需通过密集的参与式设计方法。gydF4y2Ba

新型冠状病毒肺炎gydF4y2Ba 情绪分析gydF4y2Ba 联系人追踪应用gydF4y2Ba NLPgydF4y2Ba 文本分类gydF4y2Ba 伯特gydF4y2Ba fastTextgydF4y2Ba 变形金刚gydF4y2Ba 罗伯塔gydF4y2Ba

简介gydF4y2Ba COVID-19应对中的合同追踪gydF4y2Ba

自COVID-19出现以来，全球公共当局都在尽最大努力减缓病毒的感染率。作为努力的一部分，他们已经实施了一些解决方案，如关闭公共场所，实施全面或部分封锁，限制人们的接触。接触者追踪已被全球公认为减缓病毒感染率的有效方法之一[gydF4y2Ba 1gydF4y2Ba］．为此，大多数初步工作是基于人工追踪感染者的接触者。只有当感染者知道谁曾与他或她有过身体接触时，手动接触追踪才有效，这降低了方法的有效性。此外，手动追踪接触者是一个非常耗时和耗费资源的过程[gydF4y2Ba 2gydF4y2Ba，gydF4y2Ba 3.gydF4y2Ba］．gydF4y2Ba

理想情况下，如果接触者追踪机制能够大规模追踪受感染者的接触者，接触者追踪的潜力就可以得到充分利用。例如，在理想情况下，如果有关当局能够追踪受感染者去过哪里，并识别和通知患者的潜在接触者，那将是有益的。智能手机和可穿戴设备中的接近传感器等技术可以在这种情况下提供帮助，使当局能够更快速、更准确地自动通报潜在病例[gydF4y2Ba 1gydF4y2Ba，gydF4y2Ba 4gydF4y2Ba］．为此，世界各地开发了几款具有多样化功能的移动应用程序，每款应用程序都与covid -19相关政策、社会价值观和当地基础设施保持一致。然而，此类应用程序的成功在很大程度上受到用户数量的限制。根据Hinch等人[gydF4y2Ba 5gydF4y2Ba]，如果至少有80%的移动用户使用这些移动应用程序，这些应用程序的潜力就可以得到充分利用——根据作者的报告，在英国，这一数字占总人口的56%，但通常取决于该国的移动普及率。gydF4y2Ba

为增加这些应用程序的用户人数，政府已制订不同的策略和政策[gydF4y2Ba 6gydF4y2Ba］．例如，一些国家的公共当局强制居民安装接触者追踪应用程序，以便能够进入购物中心、交通工具、医院和其他公共场所。gydF4y2Ba

然而，在有效性和隐私方面，这些应用程序存在一些问题。例如，由于应用程序需要使用GPS和其他传感器跟踪个人的活动，以跟踪他们的互动，因此可能会出现隐私问题[gydF4y2Ba 7gydF4y2Ba，gydF4y2Ba 8gydF4y2Ba］．此外，文献还指出，在收入有限的国家，很大一部分人口对这种技术(如智能手机)缺乏了解和无法获得，这是这种接触追踪应用程序效率较低的主要原因之一[gydF4y2Ba 9gydF4y2Ba］．gydF4y2Ba

研究动机gydF4y2Ba

这项研究的动机源于观察，尽管取得了成功，但由于隐私和其他技术问题(包括电池消耗增加)的担忧，接触追踪应用程序在全球范围内受到了公众的批评和审查。我们相信，分析用户对这些应用程序的评论将有助于更好地理解对这些应用程序的关注。在这方面已经有了一些努力[gydF4y2Ba 3.gydF4y2Ba，gydF4y2Ba 9gydF4y2Ba，gydF4y2Ba 10gydF4y2Ba］．然而，大多数方法依赖于对用户评论的探索性和人工分析，这是一个耗费资源和耗时的过程。此外，一些工作还依赖于现有的通用情绪分析平台或工具，而没有对COVID-19应用程序审查工具进行培训或微调。例如，在[gydF4y2Ba 10gydF4y2Ba)，一个名为AppBot的商业工具，仅用于对欧洲使用的9款移动应用的用户评论进行情绪分析。然而，该工具依赖于训练有素的人工智能(AI)模型进行一般情绪分析，并返回4种类型的情绪，即积极、消极、中性和混合。因此，结果是不可靠的，因为模型没有在特定任务的数据(即应用程序评论)上进行训练。例如，绝大多数评论都强调了一些技术问题，例如注册困难，这些问题也需要分析。为了解决这些限制，我们相信，在手动注释的用户评论的大规模数据集上训练的特定于任务的模型将有助于更好地对评论进行特定于上下文的分类。此外，现有的文献依赖于在特定地区使用的较少应用程序的用户评论，而这些应用程序只覆盖了世界人口的一部分。gydF4y2Ba

范围及贡献gydF4y2Ba

为了便于对这些应用程序的用户评论进行自动情感分析，需要一个大规模的人工注释数据集来训练和评估用于情感分析的机器学习(ML)模型。在这项工作中，我们收集并注释了大量手工注释的46个不同应用程序的用户评论。更具体地说，我们收集并注释了Android和iOS移动应用程序用户对COVID-19接触者追踪的评论的大规模数据集。gydF4y2Ba

我们分析了人工智能模型如何帮助自动提取和分类用户情绪的极性，并提出了一个情绪分析框架，用于自动分析用户对COVID-19接触者追踪手机应用程序的评论。提出了几种算法，并在数据集上进行了评估，作为概念证明，以显示对用户对这些应用程序的评论进行自动情感分析的有效性。在手动分析和注释用户的评论后，我们同时使用了经典(即，多项Naïve贝叶斯[MNB]，支持向量机[SVM]，随机森林[RF])和深度学习(即，神经网络[gydF4y2Ba 11gydF4y2Ba， fastText [gydF4y2Ba 12gydF4y2Ba]，以及不同的变压器[gydF4y2Ba 13gydF4y2Ba])分类实验方法。由此产生了8种不同的分类模型。此外，据我们所知，这是首次尝试开发大规模基准数据集，用于分析来自46个不同国家的谷歌Play和苹果应用商店的COVID-19接触追踪应用程序的用户评论。所提出的解决方案与界面相结合，可以作为一种快速监控工具，监测应用程序的有效性，并在不经过密集的参与式设计方法的情况下立即进行更改，尽管在正常情况下是最优的，但在紧急情况下，由于更大的公共利益，需要立即部署移动设备，而且从一开始就很少甚至没有用户输入，这种情况下就不是最优的。gydF4y2Ba

这项工作的主要贡献可以总结如下:我们根据对46个不同的COVID-19接触者追踪应用程序的40,000条评论的分析，提供了34,534条手动标记的评论。标签由情绪极性(即积极、中性和消极)和标签(技术问题)组成。我们对数据集进行了深入分析，展示了不同的特征和见解。我们与研究界共享数据集和数据分割，以提高可重复性和进一步增强。我们使用8个不同的分类实验报告基准结果，这可以作为未来研究的基线。我们还提出了一个web应用程序，采用所提出的NLP技术，并具有用户友好的界面，允许利益相关者快速分析人们对此类移动应用程序的看法。gydF4y2Ba

相关工作gydF4y2Ba

为了抗击COVID-19大流行，几乎所有的研究领域，如卫生、NLP和计算机视觉，都发挥了重要作用。因此，去年提出了针对这一流行病不同方面的若干有趣的解决办法[gydF4y2Ba 14gydF4y2Ba］．例如，一直在努力早期检测COVID-19疫情，以帮助做好应急准备[gydF4y2Ba 15gydF4y2Ba］．同样，很大一部分工作旨在解决自动诊断、预后和治疗[gydF4y2Ba 15gydF4y2Ba，gydF4y2Ba 16gydF4y2Ba］．假新闻检测、风险评估、后勤规划以及对社会干预措施(如监测社交距离)的理解，是大流行受到社区关注的其他关键方面[gydF4y2Ba 14gydF4y2Ba，gydF4y2Ba 17gydF4y2Ba，gydF4y2Ba 18gydF4y2Ba］．接触者追踪也是文献中广泛探讨的大流行的一个方面。例如，Lash等人的研究[gydF4y2Ba 19gydF4y2Ba]分析了2个不同国家的接触者追踪机制和结果。作者报告说，一种准确和有效的接触者追踪机制可以显著降低病毒的感染率。然而，在及时和准确追踪COVID-19患者的接触者方面存在几个挑战。在这方面，社区的共同努力，以及基于不同技术的更先进的方法，如GPS、Wi-Fi、蓝牙、社交图、基于网络的api和移动跟踪数据，将在很大程度上有所帮助[gydF4y2Ba 20.gydF4y2Ba，gydF4y2Ba 21gydF4y2Ba］．已经嵌入此类技术的手持设备(如移动电话)是部署接触追踪解决方案的理想平台。作为一种可行的解决方案，世界各地已经开发了几款移动应用程序。除了基本的接触者追踪功能外，还根据国内COVID-19政策实施了不同的功能[gydF4y2Ba 22gydF4y2Ba］．例如，在不同的国家，如卡塔尔和澳大利亚，应用程序用于访问不同的设施。同样，在沙特阿拉伯，人们使用一种应用程序来寻求在封锁期间外出的许可。在gydF4y2Ba 表1gydF4y2Ba，我们提供了一些在世界不同地区使用的著名的联系人追踪应用程序的列表。gydF4y2Ba

表1gydF4y2Ba

本研究中使用的COVID-19接触追踪移动应用程序。gydF4y2Ba

美国没有。gydF4y2Ba	国家gydF4y2Ba	应用程序gydF4y2Ba	技术gydF4y2Ba
1gydF4y2Ba	澳大利亚gydF4y2Ba	COVIDSafegydF4y2Ba	蓝牙,谷歌和苹果gydF4y2Ba
2gydF4y2Ba	奥地利gydF4y2Ba	阻止电晕gydF4y2Ba	蓝牙,谷歌和苹果gydF4y2Ba
3.gydF4y2Ba	巴林gydF4y2Ba	BeAwaregydF4y2Ba	蓝牙、位置gydF4y2Ba
4gydF4y2Ba	孟加拉国gydF4y2Ba	电晕示踪剂BDgydF4y2Ba	蓝牙,谷歌gydF4y2Ba
5gydF4y2Ba	比利时gydF4y2Ba	CoronalertgydF4y2Ba	蓝牙,谷歌和苹果gydF4y2Ba
6gydF4y2Ba	保加利亚gydF4y2Ba	ViruSafegydF4y2Ba	位置，蓝牙，谷歌/ApplegydF4y2Ba
7gydF4y2Ba	加拿大gydF4y2Ba	COVID警报gydF4y2Ba	蓝牙,谷歌和苹果gydF4y2Ba
8gydF4y2Ba	塞浦路斯gydF4y2Ba	CovTracergydF4y2Ba	位置、全球定位系统(GPS)gydF4y2Ba
9gydF4y2Ba	捷克共和国gydF4y2Ba	eRouskagydF4y2Ba	蓝牙,谷歌和苹果gydF4y2Ba
10gydF4y2Ba	丹麦gydF4y2Ba	SmittestopgydF4y2Ba	蓝牙,谷歌和苹果gydF4y2Ba
11gydF4y2Ba	爱沙尼亚gydF4y2Ba	HOIAgydF4y2Ba	蓝牙，DP-3T，谷歌/ApplegydF4y2Ba
12gydF4y2Ba	斐济gydF4y2Ba	CareFijigydF4y2Ba	蓝牙,谷歌和苹果gydF4y2Ba
13gydF4y2Ba	芬兰gydF4y2Ba	KoronavilkkugydF4y2Ba	蓝牙,DP-3TgydF4y2Ba
14gydF4y2Ba	法国gydF4y2Ba	TousAntiCovidgydF4y2Ba	蓝牙,谷歌和苹果gydF4y2Ba
15gydF4y2Ba	德国gydF4y2Ba	Corona-Warn-AppgydF4y2Ba	蓝牙,谷歌和苹果gydF4y2Ba
16gydF4y2Ba	加纳gydF4y2Ba	GH COVID-19追踪器gydF4y2Ba	位置,谷歌和苹果gydF4y2Ba
17gydF4y2Ba	直布罗陀gydF4y2Ba	打败直布罗陀疫情gydF4y2Ba	蓝牙,谷歌和苹果gydF4y2Ba
18gydF4y2Ba	匈牙利gydF4y2Ba	VirusRadargydF4y2Ba	蓝牙,谷歌gydF4y2Ba
19gydF4y2Ba	冰岛gydF4y2Ba	Rakning C-19gydF4y2Ba	位置,谷歌和苹果gydF4y2Ba
20.gydF4y2Ba	印度gydF4y2Ba	Aarogya是以gydF4y2Ba	蓝牙，位置，谷歌/ApplegydF4y2Ba
21gydF4y2Ba	印尼gydF4y2Ba	PeduliLindungigydF4y2Ba	蓝牙,谷歌和苹果gydF4y2Ba
22gydF4y2Ba	爱尔兰gydF4y2Ba	Covid追踪gydF4y2Ba	蓝牙,谷歌和苹果gydF4y2Ba
23gydF4y2Ba	以色列gydF4y2Ba	HaMagengydF4y2Ba	位置,谷歌和苹果gydF4y2Ba
24gydF4y2Ba	意大利gydF4y2Ba	ImmunigydF4y2Ba	蓝牙,谷歌和苹果gydF4y2Ba
25gydF4y2Ba	日本gydF4y2Ba	可可gydF4y2Ba	谷歌和苹果gydF4y2Ba
26gydF4y2Ba	沙特阿拉伯王国gydF4y2Ba	TawakkalnagydF4y2Ba	蓝牙,谷歌gydF4y2Ba
27gydF4y2Ba	沙特阿拉伯王国gydF4y2Ba	TabaudgydF4y2Ba	谷歌gydF4y2Ba
28gydF4y2Ba	科威特gydF4y2Ba	ShlonikgydF4y2Ba	位置,谷歌和苹果gydF4y2Ba
29gydF4y2Ba	马来西亚gydF4y2Ba	MyTracegydF4y2Ba	蓝牙,谷歌和苹果gydF4y2Ba
30.gydF4y2Ba	墨西哥gydF4y2Ba	CovidRadargydF4y2Ba	蓝牙gydF4y2Ba
31gydF4y2Ba	新西兰gydF4y2Ba	新西兰COVID示踪剂gydF4y2Ba	二维码，谷歌/ApplegydF4y2Ba
32gydF4y2Ba	北马其顿gydF4y2Ba	StopKoronagydF4y2Ba	蓝牙gydF4y2Ba
33gydF4y2Ba	北爱尔兰gydF4y2Ba	StopCOVID倪gydF4y2Ba	蓝牙,谷歌和苹果gydF4y2Ba
34gydF4y2Ba	挪威gydF4y2Ba	SmittestoppgydF4y2Ba	蓝牙，位置，谷歌gydF4y2Ba
35gydF4y2Ba	巴基斯坦gydF4y2Ba	COVID-Gov-PKgydF4y2Ba	蓝牙，GPS，谷歌/ApplegydF4y2Ba
36gydF4y2Ba	菲律宾gydF4y2Ba	StaySafegydF4y2Ba	蓝牙,谷歌和苹果gydF4y2Ba
37gydF4y2Ba	波兰gydF4y2Ba	盔甲护身安全gydF4y2Ba	蓝牙,谷歌gydF4y2Ba
38gydF4y2Ba	卡塔尔gydF4y2Ba	EhterazgydF4y2Ba	蓝牙，位置，谷歌/ApplegydF4y2Ba
39gydF4y2Ba	新加坡gydF4y2Ba	TraceTogethergydF4y2Ba	蓝牙,谷歌和苹果gydF4y2Ba
40gydF4y2Ba	南非gydF4y2Ba	COVID警报SAgydF4y2Ba	蓝牙,谷歌和苹果gydF4y2Ba
41gydF4y2Ba	瑞士gydF4y2Ba	SwissCovidgydF4y2Ba	蓝牙，DP-3T，谷歌/ApplegydF4y2Ba
42gydF4y2Ba	泰国gydF4y2Ba	MorChanagydF4y2Ba	位置,蓝牙gydF4y2Ba
43gydF4y2Ba	突尼斯gydF4y2Ba	E7migydF4y2Ba	谷歌和苹果gydF4y2Ba
44gydF4y2Ba	火鸡gydF4y2Ba	哈亚特·伊夫·萨格˘argydF4y2Ba	蓝牙，位置，谷歌/ApplegydF4y2Ba
45gydF4y2Ba	阿拉伯联合酋长国gydF4y2Ba	TraceCovidgydF4y2Ba	蓝牙gydF4y2Ba
46gydF4y2Ba	联合王国gydF4y2Ba	NHS COVID-19应用程序gydF4y2Ba	蓝牙,谷歌和苹果gydF4y2Ba

尽管这些应用是降低感染率的可行解决方案，但由于与之相关的风险，它们受到了批评。在文献中，已经报道了一些问题，如隐私、功耗和恼人的警报。例如，Bengio等[gydF4y2Ba 23gydF4y2Ba]分析并报告了与COVID-19接触追踪应用程序相关的隐私问题。除了一些关于如何确保用户隐私的建议外，作者还通过优化隐私和效用的权衡，提出了一种去中心化的联系人跟踪设计。Reichert等人[gydF4y2Ba 24gydF4y2Ba]分析了应用程序的隐私问题，提出了一种基于保护隐私协议安全多方计算的保护隐私联系人跟踪机制[gydF4y2Ba 25gydF4y2Ba]以保障个人的私隐。功耗是接触追踪应用程序面临的另一个关键挑战。gydF4y2Ba

文献还描述了一些有趣的研究，这些研究通过分析人们对这些应用程序的反应或反馈来评估这些移动应用程序的可行性[gydF4y2Ba 22gydF4y2Ba，gydF4y2Ba 26gydF4y2Ba，gydF4y2Ba 27gydF4y2Ba］．例如，在[gydF4y2Ba 28gydF4y2Ba，一项在线调查分析了爱尔兰公民对HSE3(爱尔兰使用的一款联系人追踪应用程序)的反应。在调查过程中，有相当比例的参与者表示有意使用该应用程序。然而，调查主要是为了分析和识别使用此类应用程序的不同障碍，而没有分析用户使用该应用程序的体验。为了更好地分析、理解和评估用户对COVID-19接触追踪应用程序的体验和反馈，需要详细分析Apple和谷歌Play Store中提供的公众评论。在这个方向上已经有了一些努力。例如，Rekanar等[gydF4y2Ba 3.gydF4y2Ba]从可用性、功能有效性和性能方面详细分析了用户对HSE3的反馈。然而，作者仅依靠人工分析，这是一个耗时的过程。另一项相关工作报道于[gydF4y2Ba 10gydF4y2Ba]，其中对欧洲使用的9个COVID-19接触者追踪应用程序的用户反馈进行了探索性分析。为了实现这一目标，作者依靠一个商业应用评论分析工具Appbot来提取和挖掘用户对应用的评论。据我们所知，文献仍然缺乏一个基准数据集来训练和评估ML模型，以自动分析用户对COVID-19接触追踪应用程序的反馈。此外，现有的文献依赖于在特定地区使用的少数应用程序的用户评论，而这些应用程序只覆盖了世界人口的一部分。因此，我们的工作在以下方面有所不同:我们(1)分析了世界不同地区使用的大量应用程序的评论，(2)手动注释数据集并将其提供给社区，(3)提供详细的实验结果。gydF4y2Ba

方法gydF4y2Ba 概述gydF4y2Ba

在本节中，我们将概述本文采用的方法。拟议工作的完整流程描述在gydF4y2Ba 图1gydF4y2Ba．工作主要分2个阶段进行，包括(1)数据集开发阶段和(2)实验阶段。在开发阶段，作为第一步，我们从谷歌Play和App Store中抓取了用户对全球不同地区使用的COVID-19接触追踪应用程序的评价。在获得用户评论后，进行众包研究，对评论进行注释，用于ML模型的训练和评估，用于评论的自动情感分析。然后分析在众包研究期间获得的注释和其他细节，详见后面各节。在实验阶段，在进行实验之前，对数据进行预处理，使数据对实验中部署的AI模型更有意义。在实验过程中，我们使用了几个AI模型，详见后面的章节。在本节的其余部分，我们将提供数据集开发过程的详细信息，包括收集、注释和分析数据集的方法。gydF4y2Ba

图1gydF4y2Ba

新冠肺炎接触者追踪手机应用用户反馈情感分析管道框图，大致分为2个部分，即(1)数据集开发和(2)实验。gydF4y2Ba

数据集开发gydF4y2Ba 数据收集gydF4y2Ba

为了获得真实的用户评论，以供我们分析，我们从世界不同地区使用的46个COVID-19接触追踪应用程序中抓取评论，这些应用程序托管在谷歌Play和苹果应用程序商店上。这些应用程序在gydF4y2Ba 表1gydF4y2Ba．本工作所涉及的应用程序清单是从网上来源获得的。在搜索过程中，我们使用了不同的关键字，以确保分析中涵盖了大多数应用程序。我们注意到，在这项工作中，只有当我们确保对每个应用程序的至少50%的评论进行分析和注释时，我们才会考虑英语语言的评论。然而，为了确保数据集在不同应用程序的评论方面是平衡的，对于一些应用程序，如Aarogya Setu，分析了可用评论的较小部分。除了用户的评论，我们还获得了对评论的回复，如果有的话，以及评分。但是，在本研究中，我们只使用综述进行分析和实验。我们注意到审查是在2020年12月20日至2020年12月25日期间进行的。值得一提的是，在这项工作中，我们主要是为了收集大量的用户评论，用于ML模型的训练和评估，以便将来自动分析用户对应用程序的评论。因此，覆盖一个特定应用程序的所有审查并不是我们在这项工作中的兴趣所在。 However, we tried our best to cover enough samples from all applications. Moreover, the main idea behind covering reviews from several applications instead of a single application was to train our models on a diversified data set, which will ultimately help our model to automatically analyze reviews on any application used in any part of the world.

数据注释gydF4y2Ba

对于情绪的注释，通常使用3种情绪极性:积极、消极和中性。从我们最初的分析中，我们意识到应用程序可能存在技术问题;因此，我们为注释使用了另一个标签，技术问题。因此，我们的注释由4个标签组成:(1)积极的，(2)消极的，(3)中性的，和(4)技术问题。我们注意到中性评论是指那些既不赞扬也不抱怨应用程序的评论。gydF4y2Ba

为了方便注释过程，我们开发了一个web应用程序，通过该应用程序，用户对应用程序的评论被呈现给注释人员，以手动标记它们。在gydF4y2Ba 图2gydF4y2Ba，我们展示了标注平台的截图，展示了要标注的评审和标签(问题1)。此外，我们要求注释者简要说明他们在回答问题1时所作决定背后的原因。问题(Q.2)用于评估注释的质量(即，注释者是否仔细阅读了综述)。此外，我们相信这个问题将为手动分析用户反馈提供有用的信息。gydF4y2Ba

总共分析了4万条评论。为了保证注释的质量，每一篇评论都由至少2名参与者(来自不同年龄段的研究生)进行分析，我们考虑了大多数注释者同意的评论和标签。在注释过程中，我们删除了一些评论，原因包括:(1)不是英文，(2)有大量的表情符号或符号，(3)不相关(即没有直接评论应用程序)。这个过程总共产生了34,534个带注释的评论。gydF4y2Ba

我们将数据集公开，供研究人员进一步探索NLP技术在自动分析接触追踪应用程序用户反馈方面的潜力[gydF4y2Ba 29gydF4y2Ba］．gydF4y2Ba

图2gydF4y2Ba

注释平台的截图。gydF4y2Ba

分析gydF4y2Ba

总的来说，数据集涵盖了每个类的大量样本。然而，有一类，即中性类，由相对较少的样本组成。我们总共有15,587个正面评论，而负面和技术问题类别分别由8178个和9496个样本组成。少数民族阶级(即中立阶级)总共只有1271人。gydF4y2Ba

通过对第二个问题(Q.2)的分析，我们确定了影响参与者决策的原因和信息。在本节中，我们将提供与第二个问题(Q.2)相关的统计数据。在gydF4y2Ba 图3gydF4y2Ba，我们提供了正面和负面评价的最常见原因和原因的分类，以及常见的技术问题。gydF4y2Ba

在gydF4y2Ba 表2gydF4y2Ba，我们分别提供了与正面评价、负面评价和技术问题相关的最常见原因和原因的分布。gydF4y2Ba

图3gydF4y2Ba

分类主要原因或原因的积极和消极的评价，以及技术问题。gydF4y2Ba

表2gydF4y2Ba

评论中提供反馈的常见原因(n=34,534)。gydF4y2Ba

反馈的类型gydF4y2Ba		反应频率，n (%)gydF4y2Ba
正反馈(n=15,587)gydF4y2Ba
	易于安装或使用gydF4y2Ba	1137 (7.3)gydF4y2Ba
	有用的，信息量大的，有用的gydF4y2Ba	5673 (36.4)gydF4y2Ba
	喜欢这个想法或倡议gydF4y2Ba	904 (5.8)gydF4y2Ba
	工作正常gydF4y2Ba	3226 (20.7)gydF4y2Ba
	没有任何原因gydF4y2Ba	4645 (29.8)gydF4y2Ba
技术问题(n=9496)gydF4y2Ba
	注册的问题gydF4y2Ba	4111 (43.3)gydF4y2Ba
	更新问题gydF4y2Ba	978 (10.3)gydF4y2Ba
	频繁的事故gydF4y2Ba	1443 (15.2)gydF4y2Ba
	没有任何原因gydF4y2Ba	2954 (31.1)gydF4y2Ba
负反馈(n=8178)gydF4y2Ba
	电力消耗gydF4y2Ba	1733 (21.2)gydF4y2Ba
	隐私问题gydF4y2Ba	1063 (13.0)gydF4y2Ba
	无用的gydF4y2Ba	2020 (24.7)gydF4y2Ba
	不友好的gydF4y2Ba	1022 (12.5)gydF4y2Ba
	没有任何原因gydF4y2Ba	2339 (28.6)gydF4y2Ba

在大多数正面评价中，用户认为这些应用程序有用、信息丰富，有助于抗击COVID-19。一些正面评价的例子如下:gydF4y2Ba

非常感谢。它非常有用，信息量很大。它帮助人们远离可疑区域。gydF4y2Ba

一个非常好的追踪和阻止冠状病毒的应用程序gydF4y2Ba

总是能得到关于病毒的最新信息gydF4y2Ba

非常有用和信息丰富的应用程序。gydF4y2Ba

相当一部分的积极评价也是基于安装的便利性，而一些评价提到他们使用的应用程序运行良好，但没有进一步的细节。然而，最令人鼓舞的是，相当大比例的用户对当局为降低感染率而追踪接触者的想法、概念和努力表示赞赏。一些示例评论包括:gydF4y2Ba

政府的好举措gydF4y2Ba

很好地预防了冠状病毒的传播，我感谢幕后工作人员的努力。gydF4y2Ba

还有大量简短的评论，用户只是简单地表达了他们的积极回应，而没有提到任何特定的原因。除此之外，用户强调的其他积极评价的常见原因包括世界不同地区不同应用程序的一些特定功能。例如，沙特政府的Takkawalna应用程序被用于在封锁期间寻求外出许可，被称赞为寻求许可的来源。gydF4y2Ba

另一方面，这些应用程序的关键技术问题包括注册和更新问题。此外，大量的评论还强调了应用程序崩溃或经常停止工作。除了这些常见问题外，这些评论还暗示了某些技术问题，如设备兼容性和连接问题;缺乏对某些语言的支持，如英语;而不是纠正来自不同应用程序的二维码。一些突出应用程序中的技术问题的示例评论包括:gydF4y2Ba

应用程序不断崩溃。gydF4y2Ba

我有商务签证，无法注册，请给一个解决方案。gydF4y2Ba

我安装了，但我还不能注册。gydF4y2Ba

我不能更新?gydF4y2Ba

安装应用程序，但仍然显示连接错误。即使重启手机，也一样。gydF4y2Ba

最常见的问题包括功耗、无用性和隐私(gydF4y2Ba 表2gydF4y2Ba)．大量的评论还强调，大多数应用程序并不友好。还有一些评论描述了其他问题，例如恼人的通知，不必要的访问图库，帮助热线的响应缓慢，以及一些关键功能的不可用，这些问题可以进一步提高应用程序的有效性。一些负面评论包括:gydF4y2Ba

收集了太多的个人信息。隐私风险。不符合国际标准。gydF4y2Ba

允许太多的权限，请禁止此应用程序。完全是浪费。gydF4y2Ba

我担心他们的数据隐私。gydF4y2Ba

这个应用程序很耗电。gydF4y2Ba

我们也提供国家的统计数据gydF4y2Ba 图4gydF4y2Ba，其中我们总结了样本的数量和百分比，并对属于每个类别的不同国家使用的应用程序进行了评论。从图中可以看出，在世界不同地区，强调技术问题的负面、正面、中性评论的数量分布有所不同。每节课的评论数量的变化描述了世界不同地区对应用程序使用的不同反应。可以看到，在某些国家，如日本，以色列，加拿大和爱尔兰，负面评论的比例很高。正面评价的比例在大多数国家是足够的，这表明用户对应用程序的信任。另一方面，正如预期的那样，从大多数国家获得的关于该数据集的中立评论较少。该数据集还包括大多数国家中相当大比例的技术问题类别。例如，在丹麦、突尼斯和塞浦路斯，强调应用程序中技术问题的评论比例非常高。gydF4y2Ba

图4gydF4y2Ba

在我们的数据集中，按国家报告的应用程序的负面、正面和中性评论的分布以及技术问题。gydF4y2Ba

为了分析用户情绪极性随时间的变化，在gydF4y2Ba 图5gydF4y2Ba，我们提供了初步的时间分析，以分析消极、积极和中性以及技术问题随时间分布的变化。我们注意到，在这项工作中，我们提供了一个初步的时间分析，这将在未来进一步探索，为了实现这一目标，我们手动分析了200个最近的审查，以及在最初和最近的审查中具有合理时间持续时间的应用程序的最初200个审查。如在gydF4y2Ba 图5gydF4y2Ba，在积极、消极和中性类别中观察到较高的总体变异。就个别应用而言，在澳大利亚、新加坡、阿拉伯联合酋长国和加拿大使用的应用中，情绪极性的变化较大。gydF4y2Ba

在数据分析过程中，虽然对隐私有一些怀疑，但我们观察到，在一开始，接触追踪的倡议或想法在很大程度上受到了世界各地用户的赞赏。此外，我们还观察到，随着时间的推移，这些应用程序的用户面临着设备兼容性和应用程序的注册问题。有趣的是，在大多数应用程序中，负面评论的数量随着时间的推移而增加。增加的一个可能原因是应用程序未能实现它们的承诺。gydF4y2Ba

图5gydF4y2Ba

初步的时间分析反映了情绪类别随时间分布的变化。这些数据是通过分析最近(即2020年12月25日)的前200名应用程序和一些有足够数量评论的应用程序的最初200条评论编制的。gydF4y2Ba

词法分析gydF4y2Ba

为了理解词汇内容，我们对每个评论的标记数量进行了分析。它有助于理解数据集的特征。例如，对于卷积神经网络和基于长短期记忆的架构，需要定义最大序列长度。数据集中令牌的最小、最大和平均数量分别为3、198和18。gydF4y2Ba 表3gydF4y2Ba根据数据集中不同评论的长度提供数据集的统计信息。gydF4y2Ba

我们还分析了每个类别的词汇内容，以了解它们在词汇内容顶部n-gram方面是否具有独特性。该分析还证明了标记数据的质量。我们使用效价分数[来比较所有类别的词汇。gydF4y2Ba 30.gydF4y2Ba，gydF4y2Ba 31gydF4y2Ba]， ϑ对于每个令牌，x，使用以下公式:gydF4y2Ba

其中C(.)是一个给定类的标记x的频率gydF4y2Ba lgydF4y2Ba_我gydF4y2Ba.TLgydF4y2Ba_我gydF4y2Ba 类中存在的令牌总数。在ϑ(x)的柱柱中，柱柱的值+1表示该令牌在目标类中的使用量明显高于其他类。在gydF4y2Ba 表4gydF4y2Ba，我们为每个类别提供最常见的bi和triggram， ϑ=1.0。从表中，我们观察到这些n-gram清楚地代表了数据的分类信息。gydF4y2Ba

表3gydF4y2Ba

在整个数据集中不同长度的评论数。gydF4y2Ba

令牌数量gydF4y2Ba	评论,ngydF4y2Ba
0-20gydF4y2Ba	23602年gydF4y2Ba
意向gydF4y2Ba	6611gydF4y2Ba
41-60gydF4y2Ba	2463gydF4y2Ba
61 - 80gydF4y2Ba	1068gydF4y2Ba
81 - 100gydF4y2Ba	664gydF4y2Ba
101 - 120gydF4y2Ba	68gydF4y2Ba
> 120gydF4y2Ba	60gydF4y2Ba

表4gydF4y2Ba

最常见的基于valance分数的分类n-grams。gydF4y2Ba

排名gydF4y2Ba	负gydF4y2Ba	积极的gydF4y2Ba	技术问题gydF4y2Ba
1gydF4y2Ba	电池坏了gydF4y2Ba	最好的应用gydF4y2Ba	错误的请求gydF4y2Ba
2gydF4y2Ba	要删除这个gydF4y2Ba	优秀的应用程序,gydF4y2Ba	不能注册。gydF4y2Ba
3.gydF4y2Ba	过热和电池gydF4y2Ba	和有用的gydF4y2Ba	什么是错的gydF4y2Ba
4gydF4y2Ba	不高兴gydF4y2Ba	非常好gydF4y2Ba	解决这个问题,gydF4y2Ba
5gydF4y2Ba	卸载原因:gydF4y2Ba	感到更安全gydF4y2Ba	我看不出来gydF4y2Ba
6gydF4y2Ba	耗尽电池和gydF4y2Ba	非常好的应用程序gydF4y2Ba	无法继续gydF4y2Ba
7gydF4y2Ba	巨大的消耗gydF4y2Ba	有用的信息gydF4y2Ba	错误而gydF4y2Ba
8gydF4y2Ba	电量太大，gydF4y2Ba	拯救生命gydF4y2Ba	有错误gydF4y2Ba
9gydF4y2Ba	大量电池损耗gydF4y2Ba	非常有用gydF4y2Ba	电话号码。试着gydF4y2Ba

实验gydF4y2Ba 任务描述gydF4y2Ba

如前所述，我们获得了大量正面、负面和技术问题(PNT)的样本，而中性类的样本较少。此外，突出应用程序中的技术问题的评论也可能被视为负面评论。因此，为了涵盖问题的不同方面，我们将其分为3个不同的任务。gydF4y2Ba

任务1涉及PNT的三元分类。我们将该问题视为三元分类问题，其中考虑了PNT。为这项任务训练的模型被期望帮助识别应用程序中突出技术问题的评论以及积极和消极的评论。gydF4y2Ba

任务2涉及二元分类(正面或负面[PN])。负面和技术问题类被合并为一个单一的负面类，形成一个二元分类问题的2个类别以及正面评论(即PN)。将该任务视为二元分类问题的主要原因之一是中性类样本的可用性较低。gydF4y2Ba

任务3涉及3类三元分类:阳性、阴性或中性(PNN)。我们注意到，在这项任务中，否定类是原始否定类和技术问题类的结合。gydF4y2Ba

所有这些任务都有助于分析所提出的情感分析器的性能如何随着不同的注释集而变化。gydF4y2Ba

数据分割gydF4y2Ba

对于分类实验，我们将数据集分为训练集、验证集和测试集，比例分别为60.3%、6.7%和30.0%。在划分数据集时，我们使用分层抽样来保持不同集之间的类分布。对每个任务分别执行数据分割或分布，这导致每个任务的训练、验证和测试集的样本数量不同。每项任务的数据分割将分别公开，以确保在未来的工作中进行公平比较。gydF4y2Ba 表5gydF4y2Ba-gydF4y2Ba 7gydF4y2Ba将数据的分布分别总结为任务1、任务2和任务3中使用的训练集、验证集和测试集。gydF4y2Ba

表5gydF4y2Ba

任务1中类标签的数据分割和分布。gydF4y2Ba

类gydF4y2Ba	火车gydF4y2Ba	验证gydF4y2Ba	测试gydF4y2Ba	总计gydF4y2Ba
积极的gydF4y2Ba	9370gydF4y2Ba	1041gydF4y2Ba	5176gydF4y2Ba	15587年gydF4y2Ba
负gydF4y2Ba	5000gydF4y2Ba	556gydF4y2Ba	2622gydF4y2Ba	8178gydF4y2Ba
技术问题gydF4y2Ba	5686gydF4y2Ba	632gydF4y2Ba	3178gydF4y2Ba	9496gydF4y2Ba
总计gydF4y2Ba	20056年gydF4y2Ba	2229gydF4y2Ba	10976年gydF4y2Ba	33261年gydF4y2Ba

表6gydF4y2Ba

任务2中类标签的数据分割和分布。gydF4y2Ba

类gydF4y2Ba	火车gydF4y2Ba	验证gydF4y2Ba	测试gydF4y2Ba	总计gydF4y2Ba
积极的gydF4y2Ba	9342gydF4y2Ba	1038gydF4y2Ba	5207gydF4y2Ba	15587年gydF4y2Ba
负gydF4y2Ba	10715年gydF4y2Ba	1191gydF4y2Ba	5770gydF4y2Ba	17676年gydF4y2Ba
总计gydF4y2Ba	20057年gydF4y2Ba	2229gydF4y2Ba	10977年gydF4y2Ba	33263年gydF4y2Ba

表7gydF4y2Ba

任务3中类标签的数据分割和分布。gydF4y2Ba

类gydF4y2Ba	火车gydF4y2Ba	验证gydF4y2Ba	测试gydF4y2Ba	总计gydF4y2Ba
积极的gydF4y2Ba	9364gydF4y2Ba	1040gydF4y2Ba	5183gydF4y2Ba	15587年gydF4y2Ba
负gydF4y2Ba	10690年gydF4y2Ba	1188gydF4y2Ba	5798gydF4y2Ba	17676年gydF4y2Ba
中性gydF4y2Ba	770gydF4y2Ba	85gydF4y2Ba	416gydF4y2Ba	1271gydF4y2Ba
总计gydF4y2Ba	20824年gydF4y2Ba	2314gydF4y2Ba	11398年gydF4y2Ba	34534年gydF4y2Ba

数据预处理gydF4y2Ba

在继续实验之前，还通过删除不必要的标记来清理数据，例如非ascii字符、标点符号(替换为空格)和其他符号。gydF4y2Ba

模型gydF4y2Ba

对于这项研究，我们的分类实验包括使用经典和深度学习算法进行多类分类，如下所示。gydF4y2Ba

经典的算法gydF4y2Ba

在本研究中，我们使用了几种经典算法，如MNB [gydF4y2Ba 32gydF4y2Ba]， SVM [gydF4y2Ba 33gydF4y2Ba]和RF [gydF4y2Ba 34gydF4y2Ba］．我们使用bag-of-ngram作为这些算法的特征表示，它是文本分类和检索应用中最常用的方法之一，与经典算法一起应用。这是一种简单有效且计算效率高的方法，已被广泛应用。这是因为它在类似类型的文本分类应用程序中表现更好，例如Twitter文本中的假新闻和洪水检测[gydF4y2Ba 17gydF4y2Ba，gydF4y2Ba 35gydF4y2Ba，gydF4y2Ba 36gydF4y2Ba]，我们使用上述经典算法对这种表示进行了实验。gydF4y2Ba

fastTextgydF4y2Ba

fastText是一个NLP库，旨在提供高效的单词嵌入和文本分类，与传统的深度学习解决方案相比，速度更快[gydF4y2Ba 12gydF4y2Ba］．对于词嵌入，该模型依赖于连续词袋，它基于一个浅神经网络，通过它的邻居预测一个词。为了确保以更高的速度训练，该模型依赖于分层分类机制，用分层分类机制取代传统的软最大函数，从而减少了参数数量。gydF4y2Ba

变形金刚gydF4y2Ba

变压器的双向编码器表示(BERT) [gydF4y2Ba 13gydF4y2Ba]是一种最先进的预训练模型，已在许多下游NLP任务中证明了成功。它通常用于下游分类问题，通过使用嵌入表示作为特征或微调模型。该模型的主要优势来自于在非常大的文本数据集上进行预训练，这使得模型能够在不同的NLP应用程序中轻松地理解和解释文本。此外，该模型还具有从上下文中学习的能力。在这项研究中，我们使用了不同的变压器模型，包括BERT [gydF4y2Ba 13gydF4y2Ba]，罗伯塔[gydF4y2Ba 37gydF4y2Ba]， XLM-RoBERTa [gydF4y2Ba 37gydF4y2Ba]、蒸馏酒[gydF4y2Ba 38gydF4y2Ba］．gydF4y2Ba

评价指标gydF4y2Ba

为了衡量每个分类器的性能，我们使用加权平均精度(P)、召回率(R)和F1。我们使用加权指标，因为它们有能力考虑到阶级不平衡分布。gydF4y2Ba

分类实验gydF4y2Ba

为了使用MNB、SVM和RF训练分类器，我们将文本转换为用对数术语频率(tf)乘以逆文档频率(idf)加权的n-gram矢量袋。为了利用上下文信息，例如对分类有用的n-gram，我们提取了unigram、biggram和trigram特征。gydF4y2Ba

我们使用网格搜索来优化MNB, SVM和RF的参数。对于MNB，我们优化了α参数的拉普拉斯平滑，在0到1之间有20个值。对于支持向量机，我们优化了具有C参数的线性核(30个值，范围从0.00001到10)和具有C和γ参数的径向基函数核(对于γ，我们使用了从1e-5到1e-1的10个值)。对于RF，我们优化了树的数量(200到2000的10个值)和树的深度(10到110的11个值)。选择这样的值范围取决于可用的计算资源，因为它们的计算成本很高。gydF4y2Ba

对于fastText，我们使用在Common Crawl和默认超参数设置上训练的预训练嵌入[gydF4y2Ba 39gydF4y2Ba］．gydF4y2Ba

对于基于变压器的模型，我们使用变压器工具包[gydF4y2Ba 40gydF4y2Ba］．中的超参数设置对每个模型进行了微调gydF4y2Ba 表8gydF4y2Ba，在模型的顶部有一个特定于任务的层。如在[gydF4y2Ba 13gydF4y2Ba]，用预训练的变压器模型训练显示不稳定性;因此，我们使用不同的随机种子对每个实验进行10次运行，并选择在开发集中表现最好的模型。为了为每个任务训练基于变压器的模型，我们以“分类交叉熵”作为损失函数对模型进行了10个epoch的微调，并使用了中提供的超参数设置gydF4y2Ba 表8gydF4y2Ba．gydF4y2Ba

每个模型的参数的详细数量，说明了模型的大小，如下:gydF4y2Ba

BERT (BERT -base-uncase):这个模型是在小写英文文本上训练的。它由12层、768个隐藏状态、12个头部和1.1亿个参数组成。gydF4y2Ba

DistilBERT (DistilBERT -base un外壳):这是BERT模型的蒸馏版，由6层、768个隐藏状态、12个头和6600万个参数组成。gydF4y2Ba

RoBERTa (RoBERTa -large): RoBERTa采用BERT-large架构，由24层、1024个隐藏状态、16个头部和3.55亿个参数组成。gydF4y2Ba

XML-RoBERTa (xlm-roberta-large):它由355M个参数组成，24层，1027个隐藏状态，4096个前馈隐藏状态，16个头部。gydF4y2Ba

表8gydF4y2Ba

实验中使用的超参数设置。gydF4y2Ba

参数gydF4y2Ba	价值gydF4y2Ba
批量大小gydF4y2Ba	8gydF4y2Ba
学习率(Adam)gydF4y2Ba	2 e-5gydF4y2Ba
纪元数gydF4y2Ba	10gydF4y2Ba
最大序列长度gydF4y2Ba	128gydF4y2Ba

结果gydF4y2Ba 任务1:三元分类(PNT)gydF4y2Ba

表9gydF4y2Ba给出Task 1的加权准确率、精密度、召回率和F1得分的实验结果。总体而言，与经典和基于深度学习的方法相比，变压器获得了更好的结果。变压器性能更好的主要原因之一是它们的文本解释能力。虽然在不同变压器的性能上没有观察到显著差异，但RoBERTa的性能比其他变压器略有改善。gydF4y2Ba

为了更好地分析所提出方法的性能，我们还提供了按类的性能。总体而言，三个班均取得了合理的结果;然而，正类的所有方法的性能都更高。其他两类学生表现相对较差的原因之一可能是班级间差异较小。如前所述，负面问题类和技术问题类的评论包含类似类型的单词，并且在课堂上有更高的混淆几率。任务1的实验结果为任务2提供了基础，在任务2中，负面问题和技术问题类别被合并。gydF4y2Ba

表9gydF4y2Ba

任务1的实验结果:正面、负面和技术问题(PNT)的三元分类。gydF4y2Ba

方法gydF4y2Ba	积极的gydF4y2Ba			负gydF4y2Ba				技术问题gydF4y2Ba				总体(加权平均)gydF4y2Ba
	PgydF4y2Ba^{一个gydF4y2Ba}	RgydF4y2Ba^bgydF4y2Ba	F1gydF4y2Ba	PgydF4y2Ba	RgydF4y2Ba	F1gydF4y2Ba	PgydF4y2Ba		RgydF4y2Ba	F1gydF4y2Ba	AccgydF4y2Ba^cgydF4y2Ba		PgydF4y2Ba	RgydF4y2Ba	F1gydF4y2Ba
MNBgydF4y2Ba^dgydF4y2Ba	.910gydF4y2Ba	.892gydF4y2Ba	.901gydF4y2Ba	.679gydF4y2Ba	.664gydF4y2Ba	.671gydF4y2Ba	.751gydF4y2Ba		.789gydF4y2Ba	.769gydF4y2Ba	.808gydF4y2Ba		.809gydF4y2Ba	.808gydF4y2Ba	.808gydF4y2Ba
射频gydF4y2Ba^egydF4y2Ba	.854gydF4y2Ba	.923gydF4y2Ba	.887gydF4y2Ba	.809gydF4y2Ba	.538gydF4y2Ba	.646gydF4y2Ba	.729gydF4y2Ba		.833gydF4y2Ba	.777gydF4y2Ba	.805gydF4y2Ba		.806gydF4y2Ba	.805gydF4y2Ba	.797gydF4y2Ba
支持向量机gydF4y2Ba^fgydF4y2Ba	.946gydF4y2Ba	.867gydF4y2Ba	.905gydF4y2Ba	.660gydF4y2Ba	.707gydF4y2Ba	.683gydF4y2Ba	.745gydF4y2Ba		.803gydF4y2Ba	.773gydF4y2Ba	.810gydF4y2Ba		.820gydF4y2Ba	.810gydF4y2Ba	.814gydF4y2Ba
fastTextgydF4y2Ba	.930gydF4y2Ba	.904gydF4y2Ba	原来得到gydF4y2Ba	.713gydF4y2Ba	.691gydF4y2Ba	.702gydF4y2Ba	.752gydF4y2Ba		.806gydF4y2Ba	.778gydF4y2Ba	.825gydF4y2Ba		.827gydF4y2Ba	.825gydF4y2Ba	.825gydF4y2Ba
DistilBERTgydF4y2Ba^ggydF4y2Ba	.943gydF4y2Ba	.934gydF4y2Ba	.939gydF4y2Ba	.753gydF4y2Ba	.714gydF4y2Ba	.733gydF4y2Ba	.778gydF4y2Ba		.824gydF4y2Ba	.800gydF4y2Ba	.849gydF4y2Ba		.850gydF4y2Ba	.849gydF4y2Ba	.849gydF4y2Ba
伯特gydF4y2Ba	.938gydF4y2Ba	.936gydF4y2Ba	.937gydF4y2Ba	.750gydF4y2Ba	.718gydF4y2Ba	.734gydF4y2Ba	.786gydF4y2Ba		.817gydF4y2Ba	.801gydF4y2Ba	.850gydF4y2Ba		.849gydF4y2Ba	.850gydF4y2Ba	.849gydF4y2Ba
罗伯塔gydF4y2Ba	.943gydF4y2Ba	.946gydF4y2Ba	.945gydF4y2Ba	.754gydF4y2Ba	.716gydF4y2Ba	.734gydF4y2Ba	.788gydF4y2Ba		.817gydF4y2Ba	.802gydF4y2Ba	.854gydF4y2Ba		.853gydF4y2Ba	.854gydF4y2Ba	.853gydF4y2Ba
XML-RoBERTagydF4y2Ba	.941gydF4y2Ba	.946gydF4y2Ba	.943gydF4y2Ba	.744gydF4y2Ba	.705gydF4y2Ba	.724gydF4y2Ba	.783gydF4y2Ba		.811gydF4y2Ba	.797gydF4y2Ba	.849gydF4y2Ba		.848gydF4y2Ba	.849gydF4y2Ba	.848gydF4y2Ba

^{一个gydF4y2Ba}P:精度。gydF4y2Ba

^bgydF4y2Ba接待员:召回。gydF4y2Ba

^cgydF4y2BaAcc:准确性。gydF4y2Ba

^dgydF4y2BaMNB:多项式Naïve贝叶斯。gydF4y2Ba

^egydF4y2BaRF:随机森林。gydF4y2Ba

^fgydF4y2Ba支持向量机:支持向量机。gydF4y2Ba

^ggydF4y2BaBERT:来自变压器的双向编码器表示。gydF4y2Ba

任务2:二元分类(PN)gydF4y2Ba

表10gydF4y2Ba提供了任务2的实验结果，其中模型必须区分积极和消极的评价。正如预期的那样，Task 2的性能有了明显的提高，这证明了我们的假设，negative和technical issues类的内容相似。此外，与任务1类似，变压器的性能优于其他方法。gydF4y2Ba

从表中可以看出，与任务1相比，在不同的类上，方法的表现没有显著差异，这表明在应用程序中突出技术问题的评论引起了负面情绪或情绪。此外，在特定类上没有观察到方法性能的显著变化。gydF4y2Ba

表10gydF4y2Ba

任务2的实验结果:二元分类(阳性或阴性[PN])。gydF4y2Ba

方法gydF4y2Ba	积极的gydF4y2Ba				负gydF4y2Ba				总体(加权平均)gydF4y2Ba
	PgydF4y2Ba^{一个gydF4y2Ba}	RgydF4y2Ba^bgydF4y2Ba	F1gydF4y2Ba	PgydF4y2Ba		RgydF4y2Ba	F1gydF4y2Ba	AccgydF4y2Ba^cgydF4y2Ba		PgydF4y2Ba	RgydF4y2Ba	F1gydF4y2Ba
MNBgydF4y2Ba^dgydF4y2Ba	.925gydF4y2Ba	.873gydF4y2Ba	.898gydF4y2Ba	.891gydF4y2Ba		.936gydF4y2Ba	.913gydF4y2Ba	.906gydF4y2Ba		.907gydF4y2Ba	.906gydF4y2Ba	.906gydF4y2Ba
射频gydF4y2Ba^egydF4y2Ba	.902gydF4y2Ba	.879gydF4y2Ba	.891gydF4y2Ba	.894gydF4y2Ba		.914gydF4y2Ba	.904gydF4y2Ba	.898gydF4y2Ba		.898gydF4y2Ba	.898gydF4y2Ba	.898gydF4y2Ba
支持向量机gydF4y2Ba^fgydF4y2Ba	.944gydF4y2Ba	.876gydF4y2Ba	.909gydF4y2Ba	.895gydF4y2Ba		.953gydF4y2Ba	.923gydF4y2Ba	.916gydF4y2Ba		.918gydF4y2Ba	.916gydF4y2Ba	.916gydF4y2Ba
fastTextgydF4y2Ba	.947gydF4y2Ba	.890gydF4y2Ba	原来得到gydF4y2Ba	.905gydF4y2Ba		.955gydF4y2Ba	.929gydF4y2Ba	.924gydF4y2Ba		.925gydF4y2Ba	.924gydF4y2Ba	.924gydF4y2Ba
DistilBERTgydF4y2Ba^ggydF4y2Ba	.947gydF4y2Ba	.932gydF4y2Ba	.939gydF4y2Ba	.939gydF4y2Ba		.953gydF4y2Ba	.946gydF4y2Ba	.943gydF4y2Ba		.943gydF4y2Ba	.943gydF4y2Ba	.943gydF4y2Ba
伯特gydF4y2Ba	.947gydF4y2Ba	.936gydF4y2Ba	.941gydF4y2Ba	.943gydF4y2Ba		.953gydF4y2Ba	.948gydF4y2Ba	.945gydF4y2Ba		.945gydF4y2Ba	.945gydF4y2Ba	.945gydF4y2Ba
罗伯塔gydF4y2Ba	.948gydF4y2Ba	.942gydF4y2Ba	.945gydF4y2Ba	.948gydF4y2Ba		.953gydF4y2Ba	.951gydF4y2Ba	.948gydF4y2Ba		.948gydF4y2Ba	.948gydF4y2Ba	.948gydF4y2Ba
XML-RoBERTagydF4y2Ba	.953gydF4y2Ba	.930gydF4y2Ba	.942gydF4y2Ba	.939gydF4y2Ba		.959gydF4y2Ba	.949gydF4y2Ba	.945gydF4y2Ba		.946gydF4y2Ba	.945gydF4y2Ba	.945gydF4y2Ba

^{一个gydF4y2Ba}P:精度。gydF4y2Ba

^bgydF4y2Ba接待员:召回。gydF4y2Ba

^cgydF4y2BaAcc:准确性。gydF4y2Ba

^dgydF4y2BaMNB:多项式Naïve贝叶斯。gydF4y2Ba

^egydF4y2BaRF:随机森林。gydF4y2Ba

^fgydF4y2Ba支持向量机:支持向量机。gydF4y2Ba

^ggydF4y2BaBERT:来自变压器的双向编码器表示。gydF4y2Ba

任务3:三元分类(PNN)gydF4y2Ba

表11gydF4y2Ba提供了任务3的实验结果，其中模型必须区分积极，消极和中性的评论。与前面的2项任务类似，与经典的和基于深度学习的方法相比，变压器产生了更好的结果。从表中可以看出，在正类和负类上的所有方法都报告了更好的结果。但是，本文提出的方法的性能明显较低，特别是对于带有朴素贝叶斯分类器的单词袋和ngram。中性类性能较低的主要原因之一是类中的样本较少，如前所述。我们注意到，Task 2和Task 3是分别执行的，以分析中性类中较少样本的影响。gydF4y2Ba

表11gydF4y2Ba

任务3的实验结果:三元分类(阳性、阴性或中性[PNN])。gydF4y2Ba

方法gydF4y2Ba	积极的gydF4y2Ba				负gydF4y2Ba				中性gydF4y2Ba				总体(加权平均)gydF4y2Ba
	PgydF4y2Ba^{一个gydF4y2Ba}	RgydF4y2Ba^bgydF4y2Ba	F1gydF4y2Ba	PgydF4y2Ba		RgydF4y2Ba	F1gydF4y2Ba	PgydF4y2Ba		RgydF4y2Ba	F1gydF4y2Ba	AccgydF4y2Ba^cgydF4y2Ba		PgydF4y2Ba	RgydF4y2Ba	F1gydF4y2Ba
MNBgydF4y2Ba^dgydF4y2Ba	.902gydF4y2Ba	.873gydF4y2Ba	.888gydF4y2Ba	.854gydF4y2Ba		.935gydF4y2Ba	.892gydF4y2Ba	.379gydF4y2Ba		.027gydF4y2Ba	.050gydF4y2Ba	.874gydF4y2Ba		.859gydF4y2Ba	.874gydF4y2Ba	.860gydF4y2Ba
射频gydF4y2Ba^egydF4y2Ba	.875gydF4y2Ba	.881gydF4y2Ba	.878gydF4y2Ba	.862gydF4y2Ba		.916gydF4y2Ba	.888gydF4y2Ba	对于brutegydF4y2Ba		.005gydF4y2Ba	.010gydF4y2Ba	.866gydF4y2Ba		.844gydF4y2Ba	.866gydF4y2Ba	.851gydF4y2Ba
支持向量机gydF4y2Ba^fgydF4y2Ba	.926gydF4y2Ba	.844gydF4y2Ba	.883gydF4y2Ba	.881gydF4y2Ba		.914gydF4y2Ba	.897gydF4y2Ba	.211gydF4y2Ba		.330gydF4y2Ba	.257gydF4y2Ba	.861gydF4y2Ba		.877gydF4y2Ba	.861gydF4y2Ba	.868gydF4y2Ba
fastTextgydF4y2Ba	.947gydF4y2Ba	.890gydF4y2Ba	原来得到gydF4y2Ba	.905gydF4y2Ba		.955gydF4y2Ba	.929gydF4y2Ba	.463gydF4y2Ba		.177gydF4y2Ba	.256gydF4y2Ba	.891gydF4y2Ba		.883gydF4y2Ba	.891gydF4y2Ba	.883gydF4y2Ba
DistilBERTgydF4y2Ba^ggydF4y2Ba	.932gydF4y2Ba	.918gydF4y2Ba	.925gydF4y2Ba	.913gydF4y2Ba		.934gydF4y2Ba	.923gydF4y2Ba	.364gydF4y2Ba		.312gydF4y2Ba	巨人队gydF4y2Ba	.904gydF4y2Ba		.901gydF4y2Ba	.904gydF4y2Ba	.902gydF4y2Ba
伯特gydF4y2Ba	.933gydF4y2Ba	.927gydF4y2Ba	.930gydF4y2Ba	.913gydF4y2Ba		.940gydF4y2Ba	.926gydF4y2Ba	.387gydF4y2Ba		下来gydF4y2Ba	.312gydF4y2Ba	.909gydF4y2Ba		.903gydF4y2Ba	.909gydF4y2Ba	.905gydF4y2Ba
罗伯塔gydF4y2Ba	.933gydF4y2Ba	.931gydF4y2Ba	.932gydF4y2Ba	.919gydF4y2Ba		.941gydF4y2Ba	.930gydF4y2Ba	原始素材gydF4y2Ba		.269gydF4y2Ba	.317gydF4y2Ba	.912gydF4y2Ba		.906gydF4y2Ba	.912gydF4y2Ba	.909gydF4y2Ba
XML-RoBERTagydF4y2Ba	.941gydF4y2Ba	.932gydF4y2Ba	.936gydF4y2Ba	.923gydF4y2Ba		.936gydF4y2Ba	.929gydF4y2Ba	.341gydF4y2Ba		.319gydF4y2Ba	对于brutegydF4y2Ba	.911gydF4y2Ba		.910gydF4y2Ba	.911gydF4y2Ba	.911gydF4y2Ba

^{一个gydF4y2Ba}P:精度。gydF4y2Ba

^bgydF4y2Ba接待员:召回。gydF4y2Ba

^cgydF4y2BaAcc:准确性。gydF4y2Ba

^dgydF4y2BaMNB:多项式Naïve贝叶斯。gydF4y2Ba

^egydF4y2BaRF:随机森林。gydF4y2Ba

^fgydF4y2Ba支持向量机:支持向量机。gydF4y2Ba

^ggydF4y2BaBERT:来自变压器的双向编码器表示。gydF4y2Ba

我们观察到，不同经典或基于变压器的模型之间的性能差异很小;为了了解这些差异是否具有统计学意义，我们进行了统计学显著性检验。我们对二元分类任务(即任务2)使用McNemar检验，对任务1和任务3使用Bowker检验。有关这项测试的详情，请参阅[gydF4y2Ba 41gydF4y2Ba］．从…中可以看出gydF4y2Ba 图6gydF4y2Ba-gydF4y2Ba 8gydF4y2Ba，我们的研究结果表明，在所有任务中，变压器和其他模型之间的测试结果在统计上有显著差异。单元格中的值表示gydF4y2Ba PgydF4y2Ba值，淡黄色表示有统计学意义(gydF4y2Ba PgydF4y2Ba< . 05)。在经典算法中，测试结果的差异并不显著。同样，在基于变压器的模型中，结果很低，这也反映在不同任务的总体F1分数上。gydF4y2Ba

模型在不同任务上的表现差异可能与每个任务中涵盖的评审类别(即，积极的、消极的、中性的和技术问题)有关。例如，在三元分类任务1中，考虑了正面、负面和技术问题3个类别，由于负面评价和突出技术问题的评价有相似之处，所以绩效较低。同样，在二元分类Task 2中，当消极问题类和技术问题类合并为一个类时，性能显著提高。另一方面，在三元分类任务3中，由于中性类样本数量较少，性能下降。gydF4y2Ba

图6gydF4y2Ba

任务1的不同方法比较的统计显著性(McNemar)检验结果。BERT:变压器的双向编码器表示;MNB:多项式Naïve贝叶斯;RF:随机森林;支持向量机:支持向量机。gydF4y2Ba

图7gydF4y2Ba

任务2的不同方法比较的统计显著性(McNemar)检验结果。BERT:变压器的双向编码器表示;MNB:多项式Naïve贝叶斯;RF:随机森林;支持向量机:支持向量机。gydF4y2Ba

图8gydF4y2Ba

任务3的不同方法比较的统计显著性(McNemar)检验结果。BERT:变压器的双向编码器表示;MNB:多项式Naïve贝叶斯;RF:随机森林;支持向量机:支持向量机。gydF4y2Ba

潜在快速分析和反馈工具的仪表板gydF4y2Ba

为了方便不同的利益相关者(即建议的用户对COVID-19接触追踪应用程序的评论的情感分析仪的用户)，我们还旨在开发一个具有用户友好界面的web应用程序。gydF4y2Ba 图9gydF4y2Ba提供潜在情绪分析器web应用程序的仪表板的屏幕截图。在当前的实现中，如图所示，web应用程序提供了正面、负面、中性和技术评论的分布，并提供了搜索功能来分析用户对特定应用程序的反馈。值得一提的是，通过在相关数据集上训练模型，所提议的工具可以扩展到其他医疗保健应用。gydF4y2Ba

图9gydF4y2Ba

基于提议的解决方案的潜在工具的屏幕截图。gydF4y2Ba

讨论gydF4y2Ba 主要研究结果gydF4y2Ba

COVID-19患者的接触者追踪是全球公认的控制感染率的最有效方法之一。然而，现有机制存在一些局限性。手动追踪接触者是一个繁琐且耗时的过程。此外，很难跟踪患者的所有潜在接触者。数字解决方案，如使用移动应用程序，一直被认为是一种有前途的解决方案，通过它可以快速追踪和通知患者的联系人。但是，在应用程序的工作机制和性能方面存在一些问题。这项工作揭示了COVID-19接触追踪应用程序的不同方面、优点、缺点以及用户对这些应用程序的担忧。gydF4y2Ba

我们的发现表明，通过移动应用程序追踪接触者的想法或倡议受到了全球人们的高度赞赏。除了接触者追踪外，这些应用程序在执行和确保COVID-19公共政策方面也很有用。然而，对于应用程序的工作机制和有效性也存在一些担忧。在这方面，分析用户对这些应用程序的评论有助于更好地了解和纠正对这些应用程序的关注。gydF4y2Ba

我们观察到，大多数的评论都属于3类，即积极的、消极的和技术问题。另一方面，很少有中立的评论被观察到。通过GPS跟踪和应用程序访问图库和其他信息的隐私是主要问题。此外，世界各地的这些应用程序的绝大多数用户都不满意这些应用程序的高功耗。大多数用户在使用这些应用程序时还面临一些技术问题。一些关键的技术问题包括设备兼容性、注册、更新缓慢、连接问题以及缺乏对某些语言的支持(如英语)。另一个重要的观察是，负面、正面、中性和技术性问题的分布可能会随着时间的推移而变化。gydF4y2Ba

就人工智能模型的性能而言，在用户评论的情感分析中，所有模型的整体性能都有所提高，可以更快地高效分析用户对应用程序的响应。在这项工作中用于情感分析的模型中，变形金刚是最有效的。这表明人工智能和NLP技术在自动分析COVID-19接触者追踪应用方面的有效性。gydF4y2Ba

结论gydF4y2Ba

本文重点对COVID-19接触者追踪手机应用的使用评论进行情感分析，分析用户对这些应用的反应。为了实现这一目标，管道由多个阶段组成，如数据收集;通过众包活动进行注释;以及用于情感分析的AI模型的开发、训练和评估。现有文献大多依赖于人工或探索性分析用户对应用程序的评论，这是一个繁琐和耗时的过程。此外，在现有的研究中，一般来说，分析的数据来自较少的应用程序。在这项工作中，我们展示了自动情感分析如何帮助更快地分析用户对应用程序的响应。此外，我们还提供了一个由来自46个不同应用程序的34,534个评论组成的大规模基准数据集。我们相信提出的分析和数据集将支持未来关于该主题的研究。gydF4y2Ba

我们相信，将数据集作为基线可以进行许多有趣的应用和分析。时间分析和局部分析是今后研究的重点。gydF4y2Ba

缩写gydF4y2Ba

人工智能gydF4y2Ba

伯特gydF4y2Ba

来自变压器的双向编码器表示gydF4y2Ba

毫升gydF4y2Ba

机器学习gydF4y2Ba

MNBgydF4y2Ba

多项式Naïve贝叶斯gydF4y2Ba

PNgydF4y2Ba

正面或负面gydF4y2Ba

并通过gydF4y2Ba

积极的、消极的或中性的gydF4y2Ba

PNTgydF4y2Ba

积极、消极和技术问题gydF4y2Ba

射频gydF4y2Ba

随机森林gydF4y2Ba

支持向量机gydF4y2Ba

本文由卡塔尔国家研究基金(卡塔尔基金会成员)的国家优先研究计划(NPRP)资助号[13S-0206-200273]得以发表。在此所作的声明完全是作者的责任。gydF4y2Ba

没有宣布。gydF4y2Ba

1gydF4y2Ba

KucharskigydF4y2Ba

AJgydF4y2Ba

KlepacgydF4y2Ba

PgydF4y2Ba

ConlangydF4y2Ba

来自自由克什米尔gydF4y2Ba

KisslergydF4y2Ba

SMgydF4y2Ba

唐gydF4y2Ba

毫升gydF4y2Ba

弗莱gydF4y2Ba

HgydF4y2Ba

高格gydF4y2Ba

小gydF4y2Ba

埃德蒙兹gydF4y2Ba

WJgydF4y2Ba

CMMID COVID-19工作组gydF4y2Ba

隔离、检测、接触者追踪和保持物理距离在不同环境下减少SARS-CoV-2传播的有效性:一项数学建模研究gydF4y2Ba

柳叶刀感染病gydF4y2Ba 2020gydF4y2Ba 10gydF4y2Ba 20.gydF4y2Ba 10gydF4y2Ba 1151gydF4y2Ba 1160gydF4y2Ba

10.1016 / s1473 - 3099 (20) 30457 - 6gydF4y2Ba

32559451gydF4y2Ba

s1473 - 3099 (20) 30457 - 6gydF4y2Ba

PMC7511527gydF4y2Ba

2gydF4y2Ba

WetsmangydF4y2Ba

NgydF4y2Ba

联系人追踪应用承诺很大，但没有兑现gydF4y2Ba

边缘gydF4y2Ba 2020gydF4y2Ba 12gydF4y2Ba 11gydF4y2Ba

2021-01-27gydF4y2Ba

https://www.theverge.com/22168473/coronavirus-contact-tracing-apps-exposure-notification-covid-google-apple.com/y3a83l65gydF4y2Ba

3.gydF4y2Ba

RekanargydF4y2Ba

KgydF4y2Ba

奥基夫gydF4y2Ba

红外gydF4y2Ba

巴克利gydF4y2Ba

年代gydF4y2Ba

阿巴斯gydF4y2Ba

米gydF4y2Ba

比切姆gydF4y2Ba

年代gydF4y2Ba

ChochlovgydF4y2Ba

米gydF4y2Ba

菲茨杰拉德gydF4y2Ba

BgydF4y2Ba

格林gydF4y2Ba

lgydF4y2Ba

约翰逊gydF4y2Ba

KgydF4y2Ba

LaffeygydF4y2Ba

JgydF4y2Ba

McNicholasgydF4y2Ba

BgydF4y2Ba

NuseibehgydF4y2Ba

BgydF4y2Ba

奥康奈尔gydF4y2Ba

JgydF4y2Ba

奥基夫gydF4y2Ba

DgydF4y2Ba

奥卡拉汉gydF4y2Ba

米gydF4y2Ba

RazzaqgydF4y2Ba

一个gydF4y2Ba

理查森gydF4y2Ba

我gydF4y2Ba

SimpkingydF4y2Ba

一个gydF4y2Ba

StornigydF4y2Ba

CgydF4y2Ba

TsvyatkovagydF4y2Ba

DgydF4y2Ba

沃尔什gydF4y2Ba

JgydF4y2Ba

威尔士gydF4y2Ba

TgydF4y2Ba

巴克利gydF4y2Ba

JgydF4y2Ba

对HSE Covid-19接触者追踪应用程序用户反馈的情感分析gydF4y2Ba

红外医学科学gydF4y2Ba 2022gydF4y2Ba 02gydF4y2Ba 191gydF4y2Ba 1gydF4y2Ba 103gydF4y2Ba 112gydF4y2Ba

10.1007 / s11845 - 021 - 02529 - ygydF4y2Ba

33604836gydF4y2Ba

10.1007 / s11845 - 021 - 02529 - ygydF4y2Ba

PMC7891483gydF4y2Ba

4gydF4y2Ba

SinhagydF4y2Ba

PgydF4y2Ba

帕特森gydF4y2Ba

AEgydF4y2Ba

联系人追踪:“大型科技公司”能来拯救吗?如果可以，代价是什么?gydF4y2Ba

EClinicalMedicinegydF4y2Ba 2020gydF4y2Ba 07gydF4y2Ba 24gydF4y2Ba 100412gydF4y2Ba

10.1016 / j.eclinm.2020.100412gydF4y2Ba

32766536gydF4y2Ba

s2589 - 5370 (20) 30156 - 5gydF4y2Ba

PMC7293963gydF4y2Ba

5gydF4y2Ba

参加gydF4y2Ba

RgydF4y2Ba

不分伯仲gydF4y2Ba

WgydF4y2Ba

NurtaygydF4y2Ba

一个gydF4y2Ba

肯德尔gydF4y2Ba

米gydF4y2Ba

WymantgydF4y2Ba

CgydF4y2Ba

大厅gydF4y2Ba

米gydF4y2Ba

LythgoegydF4y2Ba

KgydF4y2Ba

克鲁兹gydF4y2Ba

一个gydF4y2Ba

赵gydF4y2Ba

lgydF4y2Ba

斯图尔特gydF4y2Ba

一个gydF4y2Ba

Ferretti)gydF4y2Ba

lgydF4y2Ba

帕克gydF4y2Ba

米gydF4y2Ba

MerouehgydF4y2Ba

一个gydF4y2Ba

马赛厄斯gydF4y2Ba

BgydF4y2Ba

史蒂文森gydF4y2Ba

年代gydF4y2Ba

蒙特gydF4y2Ba

DgydF4y2Ba

沃伦gydF4y2Ba

JgydF4y2Ba

马瑟gydF4y2Ba

NKgydF4y2Ba

芬克尔斯坦gydF4y2Ba

一个gydF4y2Ba

Abeler-DornergydF4y2Ba

lgydF4y2Ba

BonsallgydF4y2Ba

DgydF4y2Ba

弗雷泽gydF4y2Ba

CgydF4y2Ba

数字联系人追踪应用程序的有效配置:向NHSX报告gydF4y2Ba

谈话gydF4y2Ba 2020gydF4y2Ba 04gydF4y2Ba 16gydF4y2Ba

2022-04-23gydF4y2Ba

https://cdn.theconversation.com/static_files/files/1009/Report_-_Effective_App_Configurations.pdf?1587531217gydF4y2Ba

6gydF4y2Ba

ShahrozgydF4y2Ba

米gydF4y2Ba

艾哈迈德gydF4y2Ba

FgydF4y2Ba

尤尼斯gydF4y2Ba

女士gydF4y2Ba

艾哈迈德gydF4y2Ba

NgydF4y2Ba

布洛斯卡gydF4y2Ba

锰gydF4y2Ba

VinuesagydF4y2Ba

RgydF4y2Ba

QadirgydF4y2Ba

JgydF4y2Ba

COVID-19数字接触追踪应用程序和技术:初步部署后回顾gydF4y2Ba

交通运输工程gydF4y2Ba 2021gydF4y2Ba 09gydF4y2Ba 5gydF4y2Ba 100072gydF4y2Ba

10.1016 / j.treng.2021.100072gydF4y2Ba

7gydF4y2Ba

亚伯gydF4y2Ba

JgydF4y2Ba

支持者gydF4y2Ba

米gydF4y2Ba

BuermeyergydF4y2Ba

UgydF4y2Ba

ZillessengydF4y2Ba

HgydF4y2Ba

COVID-19接触者追踪和数据保护可以同时进行gydF4y2Ba

JMIR Mhealth UhealthgydF4y2Ba 2020gydF4y2Ba 04gydF4y2Ba 20.gydF4y2Ba 8gydF4y2Ba 4gydF4y2Ba e19359gydF4y2Ba

10.2196/19359gydF4y2Ba

32294052gydF4y2Ba

v8i4e19359gydF4y2Ba

PMC7173240gydF4y2Ba

8gydF4y2Ba

弗朗哥gydF4y2Ba

米gydF4y2Ba

罗德里格斯gydF4y2Ba

BgydF4y2Ba

杀手gydF4y2Ba

CgydF4y2Ba

ScheidgydF4y2Ba

EJgydF4y2Ba

De CarligydF4y2Ba

一个gydF4y2Ba

GassmanngydF4y2Ba

一个gydF4y2Ba

SchonbachlergydF4y2Ba

DgydF4y2Ba

斯蒂勒gydF4y2Ba

BgydF4y2Ba

WeTrace:一种保护隐私的跟踪方法gydF4y2Ba

通信与网络杂志gydF4y2Ba 2021gydF4y2Ba 10gydF4y2Ba 23gydF4y2Ba 5gydF4y2Ba 374gydF4y2Ba 389gydF4y2Ba

10.23919 / jcn.2021.000021gydF4y2Ba

9gydF4y2Ba

奥特曼gydF4y2Ba

年代gydF4y2Ba

庆祝活动gydF4y2Ba

lgydF4y2Ba

ZillessengydF4y2Ba

HgydF4y2Ba

BlasonegydF4y2Ba

RgydF4y2Ba

GerdongydF4y2Ba

FgydF4y2Ba

巴赫gydF4y2Ba

RgydF4y2Ba

Kreuter如此说道gydF4y2Ba

FgydF4y2Ba

NosenzogydF4y2Ba

DgydF4y2Ba

ToussaertgydF4y2Ba

年代gydF4y2Ba

亚伯gydF4y2Ba

JgydF4y2Ba

基于应用程序的COVID-19接触追踪的可接受性:跨国调查研究gydF4y2Ba

JMIR Mhealth UhealthgydF4y2Ba 2020gydF4y2Ba 08gydF4y2Ba 28gydF4y2Ba 8gydF4y2Ba 8gydF4y2Ba e19857gydF4y2Ba

10.2196/19857gydF4y2Ba

32759102gydF4y2Ba

v8i8e19857gydF4y2Ba

PMC7458659gydF4y2Ba

10gydF4y2Ba

GarousigydF4y2Ba

VgydF4y2Ba

切割gydF4y2Ba

DgydF4y2Ba

镶嵌地块gydF4y2Ba

米gydF4y2Ba

挖掘COVID接触追踪应用程序的用户评论:对九个欧洲应用程序的探索性分析gydF4y2Ba

J系统软件gydF4y2Ba 2022gydF4y2Ba 02gydF4y2Ba 184gydF4y2Ba 111136gydF4y2Ba

10.1016 / j.jss.2021.111136gydF4y2Ba

34751198gydF4y2Ba

s0164 - 1212 (21) 00233 - 8gydF4y2Ba

PMC8566091gydF4y2Ba

11gydF4y2Ba

KrizhevskygydF4y2Ba

一个gydF4y2Ba

SutskevergydF4y2Ba

我gydF4y2Ba

辛顿gydF4y2Ba

通用电气gydF4y2Ba

基于深度卷积神经网络的ImageNet分类gydF4y2Ba

Commun。ACMgydF4y2Ba 2017gydF4y2Ba 05gydF4y2Ba 24gydF4y2Ba 60gydF4y2Ba 6gydF4y2Ba 84gydF4y2Ba 90gydF4y2Ba

10.1145 / 3065386gydF4y2Ba

12gydF4y2Ba

JoulingydF4y2Ba

一个gydF4y2Ba

坟墓gydF4y2Ba

EgydF4y2Ba

BojanowskigydF4y2Ba

PgydF4y2Ba

MikolovgydF4y2Ba

TgydF4y2Ba

高效文本分类的技巧包gydF4y2Ba

2017gydF4y2Ba

第十五届计算语言学协会欧洲分会会议gydF4y2Ba

2017年4月gydF4y2Ba

瓦伦西亚,西班牙gydF4y2Ba

10.18653 / v1 / e17 - 2068gydF4y2Ba

13gydF4y2Ba

DevlingydF4y2Ba

JgydF4y2Ba

常gydF4y2Ba

米gydF4y2Ba

李gydF4y2Ba

KgydF4y2Ba

ToutanovagydF4y2Ba

KgydF4y2Ba

BERT:用于语言理解的深度双向变压器预训练gydF4y2Ba

出来了。gydF4y2Ba 预印本于2018年10月11日在线发布gydF4y2Ba

14gydF4y2Ba

拉蒂夫gydF4y2Ba

年代gydF4y2Ba

乌斯曼gydF4y2Ba

米gydF4y2Ba

ManzoorgydF4y2Ba

年代gydF4y2Ba

伊克巴尔gydF4y2Ba

WgydF4y2Ba

QadirgydF4y2Ba

JgydF4y2Ba

泰森gydF4y2Ba

GgydF4y2Ba

卡斯特罗gydF4y2Ba

我gydF4y2Ba

RazigydF4y2Ba

一个gydF4y2Ba

布洛斯gydF4y2Ba

米gydF4y2Ba

韦勒gydF4y2Ba

一个gydF4y2Ba

Crowcroft说gydF4y2Ba

JgydF4y2Ba

利用数据科学对抗COVID-19:全面综述gydF4y2Ba

IEEE反式。Artif。智能gydF4y2Ba 2020gydF4y2Ba 8gydF4y2Ba 1gydF4y2Ba 1gydF4y2Ba 85gydF4y2Ba 103gydF4y2Ba

10.1109 / TAI.2020.3020521gydF4y2Ba

15gydF4y2Ba

GharavigydF4y2Ba

EgydF4y2Ba

NazemigydF4y2Ba

NgydF4y2Ba

DadgostarigydF4y2Ba

FgydF4y2Ba

使用推特数据进行主动危机管理的早期爆发检测:美国COVID-19案例研究gydF4y2Ba

出来了。gydF4y2Ba 预印本于2020年5月1日在线发布gydF4y2Ba

16gydF4y2Ba

QayyumgydF4y2Ba

一个gydF4y2Ba

艾哈迈德gydF4y2Ba

KgydF4y2Ba

AhsangydF4y2Ba

妈gydF4y2Ba

Al-FuqahagydF4y2Ba

一个gydF4y2Ba

QadirgydF4y2Ba

JgydF4y2Ba

面向医疗保健的协作联邦学习:前沿的多模式COVID-19诊断gydF4y2Ba

出来了。gydF4y2Ba 预印本于2021年1月19日在线发布gydF4y2Ba

17gydF4y2Ba

哈米德gydF4y2Ba

一个gydF4y2Ba

ShiekhgydF4y2Ba

NgydF4y2Ba

说gydF4y2Ba

NgydF4y2Ba

艾哈迈德gydF4y2Ba

KgydF4y2Ba

居尔gydF4y2Ba

一个gydF4y2Ba

哈桑gydF4y2Ba

lgydF4y2Ba

Al-FuqahagydF4y2Ba

一个gydF4y2Ba

使用图神经网络和NLP技术在社交媒体中检测假新闻:一个COVID-19用例gydF4y2Ba

出来了。gydF4y2Ba 预印本于2020年11月30日在线发布gydF4y2Ba

18gydF4y2Ba

爆炸gydF4y2Ba

YgydF4y2Ba

石井gydF4y2Ba

EgydF4y2Ba

CahyawijayagydF4y2Ba

年代gydF4y2Ba

霁gydF4y2Ba

ZgydF4y2Ba

冯gydF4y2Ba

PgydF4y2Ba

ChakrabortygydF4y2Ba

TgydF4y2Ba

蜀gydF4y2Ba

KgydF4y2Ba

伯纳德gydF4y2Ba

人力资源gydF4y2Ba

刘gydF4y2Ba

HgydF4y2Ba

艾克塔gydF4y2Ba

年代gydF4y2Ba

新型冠状病毒肺炎假新闻检测模型概括gydF4y2Ba

在紧急情况下，用地区语言打击网上敌对帖子gydF4y2Ba 2021gydF4y2Ba

可汗、瑞士gydF4y2Ba

施普林格国际出版gydF4y2Ba

19gydF4y2Ba

睫毛gydF4y2Ba

RRgydF4y2Ba

多诺万gydF4y2Ba

简历gydF4y2Ba

FleischauergydF4y2Ba

在gydF4y2Ba

摩尔gydF4y2Ba

zgydF4y2Ba

哈里斯gydF4y2Ba

GgydF4y2Ba

海斯gydF4y2Ba

年代gydF4y2Ba

沙利文gydF4y2Ba

米gydF4y2Ba

威尔gydF4y2Ba

一个gydF4y2Ba

昂gydF4y2Ba

JgydF4y2Ba

莱特gydF4y2Ba

DgydF4y2Ba

华盛顿gydF4y2Ba

RgydF4y2Ba

PulliamgydF4y2Ba

一个gydF4y2Ba

拜尔gydF4y2Ba

BgydF4y2Ba

麦克劳林gydF4y2Ba

惠普gydF4y2Ba

DirlikovgydF4y2Ba

EgydF4y2Ba

玫瑰gydF4y2Ba

达gydF4y2Ba

WalkegydF4y2Ba

HTgydF4y2Ba

HoneingydF4y2Ba

妈gydF4y2Ba

接触者追踪评估小组gydF4y2Ba MoonangydF4y2Ba

PKgydF4y2Ba

OeltmanngydF4y2Ba

我gydF4y2Ba

2020年6月至7月，北卡罗来纳州两个县的COVID-19接触者追踪gydF4y2Ba

MMWR Morb凡人Wkly代表gydF4y2Ba 2020gydF4y2Ba 09gydF4y2Ba 25gydF4y2Ba 69gydF4y2Ba 38gydF4y2Ba 1360gydF4y2Ba 1363gydF4y2Ba

10.15585 / mmwr.mm6938e3gydF4y2Ba

32970654gydF4y2Ba

PMC7727500gydF4y2Ba

20.gydF4y2Ba

MbungegydF4y2Ba

EgydF4y2Ba

将新兴技术整合到COVID-19接触者追踪:机遇、挑战和陷阱gydF4y2Ba

糖尿病代谢综合征gydF4y2Ba 2020gydF4y2Ba 11gydF4y2Ba 14gydF4y2Ba 6gydF4y2Ba 1631gydF4y2Ba 1636gydF4y2Ba

10.1016 / j.dsx.2020.08.029gydF4y2Ba

32892060gydF4y2Ba

s1871 - 4021 (20) 30332 - 5gydF4y2Ba

PMC7833487gydF4y2Ba

21gydF4y2Ba

LalmuanawmagydF4y2Ba

年代gydF4y2Ba

侯赛因gydF4y2Ba

JgydF4y2Ba

ChhakchhuakgydF4y2Ba

lgydF4y2Ba

机器学习和人工智能在新冠肺炎大流行中的应用综述gydF4y2Ba

混沌孤子分形gydF4y2Ba 2020gydF4y2Ba 10gydF4y2Ba 139gydF4y2Ba 110059gydF4y2Ba

10.1016 / j.chaos.2020.110059gydF4y2Ba

32834612gydF4y2Ba

s0960 - 0779 (20) 30456 - 2gydF4y2Ba

PMC7315944gydF4y2Ba

22gydF4y2Ba

艾哈迈德gydF4y2Ba

NgydF4y2Ba

米其林gydF4y2Ba

类风湿性关节炎gydF4y2Ba

雪gydF4y2Ba

WgydF4y2Ba

RujgydF4y2Ba

年代gydF4y2Ba

MalaneygydF4y2Ba

RgydF4y2Ba

KanheregydF4y2Ba

党卫军gydF4y2Ba

SeneviratnegydF4y2Ba

一个gydF4y2Ba

胡gydF4y2Ba

WgydF4y2Ba

JanickegydF4y2Ba

HgydF4y2Ba

杰哈gydF4y2Ba

SKgydF4y2Ba

COVID-19接触者追踪应用程序调查gydF4y2Ba

IEEE访问gydF4y2Ba 2020gydF4y2Ba 8gydF4y2Ba 134577gydF4y2Ba 134601gydF4y2Ba

10.1109 / access.2020.3010226gydF4y2Ba

23gydF4y2Ba

BengiogydF4y2Ba

YgydF4y2Ba

使役动词gydF4y2Ba

DgydF4y2Ba

简达gydF4y2Ba

RgydF4y2Ba

JarviegydF4y2Ba

米gydF4y2Ba

Prud’hommegydF4y2Ba

BgydF4y2Ba

卢梭gydF4y2Ba

JgydF4y2Ba

沙玛gydF4y2Ba

一个gydF4y2Ba

余gydF4y2Ba

YgydF4y2Ba

去中心化联系人追踪应用固有的隐私限制gydF4y2Ba

美国医学信息协会gydF4y2Ba 2021gydF4y2Ba 01gydF4y2Ba 15gydF4y2Ba 28gydF4y2Ba 1gydF4y2Ba 193gydF4y2Ba 195gydF4y2Ba

10.1093 /地点/ ocaa153gydF4y2Ba

32584990gydF4y2Ba

5862635gydF4y2Ba

PMC7337846gydF4y2Ba

24gydF4y2Ba

ReichertgydF4y2Ba

lgydF4y2Ba

分等gydF4y2Ba

年代gydF4y2Ba

本篇报告gydF4y2Ba

BgydF4y2Ba

保护隐私的COVID-19患者接触者追踪gydF4y2Ba

IACR密码学ePrintgydF4y2Ba 2020gydF4y2Ba

2022-04-23gydF4y2Ba

https://eprint.iacr.org/2020/375.pdfgydF4y2Ba

25gydF4y2Ba

聪明的gydF4y2Ba

NPgydF4y2Ba

密码变得简单gydF4y2Ba 2016gydF4y2Ba

可汗、瑞士gydF4y2Ba

出版公司gydF4y2Ba

26gydF4y2Ba

李gydF4y2Ba

JgydF4y2Ba

郭gydF4y2Ba

XgydF4y2Ba

COVID-19接触追踪应用程序:关于全球部署和挑战的调查gydF4y2Ba

出来了。gydF4y2Ba 预印本于2020年5月7日在线发布gydF4y2Ba

27gydF4y2Ba

赵gydF4y2Ba

HgydF4y2Ba

使役动词gydF4y2Ba

DgydF4y2Ba

余gydF4y2Ba

YWgydF4y2Ba

COVID-19的接触追踪移动应用程序:隐私考虑因素和相关权衡gydF4y2Ba

出来了。gydF4y2Ba 预印本于2020年3月25日在线发布gydF4y2Ba

28gydF4y2Ba

奥卡拉汉gydF4y2Ba

我gydF4y2Ba

巴克利gydF4y2Ba

JgydF4y2Ba

菲茨杰拉德gydF4y2Ba

BgydF4y2Ba

约翰逊gydF4y2Ba

KgydF4y2Ba

LaffeygydF4y2Ba

JgydF4y2Ba

McNicholasgydF4y2Ba

BgydF4y2Ba

NuseibehgydF4y2Ba

BgydF4y2Ba

奥基夫gydF4y2Ba

DgydF4y2Ba

奥基夫gydF4y2Ba

我gydF4y2Ba

RazzaqgydF4y2Ba

一个gydF4y2Ba

RekanargydF4y2Ba

KgydF4y2Ba

理查森gydF4y2Ba

我gydF4y2Ba

SimpkingydF4y2Ba

一个gydF4y2Ba

阿贝丁gydF4y2Ba

JgydF4y2Ba

StornigydF4y2Ba

CgydF4y2Ba

TsvyatkovagydF4y2Ba

DgydF4y2Ba

沃尔什gydF4y2Ba

JgydF4y2Ba

威尔士gydF4y2Ba

TgydF4y2Ba

格林gydF4y2Ba

lgydF4y2Ba

爱尔兰共和国对COVID-19数字接触追踪的态度进行了全国调查gydF4y2Ba

红外医学科学gydF4y2Ba 2021gydF4y2Ba 08gydF4y2Ba 16gydF4y2Ba 190gydF4y2Ba 3.gydF4y2Ba 863gydF4y2Ba 887gydF4y2Ba

10.1007 / s11845 - 020 - 02389 - ygydF4y2Ba

33063226gydF4y2Ba

10.1007 / s11845 - 020 - 02389 - ygydF4y2Ba

PMC7561439gydF4y2Ba

29gydF4y2Ba

艾哈迈德gydF4y2Ba

KgydF4y2Ba

阿拉姆gydF4y2Ba

FgydF4y2Ba

QadirgydF4y2Ba

JgydF4y2Ba

QolomanygydF4y2Ba

BgydF4y2Ba

汗gydF4y2Ba

我gydF4y2Ba

汗gydF4y2Ba

TgydF4y2Ba

SulemangydF4y2Ba

米gydF4y2Ba

说gydF4y2Ba

NgydF4y2Ba

HassagydF4y2Ba

深圳gydF4y2Ba

居尔gydF4y2Ba

一个gydF4y2Ba

Al-FuqahagydF4y2Ba

一个gydF4y2Ba

用户对COVID-19接触者追踪应用程序评论情绪分析的基准数据集gydF4y2Ba

哈佛DataversegydF4y2Ba 2021gydF4y2Ba

2021-05-04gydF4y2Ba

https://dataverse.harvard.edu/dataset.xhtml?persistentId=doi:10.7910/DVN/1RDRCMgydF4y2Ba

30.gydF4y2Ba

科诺菲尔gydF4y2Ba

米gydF4y2Ba

RatkiewiczgydF4y2Ba

JgydF4y2Ba

旧金山gydF4y2Ba

米gydF4y2Ba

GoncalvesgydF4y2Ba

BgydF4y2Ba

MenczergydF4y2Ba

FgydF4y2Ba

FlamminigydF4y2Ba

一个gydF4y2Ba

推特上的政治两极分化gydF4y2Ba

网络和社交媒体国际AAAI会议论文集gydF4y2Ba 2021gydF4y2Ba 5gydF4y2Ba 1gydF4y2Ba 89gydF4y2Ba 96gydF4y2Ba

31gydF4y2Ba

ChowdhurygydF4y2Ba

SAgydF4y2Ba

穆巴拉克gydF4y2Ba

HgydF4y2Ba

AbdelaligydF4y2Ba

一个gydF4y2Ba

荣格gydF4y2Ba

年代gydF4y2Ba

詹森gydF4y2Ba

BJgydF4y2Ba

SalminengydF4y2Ba

JgydF4y2Ba

一种多平台阿拉伯语新闻评论数据集，用于攻击性语言检测gydF4y2Ba

第十二届语言资源与评估会议论文集gydF4y2Ba 2020gydF4y2Ba 6203gydF4y2Ba 6212gydF4y2Ba

32gydF4y2Ba

张gydF4y2Ba

HgydF4y2Ba

朴素贝叶斯的最优性gydF4y2Ba

第十七届国际佛罗里达人工智能研究学会会议论文集gydF4y2Ba 2004gydF4y2Ba

33gydF4y2Ba

赫斯特gydF4y2Ba

米gydF4y2Ba

杜迈gydF4y2Ba

年代gydF4y2Ba

OsunagydF4y2Ba

EgydF4y2Ba

普拉特gydF4y2Ba

JgydF4y2Ba

ScholkopfgydF4y2Ba

BgydF4y2Ba

支持向量机gydF4y2Ba

IEEE智能。系统。他们达成gydF4y2Ba 1998gydF4y2Ba 7gydF4y2Ba 13gydF4y2Ba 4gydF4y2Ba 18gydF4y2Ba 28gydF4y2Ba

10.1109/5254.708428gydF4y2Ba

34gydF4y2Ba

SammutgydF4y2Ba

CgydF4y2Ba

韦伯gydF4y2Ba

胃肠道gydF4y2Ba

随机森林gydF4y2Ba

机器学习和数据挖掘百科全书gydF4y2Ba 2017gydF4y2Ba

波士顿gydF4y2Ba

施普林格gydF4y2Ba

35gydF4y2Ba

说gydF4y2Ba

NgydF4y2Ba

艾哈迈德gydF4y2Ba

KgydF4y2Ba

格尔gydF4y2Ba

米gydF4y2Ba

PogorelovgydF4y2Ba

KgydF4y2Ba

哈桑gydF4y2Ba

lgydF4y2Ba

艾哈迈德gydF4y2Ba

NgydF4y2Ba

ConcigydF4y2Ba

NgydF4y2Ba

社交媒体和卫星图像中的自然灾害探测:一项调查gydF4y2Ba

Multimed Tools应用gydF4y2Ba 2019gydF4y2Ba 7gydF4y2Ba 17gydF4y2Ba 78gydF4y2Ba 22gydF4y2Ba 31267gydF4y2Ba 31302gydF4y2Ba

10.1007 / s11042 - 019 - 07942 - 1gydF4y2Ba

36gydF4y2Ba

修梅克gydF4y2Ba

PHAgydF4y2Ba

CovoesgydF4y2Ba

特遣部队gydF4y2Ba

多平台、多语言假新闻检测gydF4y2Ba

专家系统与应用gydF4y2Ba 2020gydF4y2Ba 11gydF4y2Ba 158gydF4y2Ba 113503gydF4y2Ba

10.1016 / j.eswa.2020.113503gydF4y2Ba

37gydF4y2Ba

刘gydF4y2Ba

YgydF4y2Ba

奥特gydF4y2Ba

米gydF4y2Ba

GoyalgydF4y2Ba

NgydF4y2Ba

杜gydF4y2Ba

JgydF4y2Ba

JoshigydF4y2Ba

米gydF4y2Ba

陈gydF4y2Ba

DgydF4y2Ba

莱维gydF4y2Ba

OgydF4y2Ba

刘易斯gydF4y2Ba

米gydF4y2Ba

ZettlemoyergydF4y2Ba

lgydF4y2Ba

StoyanovgydF4y2Ba

VgydF4y2Ba

一种稳健优化的BERT预训练方法gydF4y2Ba

aXiv。gydF4y2Ba 预印本于2019年7月26日在线发布gydF4y2Ba

38gydF4y2Ba

山gydF4y2Ba

VgydF4y2Ba

首次亮相gydF4y2Ba

lgydF4y2Ba

ChaumondgydF4y2Ba

JgydF4y2Ba

狼gydF4y2Ba

TgydF4y2Ba

蒸馏酒，蒸馏版的蒸馏酒，更快，更便宜，更轻gydF4y2Ba

出来了。gydF4y2Ba 预印本于2019年10月2日在线发布gydF4y2Ba

39gydF4y2Ba

BojanowskigydF4y2Ba

PgydF4y2Ba

坟墓gydF4y2Ba

EgydF4y2Ba

JoulingydF4y2Ba

一个gydF4y2Ba

MikolovgydF4y2Ba

TgydF4y2Ba

用子词信息丰富词向量gydF4y2Ba

TACLgydF4y2Ba 2017gydF4y2Ba 12gydF4y2Ba 5gydF4y2Ba 135gydF4y2Ba 146gydF4y2Ba

10.1162 / tacl_a_00051gydF4y2Ba

40gydF4y2Ba

狼gydF4y2Ba

TgydF4y2Ba

首次亮相gydF4y2Ba

lgydF4y2Ba

山gydF4y2Ba

VgydF4y2Ba

ChaumondgydF4y2Ba

JgydF4y2Ba

DelanguegydF4y2Ba

CgydF4y2Ba

莫伊gydF4y2Ba

一个gydF4y2Ba

CistacgydF4y2Ba

PgydF4y2Ba

RaultgydF4y2Ba

TgydF4y2Ba

LoufgydF4y2Ba

RgydF4y2Ba

FuntowiczgydF4y2Ba

米gydF4y2Ba

戴维森gydF4y2Ba

JgydF4y2Ba

SchleifergydF4y2Ba

年代gydF4y2Ba

冯滚筒gydF4y2Ba

PgydF4y2Ba

妈gydF4y2Ba

CgydF4y2Ba

JernitegydF4y2Ba

YgydF4y2Ba

并不gydF4y2Ba

JgydF4y2Ba

徐gydF4y2Ba

CgydF4y2Ba

Le ScaogydF4y2Ba

TgydF4y2Ba

贵港市gydF4y2Ba

年代gydF4y2Ba

德拉姆gydF4y2Ba

米gydF4y2Ba

左手gydF4y2Ba

问gydF4y2Ba

冲gydF4y2Ba

我gydF4y2Ba

Huggingface的变形金刚:最先进的自然语言处理gydF4y2Ba

出来了。gydF4y2Ba 预印本于2019年10月9日在线发布gydF4y2Ba

10.18653 / v1/2020.emnlp-demos.6gydF4y2Ba

41gydF4y2Ba

霍夫曼gydF4y2Ba

杰gydF4y2Ba

特谢拉gydF4y2Ba

射频gydF4y2Ba

分类和交叉分类数据:McNemar's和Bowker's检验，Kolmogorov-Smirnov检验，ConcordgydF4y2Ba

医学和生物医学从业者基础生物统计学gydF4y2Ba 2019gydF4y2Ba

纽约斯克内克塔迪gydF4y2Ba

史黛西MasuccigydF4y2Ba

233gydF4y2Ba 247gydF4y2Ba