医学杂志互联网研究——值得信赖的健康相关的微博社交媒体在沙特阿拉伯:微博元数据分析

原始论文

¹计算机科学和信息系统,利默里克大学的利默里克,爱尔兰

²计算机和信息科学、艺术与科学学院Taibah大学Al-Ula,沙特阿拉伯

³爱尔兰软件研究中心、Lero利默里克大学的利默里克,爱尔兰

通讯作者:

Yahya Albalawi, MSc

计算机科学和信息系统

利默里克大学

Tierney建筑

利默里克,V94 NYD3

爱尔兰

电话:353 3724分机61213028

电子邮件:yahalbalawi@gmail.com

背景:社会媒体平台健康信息的传播中扮演着重要的角色。然而,证据表明,高比例的推文(tweet)不一定是准确的,许多研究表明,微博不需要准确的,或者至少是基于证据的,接受牵引。这是一个危险的组合在卫生信息领域。

摘要目的:本研究的首要目标是检查与健康有关的tweet来自沙特阿拉伯的准确性。第二个目标是找到的因素与这些tweet的准确性和传播,从而使识别的方法提高传播准确的tweet。最初来自本研究的发现和方法论的改进将被部署在一个大规模的研究,将更详细地解决这些问题。

方法:健康的词汇被用来提取与健康有关的微博使用Twitter的应用程序编程接口和结果进一步手动过滤。总共有300条每个标签由两个医生;医生同意,109条是准确或不准确的。采取了其他措施从这些tweet的元数据来看看是否有什么关系的措施和准确性或传播的tweet。整个范围的元数据分析使用Python版本3.6.5 (Python软件基金会),回答研究问题。

结果:共有34的109条(31.2%)在本研究中使用的数据集被归类为不值得信赖的健康信息。这些主要来自用户与非卫生保健的背景和社交媒体账户,没有相应的物理(即组织)表现。不出所料,我们发现传统的值得信赖的健康来源更容易推比其他用户准确的健康信息。同样,这些结果显示微博发布在早晨晚上比微博更值得信赖的发布,分别可能对应于正式和休闲的帖子。我们的研究结果还表明,群众很擅长识别可信赖的信息来源,就是明证的次数一条微博的作者是标记为受欢迎的的社区。

结论:结果表明一些最初令人吃惊的因素可能与微博及其传播的准确性。例如,推特发布时间与它的准确性,这可能反映了不同专业(即上午)和爱好者(即晚上)的微博。更令人吃惊的是,微博包含kashida-a装饰元素在阿拉伯语写作用来证明文本内线路通过转发更容易传播。这些研究结果将进一步评估使用数据分析技术在未来的工作更大的数据集。

J地中海互联网Res 2019; 21 (10): e14731

doi: 10.2196/14731

关键字

社交媒体; 新媒体; 错误信息; 诚信; 传播; 健康传播

背景

近年来,已经有显著增长在全球个人通信技术的吸收。这在很大程度上提供了社交媒体的广泛可用性(SM)和增加促进了手机的所有权。SM已经成为一个有价值的工具,用于通信和应用在许多领域,如教育(1)、市场营销(2,健康传播(3]。例如,在卫生领域的交流,美国疾病控制和预防中心(CDC) (4)在美国和当地卫生部门(5)使用Twitter流行期间的人交流。另一个例子是来自英国和挪威,地方卫生当局使用Twitter告知其公民在西非埃博拉疫情于2014年和2015年(6]。

SM的使用可以改善健康传播的本质,因为它加速了卫生保健组织之间的相互作用,专业人士,和病人(3]。因此,各种SM平台和应用程序可以在健康传播中扮演着重要的角色,在促进健康7]。尽管SM可能提供对健康传播的优势,也面临一些挑战。例如,一个健康危机期间,政府只有有限的时间有效地响应和通知人,同时帮助消除不确定性的话题。如果这不会立即发生,更有可能是谣言传播,通过SM可能;当这种情况发生时,SM的负面影响,如混乱和错误的信息,可能结果(8]。

说明性的例子包括经历的负面影响沙特阿拉伯和非洲国家在中东埃博拉病毒和呼吸道综合征即爆发。在沙特阿拉伯,SM谣言阻止一些人去急诊时在急性病症,导致取消他们的外科手术9]。在非洲,谣言被发现在SM,喝大量的盐水治疗埃博拉病毒;据报道,这可能导致了一些人的死亡10]。值得注意的是,这些错误的问题似乎影响发展中国家更深入;研究表明,4.5%的推文(tweet)在美国是误导11),然而,欧尼尔et al (10)发现证据表明50%的推文在西非是误导。

三个不同的研究对健康和不同类型的用户报道,Twitter是卫生专业人员的首选平台12),医学生(13),和糖尿病患者14]。另外,大多数健康相关研究SM专注于讲英语的人口和美国(15,16),而不是其他文化。具体来说,Hagg et al (17]报道缺乏文学分析SM数据用于健康在中东地区。这是特别令人惊讶,因为Statista最新统计数据表明,沙特拥有世界第四高的Twitter用户(18]。此外,当评估Twitter用户之间的比例和数量为每个国家(19),沙特阿拉伯在Twitter上拥有最多的用户相对于其人口。这些发现也支持由其他研究人员报道了Twitter的使用在沙特阿拉伯的患病率升高20.,21]。话虽这么说,只有一个study-Alnemer et al分析沙特健康微博22]。

考虑到可能的文化差异之间的Twitter使用在西方和中东地区,似乎重要的评估与健康有关的微博一个中东国家。鉴于Twitter使用率在沙特阿拉伯,这似乎是一个合适的选择。因此,本研究只关注沙特阿拉伯。

而许多推特特征已经评估了SM的信息的准确性,在这方面感兴趣的最重要的特征被推的来源。凭直觉,人们会预计,来自卫生专业人员的微博将更值得信赖;然而,这是一个悬而未决的问题。一项由Alnemer et al (22)发现,50%的沙特卫生专业人员的微博没有证据基础。此外,本研究只包括微博发布的账户有超过45000的粉丝。追随者的相对较高的数量表明,这些账户持有人可能被认为是意见领袖在他们的领域的专业知识,在这种情况下,是健康。

这些发现问题的准确性卫生专业人员的微博,这是一个令人担忧的结果考虑,人们通常更容易信任用户医生,健康组织,和药剂师(23- - - - - -27]。虽然这些来源是可信的,证据表明,他们并不一定可信(即准确);Alnemer et al (22]表明,即使是传统信任的来源,有一个高的可能性,其中包括不准确(即不可靠的)信息。

一些方法和工具对SM检测错误,特别是在健康危机,提出了和通常专注于特定的主题和疾病(如埃博拉病毒和Zika病毒)28,29日]。他们通常努力识别错误的特点,而忽视的因素表明值得信赖的tweet。

在这项研究中,微博被认为是值得信赖的,如果他们是准确的和被认为是不可靠的,如果他们是不准确的。这个职位类似于阴等(30.]国家,一个网站是值得信赖的如果它提供了正确的信息,和信息可能是正确的,如果它是由一个值得信任的网站。同样,赵et al (31日),他建立了一个主题模型来估计在Twitter上新闻的可信度,定义了一个值得信赖的tweet,指的是事情发生了。同样,本文认为推特是值得信赖的如果它包含准确的健康信息和评估的过程,介绍了微博的准确性的方法部分。

来看我们的工作是专注于确定的因素与健康信息的可信度tweet的因素以及影响这些tweet的传播。为了确定已开展这项工作如何有效地面向SM值得信赖的健康信息的传播。

我们评估tweet来自传统的诚信值得信赖的健康来源和检查之间的关系属性(> 100)的推特和它的可信度。

微博不需要准确的或基于证据的获得牵引力。在他们的研究中,Nastasi et al (32)指出,科学准确的健康微博用户以同样的方式作为精确的微博转发。工作还表示需要研究微博的传播指标为了找到因素与高传播。因此,第二个目标,我们将评估的因素与更大的健康传播tweet。

之前的工作

SM Facebook的数据,Instagram、YouTube和Twitter被用来理解人们的态度和行为在共享和使用相关信息到特定的健康问题,如疫苗、堕胎、创伤后压力和癌症(33- - - - - -38]。Facebook已经被私人健康利益相关者和政府机构与公众参与(39,40];通过分析研究提供了理解Facebook的时间表(40)在Facebook上和健康机构的帐户(39]。

虽然Facebook是最受欢迎的整体平台,最受欢迎的SM平台研究健康是Twitter [41- - - - - -43),通过研究包括在不同的系统评价健康和社交媒体相关的话题44- - - - - -47]。这种关注可能是由于Facebook的数据的复杂性和不可用由于隐私限制(41]。

在Twitter上最健康研究收集数据通过使用特定的关键词(28,29日,48- - - - - -52)或从微博由特定的健康利益相关者,如卫生组织(5,22,53- - - - - -58]。然而,大多数研究使用特定的关键词分析Twitter对健康没有发布tweet的用户的类型分析28,29日,48- - - - - -52];众所周知从其他研究有不同类型的用户和他们分享不同类型的信息或特定的健康问题持有不同的态度59- - - - - -62年]。例如,许多研究执行微博使用关键字提取识别公众关切Zika病毒暴发期间(48- - - - - -52]。除了限制在一个特定的爆发,这些研究没有分析公众关切之间的相互作用和类型的用户,没有地址的因素做一个tweet值得信赖。

一个值得关注的研究与健康有关的微博用阿拉伯语是由Alnemer et al (22),手动分析微博的准确性由预选健康账户。他们的研究结果表明,政府机构更容易推准确的信息比其他卫生专业人员或机构(如医生、营养师和非政府和非官方的卫生机构)。他们报告说,80%的观察到政府机构的微博由精确的健康信息,其次是医生(60%)。然而,微博的整体精度,在所有观察到的账户,是50%。这些发现表明,即使SM用户有健康专家,它不能理所当然地认为他们的tweets提供准确的健康信息。这条线的调查可以很容易地扩展到nonhealth用户。Alnemer et al (22)并没有检验的特点可能与它的可信度的一条微博。

在诚信方面,分类器的数量与健康有关的微博用英语。例如,Ghenai和Mejova58)提出了一个分类器来检测健康传言在Twitter上局限于Zika病毒。本研究的一个限制是分类器的训练是有限数量的谣言,确定外部非sm网站上的信息。此外,注解标签误导的微博没有健康专家。在另一项研究中,Ghenai和Mejova29日)关注用户发微博或传播错误信息的检测癌症,不包括社会机器人和组织的帐户。

然而,社会机器人也被认为是健康的一个可能原因错误SM (63年,64年]。例如,Allem et al (64年]分析了微博对烟的讨论,发现社会机器人可能支持错误信息在SM由于电子烟戒烟。在他们的研究中,他们强调的重要性,区分社会机器人和真实用户。类似于Allem et al (64年],Broniatowski [63年]分析了微博专门了解机器人促进网络健康内容关于与疫苗相关的信息,发现社会机器人的一个可能的来源对SM反对疫苗接种的建议。

如上建议,SM社会机器人和错误信息,以往的研究强调了区分社会机器人和真实用户的重要性,特别是当用户持有的目的是评估的观点不是机器人(64年,65年]。然而,这不是一项容易的任务,因为一些社会机器人可能会模仿用户行为(66年]。社会机器人可能自我介绍与位置和照片的个人账户资料(64年,66年]。此外,一些组织使用社交机器人来传播信息,这使得它很难区分的机器人的意见或者他们的组织和分类根据他们的组织可能是困难的67年,68年]。在这里介绍的工作,用户被列为他们自我介绍,分类,分析了信息描述的准确性。

Kalyanam et al (28]分析了标签和消息的可信度之间的联系与埃博拉病毒疫情。他们可靠的微博定义为那些标签表明起源从著名的政府机构或其他权威来源(例如,#疾控中心或# cnn)和投机推那些标签显示的传播恐惧,谣言,诈骗,或幽默。这是决定,几乎25%的分析微博是投机。他们的研究结果表明,验证用户更有可能与可信的标签;平均账户,发布微博的粉丝数量与可信的标签是7000,比2700年与投机账户,发布微博标签的数据集。Kalyanam等依靠标签,没有评价的信息由tweet。,目前尚不清楚微博分为可信真的包含准确的或值得信赖的信息。

识别方面有影响力的用户在SM, Albalawi和Sixsmith69年]应用六种不同的工具来识别在沙特阿拉伯最具影响力的Twitter用户。首先,他们使用了应用Tweepar SocialBaker,揭示了最有影响力的用户在Twitter上每个国家。确定的有影响力的用户,他们整理四个Twitter分数通过以下影响:社会权威Moz [70年],PeerIndex [71年),基米-雷克南72年],Klout [73年]。然而,他们的研究范围内,他们没有考虑卫生隔离和他们没有分析消息的准确性。

黄等人[5]分析了微博发送的287名当地卫生部门(方面)在埃博拉疫情在美国。他们发现70%的铲运机在推特上至少一次对埃博拉病毒和Twitter已经成为一个频繁使用的工具方面在这个特定的流行。关于微博的传播,他们的发现之一是,标签和链接的存在是高度相关的消息被转发。同样,Suh et al (74年包含标签和链接)也报道,消息更容易被转发。他们没有考虑用户推荐的类型的影响。此外,分析了微博在随机选择的话题,与卫生保健领域无关。

研究结果总结在这一节中表明,缺乏全面的研究的准确性在SM与健康有关的微博。具体来说,我们最好的知识,没有结果,确定在一般健康相关微博值得信赖的因素,除了它是由一个可信的机构。此外,没有研究的一般因素影响值得信赖的传播与健康有关的微博,除了作者的可信度和标签和链接的存在。我们相信,这些因素可能有助于健康的识别组织更好的传播在霍乱健康危机数占与霍乱疫情相关的值得信赖的信息。特别是,缺乏研究与健康有关的微博用阿拉伯语;这使得这样一个研究重点,考虑到高流行的Twitter在阿拉伯世界。

因此,本文中给出的工作解决以下问题:

卫生保健的可信度如何利益相关者的推文被识别从微博的特征吗?
1. 什么比例的值得信赖的健康tweet来自下列来源:健康专家,健康组织,和政府?
2. 与值得信赖的健康相关的微博相关的其他特征是什么?
是什么因素导致医疗卫生相关的微博的广泛传播,可能被用来作出准确的健康信息主导/ SM的其他相关信息?
1. 的值得信赖的自然与健康有关的微博增加传播?
2. 什么其他因素导致医疗卫生相关的微博的传播吗?

本文的结构如下。首先,介绍了经验设计识别可信度和传播的影响因素与健康有关的微博。第二,它展示了我们的工作成果和突出,尤其是发现对应于上述研究问题。最后,本文通过讨论结束我们的研究的未来发展方向和可能的影响结果。

概述

这项工作使用一个标准的文本分析方法,包含以下步骤:

我们开发了一个健康词典使用两种不同的方法。
通过健康的词典,我们提取健康微博使用Twitter的应用程序编程接口(API)。
从剩下的推文,我们手工精制微博相关健康使用两个注释。
医务人员手动标记剩下的tweet准确或不准确的。
我们从标签数据集特征提取。这些包括tweet的属性以及属性的用户配置文件的用户编写的tweet。在本文,只有聚合用户数据提出了道德原因。
我们分析了标签数据集提供初步的答案在前一节中列出的研究问题。

概述了方法提出了图1。接下来的小节详细解释每一个步骤。

建设健康的词汇

为了确定与健康有关的微博,一个卫生创建词典。重要的是要注意,象征健康的不正确的选择关键词可能偏差的结果75年]。因此,两个独立的分析方法被用来生成这个词汇。第一个方法是问三个医生积极Twitter账户提供100个卫生相关的单词。我们问的医生是熟练的在不同的学科和不同于彼此的年龄,背景,和性别。他们被要求提供一个初始的与健康有关的单词列表,他们认为将被用于微博与健康有关。第二种方法涉及使用110卫生保健的关键字是独立的语言学的注释器拥有大学学位。作为本研究集中于沙特阿拉伯,这些关键字标识的注释器通过检查一组微博与地理位置显示一个沙特阿拉伯的起源,虽然使地理位置的人可能代表一个特定的人群(76年,77年]。因此,选择的单词注释器可能有限的普遍性对更广泛的人群。因此,注释器还回顾了健康账户和标签来识别不同的与健康有关的词汇。关键字的完整列表附加多媒体附录1。

这两种方法相结合,试图构建一个健康尽可能公正的词汇。

数据清理

使用词典发达如前一节所述,当时可能提取Twitter数据为我们工作的主要部分。Twitter API不允许用户提取微博一周多老78年]。减少这种局限性的影响,这是决定我们将抽取两个数据集。第一个数据集提取5月18日,2018年,于2018年8月7日,第二个数据集。表1描述每个数据集的特征。

表1。数据集的特性。

特征	第一个数据集,n (%)	第二个数据集,n (%)
总微博	209345 (100)	196670 (100)
原创微博	57794 (27.61)	39454 (20.06)
回复微博	28329 (13.53)	32470 (16.51)
转发微博	123222 (58.86)	124746 (63.43)

回复微博被注释器难以评估,由于缺乏上下文信息。因此,这些信息已清除。也需要删除所有转发微博由于冗余。

tweet提取过程导致的积累97248微博:57794年从39454年第一个数据集,从第二个。使用随机方法在Python中,版本3.6.5 (Python软件基金会),2800条样本从集合中选择使用一个原型的研究。尽管词汇建议所有的97248条健康相关,tweet的手动检查表明,未必是这样。因此,两个注释器是用来过滤掉无关的微博健康样本的2800条推讯。注释器的指导方针如下:

微博描述身体的任何函数,如酶、器官,或疾病,应该保留。
推给建议或补充信息,药品,体育活动,或食物和链接到人们的健康,比如维生素、食物、和药物影响人们的健康,应该保留。

基于一个内部讨论本研究的三位作者中,这些指导方针由Bobicey Sokolova本体的个人健康信息(79年]。术语来自概念的本体和被认为是所有三个作者最象征与健康有关的材料。

每个注释器标记tweet的60%,以10%的tweet (n = 280)标记的注释器为了检查的可靠性分析。科恩kappa统计评分者间信度(80年)计算,导致.872的价值,这表明优秀的注释器之间的协议。

只出2800条,552条(19.71%)贴上健康相关。的552条,180条(32.6%)来自第一个数据集选择,除了120条(21.7%)来自第二个数据集。通过这样做,可以为我们保留在原来的比例推收集的数据集。

诚信的分类

一旦前面的流程已经完成,10医生被要求手动分类推分为以下几类:

准确的健康信息。
不准确的健康信息。
不确定的准确性。

的不确定选择是给医生为了避免迫使他们做出决定在微博如果他们没有足够的相关健康知识准确地评估他们或者微博是模棱两可的。

共有10个谷歌形式出现,每个都包含30个tweet。每个表单的链接是通过电子邮件发送给两位医生。为了实现高可靠性的准确性和不准确,我们排除了任何医生贴上的tweet不确定。此外,我们排除了任何微博两医生编码他们不同意他们的准确性。这导致109电子表格中的标记tweet, 75(68.8%)被标记为可信赖的(即微博这两个医生贴上准确)和34(31.2%)的被标记为不可靠的(即微博这两个医生贴上不准确)。然后转移到一个电子表格的信息并为描述性统计分析使用Python。对于统计测试,我们使用R包,版本3.4.0 (R基金会)81年]。中说明了此过程的输出图2。

图2。值得信赖的比例(n = 75)和不可靠的(n = 34)推109年样本的标记,与健康有关的微博。

特征提取

概述

回答研究问题,它是必要的,以确定微博的特点以及他们的诚信水平。微博的特点是分为两种类型:微博功能和用户功能。

这些特性,是否在用户级或推水平,可能提供有用的数据类型分类的用户或识别的可信度为不同的主题(微博82年- - - - - -86年]。

微博功能

直接从推特微博特征提取。其中包括tweet是否转发(即作为传播措施)以及各种微博的语言特征,如单词的数量和每个tweet中的字符数。推特微博的特性还包括其他属性,比如url包含在推特,推特的时候,和标签。大部分的这些特性已经被其他研究人员使用;然而,语言特征识别在大多数其他研究Latin-derived话语进行了分析。因此,更多的功能被添加在回顾文献有关阿拉伯语自然语言处理。这些特性如下:

Tashkeel:存在Tashkeel tweet。tashkeel是一种特殊的阿拉伯语字符写在文本表示失踪元音[87年]。
Kashida:存在Kashida tweet。kashida装饰元素在阿拉伯语写作用于证明文本(88年]。

此外,类似于卡斯蒂略等(82年),我们研究了不同类型的标点符号在微博信息可信度和他们的关系。这是基于我们的洞察力,那些使用标点符号出现在他们的微博更彻底,这可能与更大的准确性和传播有关。

提供微博功能的完整列表多媒体附录2。

用户功能

概述

微博与元数据来提供基本概要信息的用户发布微博,比如屏幕名称、朋友的数量,数量的追随者,最喜欢数、转发数,和年龄的帐户。此外,还有累积微博特征为每个用户。获得这些数据,我们使用Twitter API来提取另一个200条/作者的作者109标记的微博。200年的微博数量被认为是足够的为提取用户特性(83年,89年]。用户特征被分为四组,将在以下小节中描述。提供这些功能的完整列表多媒体附录2。

活动和连通性的特点

这些特性包括指标衡量活跃用户,如用户回复其他用户或多久多久用户转发(86年]。

用户语言特性

这些特性包括措施通常用户如何使用独特的标签,标签中使用微博的平均数量,词的平均数量在用户的tweet。这样的语言特征已经被用于其他研究来评估信息的可信度在Twitter上(82年在SM[]和对用户进行分类83年,90年]。

用户时间特性

这些特性的处理时间方面用户的tweet。例如,先前的研究检查了星期一天微博发布时确定与新闻的可信度(82年]。本文的研究中,添加了更多的功能,如首选天早上,晚上,晚上用户微博和推特发布是否在工作日或周末(91年]。

用户普及特性

这些特性显示用户的普及,如追随者的数量每用户以及多长时间用户的推文被转发(86年]。

帐户分类

账户分类根据以下标准(53,59,61年,62年,69年,92年]:

帐户持有人有医疗背景吗?
个人或集团的账户吗?
如果帐户持有人是力,账户代表一个物理权威还是一个专门SM-based账户?

因此,结束的这个过程,这是预期,以下类别的用户帐户可以分析:

个人医疗帐户。
个人nonhealth账户。
卫生组织账户。
Nonhealth组织账户。
专门SM-based账户。
用户的配置文件不能被提取,因此仍然未知。

两个注释器分类数据集的类型的微博账户和不同意作者基于7个用户。他们遇到了来解释自己的观点。最后,讨论后,他们同意这七个用户的五类。健康传播的专家对SM咨询过医生与健康促进新媒体分类博士学位最后的两个用户。此外,大约有10个账户的配置文件数据无法提取;这些账户被归类为未知的。

数据分析

兰开斯特et al (93年]建议的执行一个试点研究应该主要依赖于描述性和分布统计信息的结果。为连续变量,它是决定现在的中位数号码,作为中位数不受异常值影响。为分类变量,它是决定采用统计检验来确定初步结果。我们的非参数数据,Mann-Whitney-Wilcoxon (MWW)测试是用来建立统计学意义。MWW测试被认为是适合的非参数数据,当两个样本来自不同人群(例如,在我们的案例中,精确的微博和不准确的tweet)和大小不同的94年]。

对于分类变量,Fisher精确检验也使用,适用于小样本的不到1000 (94年]。这里介绍的研究中,有两个分类变量超过两个值:作者的类型和时代微博贴了。通常,Fisher精确检验不测试列联表的统计显著性大于2×2;然而,在R可以计算P值较大的应急表),因此使用R。的机制,允许计算的P价值是基于Mehat和花瓣的工作95年和克拉克森等96年]。

在本节中,最有希望的结果,这表明也许说明了诚信和值得信赖的因素与健康有关的微博。总的来说,超过100 tweet-level和用户级特性的数据集109推特进行了探讨;这些微博贴上准确和可信或不准确和不值得信任。

tweet-level特征的初步分析表明,值得信赖的健康微博更有可能有一个作者,属于一个列表(例如,一个策划组Twitter账户)(P= . 05)。虽然不显著,值得信赖的推文似乎更容易被别人收藏次数(P= 0。06)。

相比之下,表2表明,靠不住的健康微博更有可能url嵌入(P= 03)。具体来说,24%(8/34)靠不住的tweet的url, 8%(6/75)的值得信赖的tweet。总共4 8例(50%)的url引用不准确的微博新闻网站,而2的8(25%)被称为博客。

表2。最有前途的微博功能来帮助区分tweet的精度水平。

度规	描述	值得信赖的tweet (N = 75)、N (%)	靠不住的tweet (N = 34), N (%)	P价值^一个
url	微博包含一个URL	6 (8)	8 (24)	03
上市	作者是上市	53 (71)	17 (50)	.051
受欢迎的	微博是受欢迎的	46 (61)	14 (41)	06
标签	微博包含一个标签	20 (27)	4 (12)	13。
Tashkeel	微博包含tashkeel	22日(29)	5 (15)	酒精含量
感叹号	微博包含“!”	3 (4)	4 (12)	.20
分号	微博包含”;“	42 (56)	14 (41)	. 21
转发	微博被转发	43 (57)	15 (44)	口径。
Kashida	微博包含kashida	6 (31)	8 (24)	报

^一个P值计算使用Fisher精确检验P≤。05年显示统计学意义。

用户级特性也进行了分析(见表3)。分析揭示了令人担忧的趋势,较低的用户里的数量(F3)更有可能推准确卫生tweet (P<措施)。更令人鼓舞的是,受欢迎的的次数,作者的微博是受欢迎的(FT2)与诚信有关,这表明准确的微博被认为是这样的。有趣的是,作者倾向于转发微博的标签(RMH5)也倾向于推特可信赖的微博,虽然P值不是很明显的在这种情况下(P= 0。06)。

表3。指标的用户微博推特不准确准确的信息和用户信息。

度规	描述	可信赖的tweet,中位数(SD)	靠不住的tweet,中位数(SD)	P价值^一个
F3	里算	75.5 (2517)	891 (12952)	<措施
FT2	次数的作者的微博收藏次数(即最喜爱的作家标签)	281.5 (76054)	46 (2454)	. 01
RMH5	独特的标签数在微博转发的作者	6 (24.2)	1 (26.6)	06
OT3	作者的微博的标签数量	18 (144.4)	6 (64.5)	.09点
1	作者的转发微博,用户提到的其他用户	20 (76.3)	13 (49.7)	.09点
FT6	的原始作者微博发布数量是受欢迎的	55 (60.5)	26日(58.7)	厚
SSI	比原来的帖子作者发布的微博转发的作者	4.51 (61.6)	8.94 (93.8)	厚
MH5	独特的关键字计数标签中设置原始作者微博发布	7 (46.1)	3 (22.9)	.14点
一国	作者上传他们的应答消息的数量	21 (47)	3 (54.1)	.20
RMM5	独特的作者提到在转发微博	7 (26.1)	4 (24)	点
M1	作者提到了其他用户的tweet	18.5 (61.6)	10 (66.6)	.51
FT1	微博受欢迎的作者	179 (1202.6)	83 (14073)	点

^一个P值计算使用Mann-Whitney-Wilcoxon (MWW)测试P≤。05年显示统计学意义。

图3显示了用户特性的箱线图,离群值超出90%的数据排除在外。这个数字表明,可能有其他指标与可信度更大的数据集,例如微博受欢迎的作者(FT1)的原始作者微博发布数量是受欢迎的(FT6),比原来的帖子作者发布的微博转发的作者(SSI)。

图3。箱线图的特性最密切关联与微博的可信度;异常值之外的第90个百分位被排除在外。F3:里;FT1:微博受欢迎的作者数量;FT2:次数,作者的微博都是受欢迎的;FT6:作者的原创微博发布数量是受欢迎的;M1:数量的微博作者提到的其他用户;MH5:独特的关键字计数在标签中设置原始作者微博发布;OT3:作者的微博的标签数量; RM1: number of retweeted tweets by the author where the user mentioned other users; RMH5: hashtag count in tweets that were retweeted by the author; RMM5: unique mentions in retweeted tweets by the author; RP1: number of reply-to tweets posted by the author; SSI: ratio of original tweets posted by the author to tweets retweeted by the author.

按图4,关于时间指标,似乎大多数值得信赖,早上,虽然大多数不值得信任,在傍晚或晚上。相关的费舍尔测试是边缘,P06的价值。然而,当比较只有两个集团——早上tweet和晚上tweets-statistical意义实现的P.04美元的价值。这个结果与我们的洞察力,专业微博发布在白天更非正式的微博发布在夜间。

我们可以看到图5,来源分为组织更有可能推准确的信息,其次是传统上认为是可信的用户来源(即卫生专业人员、卫生部门和卫生组织账户)。然而,只有10微博组织账户,其中一个来自一个组织与医疗无关。总的来说,传统的信任用户数据集被认为是最值得信赖的来源,从他们有34个tweet和只有4个(12%)被认为是不准确的。最值得信赖的类别的数据集包括用户专门SM-based账户。

个人用户的背景考虑时,那些有医疗背景(即卫生专业人员)似乎推准确的健康信息和不太可能推不准确的健康信息(见图6和7);他们发布了29 109条(26.6%)。个人从非卫生保健的背景是核心球员的推文的体积,与18的30(60%)的微博贴上值得信赖。总的来说,然而,他们撰写12 34(35%)的靠不住的tweet,只有18 75(24%)的值得信赖的tweet。

另一个有趣的发现是,专门SM-based账户似乎推更比其他账户类型不准确的健康信息。因此,总而言之,值得信赖的健康账户(即医疗机构和专业医疗保健个人)更有可能推值得信赖的健康信息比其他类型的帐户。个人用户的主要球员的健康信息在SM的体积,但高容量没有与可信度。Fisher精确检验表明之间的统计学意义的类型用户发布了一条微博和推特的准确性(P= .04点)。

图4。分布的准确和不准确的推文每一天的时间在三个类别:上午(6 am-2点),晚上(2)pm10点,和晚上(10 pm-6点)。

图6。分布的准确的作者(可信赖的)与健康有关的微博。esm:专门社交媒体账户;何:卫生组织账户;ih:个人医疗账户;异烟肼:个人nonhealth账户;nho: nonhealth组织账户;unk:不能提取用户的配置文件,因此,仍然未知。

图7。分配不准确的作者(不可信)与健康有关的微博。esm:专门社交媒体账户;何:卫生组织账户;ih:个人医疗账户;异烟肼:个人nonhealth账户;nho: nonhealth组织账户;unk:不能提取用户的配置文件,因此,仍然未知。

解决的问题微博的可信度是否增加他们的传播,转发指标检查。根据Suh et al (74年),转发是Twitter上的信息传播机制的关键。我们的研究结果表明,值得信赖的健康信息更有可能比不准确的健康信息转发,但差异不显著。具体来说,43岁的75例(57%)相比,精确的微博被转发到15的34(44%)不准确的推文被转发。这是符合发现在其他的研究中,发现健康信息不需要准确为了传播(32]。然而,准确的与健康有关的微博转发时,他们更有可能被进一步比不准确的与健康有关的微博转发,如图所示图8。

临时的研究结果表明,微博与嵌入式逗号,列出作者、或标记为喜欢的也与传播(P<措施),如示表4,还列出了其他一些因素我们检查了。唯一的因素,显然counter-indicative传播推特是一个URL的存在,只有5.2%的微博被转发。

表5显示了大部分的流行指标统计显著性。

图8。转发数量准确、可信和准确推在我们的数据集;异常值之外的第90个百分位被排除在外(P= .043)。

表4。特性转发微博与unretweeted tweet。

度规	描述	转发微博(N = 58)、N (%)	Unretweeted tweet (N = 51)、N (%)	P价值^一个
上市	作者是上市	50 (86)	20 (39)	<措施
受欢迎的	微博是受欢迎的	51 (88)	9 (18)	<措施
逗号	微博包含一个逗号	25 (43)	9 (18)	. 01
Kashida	微博包含kashida	22 (38)	9 (18)	02
url	微博包含一个URL	3 (5)	11 (22)	02
Tashkeel	微博包含tashkeel	19 (33)	8 (16)	.04点
推精度	这个微博是精确的	43 (74)	32 (63)	口径。
标签	微博包含一个标签	14 (24)	10 (20)	.64点

^一个P值计算使用Fisher精确检验P<。05年显示统计学意义。

表5所示。指标的用户写道:准确的信息和用户的推文被转发。

度规	描述	转发微博,中位数(SD)	Unretweeted tweet,中位数(SD)	P价值^一个
FT2	的次数,作者的微博是受欢迎的	857.5 (8366)	25 (121)	<措施
TFF	里的追随者比(F1、F3)	81.6 (18950)	1.09 (22728)	<措施
列数	列表,用户数量的成员	29.5 (912.1)	1 (99)	<措施
RT2	作者的其他用户微博转发的数量	79.5 (59.8)	9 (25.5)	<措施
FT6	的原始作者微博发布数量是受欢迎的	77 (61.5)	17 (42.3)	<措施
平方米	提到的作者独特的用户数量	16 (43.1)	3 (23.5)	.052
一国	作者上传他们的应答消息的数量	24.5 (53)	4 (42.2)	。08
SSI	比原来的帖子作者发布的微博转发的作者	3.83 (63.4)	21.11 (87.6)	厚
M1	作者提到了其他用户的tweet	18.5 (67.4)	3 (47.6)	点
1	作者的转发微博,用户提到的其他用户	20 (78.3)	7 (56.2)	点
RT1也	许多作者的微博转发	19.5 (49.1)	7 (54.4)	.14点
OT3	作者的微博的标签数量	20 (142.5)	9 (103)	点

^一个的P值的计算使用Mann-Whitney-Wilcoxon (MWW)测试P<。05年显示统计学意义。

用户功能比里的追随者FT2 (TFF),作者的其他用户微博转发的数量(RT2) FT6、列出数似乎与传播有着紧密的联系,如所示图9。这并不令人惊奇,因为这些功能通常被认为是流行指标。此外,结果显示在表5中,显示用户提到其他用户/海报的tweet (M2)更有可能有自己的微博转发。

图9。箱线图的特性最密切相关的传播;异常值之外的第90个百分位被排除在外。FT2:次数,作者的微博都是受欢迎的;FT6:作者的原创微博发布数量是受欢迎的;M1:数量的微博作者提到的其他用户;作者提到的M2:独特的用户数量;OT3:作者的微博的标签数量;1:转发微博的作者数量用户提到的其他用户;一国:许多作者应答消息发布; RT1: number of tweets that the author retweeted; RT2: number of author’s tweets retweeted by other users; SSI: ratio of original tweets posted by the author to tweets retweeted by the author; TFF: ratio of followers to followees.

主要研究结果

个人健康微博而言,这项研究的结果不同意那些Alnemer et al (22),他们建议50%的微博没有证据基础。然而,Alnemer等标记每条tweet的数据集是准确或不准确的,而在这项研究中,微博,并不是所有的注释器同意被排除在外。这种差异在注释可以解释结果的差异。然而,这一矛盾表明的重要性进行未来的研究来解释这些差别。

在这个初步分析,一组用户与健康信息的准确性被确认,表明值得信赖的健康更容易推特用户值得信赖的健康信息不准确的健康信息。本协会支持的结果Medlock et al (26]。

然而,没有健康的高比例的tweet来自个人背景也被发现是准确的。这个观察表明存在一群值得信赖的SM账户。的隔离群可能通过其他特征的识别。

两个黄等(5和Suh等74年)报道,与标签互动与传播,尽管这项研究没有提供明确的证据证明这样的关系。相反,我们发现更多的用户与其他用户互动(即的次数,作者的微博是受欢迎的[FT2]),更有可能的是,他们的微博是准确的。这一发现表明,值得信赖的用户比其他用户拥有更大的影响力,作为FT2被认为是影响指标(86年]。

有趣的是,准确的数据显示,大多数健康,早上,虽然大多数的不准确,在晚上。这种差异可能发生因为卫生专业人员可能推准确的健康信息在他们工作时,这可能是他们工作的一部分,而不那么可信消息更有可能在晚上非专业人士更有可能给出一个意见。

此外,没有明确的答案是否诚信与传播,因为值得信赖的tweet稍微可能转发。然而,当考虑到转发数,精确的微博更容易被更频繁地转发,如图所示图8。这些初步结果表明,有一个协会之间的可信度和最终传播的tweet。

类似的结果也注意到了Kalyanam et al (28];这就提出了一个问题,为什么值得信赖的微博更有可能更频繁地转发一次转发。一种解释可能是有追随者,可以超过阈值,一旦超过,作者可能有一定影响力的微博转发更多97年]。然而,本研究也Kalyanam et al看着self-retweeting特别。在微博这种做法是常见,比如在用户转发的情况下赢得奖品。令人惊讶的是,微博与嵌入式逗号和kashidas转发,这表明正确的标点符号可能被视作精确性的一个标志。

此外,一些推指标似乎与传播和可信度;例如,tweet嵌入式tashkeel更容易被转发并表示可能的趋势更值得信赖,虽然微博嵌入网址不太可能转发和值得信赖。这些研究结果相抵触的黄等(5),分析特定卫生账户,发现url与传播相关。

关于url引用的来源不准确的消息,我们的研究结果表明,新闻网站是最引用(50%)。这是符合Ghenai Mejova [58),发现新闻网站是最引用来源不准确的tweet (url)的39%。

我们的研究结果,如所示表2和4,建议的语言特征可能与传播和可信度。在一个较高的水平,这可能表明,微博都写的风格也与传播和可信度。在低水平,这些特性是特定于语言的;例如,tashkeel阿拉伯语中使用但不存在于拉丁语言。这种特异性表示需要考虑语言类型在设计任何未来的研究。tashkeel没有测试的意义值得信赖的微博;作为P= 10,为未来的研究应该考虑这些结果。

在未来的工作中,我们将寻求开发一个机器学习模型的分类与健康有关的微博可信或者不可信。要做到这一点,我们的目标是使用一个更大的数据集和评估一组更大的特性预测的有效性。其中的一些功能可能包括用户的语言能力的措施。提取的附加功能也可能需要额外的机器学习模型的开发,模型等话题检测为了测量,例如,用户tweets关于健康的次数。

内部效度

由于有限的数据大小,这项研究提供了初步结果变量之间的关系进行了研究。此外,本研究并没有建立任何变量之间的因果关系,只有相关性。

外部效度

本研究中数据的选择是有限的健康微博在Twitter上的阿拉伯语。此外,我们收集微博从有限的时间:7天的两个时期。最后,我们分析了少量的微博,因此,我们不能假定概括本研究的发现。

我们没有包含任何回复微博的分析;因此,我们的研究结果不能推广到交互类型沟通SM(例如,如果用户的帖子直接健康问题给另一个用户)。我们的结果仅指最初的tweet。

虽然我们使用两种方法在发展中一个词典,我们不能说词汇是完全代表的人口。其次,在本研究中,我们只研究了109 300条标记的医生。我们排除了tweet的医生之一是确定的准确性tweet或者两位医生之间有分歧关于微博的准确性。这些措施肯定排除一些健康微博,更令人担忧的是,可能因此排除类健康的微博没有研究。然而,协议并提高数据的质量的准确性。此外,所有20医生参与这项研究作为注释器来自相同的国家,沙特阿拉伯,研究的目标。

结构效度

虽然之间有高度的协议的注释器过滤掉微博与健康,他们没有健康的背景。这意味着nonhealth tweets可以通过这个阶段了。然而,这是解决当医生评估微博健康准确;他们没有确定任何推nonhealth相关。

本研究包括微博的作者分成不同组的分类;然而,个人医疗帐户,卫生组织账户和个人没有外部检查为了测试分类是否正确。

此外,本研究旨在研究微博从沙特用户,特别是在健康发展的词汇,指出该研究的设计。然而,我们不能保证所有的微博有一个沙特的起源。

结论

这项工作的目的是验证方法,以确保它是实际确定的准确性和可信度和传播的相关因素与健康有关的微博;这样做是为了暂时评估因素可能影响值得信赖的tweet和传播的微博。我们的研究结果表明,微博贴上之间可能会有一些明显的区别值得信赖的健康信息和微博贴上靠不住的卫生信息。他们还表明,信任卫生专业人员更有可能推准确的健康信息,虽然只SM-based账户更有可能产生不可靠的tweet。有趣的是,最值得信赖的tweet的早上在推特上,而更多的靠不住的晚上推是推。关于微博的传播,有一些特性,似乎被关联到一个高传播的tweet。这些特性出现在tweet-level和用户级别的分析。

由于数量有限的数据,我们不能有信心在统计预测模型。结果说明,未来的研究使用大型数据集可能会产生一个预测模型为分类tweet可信或者不可信。

确认

我们要感谢Shahat尤瑟夫Albalawi和哈立德博士对他们有价值的建议。此外,我们感谢所有的医生参与的过程评估健康微博在这项研究。这项工作是支持的,在某种程度上,Taibah大学Al-Ula,沙特阿拉伯和爱尔兰科学基金会的资助(格兰特数量:13 / RC / 2094)。

的利益冲突

没有宣布。

‎

多媒体附录1

研究中使用的关键字的完整列表。

PDF文件(Adobe PDF文件),326 KB

‎

多媒体附录2

微博和用户特性研究中使用。

PDF文件(Adobe PDF文件),205 KB

劳B, Laffey d是Twitter的鸟?J马克建造2011年5月31日,33 (2):183 - 192。(CrossRef]
伊斯坦布尔~圣文亚当m .江泽民L, Twitter在多部件餐厅营销:是一种可行的营销工具吗?J Foodserv总线Res 2016 9月07;20 (5):568 - 578。(CrossRef]
学习SA Hazlett DE,哈里森L,卡罗尔JK,欧文,霍文c .卫生保健的新维度:系统回顾的用途,福利,和社交媒体健康传播的局限性。J地中海互联网Res 2013 4月23日,15 (4):e85燃料(免费的全文][CrossRef][Medline]
骗子B, Glowacki EM, Suran M,哈里斯JK,伯恩哈特JM。内容分析的生活中心推特在2014年的埃博拉暴发聊天。Commun Res代表2016年10月14日,33 (4):349 - 355。(CrossRef]
黄R,哈里斯JK,斯桃波M,伯恩哈特JM。当地卫生部门关于埃博拉发微博:特点和消息传递。J公共卫生等Pract 2017; 23 (2): e16-e24。(CrossRef][Medline]
麦克因尼斯C。“加入Twitter和搅拌”:使用Twitter的公共当局在挪威和英国在2014 - 15埃博拉病毒疫情。Observatorio 2018; 12 (2): 23-46。(CrossRef]
Levac JJ,奥沙利文t .社交媒体和其在健康促进使用。Interdiscip J卫生Sci 2010 2月10;1 (1):47 (免费的全文][CrossRef]
Heldman AB, Schindelar J,韦弗简森-巴顿。社交媒体的参与和公共卫生交流:影响公共卫生组织真正的“社会”。公共卫生牧师2013年6月3;35 (1):13。(CrossRef]
Omrani, Shalhoub美国中东呼吸系统综合症冠状病毒(MERS-CoV):我们能学到什么教训?J Hosp感染2015年11月,91 (3):188 - 196。(CrossRef][Medline]
欧尼尔,Gabarron E,永利r .埃博拉,Twitter,和错误信息:一个危险的组合吗?BMJ 2014年10月14日,349:g6178。(CrossRef][Medline]
咀嚼C, Eysenbach g大流行时代的Twitter:内容分析在2009年甲型H1N1流感爆发的tweet。《公共科学图书馆•综合》2010年11月29日,5 (11):e14118 [免费的全文][CrossRef][Medline]
Alsobayel h .使用社会媒体的专业发展卫生保健专业人员:横断面网络调查。地中海JMIR建造2016 9月12;2 (2):e15 [免费的全文][CrossRef][Medline]
Omair妈,迎宾,Alashgar LM。意识和误解在沙特国王大学的女学生系统性红斑狼疮。风湿病学(Sunnyvale) 2015; 5 (3): 165 (免费的全文][CrossRef]
贾马尔,汗撒,AlHumud Al-Duhyyim, Alrashed M,本Shabr F, et al。协会的网上健康信息寻求行为和自我照顾活动在2型糖尿病患者在沙特阿拉伯。J地中海互联网Res 2015 8月12;17 (8):e196 [免费的全文][CrossRef][Medline]
黄金J, Pedrana AE, Sacks-Davis R, Hellard我,Chang年代,霍华德年代,et al。系统检查的使用在线性健康促进社交网站。BMC公共卫生2011年7月21日,11:583 [免费的全文][CrossRef][Medline]
Capurro D,科尔K,官员MI,乔·J公司T,特纳。社交网站的使用公共卫生实践和研究:一项系统回顾。J地中海互联网Res 2014 3月14,16 (3):e79 [免费的全文][CrossRef][Medline]
Hagg E,库里LM Dahinten VS。新兴的社交媒体使用与健康有关的用途在低收入和中等收入国家:范围审查。Int J地中海通知2018年7月,115:92 - 105。(CrossRef][Medline]
克莱门特j . Statista。2019年8月09年。主要国家基于Twitter用户的数目为2019年7月(百万)网址:https://www.statista.com/statistics/242606/number-of-active-twitter-users-in-selected-countries/[2019-07-18]访问
Worldometers》2019。国家的人口(2019)网址:https://www.worldometers.info/world-population/population-by-country/[2019-07-18]访问
普罗金博加特·l·华盛顿学院。华盛顿特区:华盛顿近东政策研究所;2013年12月09年。沙特阿拉伯的战争在Twitter上网址:https://www.washingtoninstitute.org/policy-analysis/view/saudi-arabias-war-on-twitter[2019-07-19]访问
穆罕默德。沙特twitter的动态。:Mellor N, Rinnawi K,编辑。政治伊斯兰教和全球媒体:宗教身份的界限。英国伦敦:劳特利奇;2016:203 - 218。
Alnemer KA, Alhuzaim WM Alnemer AA, Alharbi BB, Bawazir, Barayyan或者,等。基于健康相关微博的证据吗?审查和分析在Twitter上与健康有关的微博。J地中海互联网Res 2015 10月29日,17 (10):e246 [免费的全文][CrossRef][Medline]
•多诺休JM, Huskamp哈,威尔逊IB Weissman j .老年人应该相信谁最提供处方药信息?是J Geriatr Pharmacother 2009年4月,7 (2):105 - 116 (免费的全文][CrossRef][Medline]
灰色的新泽西,克莱因JD,诺伊斯公关,Sesselberg TS, Cantrill农协。在青春期健康资讯寻求行为:互联网的地方。社科地中海2005年4月;60 (7):1467 - 1478。(CrossRef][Medline]
Hesse BW,纳尔逊德,《GL, Croyle RT, Arora NK,绞刀BK, et al。信任和健康信息的来源:互联网的影响及其对卫生保健提供者的影响:国家趋势调查发现从第一健康信息。地中海拱形实习生2005;165 (22):2618 - 2624。(CrossRef][Medline]
Medlock年代,伊斯拉米年代,民兵M,艺术DL, D, de罗阿SE,等。健康老年人使用互联网的信息寻求行为:一项调查。J地中海互联网Res 2015 1月08年,17 (1):e10 [免费的全文][CrossRef][Medline]
Worsley a感知健康信息来源的可靠性。卫生建造Res 4 1989; (3): 367 - 376。(CrossRef]
Kalyanam J, Velupillai年代,Doan年代,康威M, Lanckriet g . ACM知识发现(KDD)连接健康研讨会在大数据时代21 ACM SIGKDD会议在知识发现和数据挖掘。2015年8月10日。关于埃博拉事实和捏造事实的人:一个基于研究网址:http://eceweb.ucsd.edu/ ~哥特/论文/ KDD_BigCHat_2015.pdf[2019-09-30]访问
Ghenai, Mejova y假治疗。Proc ACM哼第一版2018年11月01交互;2 (CSCW): 1。(CrossRef]
阴X,余汉J, PS。真理在网上发现有多个相互冲突的信息提供者。IEEE反式知识数据Eng 2008 6月12;20 (6):796 - 808。(CrossRef]
陈陆赵L,华T C, Twitter的好帮手的信任模型。第一版Commun 2016年2月15日,76:1-11 [免费的全文][CrossRef]
Nastasi,科比T罐头JK Dredze M,女士,纳n .乳腺癌筛查和社交媒体:内容分析的证据在Twitter上使用和指导意见。J癌症建造2018年6月,33 (3):695 - 702。(CrossRef][Medline]
Altshuler艾尔先生层霍奇金淋巴瘤,普拉格西南。探索堕胎的态度我们青少年和年轻人使用社交媒体。避孕2015年3月,91 (3):226 - 233。(CrossRef][Medline]
本德杰,Jimenez-Marroquin M, Jadad AR。在Facebook上寻求支持:乳腺癌组的内容分析。J地中海互联网Res 2011 3月04,13 (1):e16天(免费的全文][CrossRef][Medline]
戴维斯,安东尼DL,保罗SD。寻求和接受社会支持在Facebook上手术。社科地中海2015年4月;131:40-47 [免费的全文][CrossRef][Medline]
古伯伯詹妮弗,凯雷KE,女子拉詹,佩兰P, Messner M,瑞安·M·使用健康信念模型分析Instagram发布的关于Zika病毒对公共卫生的通信。紧急情况感染说2019年1月,25 (1):179 - 180 (免费的全文][CrossRef][Medline]
施密特,Zollo F, Scala, Betsch C, Quattrociocchi w .极化的疫苗接种在Facebook上辩论。疫苗2018年6月14日,36 (25):3606 - 3612。(CrossRef][Medline]
Salzmann-Erikson M, Hicdurmaz d使用社会媒体个体患有创伤后应激:叙述的定性分析。质量卫生Res 2017年1月,27 (2):285 - 294。(CrossRef][Medline]
巴塔查里亚,Srinivasan P, Polgreen P .社交媒体参与美国联邦卫生机构在Facebook上的分析。BMC医学通知决策Mak 2017 4月21日,17 (1):49免费的全文][CrossRef][Medline]
汉森层子N, K, Mukkamala R,侯赛因,Gronli T,清除h .大社会对公共卫生数据分析:Facebook订婚和性能。18国际会议:《IEEE E-Health网络、应用程序和服务(Healthcom 2016)。纽约:IEEE;2016发表于:IEEE 18国际会议E-Health网络、应用程序和服务(Healthcom 2016);9月14 - 16,2016;德国慕尼黑p。442 - 447。(CrossRef]
黄金Y, J,金刚砂垃圾,垃圾:数据收集、质量评估和报告标准社交媒体数据用于卫生研究,infodemiology和数字疾病检测。J地中海互联网Res 2016 3月26日,18(2):出价(免费的全文][CrossRef][Medline]
阿巴斯MAA Keshava HB,德莱尼CP。更大的图景:选择正确的肥皂盒子有可能与不同的受众目标(医生和病人)从同一平台?结肠直肠杂志2017年9月,30 (4):281 - 290 (免费的全文][CrossRef][Medline]
Kalyanam J,麦基TK。回顾数字监控方法和方法应对处方药物滥用。咕咕叫瘾君子代表2017年9月18;4 (4):397 - 409。(CrossRef]
陈WS,梁啊。使用社交网站的卫生专业人员之间的沟通:系统性回顾。J地中海互联网Res 2018年3月28日,20 (3):e117 [免费的全文][CrossRef][Medline]
唐L, Bie B,公园,智d .社交媒体和新兴传染病的暴发:系统回顾文献。感染控制2018 9月,46 (9):962 - 972。(CrossRef][Medline]
Fung IC,杜克CH,芬奇KC,斯努克KR,曾P,埃尔南德斯AC, et al。埃博拉病毒病和社交媒体:系统回顾。感染控制2016 12月01;44 (12):1660 - 1671。(CrossRef][Medline]
查尔斯·史密斯勒,雷诺兹TL,卡梅隆,康威M,刘呃,奥尔森JM,等。使用社交媒体的疾病监测和疫情管理:一个系统的文献回顾。《公共科学图书馆•综合》2015;10 (10):e0139701 [免费的全文][CrossRef][Medline]
傅K,梁H, Saroha N,谢霆锋那种写法,Ip P, Fung IC。人们如何应对Zika病毒疫情在Twitter上吗?计算内容分析。感染控制2016 12月01;44 (12):1700 - 1702。(CrossRef][Medline]
Glowacki EM, Lazard AJ, Wilcox GB, Mackert M,伯恩哈特JM。确定公众的关切和疾病控制和预防中心在一个健康危机的反应:分析Zika病毒活Twitter聊天。感染控制2016 12月01;44 (12):1709 - 1711。(CrossRef][Medline]
年轻的R,塔米,Dalrymple k . #订婚:使用Twitter聊天构建健康危机期间名义参与空间。通知Commun Soc 2017年3月27日,21 (4):499 - 515。(CrossRef]
米勒M, Banerjee T, Muppalla R, Romine W, Sheth人发微博Zika病毒是什么?一个探索性研究关于其症状,治疗,预防传播,。JMIR公共卫生Surveill 2017 6月19;3 (2):e38 [免费的全文][CrossRef][Medline]
Juric R, Kim我Panneerselvam H, Tesanovic Zika病毒tweet。分析:Hadoop平台可以帮助在全球卫生管理。:学报50夏威夷国际会议系统科学。2017年发表于:50夏威夷国际会议系统科学;2017年1月3 - 6,;Waikoloa村,你好。(CrossRef]
公园H,犹太人的尊称BH,分微博健康传播:健康组织的使用Twitter的健康促进和公众参与。J健康Commun 2016; 21 (2): 188 - 198。(CrossRef][Medline]
Vos SC Buckner毫米。社会媒体信息在一个新兴的健康危机:微博禽流感。J健康Commun 2016; 21 (3): 301 - 308。(CrossRef][Medline]
巴塔查里亚,Srinivasan P, Polgreen P与卫生机构在Twitter上的接触。《公共科学图书馆•综合》2014;9 (11):e112235 [免费的全文][CrossRef][Medline]
那个提单,萨克雷R, Van Wagenen SA,汉森CL,西JH Barnes博士等。使用社会媒体在健康促进:目的,关键绩效指标和评价指标。健康促进Pract 2012年3月,13 (2):159 - 164。(CrossRef][Medline]
Dumbrell D,斯蒂尔r .澳大利亚背景:Twitter和卫生健康组织微博是什么类型的信息?:第46届夏威夷国际会议系统科学学报》上。纽约:IEEE;2013发表于:46夏威夷国际会议系统科学;2013年1月7 - 10,;毛伊岛,嗨7 - 10页。(CrossRef]
Ghenai, Mejova y捕捉Zika病毒发烧:众包和机器学习的应用在Twitter上跟踪健康错误信息。:《IEEE国际会议上医疗信息学(阿)。2017发表于:IEEE国际会议上医疗信息学(ICHI);2017年8月23日,;城市公园,UT p。518 - 518。(CrossRef]
Passerello GL, Hazelwood我,洛瑞·s·使用Twitter来评估精神分裂症和精神病的态度。BJPsych公牛2019年8月,43 (4):158 - 166 (免费的全文][CrossRef][Medline]
草地CZ,唐L,刘w . Twitter消息类型,健康信念,疫苗的态度在加州在2015年麻疹疫情。感染控制2019小君29:1。(CrossRef][Medline]
钟我。一场戒烟运动在Twitter上:了解使用Twitter和确定卫生运动的主要参与者。J健康Commun 2016可能;(5):517 - 526。(CrossRef][Medline]
Stautz K, Bignardi G,荷兰制杜松子酒GJ, Marteau TM。反应在推特上更新酒精指南在英国:一个内容分析。BMJ开放2017年2月28日;7 (2):e015493 [免费的全文][CrossRef][Medline]
Broniatowski哒,贾米森,气,AlKulaib L,陈T,本顿,et al .核武化的健康传播:Twitter机器人和俄罗斯巨魔放大疫苗辩论。公共卫生2018年10月,108 (10):1378 - 1384。(CrossRef][Medline]
Allem J,费拉拉E, Uppu SP,克鲁兹结核病,昂格尔简森-巴顿。烟与社交媒体数据监测:社会机器人,新兴的话题,和趋势。JMIR公共卫生Surveill 2017 12月20;3 (4):e98 [免费的全文][CrossRef][Medline]
贾米森,Broniatowski哒,奎因SC。恶意的演员在Twitter上:公共卫生人员的指导。109年5月,是公共卫生2019 (5):688 - 692。(CrossRef][Medline]
杨K, Varol O,戴维斯CA,费拉拉E, Flammini, Menczer f .武装公众应对社会人工智能机器人。哼Behav紧急情况2019年2月06;生物抛光工艺1 (1):48 - 61。(CrossRef]
霍华德P,伍利年代,卡洛r算法,机器人,和政治沟通在美国2016年大选:自动化的政治沟通的挑战选举法和管理。J Inf抛光工艺Polit 2018 4月11;15 (2):81 - 93。(CrossRef]
爱德华兹C,比蒂AJ,爱德华兹,斯宾塞公关。沟通的感知质量差异Twitterbot和人类代理信息寻求和学习。人类Behav 2016年12月第一版;65:666 - 671。(CrossRef]
Albalawi Y, Sixsmith j .识别Twitter影响健康促进档案在沙特阿拉伯。健康促进Int 2017 6月01;32 (3):456 - 463。(CrossRef][Medline]
社会权力。URL:https://followerwonk.com/social-authority[2019-09-30]访问
PeerIndex。URL:http://peerindex.com[2019-09-30]访问
kr。URL:https://home.kred/[2019-09-30]访问
Klout。URL:https://khoros.com/platform/klout[2019-09-30]访问
Suh B,香港L, Pirolli P,气大肠想转发吗?大规模分析因素影响Twitter网络中转发。:《IEEE第二社会计算国际会议。纽约:IEEE;2010发表于:IEEE第二社会计算国际会议;2010年8月20 - 22日举行,;明尼阿波利斯,MN 20 - 22页。(CrossRef]
金AE,汉森嗯,墨菲J,理查兹AK,杜克J,艾伦农协。在分析Twitter数据方法论的注意事项。中华肿瘤杂志Monogr 2013年12月,2013 (47):140 - 146。(CrossRef][Medline]
格雷厄姆•M Hale SA, Gaffney d在世界是吗?地理位置和语言识别在Twitter。Geogr教授于2014年5月19日,66 (4):568 - 578。(CrossRef]
斯隆L,摩根j .谁微博与他们的位置?了解人口特征之间的关系,使用geoservices和地理标记在Twitter上。《公共科学图书馆•综合》2015;10 (11):e0142209。(CrossRef][Medline]
Twitter开发者。搜索微博网址:https://developer.twitter.com/en/docs/tweets/search/api-reference访问[2018-11-15][WebCite缓存]
Bobicev V, Sokolova m .拇指上下:情绪分析医疗在线论坛。:《2018年实证方法在自然语言处理(EMNLP):社交媒体3日矿业健康应用程序(SMM4H)车间&共享任务。斯特劳斯堡,爸爸:计算语言学协会;2018年10月31日发表于:2018经验方法在自然语言处理(EMNLP):社交媒体3日矿业健康应用程序(SMM4H)车间&共享任务;,2018年10月31-November 4;比利时布鲁塞尔p。22日至26日进行的URL:https://aclweb.org/anthology/w18 - 5906(CrossRef]
科恩加权kappa:定类尺度缩放分歧或部分信贷协议规定。Psychol公牛1968年10月,70 (4):213 - 220。(CrossRef][Medline]
R核心团队。接待员:统计计算的语言和环境。参考指数。奥地利维也纳:R统计计算的基础;2019年7月05。URL:https://cran.r-project.org/doc/manuals/r-release/fullrefman.pdf[2019-09-30]访问
卡斯蒂略C,门多萨M, Poblete Twitter上的信息的可信度。:20国际会议的程序在万维网上。纽约:ACM;2011发表于:20国际万维网会议;2011年4月28日3月1日;印度海德拉巴,p . 675 - 684。(CrossRef]
金,Miano T,咀嚼R,艾格斯M, Nonnemaker j .分类Twitter的用户关于电子烟。JMIR公共卫生Surveill 2017年9月26日,3 (3):e63 [免费的全文][CrossRef][Medline]
莫里斯M,重要的年代,Roseway,霍夫,施瓦茨认为是j .发微博?:理解微博可信度感知。:ACM 2012会议的程序计算机支持的协同工作。纽约:ACM;2012发表于:ACM 2012会议上计算机支持的协同工作;2012年2月11日- 15日;西雅图,华盛顿州p。441 - 450。(CrossRef]
张壮族K,沈H, H .用户在微博传播影响测量。Multimed工具:2016年8月4日,76 (3):3169 - 3185。(CrossRef]
里克尔梅F, Gonzalez-Cantergiani p .测量用户在Twitter上的影响:一项调查。正过程等2016年9月,52 (5):949 - 975。(CrossRef]
El Gayar N,孙CY、编辑。计算语言学、语音和图像处理阿拉伯语。新加坡:世界科学;2017年。
Al-Nazer, Gutub A利用kashida增加阿拉伯语e文高容量隐写术。》:第三届国际会议上网络和系统安全。纽约:IEEE;2009发表于:第三国际会议网络和系统安全;2009年10月19日,;黄金海岸,澳大利亚p。447 - 451。(CrossRef]
茱莉亚,Van Durme b在线社交媒体的个人分析贝叶斯模型。:《29日促进会人工智能(AAAI)会议上人工智能。帕洛阿尔托,CA: AAAI出版社;2015发表于:29日促进会人工智能(AAAI)人工智能大会;2015年1月25 - 30日;奥斯汀,得克萨斯州p。2325 - 2331网址:http://www.cs.jhu.edu/ vandurme /论文/ online-bayesian-models-for-personal-analytics-in-social-media.pdf
施瓦茨哈,Eichstaedt JC, Kern ML, Dziurzynski L,雷蒙斯SM, Agrawal M, et al。个性,性别、年龄和社会媒体的语言:open-vocabulary方法。《公共科学图书馆•综合》2013;8 (9):e73791 [免费的全文][CrossRef][Medline]
李韩L,彝族X, Y, g .影响预测模型对微博在突发公共卫生事件的条目。数据正等2019;3 (2):102 - 115。(CrossRef]
李您正在V, T,勒布年代,福尔摩斯JH,黄金HT, Lepor H, et al。Twitter应对美国预防服务专责小组建议对与前列腺特异性抗原筛查。北大Int 2015年7月,116 (1):65 - 71 (免费的全文][CrossRef][Medline]
兰开斯特,多德年代,威廉姆森公关。试点研究设计和分析:对良好实践的建议。J Eval Pract 2004; 10 (2): 307 - 312。(CrossRef][Medline]
de冬季JCF Dodou d五点李克特项目:与Mann-Whitney-Wilcoxon t测试。Pract评估Res Eval 2010; 15 (11): 1 - 12 (免费的全文]
643年Mehta CR, Patel NR。算法:FEXACT: Fortran子例程的确切概率法无序r×c应急表。ACM反式数学Softw 1986年6月,12 (2):154 - 161。(CrossRef]
克拉克森DB,风扇Y,乔·h·643评论算法:FEXACT:一个算法执行确切概率法在x r c应急表。ACM反式数学Softw 1993; 19 (4): 484 - 488。(CrossRef]
Yoo E,兰德W, Eftekhar M,拉比诺维奇大肠评估信息扩散速度和其决定因素在社交媒体网络人道主义危机。J等歌剧院2016年7月09年;45 (1):123 - 133。(CrossRef]

‎

API:应用程序编程接口

疾病预防控制中心:美国疾病控制和预防中心

外国游客1:数量的追随者

F3:里的数量

FT1:微博受欢迎的作者

FT2:的次数,作者的微博是受欢迎的

FT6:的原始作者微博发布数量是受欢迎的

LDH:当地的卫生部门

M1:作者提到了其他用户的tweet

M2:提到的作者独特的用户数量

即:中东呼吸系统综合症

MH5:独特的关键字计数标签中设置原始作者微博发布

MWW:Mann-Whitney-Wilcoxon

OT3:作者的微博的标签数量

1:作者的转发微博,用户提到的其他用户

RMH5:独特的标签数在微博转发的作者

RMM5:独特的作者提到在转发微博

一国:作者上传他们的应答消息的数量

RT1也:许多作者的微博转发

RT2:作者的其他用户微博转发的数量

SM:社交媒体

SSI:比原来的帖子作者发布的微博转发的作者

TFF:比里的追随者

由G Eysenbach编辑;提交19.05.19;同行评议的JP Allem K路透社;评论作者18.06.19;修订版本收到02.09.19;接受03.09.19;发表08.10.19

这是一个开放分布式根据条知识共享归属许可(https://creativecommons.org/licenses/by/4.0/),它允许无限制的使用、分配、和繁殖在任何媒介,提供原工作,首先发表在《医学网络研究,正确地引用。完整的书目信息,原始发布在//www.mybigtv.com/上的链接,以及这个版权和许可信息必须包括在内。

本文在以下e-collection /主题问题:

值得信赖的健康相关的微博社交媒体在沙特阿拉伯:微博元数据分析