医学互联网研究杂志-推特上的疫苗图像:哪些图像被共享的分析

原始论文

语言与语音处理中心，约翰霍普金斯大学，巴尔的摩，MD，美国

通讯作者:

陈涛，BE，博士

语言和语音处理中心

约翰霍普金斯大学

海克曼大厅226号

北查尔斯街3400号

巴尔的摩，马里兰州，21218

美国

电话:1 410 516 4237

电子邮件:tchen77@jhu.edu

背景:视觉图像在卫生传播中发挥关键作用;然而，人们对疫苗相关图像的哪些方面使其成为有效的传播辅助手段知之甚少。Twitter是讨论疫苗接种相关问题的热门场所，提供了大量与推文共享的图片。

摘要目的:本研究的目的是了解图像如何在疫苗相关的推文中使用，并就疫苗相关图像的特征提供指导，这些特征与被转发的更高可能性相关。

方法:我们从Twitter上收集了超过100万张疫苗图片信息，并使用自动图像分析来描述这些图片的各种属性。我们拟合了一个逻辑回归模型来预测疫苗图像推文是否被转发，从而确定与分享可能性较高相关的特征。为了进行比较，我们为Facebook上的疫苗新闻分享和一般图像推文建立了类似的模型。

结果:大多数疫苗相关图像是重复的(125,916/237,478;53.02%)或来自其他来源，不一定是推文作者创造的。几乎一半的图片都包含嵌入式文本，许多图片还包括人和注射器的图像。视觉内容与推文的文本主题高度相关。疫苗图片推文的分享可能性是非图片推文的两倍。图像的情感和图像中显示的对象是决定图像是否被转发的预测因素。

结论:我们是第一个研究推特上疫苗图片的人。我们的发现为疫苗图像的研究和使用指明了未来的方向，并可能为围绕疫苗接种的传播策略提供信息。此外，我们的研究展示了一种有效的图像分析研究方法。

中国医学网络杂志2018;20(4):e130

doi: 10.2196 / jmir.8221

关键字

疫苗；视觉传达；图片微博；推特；转发预测；社交媒体

背景

视觉意象在许多领域的交际中都扮演着重要的角色。它们在卫生传播中的重要性得到广泛承认[1]，制作有效的健康传播文献、材料和活动包括创建视觉内容，以扩大信息的共鸣，超越书面文字。

在公共卫生领域尤其如此，宣传宣传运动是改变公共卫生行为的主要干预措施之一;例如，在提高认识运动中广泛使用图像的戒烟领域。的戒烟者的建议由疾病控制和预防中心开展的一项运动使用了令人震惊的图像来鼓励戒烟[2］．此外，香烟包装上的警示图案也可劝阻人们吸烟[3.］．

在与疫苗接种相关的传播中，图像尤其重要，这是一个公共卫生领域，支持和反对所提倡的行为。疫苗支持者和怀疑论者依靠科学论证、逻辑和情感共鸣来说服人们相信他们的观点。图像不仅是激发情绪反应的有效工具，而且还可以传达支持立场的统计数据和数据。这些可以结合在“信息图”中——混合了相关图像和统计数据的视觉效果。

疫苗怀疑论者和支持者都在社交媒体上大量出现，尤其是推特，并利用这些平台宣传他们的立场[4，5］．虽然有几项研究对这些社区进行了研究，但与疫苗相关的图像主题很少受到关注。为数不多的研究[6，7疫苗相关图像研究的重点Pinterest这是一个基于图像的社交媒体平台。虽然Pinterest越来越受欢迎，但它的月活跃用户总数还不到Twitter的一半[8］．此外，这些研究利用了定性分析(即手动注释)，因此他们的分析仅限于非常小的数据集的几个方面。此外，他们没有考虑图像特征与信息参与度之间的关系。请参阅下面的先前工作部分，以详细回顾这一领域的文献。

在本文中，我们研究了一个与疫苗相关的图像推文的大型语料库。我们是第一个在推特上研究疫苗图像的人，并提出了两个研究问题:

研究问题1:推特上分享的疫苗相关图片的共同特征是什么?
研究问题2:这些图像的哪些属性与与其他用户的更高参与度相关?

为了回答这些问题，我们通过自动图像分析提出并分析各种图像属性，这允许我们将分析扩展到大型图像集合。此外，我们拟合了一个逻辑回归模型来模拟图像推文是否被转发，作为识别与参与度相关的图像和推文特征的手段。我们的目标是了解图像是如何在疫苗相关的推文中使用的，并确定与转发可能性较高相关的疫苗图像的特征。

之前的工作

《一般公共卫生》图片

先前关于图像在公共卫生中的影响的工作主要集中在传统媒体，如小册子、广告或杂志。豪茨等人[1综合文献综述，总结出图像在健康传播中的四个功能:注意，理解，回忆,依从性健康信息。当图像与书面或口头文本紧密联系并表现出适当的情感刺激时，它们是最有效的。这种影响在文化程度低的人群中更为明显[9-11］．Houts等[1]建议以下七项有效使用图像的准则:(1)考虑使用图像作为视觉辅助;(2)喜欢简单的图画或照片而不是复杂的图像;(3)简化附文;(4)引导观众对图像的解读;(5)了解观众的文化;(6)积极塑造形象;(7)系统评价图像效果。

对于特定的用例，已经对图像进行了多次分析。张(12]研究了围绕四种疾病(足癣、牙周病、H1N1和消化性溃疡)的广告中图像的效果，发现图像可以有效地传播风险(即增加观众对疾病严重性的认识)，并向观众宣传预防步骤。与此同时，香烟包装上的图片警告已被证明是鼓励吸烟者使用戒烟服务和戒烟的关键因素，并比纯文字警告的效果更持久。[13-15］．

尽管人们普遍认为图像在公共卫生信息传递中至关重要，但目前还没有系统地指导图像设计和使用的视觉理论，而且健康传播中有效图像的特征仍不清楚[16］．此外，社区缺乏标准工具来分析健康图像内容和估计对健康行为的影响[16］．我们的工作旨在填补社交媒体上疫苗图像的这些空白。我们通过拟合逻辑回归模型确定了与图像共享相关的疫苗图像的关键特征。

疫苗接种中的图像

为了研究麻疹、腮腺炎和风疹(MMR)疫苗宣传信息的有效性(例如，关于MMR疾病危险的文本信息和患有MMR疾病的患病儿童的图像)，Nyhan等人[17他们对1759名子女不满18岁的父母进行了两波网络调查实验。与大多数公共卫生研究中图像的积极作用不同，他们的实验结果表明，生病儿童的图像具有相反的效果，也就是说，它增加了父母对严重疫苗副作用的信念。这一结果强调了在运动中使用疫苗接种信息之前仔细测试的必要性。

其他三个作品研究了社交媒体上的疫苗图像，包括脸谱网［18),Pinterest(一个以图像为导向的平台)[7，6］．Broniatowski等[18]分析了迪士尼乐园麻疹爆发期间与疫苗和疫苗可预防疾病相关的新闻文章，并衡量了影响Facebook分享的几个因素(例如，文章是否包含故事和文章是否包含图像)的程度。他们发现，文章中图片的出现增加了分享的可能性，但他们没有对图片本身进行分析。

古德利等[7]收集了800个与疫苗相关的图钉(即来自Pinterest由图像和标题组成)通过关键字搜索，并进行了定量分析，以表征内容和用户行为。就立场而言，作者发现大多数别针(74.0%)对疫苗的描述是负面的，反疫苗别针更多地使用叙述而不是统计信息，而prov疫苗别针恰恰相反。共有81.5%的pin有外部引用(即包含外部URL)，但只有0.3%的pin指的是政府网站，3.7%的pin指的是官方医疗网站(如医院)。他们还检查了5种健康信念模型结构在数据集中的分布。例如，只有16.5%的人认为接种疫苗非常有效，而59.8%的人认为接种疫苗的障碍很高。就用户行为而言，使用疫苗别针最常见的用户参与是“重复”(一种分享形式)，其次是“喜欢”和评论。

专注于图像本身，Milani [6]手动分析了1000多个明确显示出抗疫苗位置的针。总的来说，83.9%的图片是照片，10.2%是图表和信息图，剩下的5.9%是图纸。从对象来看，注射器占比最多(30.8%)，其次是儿童(19.8%)，成人(14.6%)，儿童和注射器结合使用(11.7%)。因此，注射器是接种疫苗的主要符号学标志。他们在照片中发现了一些刻板印象。从种族上看，所有的医生、护理人员和92.1%的婴儿都是白人。在情感上，儿童在独处时经常表现出中性的面部表情，在与家人或在一群人时微笑，在接种疫苗(用注射器)或被描绘成生病时哭泣，而大多数成年人是没有情绪的。此外，作者在最常见的图片中发现了一个共同的主题，即丰富的情感但缺乏信息(即没有关于疫苗接种的文本信息)。这些帖子利用情感诉求，试图说服人们接种疫苗是不必要的，而且可能有害。

尽管这些研究见解深刻，但也有一些局限性。其中两个[17，18]没有分析图像的内容，另外两个[7，6的定性分析Pinterest图像。由于这些工作需要手动标记，他们的定性分析仅限于小数据集(少于几千张图像)的几个方面。更重要的是，他们都没有研究推特上的疫苗图片，而推特是一个比美国更受欢迎的论坛Pinterest．相比之下，我们依靠自动分析来分析推特上数百万张疫苗图片。

推特上的疫苗接种

尽管此前缺乏关于推特上疫苗相关图像的研究，但已有几项研究对疫苗文本推文进行了研究。一个共同的线索是关于疫苗接种的态度和信念的研究[4，5，19-21］．这些研究通常利用机器学习算法自动对疫苗推文的情绪(反疫苗、prov疫苗或中性)进行分类，然后基于这种分类分析内容。例如，Dunn等人[19]的研究发现，接触到关于人类乳头瘤病毒(HPV)疫苗的负面意见的用户更有可能随后发布负面意见，Mitra等人[4]通过一项纵向研究确定了持续持有支持或反对疫苗态度的用户群体。

另一个研究方向是研究帖子的主题、传播模式、社区结构和用户行为[20.，22-24］．例如，Surian等[22]首先使用主题建模来描述关于HPV疫苗的推文，然后检查主题和用户社区结构的一致性。Radzikowski等[24]收集了2015年麻疹爆发后的疫苗接种推文，并分析了关键术语、这些术语之间的联系、传播模式和地理模式。其他人则开发了新颖的机器学习算法来发现具有特定特征的推文，包括识别关于寨卡疫苗的伪科学说法[20.]及推断是否有意(已接受或拟接受)注射流感疫苗[23］．

一般推特图片

相对大量的推文包含图片(17.2%，根据最近的一项研究[25])。因为有图片的推文比没有图片的推文更有可能被分享，用户会被激励在他们的消息中添加图片。与其他照片分享网站(如Flickr)不同的是，Twitter的图片不仅限于照片，还包括数字、图形、截图和其他旨在传达信息或宣传潜在内容的图片。例如，许多人在推特上发布的文章图片太长，不适合在推特上发布，或者是为了配上链接网站或新闻报道的照片。因此，大量研究调查了推特上图像的一系列方面(例如，[26])。方面包括描述图像[27，28]，自动识别图像的情感[29，30.]，预测图片推文受欢迎程度[31，32]，以侦测多媒体事件[33，34]，识别虚假图片[35，36]，从图像中挖掘趋势[37，38]，以及了解用户[25，39］．

概述

我们将描述Twitter上与疫苗相关的消息中使用的图像类型。我们的分析依赖于对图像和推文内容的自动分析，我们确定了影响图像被分享(转发)可能性的因素。本节将描述数据集创建、内容和图像分析，以及我们的转发预测任务。

数据集

疫苗推特数据

我们构建了一个与疫苗接种相关的大型推文语料库。图1显示数据收集的流程图。我们首先收集了包含一组疫苗相关关键字和疫苗可预防疾病中的一个术语的推文(详细内容见文本框1)在2014年11月11日至2016年8月8日期间使用Twitter流媒体应用程序编程接口(API)。这包括所有包含这些关键字的公开推文，但费率限制为当时推文总量的1%左右。

接下来我们应用一个统计分类器[40]以识别与疫苗接种相关的推文，而不是包含疫苗关键词的无关推文。该支持向量机(SVM)分类器是在1899年手动注释的推文(发布于[41])，并取得了良好的性能(精度=0.96，召回率=0.91，F₁= 0.93)。应用此分类器后，我们获得了6,288,653条与疫苗相关的推文(表1)．共有18.08%(1,137,172/6,288,653)的推文包含嵌入图像，这一比例与此前报道的推文总体比例(17.2%)相似[25］．我们使用Twitter API获得了每条原始推文被转发的次数[422016年12月11日。然后，我们下载了原始推文中包含的所有图像，并在推文元数据中引用。

用于查询Twitter的完整的疫苗相关关键字和疫苗可预防疾病。

疫苗、疫苗、流行性腮腺炎、流行性腮腺炎、流行性腮腺炎、人乳头瘤病毒、小儿麻痹症、轮状病毒、水痘、天花、肝炎、乙肝、百日咳、破伤风、白喉、百日咳、百日咳、百日咳、白喉、白喉、水痘、乳头瘤病毒、流行性腮腺炎、风疹、水痘、白喉、嗜血杆菌、乳头瘤病毒、脑膜炎球菌、肺炎球菌、狂犬病、结核病、伤寒、黄热病、免疫接种、免疫接种、免疫接种、霍乱、球蛋白、脑炎，莱姆病，寨卡病毒

文本框1。用于查询Twitter的完整的疫苗相关关键字和疫苗可预防疾病。

表1。我们疫苗推特数据集的人口统计数据。

推文媒介	原始推文，n	转发,	总n
图片微博	237478年	899694年	1137172年
文本推	3162184年	1989297年	5151481年
总计	3399662年	2888991年	6288653年

此外，我们从我们的大型疫苗图像推特数据集中随机采样了500张图像(无重复，见下文)疫苗- 500)．这个小数据集主要用于进行手动分析，这是对大型数据集的自动分析的补充(详细内容将在下一节中介绍)。

Twitter一般数据

作为转发预测任务的比较基线，我们获得了2016年1月1日至12月12日期间从Twitter 1%的公共提要中采样的20万条一般图像推文的语料库。获得了2016年12月29日的转发数，77.80%(15.56万/20万)的图像推文至少被转发了一次。我们没有删除重复，因为它们在一般的图片推文中是罕见的。

消息数据

转发预测任务的第二个比较基线将是与疫苗相关的新闻文章中包含的图像。按照Broniatowski等人研究中描述的程序[18]，我们从谷歌和Bing news上收集了2014年11月18日至2016年11月15日的144,867篇疫苗新闻，使用三个与疫苗接种相关的关键词(疫苗、疫苗接种和麻疹)。我们从HTML中提取文章内容鹅［43]，包括文章的主要文本和图像，并过滤掉没有中心图像的文章(例如，排除徽标，菜单栏图形等)。结果是一组43,664篇文章的图片仍然可以在网上访问。然后我们使用脸谱网共享API [44]，以获得每篇文章的分享数，分享数是指该链接在Facebook上被分享的次数。我们发现51.51%(22489 / 43663)的文章至少被分享过一次。我们没有删除重复的图像，因为它们很罕见。

图像处理

删除重复映像

许多图像在我们的集合中多次出现，要么是相同图像文件的精确副本，要么是几乎没有变化的不同文件。我们使用知觉哈希识别重复的图像[45]，一种构造图像指纹的流行算法。如果两张照片几乎相同，那么它们将具有相似的哈希值，例如，两张内容相同但纵横比不同的照片。为了评估该算法的性能，我们手动检查了50个重复的集群(总共252张图像)，发现它达到了98.4%(248/252)的准确率。在我们的疫苗数据集中，我们发现53.02%(125,916/237,478)的图像几乎是重复的。当我们分析有多个推文的单条推文(重复)图像时，我们选择最受欢迎的推文，以每关注者的转发数(转发数除以关注者数)衡量[46］．结果是一组111,562条图像推文，其中43.00%(47,972/111,562)被转发。

用户创建的图像

用户可以在twitter上发布他们自己创建的图像，例如用户拍摄的图片，但通常他们会发布从其他来源获得的图像，例如信息图或库存图像。为了区分这些图像，我们利用了谷歌图像搜索按图像查询功能。我们提交了每一张图片疫苗- 500设置为查询，并检查图像是否出现在任何其他网站。

图像分析

从图像中提取文本

许多图像包含文本(参见图2左边是一个例子)。嵌入的文本可能有助于解释图像[25］．我们使用超正方体［47]，一个开源光学字符识别(OCR)工具包。该工具最初是为打印文本设计的，因此适用于类似于扫描文本的Twitter图像-检测89.5%的文本风格图像和92.9%的含有文本的屏幕截图-通常检测68.4%的嵌入文本的图像[25］．根据文本的数量，我们进一步将包含嵌入文本的图像分为3组:主要是图片(不超过10个词)图像和文字的混合(10 - 30个单词)，以及主要是文本(30字以上)。

识别面孔

之前的研究发现，许多推特图片都包含人物图片。27］．我们在图像中识别和描述人脸脸+ +［48，这是一款在线人脸识别工具。该工具识别了人脸，并估计了他们的年龄、性别，以及这个人是否在微笑。脸+ +据报道，人脸识别的准确率达到99.5% [49]，性别识别准确率为83.0%，年龄估计的平均绝对误差为11.0 [50］．

对象识别

我们使用自动物体识别来描述图像的内容。我们使用Clarifai［51，这是一个深度学习驱动的商业图像识别系统。Clarifai提供文本标签来描述图像的内容，并且对前5个标签的分类准确率为89.3% [52］．考虑中间的图像图2举个例子。来自Clarifai的前5个标签是“注射器、注射剂、药品、针头和疫苗”。

主题分析

我们使用潜狄利克雷分配(LDA)分析了推文的内容[53]，这是一种无监督主题模型，通过共现词来识别语料库中的主要主题。该模型已广泛应用于传统文本文档的主题分析[53，54]以及社交媒体上的帖子[22，55］．LDA的一个关键参数是主题的数量，这可以在保留集上确定。

在我们的工作中，我们训练了两个独立的LDA模型来分析帖子的文本和视觉内容。对于帖子的文本，我们使用了与疫苗相关的推文语料库(文本和图像推文)，并在帖子的文本上训练LDA模型，其中包含50个主题(文本主题，下文)。对于视觉内容，我们使用疫苗图像语料库，在Clarifai提供的带有40个主题(视觉主题，下文)的图像标签上训练LDA。两个模型中文本或视觉主题的数量是相似地通过运行初始实验来确定的，每个数据集的20%作为保留集。LDA学习每个文档的主题分布和每个主题的单词分布。遵循惯常做法[22，56]，我们使用概率最大的主题作为推文或图像的文档级主题，并通过查看单词分布中的顶部单词为每个主题手动分配一个标签(由本文的第一作者)。然后，我们研究了文本或视觉主题如何与媒体(图像推文或文本推文)、用户参与度(转发或未转发)以及帖子的情绪相关。

手动分析

除了对图像进行自动特征分析外，我们还对图像进行了手动检查疫苗- 500语料库(由本文第一作者进行)。这种分析是对自动分析的补充，旨在进一步描述图像内容的特征，并阐明图像在疫苗信息传递中的功能。

转发预测

是什么让疫苗图片的推文引人注目或吸引人?为了回答这个问题，我们考虑一个代理任务:文本和嵌入图像的哪些特征使其更有可能被共享?我们将其作为一个转发预测任务，其中我们使用二元分类来确定一条推文是否被转发(是或否)。据我们所知，我们是第一个研究疫苗图片推文转发预测的人。大多数先前的研究都集中在一般的文本推文[46，57-59]，只有两项研究专门考虑了一般的图片推文[31，32］．

我们的研究使用逻辑回归，广义线性模型，来估计二元响应的概率(在我们的情况下，转发与否)。在之前的工作中使用了逻辑回归来预测转发量[57，58，46]并且具有通过计算优势比来解释特征的预测能力的关键优势。为了构建转发分类器，之前的工作利用了推文的文本内容(例如，单词、主题和情绪)、上下文元数据(例如，发布时间、URL的存在)、作者的个人资料(例如，关注者和朋友的数量)和图像(例如，颜色直方图、GIST描述符、检测到的视觉对象)的各种特征。在我们的研究中，我们从以前的工作中提取了广泛的特征，并额外提出了几个疫苗特异性特征(如下所述)。

为了评估模型的性能，我们将我们的疫苗图像推特数据集(去除重复图像后的111562个图像推特)分为训练集和测试集。为了模拟推文的时效性，我们将最近的20%的推文作为测试集，其余80%的旧推文作为训练集。我们报告精度(真阳性除以真阳性和假阳性)，召回率(真阳性除以真阳性和假阴性)，以及F₁得分(精密度和召回率的调和平均值)。在相同的设置下，我们还使用相同的特征集(不包括疫苗特定的特征)为疫苗新闻和一般图像推文数据集构建预测模型。

用于预测模型的特征

作者知名度特征

一条推文是否会被转发，最重要的预测因素之一是推文作者的受欢迎程度。31］．为了控制作者的受欢迎程度，我们在模型中添加了两个特征:(1)用户帐户是否经过验证(Twitter的帐户验证为公众人物或有假冒风险的人建立了帐户真实性)和(2)关注者数量(日志标准化)。对于疫苗新闻，我们通过其URL域的Facebook分享数(而不是故事本身的链接)来衡量作者的受欢迎程度。

元数据功能

我们从推文的元数据中提取了三个特征:(1)包含标签的数量，(2)用户提及次数，(3)图像。我们增加了一些功能，表明推文中存在URL，无论该链接是否指向政府(gov)或非政府网页，以及该网页是否已不再提供。我们同样根据URL将疫苗新闻分类为政府或非政府页面。

文本特征

我们考虑了三种类型的文本特征。

主题:我们根据推断出的LDA主题模型添加了一些特征，其中每个特征是文档中某个主题出现的概率。考虑到这条推文的文字比较短，我们参考了之前的工作[25]，通过结合(1)推文的文本，(2)来自推文中链接的网页的文本，以及(3)来自图像的嵌入文本，获得一条推文的丰富文本表示。然后在丰富文本的基础上训练LDA主题模型。对于疫苗新闻，我们将OCR文本与其文章内容相结合。然后，我们为三个数据集训练单独的主题模型。
疫苗名称:我们确定了该推文是否包含25个疫苗名称(如MMR、HIV)中的一个，这些名称可以暗示该推文的疫苗主题。此功能适用于疫苗图片推文和新闻，但不适用于一般图片推文。
情绪:之前的研究发现，情绪是转发量的预测因素。58］．为了识别疫苗推文的情绪，我们构建了两个SVM分类器。我们首先用447条标记的推文训练一个分类器来识别情感推文和中性推文，然后我们用153条标记的推文训练另一个SVM分类器来识别情感推文是provvaccines还是antivaccine。这两个分类器获得一个F₁测试集的得分分别为0.80和0.39。为了便于进一步研究，我们在[41］．我们将这个情感标签(中性、provaccine或antivaccine)作为一个特征。由于缺乏适当的工具，我们没有为一般的图像推文和疫苗新闻提取该功能。

图像特征

我们从图像中提取了捕捉高级语义和低级视觉属性的特征。

视觉主题:我们将LDA拟合到Clarifai提供的对象识别标签中学习到的主题。我们以与前面描述的文本主题特性相同的方式添加主题。考虑到普通推文中的图像与疫苗图像有显著差异，我们将这些特征仅限制在疫苗图像推文和新闻中。
人脸识别:我们提取了四个与人脸相关的特征:(1)人脸数量，(2)性别(图像中有男性或女性面孔)，(3)年龄组(图像中有年龄在0-2岁，3-14岁，15-24岁，25-64岁或65岁以上的面孔)，(4)笑脸。
图像类型:我们将图像识别为纯粹的形象，主要是图片，图像和文字的混合,主要是文本如前所述。
视觉情感:低层次的图像特征已经被证明是一种简单但有效的方法来捕捉情绪、情绪或图像的效果[28，60］．我们提取了五组基于颜色的特征来捕捉视觉情绪:(1)饱和度:饱和度的均值和标准差;(2)亮度:亮度的均值和标准差;(3)色相:平均色散和角色散，有和没有饱和加权;(4)主色:11种基本色(即黑、蓝、棕、绿、灰、橙、粉、紫、红、白、黄)中最普遍的颜色[61];(5)情感:一套三种情感评分来衡量快乐、唤醒和支配[62］．

疫苗图片推文分析

图片推文语料库分析

尽管Twitter允许用户每条推文最多附上4张图片，但大多数疫苗图片推文(1,089,411/1,137,172;95.80%)有一个单一的图像。这些图片使疫苗推文更有可能被分享(72,906/237,478;图片推文的转发率为30.70%)高于纯文字推文(483,815/3,162,184;15.30%)。而纯文本推文的转发率在普通推文数据集中相似(13.61%;10379 /76,273转发)，图像推文存在巨大差异，即一般图像推文为2.5倍(155,600/20万;77.80%)比疫苗图片推文更有可能被分享。这突出表明，有必要了解如何使用图像在推特上讨论疫苗，并确定导致有效图像的策略。

大多数图像不是用户创建的，而是准备好的信息图、库存照片或其他图像。在疫苗- 500语料库中，88.4%(442/500)的图片是在其他网站上找到的，这表明它们不是用户生成的。在推特上发布疫苗相关信息的用户正在分享现有图片，这或许可以解释为什么这么多图片被其他用户重复使用。此外，大量疫苗图像包含文字;39.90%(44,513/111,562)的疫苗图像包含至少一个嵌入文本单词。其中，42.90%(19,096/44,513)为主要是图片(不超过10个词)，占30.60% (13620 / 44513)图像和文字的混合(10 - 30词)，26.50% (11797 / 44513)主要是文本(30字以上)。

我们还发现，四分之一(28560 / 111562;25.60%)的疫苗图像包含人脸。其中大多数人只有一张脸，其余的大多数照片(4798/ 28560;16.80%)有两张脸。大量的面孔与通过物体识别发现的物体和概念相一致;在五个最常见的Clarifai标签中，有四个(“人、企业、成人、女性和男性”)明确地与人有关。

主题分析

我们的主题模型分析(不包括转发量)表明，图像更有可能与一些文本主题相关联。图3列出25个被发现语义一致且包含图像的推文比例与平均值偏差最大的主题的手动分配标签。垂直线表示整个语料库的平均值。“埃塞俄比亚的脊髓灰质炎病毒疫苗”、“用于肝炎研究的黑猩猩”和“接种或拒绝接种疫苗的比率”等主题的图片推文比例最高，而关于“疫苗中的有毒成分”和“为士兵或退伍军人接种疫苗”的推文比例最低。

图3。疫苗图像推文和文本推文在选定文本主题中的分布情况。平均而言，18.08%(1,137,172/6,288,653)的疫苗推文是图像推文(用竖线表示)。

表2。最主要的视觉主题及其在每个文本主题中的百分比。

文本主题	主导视觉主题	n (%)
全球登革热	昆虫(害虫或苍蝇)	334 (24.29)
疫苗价格	海报或标志	231 (17.88)
埃塞俄比亚的脊髓灰质炎病毒疫苗	婴儿	3930 (91.43)
人乳头状瘤病毒^一个	注射	376 (13.60)
H1N1猪流感或禽流感	注射	275 (21.43)
疟疾	昆虫(害虫或苍蝇)	342 (21.30)
疫苗和生育	女	114 (71.5)
共和党候选人关于疫苗和自闭症的辩论	政治家	852 (20.97)
用于肝炎研究的黑猩猩	自然	1021 (56.07)
狂犬病	狗	1585 (36.91)
Zika病毒	昆虫(害虫或苍蝇)	534 (23.56)
为所有英国婴儿接种脑膜炎疫苗	婴儿	373 (15.84)
自闭症和MMR^b	沟通	410 (16.18)
疫苗科学报告	生物学或细菌	299 (14.06)
转基因生物	食物	133 (7.53)
非洲的埃博拉	医院病人或医生	473 (17.81)
抗癌疫苗	抽象图像(单元格或卡通)	182 (12.17)
艾滋病毒	海报或标志	147 (10.55)
为士兵或老兵接种疫苗	车辆	37 (6.9)
促进疫苗	婴儿	255 (10.36)

^一个人乳头瘤病毒。

^bMMR:麻疹、腮腺炎和风疹。

转到Clarifai可视标签的主题模型分析，我们发现最常见的主题是注入(图2(左)和宝宝(图2,对吧)。为了进行比较，我们还对疫苗新闻图像应用了相同的程序。推特和新闻在使用图片方面表现出差异(参见图4)．与Twitter的视觉标签相比，海报或logo和昆虫是新闻中使用最多的图片，分别占新闻图片的8.08%(3258/43,664)和7.70%(3362/43,664)。然后，我们测量了同一条推文中文本主题和视觉主题之间的相关性。表2列出20个文本主题中每一个最常见的视觉主题，以及推文中图像的比例以及包含视觉主题的文本主题。我们观察到强烈的语义联系:关于登革热的帖子显示昆虫的图像，关于小儿麻痹症的帖子显示婴儿，关于HPV的帖子显示注射。

最后，我们研究了话题与情绪之间的相关性。我们绘制了每个文本和视觉主题的情感分布图5而且6,分别。从图5时，我们看到许多文本主题呈现出情绪分布的倾斜。人们主要在讨论“比较接种疫苗和未接种疫苗的人”、“HPV”、“非洲的埃博拉”和“所有英国婴儿的脑膜炎疫苗”等话题时表达prov疫苗属性，而在讨论“用于肝炎研究的黑猩猩”、“反疫苗电影”和“自闭症和MMR”时表达反疫苗情绪。相反，视觉主题表现出更平衡的情感分布，因为大多数主题接近平均情感分布(图6)．

手动分析

我们发现大多数图片(没有相关的推文文本)都表明了疫苗或健康的主题(例如，图2、中)。这些图像的作用是符号标志这使得推文与推特上大量的非疫苗推文区别开来。对于图片中的人，我们注意到他们中的许多人正在注射疫苗，这进一步表明推文是在讨论为特定人群接种疫苗(图2,对吧)。然后我们转向包含文本的图像。这些图片是推文中不可缺少的组成部分，它们可以将长文本以图片的形式显示，以克服推文的文本长度限制(最多140个字符)，也可以可视化地呈现推文的关键信息(如图表和数字)。除此之外，我们还确定了疫苗图像表现出强烈情感的第三个用例(图2(右)，这是用来加强帖子的情绪。总之，我们确定了疫苗图像的三个关键功能:(1)在视觉上表达主题，(2)补充推文中的信息，(3)引发情绪反应。

图5。疫苗图片推文文本主题的情绪分布。平均而言，57.58%(71,417/124,029)的感伤疫苗图片推文是provaccine(用竖线表示)。疾病控制和预防中心。

图6。疫苗图片推文视觉主题的情绪分布。平均而言，57.58%(71,417/124,029)的感伤疫苗图片推文是provaccine(用竖线表示)。

表3。共享预测的实验结果。分数越高，表现越好。

数据集	精度	回忆	F₁
疫苗图片推文	0.713	0.632	0.670
疫苗的消息	0.750	0.596	0.683
一般图片推文	0.856	0.947	0.899

转发预测

logistic回归分类器得到一个F₁预测疫苗推文是否会被转发时，得分为0.670(精度=0.713，召回率=0.632)。为了进行比较，我们对疫苗新闻和一般图像推文进行了类似的实验。表3结果表明，预测模型在一般图像推文上获得了更好的性能(F₁=0.899)比疫苗图片推文(F₁=0.670)及新闻(F₁= 0.683)。这意味着重点疫苗领域的转发预测比一般领域更具挑战性。

我们计算了系数的优势比，以确定预测转发的特征强度。我们在适用的情况下比较了三个数据集之间的特征。对于这两个推文数据集，元数据特征积极地预测转发量，关于作者的信息(例如他们的受欢迎程度)最重要(表4)．

表5显示疫苗推文和新闻的具有统计意义的文本特征。提及某些疫苗(HPV、百日咳、脊髓灰质炎和天花)会增加转发量，而其他疫苗(寨卡病毒、流感、炭疽和脑膜炎球菌)则会减少转发量。新闻方面，六种疫苗名称显示出强烈的共享迹象(脑膜炎球菌、HPV和伤寒)或不共享(带状疱疹、寨卡病毒和腺病毒)。在文本中表达情感(无论是支持还是反对疫苗)会让疫苗的推文更具转发性。虽然共享url不能预测转发量，但非政府和被删除的url比政府url更能消极地表明转发量。在新闻方面，来自政府网站的文章的分享量明显高于其他新闻。最后，文本主题在转发中起着关键作用。讨论“疫苗的科学报告”、“黄热病”、“试验”、“为军人或退伍军人接种疫苗”等主题的推文吸引了更多的转发，而“世界范围内的登革热”、“自闭症和MMR”、“埃塞俄比亚的脊髓灰质炎病毒疫苗”、“巴基斯坦和俄罗斯的埃博拉病毒”、“用于肝炎研究的黑猩猩”等其他主题则是转发的负面指标。

最后我们转向基于图像的特征(表5)，并专注于疫苗推文和新闻的比较。一般来说，高级视觉特征对推文和新闻都有很强的预测能力。图7显示每个视觉主题中转发和未转发疫苗图像推文的比例。从具体的话题来看，Twitter和Facebook上的预测话题有很大的不同，有些话题的预测能力相反。例如，在Facebook上，交流和体育图片会增加转发量，但会减少新闻分享量。一般来说，有脸的图片并不能预测，但笑脸的存在是转发推文的积极指标。在图片中嵌入一些文字，无论文字数量多少，都会增加转发量，但对新闻分享没有显著影响。一般来说，视觉情感特征对推文和新闻都具有预测性，但具体特征及其影响在两个数据集中往往不同。这种特征差异表明，疫苗视觉传播在平台(Twitter和Facebook)和媒介(Twitter和新闻)之间可能有所不同。

表4。Twitter元数据特征的优势比具有统计学意义。

功能	疫苗图片推文		一般图片推文
	或^一个(95%置信区间)	P价值	或(95% ci)	P价值
粉丝数量	2.55 (0.92 ~ 0.96)	<措施	4.78(1.54至1.58)	<措施
验证用户	3.55(1.19至1.34)	<措施	2.98(0.97至1.20)	<措施
提到数	1.33(0.26至0.31)	<措施	1.39(0.30至0.35)	<措施
图像数	1.15(0.09至0.18)	. 01	1.69(0.50至0.56)	<措施
标签数	1.24(0.20至0.23)	<措施	1.05(0.03至0.06)	<措施

^一个OR:优势比。

表5所示。文字和图像特征的比值比具有统计学意义。

功能	疫苗图片推文			一般图片推文
	功能	或^一个(95%置信区间)	P价值	功能	或(95% ci)	P价值
疫苗名称	人乳头状瘤病毒^b	1.24 (0.05 ~ 0.29)	<措施	人乳头状瘤病毒	1.20(0.00至0.36)	0。
	Zika病毒	0.76(-0.43到-0.11)	<措施	Zika病毒	0.63(-0.59到-0.34)	<措施
	脑膜炎球菌	0.56(-0.72到-0.45)	<措施	脑膜炎球菌	1.28(0.11至0.39)	<措施
	百日咳	1.34(0.14至0.45)	<措施	带状疱疹	0.71(-0.63到-0.06)	02
	小儿麻痹症	1.27(0.15至0.33)	<措施	腺病毒	0.55(1.08至-0.12)	. 01
	天花	1.65(0.24至0.77)	<措施	伤寒	1.70(0.06至0.99)	03
	流感	0.85(-0.23到-0.09)	<措施
	炭疽热	0.72(-1.02至0.37)	.008
文本情绪	中性	0.87(-0.29到-0.21)	<措施	N/A^c
URL的可靠性	政府的URL	0.92(-0.23至0.07)	<措施	政府的URL	1.97 (0.71 ~ 1.79)	<措施
	非政府URL	0.76(-0.32到-0.24)	<措施
	删除网址	0.48(-0.81到-0.68)	<措施
文本的主题	自闭症和MMR^d	0.76(-0.73到-0.41)	<措施	省略作为一个单独的主题模型训练的新闻和比较可能没有意义。
	全球登革热	0.70(-0.84到-0.45)	<措施
	埃塞俄比亚的脊髓灰质炎病毒疫苗	0.12(-2.61到-2.14)	<措施
	为士兵或老兵接种疫苗	1.55(0.12至0.42)	<措施
	疫苗科学报告	1.60 (0.01 ~ 0.35)	.002
	巴基斯坦和俄罗斯的埃博拉疫情	0.73(-0.80至0.41)	<措施
	用于肝炎研究的黑猩猩	0.42(-1.39至-0.95)	<措施
	黄热病	1.41(-0.12至0.23)	<措施
	试验	1.79 (0.06 ~ 0.52)	<措施
视觉主题	艺术或绘画	1.21(0.08至0.36)	<措施	海、水或风景	1.21(0.03至-0.48)	03
	沟通	1.28(0.14至0.40)	<措施	沟通	0.57(-0.78到-0.25)	<措施
	体育	1.45(0.25至0.53)	<措施	体育	0.72(-0.48到-0.07)	. 01
	学校	1.35(0.18至0.47)	<措施	建筑	0.76(0.40到-0.02)	03
	日程表或日历	1.38(0.18至0.51)	<措施	时尚、模特或女性	1.31(0.1到-0.55)	<措施
	在一起还是幸福	1.28(0.13至0.41)	<措施	生物学或细菌	1.60(0.27至0.79)	<措施
	演出或节日	0.76(-0.47到-0.16)	03	食物	1.51(0.24至0.70)	<措施
	政治家	1.38(0.22至0.47)	<措施	老	1.29(0.08至0.56)	. 01
	手	0.77(-0.40至-0.08)	.003
	研究	1.37(0.20至0.48)	<措施
	演讲	1.26(0.14至0.38)	<措施
	图	1.46 (0.24 ~ 0.57)	<措施
	猫	0.34(-1.20至-0.92)	<措施
脸	微笑	1.27(0.16至0.32)	<措施
	主要形象	1.24(0.17至0.27)	<措施
	混合物	1.16(0.09至0.20)	<措施
	主要的文本	1.34(0.22至0.37)	<措施
视觉情绪	蓝色的	0.84(-0.83到-0.27)	<措施	蓝色的	1.87(0.20至1.21)	.006
	白色	0.84(-0.79到-0.30)	<措施	红色的	0.35(-1.52到-0.45)	<措施
	亮度SD	2.16(0.49至1.05)	<措施	亮度SD	0.52(-1.10到-0.20)	.005
	色相加权平均值	5.65(1.04至2.42)	<措施	色相加权平均值	0.08(-3.70至-1.41)	<措施
	唤醒	0.73(-1.33到-0.40)	<措施	唤醒	1.38(0.15至1.65)	02
				饱和度SD	1.79(0.17至1.00)	.006

^一个OR:优势比。

^b人乳头瘤病毒。

^cN/A:不适用。

^dMMR:麻疹、腮腺炎和风疹。

图7。经过图像重复数据删除后，疫苗图像推文在每个视觉主题中被转发和未被转发的比例。平均而言，43.00%(47,972/111,562)的疫苗图片推文被转发(以竖线表示)。

概述

图片主要用于疫苗推文(1,137,172/6,288,653;18.08%的疫苗推文包含图片)，但在之前的工作中被忽略了。我们是第一个在Twitter上研究疫苗图像的人，并特别回答了两个研究问题:(1)它们的特征是什么?(2)是什么特质让他们吸引人?我们总结了主要的发现及其影响，并在以下段落中强调了一些未来的工作。

主要研究结果

与之前关于一般图片推文的研究一样，图片使疫苗推文更有可能被分享(72906 / 237478;图片推文的转发率为30.70%)高于纯文字推文(483,815/3,162,184;15.30%)。这可能是用户在推特上附加图片的一个动机。26，63］．来自Twitter的大量重复疫苗图片(125,916/237,478;53.02%)或在其他网站上发现(442/500,88.4%)表明大多数疫苗图像不是用户创建的(例如，由用户拍摄的照片);相反，它们是由用户从其他来源选择的，以帮助宣传他们的疫苗接种信息。此外，使用外部url的疫苗图片推文的比例要高得多(653,874/1,137,172;57.50%)，而一般图片推文(22.7% [25])表明图像在疫苗相关信息传递中发挥着重要作用。这使得Twitter成为评估疫苗视觉传播有效性的一个特别有吸引力的平台。

此外，许多疫苗图片除了视觉上支持推文中的信息外，还包含它们自己的信息。近40%的图片都有嵌入文本，而嵌入的文本对于解释推文的整体信息是有信息量的。这些图像包括屏幕截图、信息图、图表和数字，与页面上的疫苗图像一致Pinterest［6，7］．在视觉内容上，疫苗图像中最常出现的两个物体是注射器和人，这与在Pinterest［6］．视觉内容也与推文的文本主题高度相关。因此，在推特上附上图片的目的是让它更有吸引力。27并传达推文的主题。

带有图片的疫苗推文被分享的可能性是无图片推文的两倍，这遵循了一般推文的趋势[26］．我们的逻辑回归表明，作者是决定图片推文是否会被分享的最重要因素之一，这与一般推文的趋势相同[46，57]，并与Broniatowski等人的研究结果一致[18］．从文本和图像中提取的情感特征也可以预测分享行为。积极或消极情绪疫苗图片推文比中性推文更容易被转发，这也与行为相匹配Pinterest［6］．四分之一的疫苗图像包含人脸。尽管之前的研究发现，有人脸的图像有更高的用户粘性[64]，我们发现含有人脸的疫苗图片推文与没有人脸的推文被转发的可能性相同(有人脸的推文为25.5%，没有人脸的推文为25.7%)。

将一般图片推文的转发量预测与疫苗新闻的转发量预测进行比较，可以看出疫苗图片推文的转发量预测是一项非常困难的任务。我们发现疫苗推文和疫苗新闻之间的特征行为不同。例如，笑脸能增加疫苗推文的分享量，但对新闻没有影响，而风景和自然图片对新闻分享有积极贡献，但对推文有负面影响。这表明这两个领域(推特和新闻)存在不同的传播模式，或者人们在两个社交媒体平台(推特和Facebook)上分享内容的方式可能存在差异。

影响

我们的研究对公共卫生研究人员和从业者具有启示意义。

我们证明了图像被广泛用于Twitter疫苗信息，并使用几种类型的分析对这些图像进行了特征分析。这应该有助于理解数百万条疫苗推文的信息内容。

此外，与疫苗相关的传播策略也可以从我们的分析中受益。图像可以扩大疫苗信息的传播范围。我们的转发预测模型可以作为一种工具来评估设计的视觉疫苗信息的有效性。从该模型中，我们还确定了与疫苗推文转发相关的几个关键因素。虽然我们还没有建立因果关系，但这些因素仍然可以指导信息设计。

最后，我们的研究展示了一种有效的图像分析研究方法。我们发现Twitter是一个研究疫苗视觉传播问题的有效平台。这是一个重要的发现，因为Twitter使得通过公共Twitter API收集大量图像数据相对容易，而不是缺乏Pinterest用于创建大型无偏数据集的api [65］．与之前依赖于人工分析图像的工作不同，我们使用全自动分析对大型数据集进行全面分析。这些技术可用于分析其他来源的疫苗图像和一般的与健康相关的图像。为了实现未来的研究，我们发布了用于构建疫苗相关性和情绪分类器的标记数据集[41］．

未来的发展方向

我们看到了未来工作的几个方向。虽然我们对Twitter的研究增加了对Pinterest的其他研究，但还没有对图片流行的几个大型社交媒体平台进行疫苗内容的检查。其中包括Instagram和Facebook。由于需要为每个平台量身定制有效的消息传递策略，因此欢迎在这些平台上找到疫苗图像有效性的证据。

此外，我们对理解本文所介绍的分析之外的图像感兴趣。例如，什么样的图像对不同的活动最有效?图像如何与现有的关于疫苗接种的叙述联系起来?疫苗接种运动的目标人群如何在图像中反映出来?最后，这些问题可以广泛应用于公共卫生宣传活动。我们计划在未来的工作中扩展我们的方法来考虑这些问题。

致谢

这项工作得到了美国国家普通医学科学研究所的部分支持，资助号为5R01GM114771。内容仅为作者的责任，并不一定代表美国国立卫生研究院的官方观点。

利益冲突

MD从Bloomberg LP获得咨询费用，并持有Good Analytics Inc.和Sickweather Inc.的股权。这些组织在研究设计、数据收集和分析、发表决定或手稿准备方面没有任何作用。没有其他冲突需要宣布。

Houts PS, Doak CC, Doak LG, Loscalzo MJ。图片在改善健康沟通中的作用:关于注意力、理解、回忆和坚持的研究综述。患者教育杂志2006年5月;61(2):173-190。［CrossRef] [Medline］
Ayers JW, Althouse BM, Emery S.与“戒烟者的建议”运动相关的互联网搜索变化。Am J Prev Med 2015 Jun;48(6):e27-e29 [免费全文] [CrossRef] [Medline］
Hammond D, Fong GT, McDonald PW, Brown KS, Cameron R.加拿大香烟警告标签图形和不良后果:来自加拿大吸烟者的证据。中华医学会公共卫生杂志2004年8月;94(8):1442-1445。［Medline］
Mitra T, Counts S, Pennebaker J.了解社交媒体中的反疫苗接种态度。发表于:第十届国际AAAI网络和社交媒体会议(ICWSM)论文集;2016年5月17-20日;德国科隆，第269-278页。
Massey PM, Leader A, yum - tov E, Budenz A, Fisher K, Klassen AC.应用多种数据收集工具量化推特上的人乳头瘤病毒疫苗传播。J Med Internet Res 2016 Dec 05;18(12):e318 [免费全文] [CrossRef] [Medline］
米兰尼E. 2015。风险传播宣传图片网址:https://www.slideshare.net/memotak/images-for-advocacy-in-communication-of-risk[访问时间:2018-03-09][WebCite缓存］
Guidry JP, Carlyle K, Messner M, Jin Y.如坐针毡:如何在Pinterest上描绘疫苗。疫苗2015年9月22日;33(39):5051-5056。［CrossRef] [Medline］
Salman A. Omni Core Agency, 2018年1月1日。Twitter的数据:统计数据，人口统计数据和有趣的事实https://www.omnicoreagency.com/twitter-statistics/[访问时间:2018-03-09][WebCite缓存］
Garcia-Retamero R, Dhami MK.图片比数字更有说服力:向非母语能力有限的移民传达医疗风险。健康预期2011年3月14日增刊1:46-57 [免费全文] [CrossRef] [Medline］
向患者传达信息:使用卡通插图来提高对说明的理解。新兴医学学院1996 Mar;3(3):264-270 [免费全文] [Medline］
Ngoh LN, Shepherd MD.设计、开发和评估可视化辅助工具，用于在喀麦隆农村向不识字的患者传达处方药说明。患者教育杂志1997七月;31(3):243-261。［Medline］
常昌。眼见为实:图片在健康宣传广告中的直接和偶然影响。卫生共通2013年2月28日;28(8):822-834。［CrossRef] [Medline］
方国强，韩明。图片对烟草警示效果的影响。牛世界卫生机构2009 Aug;87(8):640-643 [免费全文] [Medline］
Hammond D, Fong GT, McNeill A, Borland R, Cummings KM。香烟警告标签在告知吸烟者吸烟风险方面的有效性:来自国际烟草控制(ITC)四国调查的结果。Tob Control 2006 Jun;15附录3:iii19-iii25 [免费全文] [CrossRef] [Medline］
烟草制品上的健康警告信息:综述。Tob Control 2011 Sep;20(5):327-337。［CrossRef] [Medline］
McWhirter JE, Hoffman-Goetz L.视觉图像理论、评估和在皮肤癌和晒黑研究中的应用的系统综述。中华卫生杂志2014;19(6):738-757。［CrossRef] [Medline］
李志强，李志强，李志强，等。疫苗推广中有效信息的研究进展。儿科学2014年3月;133(4):e835-e842 [免费全文] [CrossRef] [Medline］
Broniatowski DA, Hilyard KM, Dredze M.迪士尼乐园麻疹爆发期间有效的疫苗传播。疫苗2016年6月14日;34(28):3225-3228 [免费全文] [CrossRef] [Medline］
Dunn AG, Leask J, Zhou X, Mandl KD, Coiera E.社交媒体上对人乳头瘤病毒疫苗负面意见的暴露与表达之间的关系:一项观察性研究。J Med Internet Res 2015 Jun 10;17(6):e144 [免费全文] [CrossRef] [Medline］
Dredze M, Broniatowski DA, Hilyard KM。寨卡疫苗误解:社交媒体分析。疫苗2016年6月24日;34(30):3441-3442 [免费全文] [CrossRef] [Medline］
Smith M, Broniatowski DA, Dredze M.使用Twitter研究拒绝接种疫苗的社会理由。发表于:国际工程系统研讨会(CESUN);2016年6月27-29日;美国华盛顿特区。
Surian D, Nguyen DQ, Kennedy G, Johnson M, Coiera E, Dunn AG。使用主题建模和社区检测来描述关于HPV疫苗的Twitter讨论。J Med Internet Res 2016 Aug 29;18(8):e232 [免费全文] [CrossRef] [Medline］
黄x, Smith M, Paul M, Ryzhkov D, Quinn S, Broniatowski D，等。研究社交媒体上的流感疫苗接种模式。发表于:AAAI健康智能联合研讨会(W3PHIAI);2017年2月4日至5日;美国加州旧金山，第542-546页。
Radzikowski J, Stefanidis A, Jacobsen KH, Croitoru A, Crooks A, Delamater PL.推特上的麻疹疫苗接种叙事:定量分析。JMIR公共卫生监测2016年;2(1):e1 [免费全文] [CrossRef] [Medline］
陈涛，何X，阚my。情境感知图像推文建模和推荐。发表于:2016年ACM多媒体会议(MM)论文集;2016年10月15-19日;荷兰阿姆斯特丹，1018-1027年。［CrossRef］
陈涛新加坡国立大学。微博图片推文分析http://scholarbank.nus.sg/handle/10635/124157[访问时间:2018-03-09][WebCite缓存］
陈涛，陆东，阚美美，崔平。图像推文的理解与分类。发表于:第21届ACM多媒体国际会议论文集;2013年10月21-25日;西班牙巴塞罗那，第718-784页。［CrossRef］
陈涛，SalahEldeen HM，何x，阚my, Lu D. VELDA:关联图像推文的文本和图像。发表于:第29届AAAI人工智能会议(AAAI)论文集;2015年1月25-30日;美国德克萨斯州奥斯汀，第30-36页。
鲍思D，吉瑞，陈涛，布吕埃尔T，张顺丰。大规模视觉情感本体与形容词名词对检测器。发表于:第21届ACM多媒体国际会议论文集;2013年10月21-25日;西班牙巴塞罗那，第223-232页。［CrossRef］
尤强，罗娟，金华，杨娟。基于深度神经网络的视觉-文本情感分析。发表于:第23届ACM多媒体国际会议论文集;2015年10月26-30日;澳大利亚布里斯班，1071-1074页。［CrossRef］
EF, Oktay H, Manmatha R.使用视觉线索预测转发数。发表于:第22届ACM信息与知识管理国际会议(CIKM)论文集;2013年10月27日至11月1日;美国加州旧金山，1481-1484页。［CrossRef］
卡帕洛，门辛克，斯诺克CG。视觉人气预测的潜在因素。发表于:第五届ACM多媒体检索国际会议论文集;2015年6月23-26日;中国上海，页195-202。［CrossRef］
边俊，杨勇，张宏，蔡世涛。微博流中社会事件的多媒体摘要。IEEE反式。多媒体2015 Feb;17(2):216-228。［CrossRef］
蔡宏，杨毅，李霞，黄哲。热门话题:探索twitter事件检测、跟踪和可视化功能。发表于:第23届ACM多媒体国际会议论文集;2015年10月26-30日;澳大利亚布里斯班，第89-98页。［CrossRef］
Boididou C, Papadopoulos S, Kompatsiaris Y, Schifferes S, Newman N.社交多媒体计算验证的挑战。发表于:第23届国际万维网会议论文集;2014年4月7日至11日;大韩民国首尔，第743-748页。［CrossRef］
Gupta A, Lamba H, Kumaraguru P, Joshi A.伪造桑迪:飓风桑迪期间推特上的虚假图像的特征和识别。发表于:第二届网络社交媒体隐私与安全国际研讨会论文集;2013年5月13-17日;里约热内卢，巴西p. 729-736。［CrossRef］
柳井K，河野Y.推特食物图片挖掘和分析的一百种食物。发表于:第15届环太平洋多媒体信息处理(PCM)会议论文集;2014年12月1日至4日;马来西亚古晋，第22-32页。［CrossRef］
赵楠，洪睿，王敏，胡霞，蔡涛。微博平台名人近照搜索。发表于:第22届ACM多媒体国际会议论文集;2014年11月3日至7日;奥兰多，佛罗里达州，美国第841-844页。［CrossRef］
林华，贾静，郭强，薛勇，李强，黄娟，等。基于深度神经网络的社交媒体用户层面心理压力检测发表于:第22届ACM多媒体国际会议论文集;2014年11月3日至7日;美国佛罗里达州奥兰多，第507-516页。［CrossRef］
Dredze M, Broniatowski DA, Smith MC, Hilyard KM。理解疫苗拒绝:为什么我们现在需要社交媒体。美国预防医学杂志2016年4月;50(4):550-552 [免费全文] [CrossRef] [Medline］
社会媒体促进公共卫生。疫苗接种观点和相关推文网址:http://www.socialmediaforpublichealth.org/resources[访问时间:2018-03-09][WebCite缓存］
Twitter状态查找API。URL:https://developer.twitter.com/en/docs/tweets/post-and-engage/api-reference/get-statuses-lookup[访问时间:2018-03-09][WebCite缓存］
Grangier X. Python-Goose -文章提取器URL:https://github.com/grangier/python-goose[访问时间:2018-03-09][WebCite缓存］
Facebook共享API。URL:https://developers.facebook.com/docs/graph-api/reference/v2.9/url[访问时间:2018-03-09][WebCite缓存］
zuner C.上奥地利应用科学大学。2010。感知图像哈希函数的实现和基准测试http://www.phash.org/docs/pubs/thesis_zauner.pdf[访问时间:2018-03-09][WebCite缓存］
王安，陈涛，阚美美。从语言的角度重新推特。发表于:第二届社交媒体语言研讨会论文集(LSM);2012年6月7日;加拿大蒙特利尔，第46-55页。
Tesseract开放源代码OCR引擎网址:https://github.com/tesseract-ocr/tesseract[访问时间:2018-03-09][WebCite缓存］
面对+ +网址:https://www.faceplusplus.com/[访问时间:2018-03-09][WebCite缓存］
周娥，曹智，尹强。单纯深度人脸识别:是否触及LFW基准的极限?URL:https://arxiv.org/abs/1501.04690[访问时间:2018-03-09][WebCite缓存］
猎犬。年龄、性别和情绪基准https://www.sighthound.com/technology/age-gender-emotion/benchmarks[访问时间:2018-03-09][WebCite缓存］
Clarifai。URL:https://www.clarifai.com[访问时间:2018-03-09][WebCite缓存］
Clarifai。Clarifai处于深度学习革命的前沿https://www.clarifai.com/technology[访问时间:2018-03-09][WebCite缓存］
布利DM，吴艾，Jordan MI。潜狄利克雷分配。J Mach Learn Res 2003 march 01;3:993-1022 [免费全文］
格里菲思TL，史提弗斯M.寻找科学主题。Proc Natl Acad science U S A 2004 04月06日;101增刊1:5228-5235 [免费全文] [CrossRef] [Medline］
Miller M, Banerjee T, Muppalla R, Romine W, Sheth A.关于寨卡病毒，人们在推特上发了什么?对其症状、治疗、传播和预防的探索性研究。JMIR公共卫生监测2017年6月19日;3(2):e38 [免费全文] [CrossRef] [Medline］
谢磊，谢磊。基于推文池自动标记的微博lda主题模型改进。发表于:第36届国际ACM SIGIR信息检索研究发展会议论文集(SIGIR);2013年7月28日至8月1日;爱尔兰都柏林，第889-892页。［CrossRef］
洪L，丹O，戴维森BD。预测推特流行信息。发表于:第20届国际会议论文集与万维网(WWW);2011年3月28日至4月1日;印度海得拉巴，第57-58页。［CrossRef］
Naveed N, Gottron T, Kunegis J, Alhadi AC.坏消息传得快:基于内容的twitter兴趣度分析。发表于:第三届国际网络科学会议论文集(WebSci);2011年6月15日至17日;科布伦茨,德国。［CrossRef］
佩特罗维奇S，奥斯本M, Lavrenko V. RT赢!预测Twitter中的消息传播。发表于:第五届国际AAAI网络和社交媒体会议(ICWSM)论文集;2011年7月17-21日;西班牙巴塞罗那。
基于心理艺术理论的情感图像分类。发表于:第18届ACM多媒体国际会议论文集;2010年10月25日至29日;意大利，佛罗伦萨，第83-92页。［CrossRef］
van de Weijer J, Schmid C, Verbeek J.从现实世界的图像学习颜色名称。发表于:第20届IEEE计算机视觉和模式识别(CVPR)会议论文集;2007年6月17-22日;美国明尼苏达州明尼阿波利斯市，第1-8页。［CrossRef］
色彩对情绪的影响。中华心理医学杂志1994年12月2日(4):394-409。［Medline］
赵旭，朱峰，钱伟，周安。多媒体对新浪微博的影响:热度与寿命。发表于:第六届中文语义网学术研讨会(CSWS)暨首届中文网络科学学术会议(CWSC)联席会议论文集;2012年11月28日至30日;深圳，中国，p. 55-65。［CrossRef］
Bakhshi S, Shamma DA, Gilbert E.脸吸引我们:有脸的照片在Instagram上能吸引更多的点赞和评论。发表于:SIGCHI会议论文集关于计算系统中的人为因素(CHI);2014年4月26日至5月1日;加拿大多伦多，p. 965-974。［CrossRef］
杰利·B，约翰·a，我需要跟随你吗?检查Pinterest跟踪机制的效用。发表于:第18届ACM计算机支持的协作工作和社会计算(CSCW)会议论文集;2015年3月14-18日;加拿大温哥华(1751-1762年)［CrossRef］

‎

API:应用程序编程接口

人乳头状瘤病毒:人类乳头状瘤病毒

LDA:潜狄利克雷分配

MMR:麻疹，腮腺炎和风疹

光学字符识别:光学字符识别

支持向量机:支持向量机

编辑:N Collier, M Conway, V Lampos, A Culotta;提交15.06.17;同行评议:E Yom-Tov, P Massey, S Doan;作者评论01.09.17;修订版本收到27.10.17;接受29.01.18;发表03.04.18

这是一篇开放获取的文章，根据创作共用署名许可(https://creativecommons.org/licenses/by/4.0/)的条款发布，允许在任何媒介上无限制地使用、分发和复制，前提是正确引用最初发表在《医学互联网研究杂志》上的原创作品。必须包括完整的书目信息，//www.mybigtv.com/上的原始出版物的链接，以及此版权和许可信息。

本文内容如下e-collection /主题问题:

推特上的疫苗图片:哪些图片被分享的分析

推特上的疫苗图片:哪些图片被分享的分析

原始论文

通讯作者:

摘要

关键字

简介

背景

之前的工作

《一般公共卫生》图片

疫苗接种中的图像

推特上的疫苗接种

一般推特图片

方法

概述

数据集

疫苗推特数据

用于查询Twitter的完整的疫苗相关关键字和疫苗可预防疾病。

Twitter一般数据

消息数据

图像处理

删除重复映像

用户创建的图像

图像分析

从图像中提取文本

识别面孔

对象识别

主题分析

手动分析

转发预测

用于预测模型的特征

作者知名度特征

元数据功能

文本特征

图像特征

结果

疫苗图片推文分析

图片推文语料库分析

主题分析

手动分析

转发预测

讨论

概述

主要研究结果

影响

未来的发展方向

致谢

利益冲突

参考文献

缩写