卡塔尔世界杯8强波胆分析|卡塔尔世界杯4强波胆分析

JMIR

J医疗互联网服务

医学互联网研究杂志

1438 - 8871

卡塔尔世界杯8强波胆分析

加拿大多伦多

v19i10e361

29084707

10.2196 / jmir.8164

原始论文

从社交媒体中发现孕妇群体进行安全监测和分析

Eysenbach

冈瑟

康威

迈克

Broniatowski

大卫

衬衣

安倍

博士学位 1

生物统计、流行病学与信息学“，佩雷尔曼医学院宾夕法尼亚大学

4级

嘉德路423号

宾夕法尼亚州费城(19104年

美国 1 6024746203 abeed@pennmedicine.upenn.edu

http://orcid.org/0000-0001-7358-544X

Chandrashekar

帕拉

女士 2

http://orcid.org/0000-0002-0175-0423

玛吉医生

Arjun

女士 2

http://orcid.org/0000-0002-4109-1346

蔡

海涛

马女士 1

http://orcid.org/0000-0002-4913-7628

克莱因

阿里

博士学位 1

http://orcid.org/0000-0002-8281-3464

冈萨雷斯

著

博士学位 1

http://orcid.org/0000-0002-6416-9556

¹ 生物统计、流行病学与信息学“，佩雷尔曼医学院宾夕法尼亚大学

费城,宾夕法尼亚州

美国 ² 生物医学信息系亚利桑那州立大学

斯科茨代尔,阿兹

美国

通讯作者:Abeed Sarker abeed@pennmedicine.upenn.edu

10 2017

30. 10 2017

19 10

e361

8 6 2017 9 8 2017 23 8 2017

©Abeed Sarker, Pramod Chandrashekar, Arjun Magge, Haitao Cai, Ari Klein, Graciela Gonzalez。最初发表于《医疗互联网研究杂志》(//www.mybigtv.com)， 2017年10月30日。

2017

这是一篇开放获取的文章，根据创作共用署名许可(https://creativecommons.org/licenses/by/4.0/)的条款发布，允许在任何媒介上无限制地使用、分发和复制，前提是正确引用最初发表在《医学互联网研究杂志》上的原创作品。必须包括完整的书目信息，//www.mybigtv.com/上的原始出版物的链接，以及此版权和许可信息。

背景

妊娠暴露登记是孕产妇孕期用药安全的主要信息来源。这种登记在怀孕早期以自愿的方式登记孕妇，并跟踪她们直到怀孕结束或更长时间，以系统地收集有关具体妊娠结果的信息。虽然妊娠登记模式与其他研究设计相比具有明显的优势，但也面临着入围率低、成本高、选择偏倚等诸多挑战和限制。

客观的

本研究的主要目标是系统地评估社交媒体(Twitter)是否可以用于发现孕妇队列，并开发和部署自然语言处理和机器学习管道，用于自动收集队列信息。此外，我们还试图初步确定从收集的队列信息中可以挖掘出哪些类型的纵向信息。

方法

我们对孕妇的发现依赖于检测怀孕提示推文(pit)，这是孕妇发布的关于怀孕的声明。我们使用了一组14种模式来首先检测潜在的pit。我们手动标注了14,156个检索到的用户帖子样本，以区分真实的pit和假阳性，并训练了一个监督分类系统来检测真实的pit。我们通过交叉验证优化了分类系统，其特征和设置旨在优化阳性类别的精度。对于通过自动分类被识别为发布真实pit的用户，我们的管道收集了他们所有可用的过去和未来帖子，从中可以挖掘其他信息(如药物使用和胎儿结局)。

结果

我们基于规则的PIT检测方法在18个月的时间里检索了超过20万个帖子。在kappa (κ =.79)时，三名标注者的手动标注一致性非常高。在一个盲测试集上，所实现的分类器获得了一个总体的F₁0.84分(怀孕组0.88分，非怀孕组0.68分)。妊娠分级的精密度为0.93，召回率为0.84。特征分析表明，稠密向量与稀疏向量相结合的分类效果最佳。使用经过训练的分类器，从收集的帖子中识别出71,954个用户。这些用户检索了超过2.5亿篇帖子，提供了关于他们的大量纵向信息。

结论

像Twitter这样的社交媒体资源可以用来识别大量的孕妇群体，并通过自动处理她们的帖子来收集纵向信息。考虑到怀孕登记的许多缺点和限制，社交媒体挖掘可能提供有益的补充信息。虽然通过社交媒体确定的队列规模很大，但未来的研究必须评估通过社交媒体获得的信息的完整性。

自然语言处理机器学习文本挖掘社交媒体怀孕队列研究数据分析

简介怀孕暴露登记

上市前临床试验在有限的环境下评估药物的安全性，因此，这些药物对特定人群(如孕妇、儿童或患有特定疾病的人)的影响无法评估。出于对胎儿安全的考虑，孕妇在新药开发期间被积极排除在临床试验之外[ 1］．因此，一旦药物投放市场，除了动物生殖毒理学研究之外，通常没有可用的数据来评估子宫内暴露对胎儿的影响[ 2］．然而，从动物研究中得出的结论可能不适用于人类[ 3.］．自发报告系统，如食品和药物管理局不良事件报告系统，用于上市后药物安全监测，它们提供了一种报告与药物消费相关的不良事件的机制。尽管这些来源可能积累了关于特定人群的药物安全知识，但研究表明，它们存在各种问题，如漏报、缺乏分母数据和缺乏对照[ 2， 4］．此外，自发报告系统等上市后监测技术在本质上是回顾性的，根据未知数量暴露的孕妇的不良结果报告登记病例，使样本偏向不良结果。

为了解决这些问题，为新药开发了妊娠暴露登记。这些登记以自愿的方式前瞻性地登记妇女(例如，暴露后但分娩前)，并在整个怀孕期间或更长时间内跟踪她们。这种妊娠暴露登记的设计使研究人员能够进行前瞻性观察性研究，这种研究优于回顾性研究，因为与回顾性研究相关的偏差(例如，出生缺陷等结果在回顾性研究中已经已知)[ 2］．因此，妊娠暴露登记所遵循的模型比其他研究设计具有明显的优势，因为这些登记可以产生关于妊娠期药物安全性的人类数据，同时避免随机对照试验的伦理和后勤陷阱[ 5］．

尽管与其他研究设计相比有优势，但妊娠暴露登记面临着许多挑战。登记或招募可能是最关键的问题，大多数登记处只能登记一小部分暴露的怀孕，导致缺乏评估具体畸形或健康结果的能力[ 6］．自愿登记过程亦可能存在偏见[ 7]，因为同意登记的妇女可能已经了解某些健康状况。其他挑战包括较大的退出率或失访率[ 7]，这导致许多暴露怀孕的信息丢失，发现怀孕前缺乏可用信息，以及报告不完整[ 8］．这些与妊娠登记相关的挑战需要探索更多的信息来源，以评估妊娠期间药物的安全性。

动机、目标和贡献

就全球用户而言，社交网络已经出现了前所未有的增长。根据皮尤研究报告[ 9，全球近一半的成年人和三分之二的美国成年人(65%)使用社交媒体，其中65岁及以上的人群占35%，18岁至29岁的人群占90%以上。因此，公共卫生监测和监测研究正在迅速纳入通过社交媒体提供的数据，并开发能够有效挖掘社交媒体数据的工具[ 10］．由于在上市前临床试验期间可获得的关于孕妇的信息有限，以及现有前瞻性和回顾性监测方法的挑战和缺点，有必要探索额外的信息资源。在药物上市后，社交媒体有可能成为获取关键药物安全信息的重要补充资源。然而，通用社交媒体在这项任务中的可用性取决于能够主动识别孕妇并收集有关孕妇的相关数据的系统的成功开发。这一需求是本文研究的主要动机。本文的具体目标如下:

设计并验证一组查询模式，用于从Twitter用户中检索高度表明怀孕的帖子。

开发和评估一种有监督的机器学习方法，可以准确区分真实的怀孕提示推文(pit)和假阳性。

设计一个从已确定的妊娠队列中收集纵向数据的端到端管道。

对提取的健康时间线进行初步分析，以评估其有用性，确定局限性，并确定未来的研究目标。

本文的主要贡献如下:

我们提出了一种机制和一组查询，通过这种机制和查询，可以在社交媒体上识别出大量潜在的孕妇。

我们提出了一种监督文本分类方法，用于准确检测和登记一个怀孕队列进行数据收集。

我们讨论了一种结合上述两种技术的管道，以主动收集由检测到的怀孕队列发布的信息。

我们讨论了从队列中收集的数据的潜在用途。

方法初步分析

为了评估社交媒体是否可以用来识别孕妇群体，我们使用Twitter进行了初步分析[ 11］．为了进行分析，我们使用了一个手动创建的表单查询模式——“I.*(m|am|’m)”。* |月(周)。*怀孕了。”通过查询检索到的推文被手动分析并分为两类:PIT和非PIT。共有1200条检索到的推文以这种方式进行标记，其中753条(62.75%)被标记为真pit, 447条(37.25%)被标记为假阳性。这一早期分析非常有希望，因为它表明，由此类查询检索到的推文很可能是女性自己发布的真实怀孕迹象。此外，该模式每月收集超过1500个公告，这表明从长远来看，可能会检测到大型队列，特别是添加了新的查询之后。

在同一分析中，我们还评估了使用自动监督分类器进一步过滤收集的推文的可能性，以便能够更精确地识别怀孕队列。我们尝试了几种有监督的分类方法，包括Naïve贝叶斯和支持向量机(svm)，发现后者在F的情况下产生了可接受的性能₁PIT类的得分为0.80(精度约为0.83)。我们的可行性分析研究的这些结果为我们进一步探索这个问题并开发一个更强大的队列收集解决方案提供了强有力的鼓励。我们将在以下小节中讨论这一初步研究的扩展。图1给出了一个流程图，说明了整个工作流程，从查询公式部分开始，直到使用结构化数据进行队列分析。

图1

从社交媒体发现怀孕队列的流程图。

查询公式

我们手动研究了初步研究中识别的推文，并使用Twitter图形界面(即实际的网站)，我们确定了额外的高频单词n-gram模式和规则，通过这些模式和规则可以高精度地检测pit。对于每个潜在的模式，我们通过在Twitter图形界面上手动使用它作为查询来评估其有用性。对于每个查询，大约有50条推文被手动评估。能够检索大约60%以上真实妊娠post的模式被选择用于大规模检索。那些检索到大量真阳性，但有太多噪声的假阳性的模式被丢弃了，因为我们主要关注的是确保高精度。

通过这种方式，除了初步分析中使用的模式外，我们还确定了13个查询模式。一旦确定了每个查询，就会使用它从Twitter Streaming应用程序编程接口(API)收集推文。该API实时公开所有公开推文的示例，并支持收集。但是，API不允许直接使用正则表达式。因此，我们使用种子术语“怀孕”、“怀孕”、“婴儿”、“家庭”和“妈妈”从API检索推文，然后将它们与特定的正则表达式匹配。数据收集模块运行了18个月，对14个查询中的每个查询都有微小的变化。表1显示所使用的查询以及在定义的时间段内由它们检索的推文的相对频率的估计。

注释

在收集期间早期收集的数据样本已准备好用于注释。我们在收集阶段的早期观察到，每个查询检索到的tweet数量有很大的差异(如中第三列所示) 表1表示)。为了确保注释集中推文的分布代表检索到的全部数据集，我们选择了14,300条推文的分层随机样本。制定了注释指南，以确保注释过程的一致性。注释指南可在多媒体附件1．

三个注释器以二进制方式注释了所有推文，并对1000个推文进行了重叠注释。多数投票是用来解决重叠推文的分歧。样本注释者之间的一致性为κ=.79(Fleiss kappa)，这代表着重要的共识。总共有9819条推文被标记为真实的pit, 4338条推文被标注为假阳性。然后，这些带注释的推文被传递到下一个阶段，用于训练和优化自动监督分类器。表2显示一个带注释的推文示例，其中删除了用户名。

分类

在完成的14300条注释中，有14156条tweet适合用于分类。其余部分由于编码问题和其他语言的存在等各种原因被删除。我们探索了许多有效执行分类任务的特征集，包括那些我们通过在该领域的广泛过去工作确定的对社交媒体文本分类有用的特征集。 12- 14］．此外，我们还试验了几种流行的监督分类方法，以确定在问题上表现最好的方法，以及基线分类系统。我们探索的分类器是支持向量机(svm)、随机森林(RF)和具有3个隐藏层的卷积深度神经网络(DNN)，基线是Naïve贝叶斯。我们将注释数据集分成大约80-20的比例(80%用于训练和系统开发，20%用于评估)。我们使用较大的分割来优化分类器和识别有用的特性。根据我们过去的研究，我们已经将培训数据样本和其他资源公开提供给研究界[ 15］．为了保持隐私和可复制性之间的平衡，并遵守Twitter的数据共享政策，我们将只使用用户id共享推文，而不是逐字逐句的文本。因此，所有被原海报删除的推文将不会向公众开放。下面是我们为最终分类系统选择的特征的描述。

表1

用于检索怀孕提示推文和指定其他详细信息的一些注释的查询模式。”。“*”表示任意长度的字符序列，“|”表示“或”，“&”表示“和”的任意顺序。查询以简化的形式显示。每种模式的推文频率和相对频率也被显示出来(N=14,156)。

查询模式	笔记	相对频率，n (%)
(im \|我\|我)。* ( 时间］．*怀孕	时间可以是周、周、月或月	4374 (30.90)
婴儿&到来	N/A^一个	375 (2.65)
宝宝快来了	精确的顺序，中间有空格或标点符号	297 (2.10)
是。* 时间因为我怀孕了	时间可以是天、天、周、周、月或月;“一直时间”的精确顺序，中间有空格或标点符号	22 (< 1.00)
成长，婴儿和肚子	N/A	150 (1.06)
(im\|i am\|i 'm)期待。*宝贝	“(我是\|，我是\|，我)期待”的精确顺序，带有空格或标点符号。“baby”必须出现在后面的任何地方	74 (< 1.00)
(im\|i am\|i 'm) going to (b\|be) a mom	精确的顺序，中间有标点或空格	179 (1.26)
(im\|i \|i)有一个孩子	N/A	1396 (9.86)
我曾经怀孕过	N/A	88 (< 1.00)
(ive\|我)怀孕了	N/A	735 (5.19)
“我们的家庭”	“我们的家庭”的确切顺序，中间有标点或空格	13 (< 1.00)
我怀孕	精确的顺序，中间有空格或标点符号	6211 (43.88)
(im\|i \|i 'm)将要有一个孩子	N/A	234 (1.65)
我们的家庭。成长。(2\| 2)英尺	N/A	8 (< 1.00)

^一个N/A:不适用。

词字格

在文本分类中，单词n-gram通常是信息量最大的特征。这些n-gram是经过预处理的单词序列，它们在捕捉文本片段的含义方面非常出色。我们通过降低推文的大小写并使用波特词干算法进行词干预处理[ 16］．我们使用1-、2-和3-g作为特征，不删除停止词，在训练期间，每条推文都表示为训练词汇中所有n-g计数的向量。在我们的初步研究中，我们还尝试了某些术语的同义词，但我们从最终系统中删除了它们，因为它们似乎没有提高性能。

密集词嵌入

n-gram(尤其是Twitter数据)的一个潜在问题是，n-gram集合中可能有很多变化，从而产生非常稀疏的向量。最近，密集词向量或嵌入的使用在自然语言处理(NLP)研究中变得流行。 17］．这些嵌入是从大量未标记的数据中学习的，它们能够以密集向量的形式捕获关于每个单词的语义信息。对于这个分类任务，我们通过添加所有单个标记的密集表示来获得每条推文的密集向量表示。为了获得术语的密集向量表示，我们使用了公开可用的预训练向量[ 18］．这些向量是从4亿条推文中学习的，每个单词都使用大小为400的密集向量表示。

词群

解决分类中稀疏向量问题的一种策略是使用基于一些预定义分组标准创建的术语的广义表示。在过去的工作中，我们发现使用单词的聚类表示可以提高分类性能[ 19］．在我们的工作中，我们使用了Owoputi等人提供的Twitter单词集群[ 20.］．这些聚类是通过首先从5600多万条推文中学习词嵌入生成的，然后使用隐马尔可夫模型将单词划分为1000个基本聚类的分层集。

在生成特征时，我们为推文中的每个令牌使用集群号(如果可用)，并将集群表示为二进制向量。因此，每条推文的聚类向量代表了推文中出现的单词的一般类别。

表2

由14个查询检索的示例推文及其二进制注释。“真”表示真实的怀孕迹象，“假”表示假阳性。对于true类别，我们从14个查询中每个查询至少包含一个样本。

推特	类别
大概一个月后的今天，我就要当妈妈了……我等不及想看看我的宝贝女儿长什么样了:-)	真正的
所以我想我应该让推特知道我在8个月后怀孕了!!	真正的
这个肚子和里面可爱的宝宝是我想要的最好的圣诞礼物!!圣诞快乐…	真正的
我已经三个星期没有听到或看到它了。所以有时候我感觉不到怀孕，但这个新的妊娠纹证明事实并非如此	真正的
再过几个月，我们家又添了一个孩子! !	真正的
准备好过圣诞节了，兴奋地宣布小男孩****将于2017年5月出生!# MC3	真正的
我们家长大了两尺一心	真正的
希望并祈祷收入问题的解决。宝宝快来了!需要更好的工作和更高的薪水	真正的
我真的无法接受我将在16天或更短的时间内生孩子的事实。	真正的
所以我要生孩子了，超级兴奋	真正的
我发誓，自从我怀孕以来，每个人都把我忘了，没有让我参与任何事情	真正的
嗯…我现在怀孕39周零6天……亲爱的，你什么时候都可以来	真正的
我刚把我怀孕的渴望提升到了一个全新的高度:我在通心粉和奶酪上放了牧场奶酪。# Yummmmmmmm	真正的
自从我怀孕以来，我就很狡猾，甚至连彩虹都不会涂。	真正的
我永远惊讶于有那么多女性问我什么时候要孩子，而不是问我的职业目标。	假
我发誓我已经怀孕两年了。# theobesityneedstostop # ineedwine	假
我要生宝宝了，JB日快把我累死了。我太爱他了@贾斯汀比伯	假
我妹妹怀孕五周零三天了。我要当阿姨了天啊	假
怀孕两天的女孩就会发照片说“我变大了”。	假
真不敢相信我有个小弟弟了!	假

情绪特征

在初步分析期间，我们对收集的推文进行了检查，发现用户在宣布怀孕时可能会表达强烈的情绪，这可以从一些例子中看出表1．情感分析本身是一个活跃的研究领域，在这一领域已经有了大量的工作，特别是对社交媒体文本的研究[ 21］．为了将帖子中的情绪捕捉为特征，我们添加了以选定尺度表示情绪的特征。对于每条推文，我们都给出了三组分数，分别代表三种不同的情绪衡量标准，这些标准基于以下几点:(1)积极和消极词汇列表[ 22]，(2)项的先验极性[ 23(3)术语的主体性，它既表现为极性，又表现为主体性[ 24］．

结构特点

这些功能包括显示每条推文的结构信息。这些特征包括推文长度(以单词和字符为单位)、推文中的句子数、平均句子长度等等。

实验

对于前面提到的四个分类器中的每一个，我们使用训练集来探索特征，并在适当的时候通过10倍交叉验证来确定特定超参数的接近最优设置。训练集由11325条推文组成，测试集由2832条推文组成。这些分类器的优化设置被用于对测试集中的推文进行分类。此外，我们还将三个分类器组合成一个集合，并通过多数投票预测测试集标签。然后使用表现最好的分类器对我们的模式收集的所有与怀孕相关的推文进行分类。在对收集到的未标记数据进行分类之前，使用整个标注数据集进行训练。

我们还评估了每种类型查询模式的最佳分类器的性能，以了解由特定查询检索的推文是否需要更多关注。此外，我们通过在相同的测试集上使用不同比例的训练集进行分类来分析分类器的学习率——从1133/ 11325(10.0%)条推文开始，每一步增加10%。我们分析了每个训练集大小下的受试者工作特征(ROC)曲线，以及整体性能，以评估进一步注释是否有可能提高性能。我们将在下一节中介绍结果，以及每个特性集的贡献的详细信息。我们使用python scikit-learn库实现svm和RF，使用TensorFlow实现DNN。

队列信息检索与存储

所有与我们选择的分类器分类为积极的推文相关的用户句柄都被收集和存储。对于每个用户，根据API的限制，使用Twitter搜索API收集该用户过去所有可用的帖子。此外，这些用户每周发布的新推文被收集，从而形成了一个时间轴对于封装纵向信息的每个用户。所有信息都存储在Mongo数据库中，以备将来分析。

从时间轴上可以获得关于每个用户怀孕情况的广泛纵向信息。这些信息包括但不限于药物使用情况、健康习惯(如吸烟或饮酒)和生育结果。我们的检测和收集方法的目标是对这些信息进行大规模分析。我们在讨论部分提出了一些可能性，并将具体的分析留给将来的工作，因为这超出了本研究的范围。

健康信息分析

我们使用收集到的数据进行了几次初步分析，以评估时间线的效用，它们在未来研究中的潜在用途，以及为提高它们的有用性所需的面向nlp的未来工作。这些分析包括:(1)评估从收集的队列中检测妊娠期信息的可能性，(2)确定队列成员是否存在与药物相关的信息，以及(3)确定时间线中是否存在与杂项健康状况有关的信息。我们现在简要地讨论一下这些分析方法。

三个月检测

妊娠期可分为三个三个月:第一周至第12周，第二周至第13周，第三周至第28周。妊娠期信息对于未来妊娠队列分析至关重要，因为健康事件(如药物摄入)可能会独特地影响胎儿结局，这取决于妊娠期。要成功识别与已发布的健康相关事件相关的三个月，需要有关怀孕开始日期的信息。我们对时间轴样本的分析表明，这个问题的关键NLP挑战是检测关于怀孕进展的陈述，这些陈述通常可以在我们的查询检索到的怀孕推文中找到。我们采用了一个简单的，基于规则的方法来评估妊娠队列的部分，从中可以得到三个月的信息。在我们基于规则的算法中，我们首先尝试识别时间轴内提到术语“怀孕”和“怀孕”(种子词)的所有推文。接下来，收集出现在种子项大小为6的对称上下文窗口内的项。然后，在上下文窗口中，算法搜索关键的时间术语，如“周”和“月”，以及提到的数字(如“6”、“12”、“18”等)。如果所有这些规则都满足，则使用提及的数量和时间术语来确定怀孕的进展(例如，“怀孕6周”中的“6周”和“怀孕”)。该数字和其他提到的术语被提取出来，并与相关推文的时间戳进行比较，以确定怀孕的大致开始日期和三个月。

药物提及分析

如本文前面所述，怀孕期间药物摄入及其与胎儿结局的潜在联系是一个重要的研究课题。怀孕登记目前是这方面的唯一信息来源。在未来，如果要将社交媒体用作研究孕期药物安全性的补充来源，必须在收集的孕期时间线内提供与摄入相关的信息。虽然完整的研究超出了本文的范围，但我们通过自动计算我们数据样本(检测到潜在妊娠期信息的同一样本)上一组药物的提及频率来进行初步评估。我们的目标是确定药物使用信息是否可用，而不是执行彻底的分析，这是我们未来的工作。

健康状况可用性评估

我们手动分析了30个用户时间线的小样本，以确定存在的健康信息类型，并确定需要执行哪些未来任务来提高所收集信息的效用。我们在“结果”部分给出一个时间轴样本，并在“讨论”部分提供进一步的细节。

结果分类结果

最终的训练集由7830个怀孕类实例和3494个非怀孕类实例组成。测试集由1989个怀孕类实例和843个非怀孕类实例组成。表3介绍了该分类器在测试集上的性能。从表中可以看出，三种非基线分类器和集合在F级怀孕方面表现相似₁得分。支持向量机和DNN的性能优于射频分类器，尽管这些性能在统计上不显著。三种分类器的集成在测试集中的性能略好于其他分类器，但改进并不显著，并且在时间方面付出了非常高的代价(例如，它的运行速度大约是独立svm的5倍)。所有这些分类器都显著优于Naïve贝叶斯基线。

基于注释集上的这些结果，我们选择在我们的系统中使用支持向量机。与DNN相比，svm似乎有更高的精度，这是我们整个管道的首选。请注意，使用更深的dnn可能会导致更好的性能，这是典型的情况。然而，更深层次的网络在计算上也要昂贵得多，所以我们没有把它们包括在我们的探索中。支持向量机的表现比DNN和集合快得多。因此，考虑到所有这些因素有利于支持向量机的使用。

图2显示所选分类器在每个查询模式检索的帖子上的性能。这些性能结果是通过对整个注释集进行10倍交叉验证获得的。从图中可以看出，对于检索率最高的两个查询(“(im|i am|i’m).*[时间]。*怀孕”和“我怀孕了”)，表现得分高于整体平均水平。这可能是因为注释是在分层随机集上进行的，因此，这些集的注释推文总数远远高于其他集，导致这些模式的算法训练得更好。模式“(im|i am|i 'm) having a baby”的检索率第三高，但该集合的分类器性能要低得多，这导致整体性能下降。一般来说，从图中可以看出，具有低检索率的模式表现较差。我们在讨论部分简要分析错误的原因。

图3提供对系统性能的进一步了解。图(上)中的ROC曲线表明，一旦使用了超过50%的训练数据，预测性能将保持相当稳定。这表明，对同一类型数据的进一步注释不太可能提高分类器的性能。学习率图(底部)显示了两个类的性能指标以及不同训练数据大小下的完整数据集。这个图表还显示，对于每个集合，在训练集大小约60%后，性能保持稳定。不出所料，随着训练集规模的增加，较小的非怀孕班的表现指标得到了最大的改善。随着这个类的性能提高，整体性能也会提高，尽管是有限的。

表4介绍了该分类器在留一和单特征实验中所获得的性能。召回率，精确度和F₁每节课的分数和全部的成绩都显示出来了。在任何一个剔除一个特征的实验中，当去掉一个特征时，特征组合的性能都没有显著下降。去除n-grams的结果是最大的下降，但只是边际下降。这表明分类器的性能不依赖于任何单个特征，而是依赖于所有特征的组合。这在Twitter数据分类器中是可取的，因为每条tweet中的字数较少，这意味着一种类型的特征通常无法捕获足够的信息来正确地进行分类。结合多个特征可以增加正确分类的机会。表中的单个特性得分可以更清楚地说明哪些特性在单独使用时信息量最大。不出所料，n-grams似乎是最强的特征集，其性能非常接近于分类器的最佳性能。密集向量和词簇本身也有很好的性能，验证了这两个特征集的有用性。结构特征和情感特征，虽然在我们使用更小的训练数据进行的初步研究中被证明是有用的，但一旦训练集大小足够大，它们就不会有显著的贡献。 For these two features, large drops in performances are observed when they are used stand-alone. In all cases, we see a greater drop in the nonpregnancy class compared with the pregnancy class once a feature or a combination of features is removed. Although our focus is the pregnancy class, it is crucial to improve performance over the nonpregnancy class as changes in performance in one class directly affect the performance in the other.

队列收集统计

在18个月的时间里，我们系统的数据收集组件(检索和分类)共收集了71,954名潜在怀孕用户。过去收集用户数据的结果是收集了超过2.5亿条推文，平均每个用户约3500条推文。怀孕的新用户以每月9000到10000的速度被检测出来，同期平均检测到2500万到3500万的新推文。按照这个速度，我们预计在未来12个月内将收集到额外的10万到12万条时间线。

表3

三个强分类器、Naïve贝叶斯基线和集成分类器的分类器性能。精度，召回率和F₁每个分类器的妊娠类别评分以及总体准确度和准确度的95% CI。

分类器	怀孕类			两个班级
分类器	精度	回忆	F₁分数	准确度(95%置信区间)
朴素贝叶斯	0.44	0.90	0.59	0.57 (0.56 - -0.58)
随机森林	0.95	0.79	0.86	0.81 (0.80 - -0.82)
深度神经网络	0.90	0.87	0.88	0.84 (0.83 - -0.85)
支持向量机	0.92	0.85	0.88	0.84 (0.83 - -0.85)
系综	0.93	0.85	0.89	0.84 (0.83 - -0.85)

表4

为分类中使用的特征保留一个和单个特征分数。“-”表示该特性被移除。

特性集		怀孕类			Nonpregnancy类			全套
特性集		P^一个	R^b	F^c	P	R	F	P	R	F
所有		0.92	0.85	0.88	0.62	0.76	0.69	0.85	0.83	0.84
	-N-grams	0.90	0.85	0.87	0.61	0.73	0.67	0.83	0.82	0.82
	密集的向量	0.92	0.85	0.88	0.61	0.76	0.68	0.84	0.83	0.83
	词群	0.92	0.84	0.88	0.58	0.76	0.66	0.84	0.82	0.83
	情绪特征	0.92	0.85	0.88	0.62	0.76	0.68	0.85	0.83	0.84
	结构特性	0.92	0.85	0.88	0.62	0.76	0.68	0.85	0.83	0.84
字格		0.92	0.83	0.86	0.55	0.76	0.63	0.84	0.81	0.82
密集的向量		0.89	0.82	0.85	0.54	0.68	0.61	0.81	0.79	0.80
词群		0.90	0.83	0.86	0.56	0.70	0.82	0.82	0.80	0.81
情绪特征		0.70	0.64	0.67	0.28	0.20	0.24	0.55	0.49	0.52
结构特点		0.67	0.69	0.68	0.30	0.28	0.29	0.55	0.56	0.56

^一个P:精度。

^b接待员:召回。

^cF: F₁得分。

图2

监督分类器对每个查询模式的怀孕类的性能。

健康信息分析结果

我们对34,895名在研究早期被分类器分类为怀孕的用户时间线应用了我们的妊娠三个月提取算法。我们的算法检测了15,523名(约44%)用户的妊娠三个月信息。该算法进一步将属于这些时间线的每条推文分类为三个三个月中的一个。虽然检测三个月信息的可用性是非常准确的，但对时间线的一个小样本的人工分析表明，在将时间线分为三个月方面，该算法仅在大约50%的情况下是准确的。这验证了在我们队列的大样本中，三个月的信息是可用的，但需要一个更健壮的算法来自动将信息分类到三个月。

计算同一样本的药物提及频率，其中三个月的信息被检测，验证有一些药物相关的颤振可用的时间轴。图4显示了推特用户在怀孕三个月期间常用药物的分布情况。然而，对之前提到的时间线的人工分析表明，只有一个提到的药物样本是真正的摄入例子。除了药物提及之外，分析还显示，从时间轴上还可以挖掘出各种其他与健康相关的信息。然而，这些信息与大量的噪音交织在一起。表5从我们手动分析的一条时间线上，按时间顺序显示样本帖子，说明了一些可用的信息类型。从表5可以看到，推文8、11和15提供了关于怀孕进程的信息，并与推文上的时间戳相匹配，这些信息可以用来识别一条推文的三个月。

图3

怀孕推文分类器在不同训练数据大小下的接收者工作特征(ROC)曲线(上图)。ROC曲线下面积(AUC)的值也显示为每个训练集的比例。每个类的分类精度、召回率和F1分数以及每个训练集的完整数据集的比例(底部)。

表5

从我们的系统分类为怀孕的用户的时间轴中抽取20个相关帖子的样本。这些帖子是手动筛选和分类的。用户名已被匿名化。

号#	推特	三个月	信息类型或注释
1	扁桃体正在被清除……1st October they will be no more!	第一个	健康状况
2	神……我30.．．．T他right thing to do is probably to eat lots of cake to make it better #happybirthdaytome #30s	第一个	用户年龄
3.	@username是的，我都做完了，现在感觉不太糟，药房里满是止痛药，看我通过!感谢xx	第一个	药物治疗
4	@用户名谢谢，回家前吃了一些吐司，刚刚做了第二批吃止痛药!	第一个	药物治疗
5	@用户名hazel在dw上计算出了成人的calpol剂量，所以我把它存起来以备不时之需，我们总是有calpol !Xx	第一个	药物治疗
6	@用户名@用户名我这周在扁桃体炎后吃了曲马多，可以确认它肯定会让你感到生气和困!	第一个	药物治疗
7	可怜你听起来可不好玩。我没事，喉咙好多了，现在不用吃止痛药了，这很好!	第一个	停止药物治疗
8	20周扫描今天!很高兴它的第一件事，我不需要等待一整天。最大的问题是，粉色还是蓝色?	第二个	进展信息
9	所以二号宝宝是个女孩!亚历克斯一直都是对的，现在我需要一些好听的女孩名字!#宝宝	第二个	婴儿性别或健康状况
10	期待#oneborneveryminute，爱宝宝秀，即使我已经怀孕25周了	第二个	我们的查询检测到怀孕后
11	没有什么比看到一个小婴儿更让我意识到我很快就会有一个这样的孩子了	第三	妊娠进展
12	看来我们也要加入瘟疫的行列了，还有谁?#水痘	第三	健康状况
13	我想我们已经度过了天花的最坏时期，第五天没有新的斑点，但有很多结痂。# poxwatch	第三	健康状况
14	我!怀孕36周，从阳光韦斯顿超级母马来看你!	第三	怀孕指示岗位
15	@username我没有被烧伤，因为我主要是在车内或有空调的车里，那里更凉爽#37周怀孕	第三	妊娠进展
16	这是夏洛特·阿米莉亚·康恩11点22分出生体重7磅10盎司	出生	出生公告
17	夏洛特原本是7磅10盎司，今天降到了6磅12盎司。显然任何超过10%的下跌都会引发一大堆问题	后出生	新生儿体重减轻
18	@username认为你会这么想!是的，很明显10%是底线，她的是11.2%。希望明天能避免再入院	后出生	新生儿体重减轻
19	@用户名没错。她需要增重，结果又减了10克。: - (	后出生	持续减肥
20.	@username作为一个成年人确实很糟糕。我们现在很好，谢谢，洛蒂也长胖了。不过还需要多睡一会儿!	后出生	新生儿体重回升

图4

在我们收集的妊娠队列样本中收集的数据中提到一组药物的分布情况。提及也被我们初步的三个月检测方法分类。

讨论主要研究结果

我们研究的目标是确定是否可以使用公开发布的社交媒体数据和自然语言处理来检测孕妇群体。我们设计了用于检索强烈表明用户怀孕的用户帖子的查询。在收集这些帖子后，使用监督分类进一步过滤假阳性，并收集一组极有可能怀孕的用户。获得的结果表明，这种方法能够检测孕妇，并创建一个基于社交媒体的妊娠队列，可用于进一步分析。我们的首要目标是从社交媒体数据中挖掘数据，补充现有的怀孕安全信息来源。为了能够做到这一点，第一步，也是最关键的一步，是能够高精度或精确地检测孕妇。我们的研究证实，通过使用精心构造的查询和设计良好的监督分类策略，这是可以实现的。尽管查询能够为每个查询收集具有不同准确性的pit，但监督分类方法的总体评分为F₁怀孕类的得分为0.88，这几乎等同于人类对这些数据的认同。这表明，我们的模型确实有效地从嘈杂的社交媒体数据中准确检测出怀孕人群。

除了分类器的性能外，从队列中收集到的大量用户帖子和通过小规模分析检测到的健康相关信息强烈支持了我们建立这样一个系统的最初动机。根据我们的小型分类后分析，从队列中收集的数据似乎封装了关于各种健康相关信息的关键知识，尽管在大量嘈杂的、不相关的信息中。因此，这些数据可用于研究药物摄入与妊娠结局、孕产妇健康模式、行为模式及其与妊娠结局、新生儿健康等之间的潜在关联。

我们的监督分类方法也有可能被应用到其他类似的问题。我们的方法结合了稀疏和密集向量，它们独立地在分类任务中表现良好。这种组合表示可能有利于其他使用短文本块作为输入的社交媒体文本分类任务，这些文本块具有有限的上下文信息。

自动队列检测的应用

如手稿第一节所述，某些队列(如孕妇)不包括在临床试验中。因此，当药物投放市场时，孕妇群体的药物安全信息通常是不知道的，发现与不良反应的新关联可能需要数年时间。利用社交媒体数据开发成功的监测技术可能会加快发现未知关联的过程。未来，这些技术将不得不在我们的探测机制的基础上发展。此外，社交媒体可能会提供有关母亲行为模式的信息，而这些信息可能不会向医生透露。这些模式可能包括吸烟、饮酒、抑郁行为和滥用处方药。这些信息可能有助于得出与不良胎儿结局和孕后产妇健康之间的因果关系。

我们的框架也可以用于检测和监测其他队列。关键在于能够识别可以检索用户所在帖子的查询订阅一个队列和一个自动分类策略可以过滤掉噪音。例如，该战略可用于检测患有特定健康状况的使用者、特定药物或医疗干预的使用者以及对处方药物或非法药物上瘾的使用者。

错误分析与语言分析误差分析

我们进行了有限误差分析，以确定哪些因素通常会导致错误。分析结果与中所示的每个查询结果分解非常一致图2．总之，我们发现三种特定的查询模式有很大比例的错误——“婴儿&到达”、“婴儿即将到来”和“添加”。*一个‘我们的家庭’。”研究发现，在前两种情况下，“婴儿”一词通常用来指爱人，而不是指即将出生的孩子。这两个查询在带注释的总数据中都有很好的表示(>2%)，但许多变化意味着自动化算法不可能区分真实的公告和假阳性。对于第三个问题，我们发现，尽管一些推文真正地表明了母亲即将出生的孩子，但其他推文提到了不相关的生活事件，比如养了一只新宠物或结婚。根据我们的指导方针，有些帖子是由其他家庭成员而不是孕妇发布的，因此被认为是假阳性。

在这些常见错误案例的基础上，我们设想了几种可能的解决方案，可以在未来尝试进一步提高分类精度。由于我们选择分层随机样本进行注释，检索率低的模式检索到的一些推文只接收了少量的注释。因此，如果注释了更多的推文，这些推文的性能可能会提高。然而，考虑到它们的低检索率，从我们未来的检索工作中删除这种容易出错的模式可能是谨慎的做法。至于我们的查询所检测到的孕妇男性的推文(例如，查询模式包括我们的)，可以将一个模块添加到我们的管道中，尝试从用户时间轴自动检测性别。我们将在将来考虑开发这样的模块或组件。

语言分析

深入了解描述和区分“怀孕”和“非怀孕”推文的语言特征，可以为将来的数据检索修改查询提供信息。为了获得这样的见解，我们使用了一个语料库分析工具 DocuScope［ 25］．基于DocuScope对3000条“怀孕”推文和3000条“非怀孕”推文的语言模式的分类和频率计数，我们进行了一项研究因子分析［ 26来探索推文中经常同时出现的特征。最后，我们使用因子分析的结果——特别是因子得分——作为方差分析(ANOVA)的输入，以评估是否有任何因子(即高度相关的语言特征组)可以解释显著的语言变异[ 27]在两组推特之间。

分析中的一个因素揭示了词语怀孕而且怀孕了经常出现在第一人称的引用中(例如，我而且我的)，而提到其他人(例如，她，他，哥哥, 妹妹)和以目标为导向的行动(例如，生孩子)在“怀孕”的推文中经常缺席，反之亦然。许多“未怀孕”推文的显著特征都是在宣布一个兄弟姐妹怀孕了(例如，我妹妹要生孩子了)，或者这条推文的作者将是你的兄弟姐妹(例如，我有个小弟弟了)，而许多“怀孕”推文的显著特征结合起来，宣布了作者自己的怀孕。根据方差分析，这一因素解释了两组推文之间统计上显著的语言差异。

因子分析可以揭示微观层面的语言线索，这些线索潜在地促成了注释者将推文归类为“真实”或“虚假”怀孕迹象的高层决定;因此，它还可以深入了解在推文自动分类中起重要作用的语言特征。例如，知道第一人称引用是“怀孕”推文的一个显著特征，这可能解释了分类器在“生孩子”查询模式上相对较弱的性能;在推特上，比如“我有一个小弟弟了。我可能会让分类器误以为这是“真实的”怀孕公告。这种洞察力可以为将来的数据检索修改查询提供信息。

限制

本研究在方法学上存在一些局限性，值得进一步研究。首先，这项研究的队列成员是从单一的社交网络Twitter中选择的。Twitter作为一种独特的社交媒体资源，帖子的最大长度为140个字符。这给NLP工具带来了许多问题，因为缺乏上下文，替代拼写等等[ 28]，但这一特性也限制了可用于描述怀孕相关信息的模式的数量。将我们的框架扩展到Twitter之外，需要对所选择的社交网络进行定制查询，并使用额外的数据训练监督学习算法。

通过Twitter接触到的人群也很有限，而且样本只偏向于社交网络用户。然而，对于类似的任务，在所有样本中都存在这种偏见，而社交媒体可能是与大量不同人群接触、沟通和协作的最有效方式[ 29， 30.］．使用社交媒体的一个更重要的限制是，与传统的流行病学研究不同，关于个别病例的完整信息可能更难获得。虽然可以发现大量的同组人群，但并非所有与健康有关的活动和健康状况都可以从其工作岗位得到。因此，大队列规模的好处可能会减少。还存在发现人口统计信息的问题——关于个人用户的人口统计信息可能只有有限或根本没有。在某些情况下，用户的地理位置是可用的。其他人口统计信息，如年龄和种族，需要通过自动化技术确定。将来必须开发可靠的技术来发现怀孕队列的人口信息。然而，在这一点上，以我们所描述的方式使用社交媒体似乎很有希望在未来补充传统资源。

与之前工作的比较

据我们所知，目前还没有现有的工作试图通过社交媒体识别孕妇群体，以进行大规模的药物安全性分析。基于社交媒体的研究主要集中在更一般的监测任务，如流感传播预测[ 31， 32]、药物警戒[ 33]、药物滥用监察[ 13， 34]，以及药物-药物相互作用[ 35举几个例子。大多数基于社交媒体的研究试图从职位层面的信息中得出结论，而不是试图从纵向数据中得出关联。一些研究利用简单的检测方法来识别具有特定特征的用户，然后对发布的信息进行分析。Correia等[ 35)，例如，使用Instagram上的标签来收集用户时间线并检测药物与药物的相互作用，而De Choudhury等人[ 36利用推特数据预测产后抑郁症。黄等[ 37]评估了从Twitter用户时间轴检测有害处方级联的可行性。然而，正如作者所讨论的那样，由于社交媒体数据的不确定性和稀有性，这种检测具有挑战性。本文提出的工作超越了这些先前的工作，建立了一个全面和准确的方法来检测一个专门的队列，也提供了一个新的机会来使用公开数据对孕妇进行安全监测。

结论

在本文中，我们提出了一种通过社交媒体自动识别大型孕妇队列的方法。我们提出的两步检测方法首先使用有针对性的查询来识别潜在的孕妇，然后使用监督分类来过滤掉大多数假阳性。我们彻底评估了我们的队列识别和分类方法，以验证这是一种可行的妊娠队列检测方法。我们还展示了收集到的信息的潜在用途和未来的任务。

基于我们的研究结果，社交媒体有望成为对妊娠队列进行药物安全性研究的有用资源，特别是考虑到与其他来源(包括妊娠登记)相关的缺陷。然而，必须指出的是，人们并不期望社交媒体取代这些传统资源，而是作为一种补充资源。相同的管道也可以用于自动检测其他类型的队列。未来的研究，收集到的数据的具体目标应用，将提供关于其有用性的进一步见解。

多媒体附件1

怀孕推文注释指南。

缩写

方差分析

API

应用程序编程接口

款

深度神经网络

NLP

自然语言处理

坑

pregnancy-indicating推

射频

随机森林

中华民国

接收机工作特性

支持向量机

作者要感谢凯伦·奥康纳和亚历克西斯·厄普舒尔在注释过程中的努力。

AS负责分类算法的训练和评估，以及分类策略的开发。他还负责准备大部分的手稿。PC机设计并分析了部分查询模式，并进行了初始数据收集和初步研究。AM设计并分析了一些查询模式，并进行了一些初始数据收集。他也是注释者之一，并编写了注释指南。AK进行因子分析，并帮助准备最终的手稿。HC负责实现端到端收集和存储管道，并实施研究的技术方面(如数据库集成和查询)。GG负责为项目提供高层指导，并负责最终稿件的编写。

没有宣布。

美国公共服务部食品和药物管理局药物评价研究中心生物制剂评价研究中心

食品及药物管理局 2005

2017-04-19

审稿人指南:评估人类怀孕中药物暴露的风险 https://www.fda.gov/downloads/Drugs/%E2%80%A6/Guidances/ucm071645.pdf

肯尼迪

戴斯。莱纳姆:

Uhl

Kweder

怀孕暴露登记

药物Saf 2004 27 4 215 28

15003034

2741

病房

孕期药物治疗对胎儿和新生儿不良影响的研究难点

Semin Perinatol 2001 06 25 3. 191 5

11453616

Harpaz

DuMouchel

沙阿

马迪根

瑞安

弗里德曼

药物不良事件发现和分析的新数据挖掘方法

临床药物学 2012 06 91 6 1010 21

10.1038 / clpt.2012.50

22549283

clpt201250

PMC3675775

哈特曼

国际扶轮

金博

在怀孕期间进行研究:挑战和展望

中国北京医学 2016 34 3. 410 5

10.1016 / j.clindermatol.2016.02.014

27265080

s0738 - 081 x (16) 30029 - 3

Gelperin

Hammad

Leishear

鸟

圣

泰勒

Hampp

领域

妊娠暴露登记的系统回顾:检查方案规定的妊娠结局、目标样本量和比较器选择

药物流行病学 2017 02 26 2 208 14

10.1002 / pds.4150

28028914

辛克莱

年代

坎宁顿

米

Messenheimer

威尔

Cragan

Lowensohn

Yerby

米

网球

妊娠登记的优点和问题:国际拉莫三嗪妊娠登记整个生命周期的观察和惊喜

药物流行病学 2014 08 23 8 779 86

10.1002 / pds.3659

24974947

PMC4406353

艾伦

在

戈麦斯

米

Yevoo

Egesah

职员

Byamugisha

Mbonye

一个

是

梅塔

Atuyambe

对参加世界卫生组织药物暴露妊娠登记的参与者报告的影响;定性研究

BMC运行状况服务决议 2014 10 31 14 525

10.1186 / s12913 - 014 - 0525 - 1

25367130

s12913 - 014 - 0525 - 1

PMC4229602

格林伍德

年代

佩兰

一个

达根

米

Pewinternet 2016 11

2017-10-04

2016年社交媒体更新 http://www.pewinternet.org/2016/11/11/social-media-update-2016/

保罗

乔丹

衬衣

一个

布朗斯坦

Nikfarjam

一个

苏格兰威士忌

米

史密斯

吉隆坡

冈萨雷斯

社会媒体挖掘用于公共卫生监测和监督

2016

2016年太平洋生物计算研讨会

2016年1月

美国夏威夷

468 79

Chandrashekar

玛吉医生

一个

衬衣

一个

冈萨雷斯

社交媒体挖掘用于识别和探索孕妇的健康相关信息

2017

采矿在线健康报告研讨会

2017

英国剑桥

衬衣

一个

冈萨雷斯

基于多语料训练的便携式自动文本分类药物不良反应检测

J生物医学信息 2015 02 53 196 207

10.1016 / j.jbi.2014.11.002

25451103

s1532 - 0464 (14) 00231 - 7

PMC4355323

衬衣

一个

奥康纳

Ginn

苏格兰威士忌

米

史密斯

马龙

冈萨雷斯

社交媒体毒物警戒挖掘:从Twitter自动监测处方药滥用

药物Saf 2016 03 39 3. 231 40

10.1007 / s40264 - 015 - 0379 - 4

26748505

10.1007 / s40264 - 015 - 0379 - 4

PMC4749656

衬衣

一个

Nikfarjam

一个

Weissenbacher

冈萨雷斯

DIEGOLab: Twitter中消息级情感分类的一种方法

2015

第九届语义评估国际研讨会(SemEval 2015)

2015年6月4-5日

科罗拉多州丹佛市

计算语言学协会

510 14

卫生语言处理实验室 2017-10-13

https://healthlanguageprocessing.org/discovering-pregnancy-cohort-sm/

行李搬运工人

曼氏金融

琼斯

威雷特

后缀剥离算法

信息检索阅读 1997

美国加州旧金山

摩根考夫曼出版公司

313 6

Mikolov

Sutskever

我

陈

柯拉

迪安

单词和短语及其组合的分布式表示

2013

第26届神经信息处理系统国际会议

2013年12月5-10日

美国内华达

柯伦联合公司，美国

Godin

Vandersmissen

德内弗

范德瓦尔

多媒体实验室@ ACL W-NUT NER共享任务:使用分布式单词表示对Twitter微帖子进行命名实体识别

ACL 2015用户生成文本噪声研讨会 2015

ACL 2015用户生成文本噪声研讨会

2015年7月31日

中国,北京

计算语言学协会

146 53

Nikfarjam

一个

衬衣

一个

奥康纳

Ginn

冈萨雷斯

来自社交媒体的药物警戒:利用序列标记和词嵌入聚类特征挖掘药物不良反应提及

美国医学信息协会 2015 05 22 3. 671 81

10.1093 /地点/ ocu041

25755127

ocu041

PMC4457113

20.

Owoputi

奥康纳

戴尔

Gimpel

施耐德

史密斯

改进的词性标签在线对话文本与词集群

2013

naacl2013论文集

2013年6月9日至14日

美国佐治亚州

计算语言学协会

380 90

Nakov

里特

一个

罗森塔尔

年代

塞巴斯蒂亚尼

Stoyanov

SemEval-2016任务4:Twitter中的情感分析

2016

semeval - 2016

2016年6月16-17日

美国加州

计算语言学协会

1 18

胡

米

刘

挖掘和总结客户评论

2004

第十届ACM SIGKDD知识发现和数据挖掘国际会议

2004年8月22日至25日

西雅图，华盛顿州，美国

纽约州纽约

ACM

168 177

10.1145/1014052.1014073

Guerini

米

•加蒂

Turchi

米

情感分析:如何从SentiWordNet中获得先验极性

2013

自然语言处理经验方法研讨会

2013年10月18日至21日

西雅图，华盛顿，美国

计算语言学协会

1259 69

Wiebe

威尔逊

羊毛衫,

用语言注释观点和情感的表达

朗资源评估 2006 02 28 39 2 - 3 165 210

10.1007 / s10579 - 005 - 7880 - 9

Ishizaki

年代

Kaufer

麦卡锡

点

Boonthum-Denecke

计算机辅助修辞分析

应用自然语言处理:识别、调查和解决 2011

好时，宾夕法尼亚州，美国

IGI全球

275 95

Kachigan

多元统计分析:概念介绍 1991

美国纽约

半径的新闻

Biber

语言和写作的差异 1988

英国剑桥

剑桥大学出版社

保罗

乔丹

Dredze

米

你就是你的推特:为公共卫生分析推特

2011

第五届国际AAAI博客和社交媒体会议

2011年7月17日至21日

西班牙巴塞罗那

AAAI出版社

学习

Hazlett

德

哈里森

卡罗尔

欧文

一个

霍文

医疗保健的一个新维度:对社交媒体用于健康传播的用途、好处和局限性的系统回顾

J医疗互联网服务 2013 04 23 15 4 e85燃料

10.2196 / jmir.1933

23615206

v15i4e85

PMC3636326

30.

高夫

一个

猎人

射频

Ajao

杰里科

一个

部

在香港

巴雷特

弗格森

米

而言

麦卡锡

米

凯

推特改变行为:利用社交媒体传播公共卫生信息

JMIR公共卫生监测 2017 03 23 3. 1 e14灯头

10.2196 / publichealth.6313

28336503

v3i1e14

PMC5383801

夏普

霍普金斯

烹饪

Striley

连续波

使用贝叶斯变化点分析评估谷歌、Twitter和维基百科作为流感监测工具:比较分析

JMIR公共卫生监测 2016 10 20. 2 2 e161

10.2196 / publichealth.5901

27765731

v2i2e161

PMC5095368

保罗

乔丹

Dredze

米

Broniatowski

推特提高流感预测

公共科学图书馆咕咕叫 2014 10 28 6 pii

10.1371 / currents.outbreaks.90b9ed0f59bae4ccaa683a39865d9117

25642377

PMC4234396

衬衣

一个

Ginn

Nikfarjam

一个

奥康纳

史密斯

Jayaraman

年代

Upadhaya

冈萨雷斯

利用社交媒体数据进行药物警戒:综述

J生物医学信息 2015 04 54 202 12

10.1016 / j.jbi.2015.02.004

25720841

s1532 - 0464 (15) 00036 - 2

PMC4408239

汉森

大炮

伯顿

年代

Giraud-Carrier

通过推特探索社交圈和处方药滥用

J医疗互联网服务 2013 09 6 15 9 e189

10.2196 / jmir.2741

24014109

v15i9e189

PMC3785991

专题

李

罗查

通过对Instagram用户时间线的网络分析来监测潜在的药物相互作用和反应

Pac Symp Biocomput 2016 21 492 503

26776212

9789814749411 _0045

PMC4720984

De Choudhury

米

计数

年代

霍维茨

通过社交媒体预测产后情绪和行为的变化

2013

计算机系统中的人为因素SIGCHI会议

2013年4月27日至5月2日

法国巴黎

美国纽约

ACM

3267 76

10.1145/2470654.2466447

黄平君

刘

普拉特

郑

大众

常

拉夫黑德

李

检测来自社交媒体的有害处方级联信号

Artif Intell医院 2016 07 71 43 56

10.1016 / j.artmed.2016.06.002

27506130

s0933 - 3657 (16) 30074 - 4