卡塔尔世界杯8强波胆分析|卡塔尔世界杯4强波胆分析

JMIR

J医疗互联网服务

医学互联网研究杂志

1438 - 8871

卡塔尔世界杯8强波胆分析JMIR出版公司

加拿大多伦多

v17i4e84

25843553

10.2196 / jmir.3769

原始论文

痛苦的推文:关于痛苦的推文的文本、情感和社区结构分析

Eysenbach

冈瑟

莫斯利

Lalloo

Chitra

船首三角帆

林赛

Tighe

帕特里克J

医学博士,女士 1

佛罗里达大学医学院麻醉科

亚彻西南道1600号

邮箱100254

盖恩斯维尔，佛罗里达州，32610

美国 1 352 273 7844 1 352 392 7029 ptighe@anest.ufl.edu

http://orcid.org/0000-0002-1881-9941

戈德史密斯

瑞安C

医学博士 1

http://orcid.org/0000-0001-8162-2159

Gravenstein

迈克尔

医学博士 1

http://orcid.org/0000-0001-6400-4789

伯纳德

H罗素

博士学位 2

http://orcid.org/0000-0002-1367-2813

Fillingim

罗杰B

博士学位 3.

http://orcid.org/0000-0002-7699-8183

¹ 佛罗里达大学医学院麻醉科

盖恩斯维尔,FL

美国 ² 佛罗里达大学人类学系

盖恩斯维尔,FL

美国 ^3. 佛罗里达大学社区牙科及行为科学系“，

盖恩斯维尔,FL

美国

通讯作者:Patrick J Tighe ptighe@anest.ufl.edu

04 2015

02 04 2015

17 4

e84

22 08 2014 05 11 2014 17 12 2014 21 01 2015

©Patrick J Tighe, Ryan C Goldsmith, Michael Gravenstein, H Russell Bernard, Roger B Fillingim。最初发表于《医疗互联网研究杂志》(//www.mybigtv.com)， 02.04.2015。

2015

这是一篇开放获取的文章，根据创作共用署名许可(http://creativecommons.org/licenses/by/2.0/)的条款发布，允许在任何媒介上无限制地使用、分发和复制，前提是正确引用最初发表在《医学互联网研究杂志》上的原创作品。必须包括完整的书目信息，//www.mybigtv.com/上的原始出版物的链接，以及此版权和许可信息。

背景

尽管社交媒体广泛流行，但人们对这些媒体用户发布的与痛苦有关的帖子的程度和背景知之甚少。

客观的

目的是研究与疼痛相关的推文的类型、背景和传播。

方法

我们对来自50个城市的与疼痛相关的推文进行了内容分析，以不引人注目地探索关于疼痛的交流的含义和模式。内容是根据每天的地点和时间，以及在线社交网络的背景进行检查的。

结果

与“痛苦”相关的最常见词汇包括“感觉”(1504)、“不要”(702)和“爱”(649)。正面情绪的推文比例从马尼拉的13%到加州洛杉矶的56%不等，各城市的中位数为29%。从时间上看，具有积极情绪的推文比例从1600年的24%到2400年的38%不等，中位数为32%。与苹果、曼联和奥巴马等常见词汇相关的社交网络相比，基于twitter的与疼痛相关的社交网络表现出更大的稀疏性和更低的连通性。与客观词汇如苹果(0.26)、曼联(0.14)和奥巴马(0.25)相比，情绪词汇如累(0.45)、高兴(0.43)和悲伤(0.4)的词簇数量与节点数的比例更大。

结论

综上所述，我们的研究结果表明，与疼痛相关的推文具有特殊的特征，反映了独特的内容和推文之间的交流。进一步的研究将探索地缘政治事件和季节变化如何影响推特用户对疼痛的感知，以及这种感知如何影响疼痛治疗。

Twitter消息情绪文本挖掘社交网络

简介

推特是世界上最受欢迎的微博网站，每3天就有超过10亿条推文发布[ 1］．Twitter应用程序编程接口(API)允许研究人员在各种固定地点和移动计算平台上以140个字符的简短“推文”形式发布的内容中搜索关键词，从而对个人和地缘政治事件的日常话语提供洞察。 2- 5］．这个API还捕获与“转发”和“提及”有关的信息，Twitter用户通过这种方式将一条推文标记给另一个人，从而允许跟踪Twitter社区。推特的这些独特特征促使人们对推文进行调查，话题从政治、金融、体育到与健康有关的问题，如H1N1流感流行病学、戒烟和灾难应对[ 2， 3.， 6- 12］．据我们所知，还没有人调查推特上是如何讨论痛苦的。

对许多人来说，疼痛是日常生活中无所不在但值得庆幸的短暂经历。然而，对于超过1亿的美国人来说，这种短暂的体验并没有消退，而是发展为慢性疼痛，造成超过6350亿美元的损失。一半以上的住院患者和50%-75%的癌症患者死于中度至重度疼痛。在急性疼痛情况下，超过60%的手术患者在手术后遭受中度至重度疼痛[ 14， 15］．根据手术类型的不同，高达50%的患者会因手术而直接发展为慢性疼痛。 14， 15］．大量证据表明，许多特定的心理社会因素调节疼痛强度。考虑到社交媒体帖子的强烈情感内容，调查疼痛是如何在Twitter等广泛的社交媒体平台上讨论的似乎是谨慎的。

Twitter内容探索的两个核心领域是(1)内容分析或从推文本身提取意义;(2)基于推文转发模式的社区结构分析或社交网络测量。内容分析包括对词汇使用和关联的简单测量，以及通过情感分析对推文影响的量化[ 16- 21］．使用规则和统计建模技术，在手动注释的语料库或正文上开发，推文可以被归类为积极的情绪(例如，“没有付出就没有收获，很棒的锻炼，我喜欢锻炼!”)或消极情绪(例如，“哎哟，我的背真疼，真难过，我要错过足球训练了，真遗憾!””)( 4， 16， 17， 22- 29］．内容分析可以让我们深入了解推特用户如何将“痛苦”一词融入日常推文中，测量这些推文中所讨论的概念和隐含的情感标签。

转发的社区结构分析衡量了基于twitter的社交网络的连通性。先前的观察表明，慢性疼痛可能与不同形式的社会隔离有关，甚至可能导致不同形式的社会隔离[ 30.- 36］．与此相反，疼痛本身可能是怜悯的焦点，作为一个尖锐的讨论话题，因此心理社会治疗往往侧重于改善社会支持系统和/或最大限度地减少社会隔离[ 37， 38］．对与疼痛相关的推特转发模式的社区结构分析，可以帮助确定关于疼痛的在线交流是反映了一个更有限、更亲密的communiqués网络，还是反映了一个更广泛的疼痛相关内容的传播。

据我们所知，这样的分析方法还没有应用到推特用户的communiqués上。在这里，我们探索了来自世界各地的65,000多条推文的内容，每条推文都包含“疼痛”一词。我们讨论了使用文本分析和网络分析相结合的可能性，可以利用Twitter在日常生活中不引人注目地研究疼痛的定性、多维方面。我们有两个目标:(1)评估与疼痛相关的推文的上下文和情绪;(2)比较基于twitter的与疼痛相关的社交网络与包含跨文化通用情感术语(快乐、兴奋、悲伤、恐惧、疲劳、痛苦)和常见客观术语样本(苹果、曼联、奥巴马)的网络的连通性[ 39， 40］．与这些目标有关的假设如下:

我们假设存在与疼痛相关的特定主题;在null中，与疼痛相关的一组随机术语。

我们在与疼痛相关的推文中假设了积极和消极情绪的混合;在null中，一种一致的负面情绪。

我们假设与其他情感和非情感术语相关的网络相比，基于twitter的与疼痛相关的转发网络具有独特的连接模式;在null中，连接模式与其他基于twitter的转发网络难以区分。

方法概述

佛罗里达大学的机构审查委员会(IRB-02)宣布该项目豁免为公共数据调查研究。进行了两个系列的分析。第一项研究检查了与疼痛相关的推文内容，第二项研究了推特用户转发与疼痛相关内容的社交网络。每组分析都使用了单独的与疼痛相关的推文语料库。

推文内容分析概述

在经典内容分析中，人类读者在一组文本中识别主题或概念。我们使用自动化的基于计算机的内容分析，提取了65000条与疼痛有关的推文中经常提到的概念。这种从社交媒体平台中提取概念的方法之前已经被许多团队证明，以解决广泛的问题[ 12， 23， 26， 41- 46］．我们还分析了与疼痛相关的词语的上下文，以区分这些词语的积极和消极用法。在这里，我们描述了我们对与疼痛相关的推文进行内容分析的方法，特别强调了这些与疼痛相关的推文中使用的情绪的量化。更多的技术细节可在多媒体附件1．

疼痛推文语料库生成

数据是在2012年9月的一次搜索中收集的。我们首先创建了一个函数，请求1500条最近包含“pain”一词的英文推文[ 9］．每条推文的发布日期和时间都被收集了起来。然后，每条推文记录的时间会被调整，以反映发布推文时所在城市的当地时间。为了确定每条推文的来源城市，该函数搜索了全球50个讲英语的大城市的经纬度范围内100英里半径内发布的推文。虽然这种方法为每条推文提供了地理位置，但重要的是要认识到这种方法没有捕获非地理位置的推文，这可能会使结果偏向于那些拥有更复杂的推文设备的人，这些设备能够通过全球定位系统(GPS)和/或蜂窝定位方法提供地理位置功能[ 47- 50］．美国进行了过采样，为城市人口和气候数据与与疼痛相关的推文情绪之间的相关性探索提供了合适的基础。更多的技术细节可在多媒体附件1．

在选中的50个城市中，每一个都重复了搜索。为了保证质量，每个城市总共有10%的推文进行了视觉检查。我们认为，由于查询代码中的错误，来自一个城市的数据被发现损坏，并从进一步分析中删除。考虑到其他所有推文都是在批量搜索中收集的，考虑到由于搜索时间不同导致的抽样倾斜，我们选择不重复这个城市的数据收集。

值得注意的是，该分析中的推文并没有专门搜索“#pain”，因此该标签被用作元标签，将一条推文标记为包含特定主题[ 18］．我们选择搜索“疼痛”作为一个通用搜索词，以了解这个词是如何在日常生活的正常话语中使用的。专门搜索“#pain”将只返回那些推文的主题被推文用户确定为疼痛的推文，从而偏离了返回的上下文和推文内容的情感。

从这个样本中获得的推文被合并到一个痛苦推文语料库中，由所有收集到的推文的文本组成。在这里，“语料库”(及其复数“语料库”)指的是进行分析的文本体。

术语-术语关联测量与图表分析

为了测量一条推文中的词语与“疼痛”或其他词语相关的频率，我们使用了一种被称为图表分析的分析方法[ 6］．每个术语都表示为网络中的一个节点，术语之间的关系是连接这些节点的链接或边。请注意，在内容分析实验中，节点代表单个单词，团体代表由链接或边连接的相关单词组。当在同一条推文中发现两个术语时，这两个术语被认为共享一个链接。由边连接的节点有助于通过支撑图论的矩阵代数方法进行定量分析。更多的技术细节可在多媒体附件1．

对于每个术语，总度中心性首先通过计算该术语与语料库中其他术语之间有多少不同的链接或边来计算。通过检查术语组之间的关联程度，而不是其他术语或术语组，使用基于鲁文方法的团体检测算法确定了彼此共同关联的术语团体[ 3.］．

情绪分析

推文的情感评分将基于规则的方法与统计建模系统相结合，创建了一个混合情感分类器[ 51］．基于规则的方法使用了AFINN(以作者Finn Årup Nielsen命名)的加权正、负关键字列表[ 52］．AFINN单词列表是一个手动标记的英语术语列表，这些术语已被评为正极和负极性，已明确验证可用于微博环境(如Twitter)。这补充了emoticon术语，以提高基于规则的分类器的准确性[ 53- 55］．此外，基于规则的方法在一个积极或消极关键字的5个术语中加入否定术语和缩略词，将情绪逆转到±1分。通过将给定推文中确定的关键字的正面和负面权重相加，可以计算出极性(正面和负面情绪)以及置信度。统计模型采用了Naïve贝叶斯算法，该算法具有平滑的相对频率，用于文本规范化和基于风险比的特征排序算法[ 48］．更多的技术细节可在多媒体附件1．

分类者的得分与使用评分者之间一致评分系统的人类情绪评分进行了比较。考虑到最初对情绪分析实施的担忧，每个审稿人都参与了由首席研究员(PT)进行的简短教学会议，并给出了具体的例子，包括“锻炼很棒!一分耕耘一分收获!，而不是“脚踝扭伤，疼痛难忍，错过比赛真难过!”来表达负面情绪。然而，考虑到情感分析的主观性和这种表征的探索性，没有提供更正式的培训。鉴于历史上注释者与情感分析之间的一致性较差，一些人认为，基于规则和基于分类器的情感分析提供的决定性结果可能比人类注释者提供的结果更具方法论优势[ 11， 56， 57］．

探索性分析将美国城市的基本人口和气候数据与对这些城市持积极态度的痛苦相关推文的比例联系起来。这种探索性分析的动机来自于历史上的临床智慧以及Keller等人的工作[ 58]及Jamison等人[ 59这表明寒冷的气候、低落的情绪和更大的疼痛强度之间存在联系。人口、人口密度、中位数年龄、高中毕业生百分比、拥有学士或更高学位的百分比、家庭收入中位数以及低于贫困水平的人数均来自2010年美国人口普查[ 60］．鉴于其农村性质，阿肯色州凤凰镇的数据是从阿肯色州波普县的数据中提取的，因为没有美国人口普查的具体数据。没有医疗保险的个人百分比提取自2010年小区域医疗保险估算数据集，以每个县为基础[ 61］．每个城市9月份的气候数据是由美国国家海洋和大气管理局发布的1981-2010年正常数据汇总而成。 62]，包括平均高温和降雨量超过0.01英寸的平均降水日数。阿肯色州凤凰镇的气候数据改编自阿肯色州小石城的气候区。

基于twitter的疼痛相关社交网络的社区结构收集转发数据

2013年3月，我们在Twitter上搜索了以下关键词:痛苦、#痛苦、快乐、兴奋、悲伤、恐惧、疲惫、痛苦、苹果、曼联和奥巴马[ 63］．情感术语是从15种普遍适用的跨文化情感影响中选取的积极和消极痛苦相关术语作为样本[ 39， 40］．根据经验选择比较术语来反映关于共同主题的论述，以便与在与合著者讨论后在不同公共领域受到广泛媒体关注的主题进行比较。每次搜索都被过滤为英语推文，并由Twitter API限制返回1500条推文。更多的技术细节可在多媒体附件1．

社会网络分析测量的描述

导入Gephi后，计算每个搜索词的网络级和节点级度量[ 8， 64， 65］．网络级指标包括节点和边缘计数、网络直径、平均路径长度、密度以及弱连接和强连接组件的数量[ 66， 67］．计算的节点级指标包括模块化社区的数量、总度中心性、度内中心性和度外中心性[ 3.， 65］．

为了确定那些参与疼痛转发网络的人转发其他情感术语的频率，我们从疼痛术语网络中抽取了100名个人，他们提交了包含“疼痛”一词的推文作为转发或向另一个推特用户提及。使用twitteR包中的userTimeline函数(twitteR包中为R编程语言创建的一段特定的计算机代码)，然后我们为这些人请求最多100条tweet。这些推文的文本被组合成一个语料库。然后在这个语料库中搜索之前提到的6个情感词(快乐、兴奋、悲伤、恐惧、疲惫、痛苦)和3个客观词(苹果、曼联、奥巴马)的出现次数。对于每个术语，计算并报告了其频率及其与术语“疼痛”频率的比例。更多的技术细节可在多媒体附件1．

结果与疼痛相关的推文内容图表分析

对疼痛推文语料库的一个版本进行了分析，其中相同的推文被删除;这被称为减少疼痛推文语料库。对于图形分析，减少疼痛的吐温语料库包含47,958个非重复推文。在减轻疼痛的青少年语库中，最常见的词汇包括“感觉”(n=1504)、“不”(n=702)、“爱”(n=649)、“不能”(n=543)、“屁股”(n=374)、“时间”(n=340)、“生活”(n=328)、“lol”(n=327)、“受伤”(n=294)和“人”(n=288) ( 多媒体附件2)．总共有14,877个术语包含在减少疼痛的吐温语料库中，这些术语连接了451,209条边。

减轻疼痛的青少年语料库图的平均度中心性为60.7，单个术语的总度中心性计数范围从0到5652，中位数为18 ( 图1)．总程度中心性最高的词汇包括“感觉”(5652度)、“不要”(3375度)、“爱”(3274度)、“讨厌”(3049度)和“不能”(2983度)( 多媒体)．最常见的关联词包括“笑”和“看”(边权值为566)，“不要”和“感觉”(边权值为395)，以及“上传”和“视频”(边权值为361)。表1)．使用Louvain算法共检测到161个基于模块的群落( 图2)．10个最常见的模数社区占所有术语的77%。

表1

项之间频繁关联的边权值。

排名	项1	项2	边缘的重量
1	笑	看	566
2	不	感觉	395
3.	上传	视频	361
4	(名字)	笑	335
5	哈特	笑	310
6	感觉	哈哈	283
7	感觉	爱	276
8	斜面	感觉	222
9	哈特	凯文	200
10	”“	感觉	183
11	醒着的	最糟糕的	171
12	婴儿	带	166
13	希望	运行	164
14	房子	运行	163
15	请	运行	161
16	芝加哥	运行	160
17	马拉松	运行	160
18	英里	运行	160
19	iPhone	脾气	158
20.	航空公司	iPhone	158
21	希望	iPhone	158
22	iPhone	保证金	158
23	(名字)	看	155
24	航空公司	脾气	147
25	希望	脾气	147

图1

与疼痛相关的推文语料库减少图。语料库中包含的每个词都用一个点表示;点大小对应于相关项的总度中心性。每个点的颜色表示模块化社区的成员。在一条推文中，只要一个词与另一个词相关联，这两个点就由一条线或边连接起来;边宽对应于两个相连项之间的关联频率。

图2

包含在161个模块化社区中的术语百分比。

情绪分析

对该情感分类器进行了阶段验证。在第一阶段，基于规则的分类器(最初用于对大量文本主题进行分类)在3个测试集上进行了测试:基于搜索“快乐”的1500条推文语料库，基于搜索“悲伤”的1500条推文语料库，以及基于搜索“苹果”的1500条推文语料库。基于规则的分类器识别出92.67%(1390/1500)的“快乐”推文在情绪上是积极的，19.53%(293/1500)的“悲伤”推文在情绪上是积极的，38.32%(575/1500)的“苹果”推文在情绪上是积极的。naïve贝叶斯分类器专门针对与疼痛相关的推文进行了训练，识别出89.64%(1345/1500)的“快乐”推文在情绪上是积极的，69.7%(1046/1500)的“悲伤”推文在情绪上是积极的，90.24%(1354/1500)的“苹果”推文在情绪上是积极的多媒体附件4)．

在第二个验证阶段，情感分类器在来自疼痛补间语料库的100条推文中进行了测试，这些推文以前没有用于naïve贝叶斯组件的训练。当由人类评分时，该测试集包含38%(38/100)(作者PJT)， 37%(37/100)(作者RG)和19%(19/100)(作者MG)积极推文，这取决于评分者，科恩kappa为0.42，表明评分者之间的一致性较低至中等。基于规则的成分确定了42%(42/100)的这些推文是积极的，naïve贝叶斯成分确定了38%(38/100)是积极的，科恩的kappa在0.16的两个成分之间。当与naïve贝叶斯组件结合创建最终的混合分类器时，总共有39%(39/100)的疼痛渐变语料库测试集推文被评为情绪积极。基于规则和naïve的混合贝叶斯分类器的Cohen 's kappa为.382，人类评分者和混合分类器的Cohen 's kappa为.317 ( 多媒体)．

研究人员对整个疼痛青少年的65,410条推文进行了情绪分析。研究人员首先在不同城市之间比较了与疼痛相关的推文的情绪评分。正面情绪的推文比例从菲律宾马尼拉的13.13%(197/1500)到加州洛杉矶的55.73%(836/1500)不等，中位数为29% ( 图3)．在49个接受测试的城市中，与疼痛相关的推文中情绪积极的比例在统计上存在显著差异( P<措施)。

研究人员比较了24小时内与疼痛相关的推文的情绪评分( 多媒体)．持积极情绪的推文比例从1600年的23.88%(833/3488)到2400年的38.25%(469/1226)，中位数为32% ( 图4)．在24小时内，与疼痛相关的正面情绪推文的比例有统计学上的显著差异( P<措施)。

城市层面的人口和气候特征与带有积极情绪的疼痛相关推文的百分比之间的相关性被作为探索性分析进行了检验( 表2)．在正面推文的百分比和没有医疗保险的个人百分比之间观察到统计学上显著的相关性(ρ=.476， P =.02)， 9月平均高温(ρ=.425， P=.03)，以及城市的纬度(ρ= -.42， P =.04点)。

表2

正面推文比例与城市人口和气候数据之间的斯皮尔曼排序相关性(ρ)。

变量	ρ	P
没有医疗保险的百分比	.476	02
九月平均高温	.425	03
纬度	-.420	.04点
经度	-.358	。08
九月平均降水日数	-.305	.14点
高中毕业生百分比	-.198	.35点
本科及以上学历。%	.180	.40
贫困线以下的个人	-.169	点
年龄中位数	.166	点
人口密度	-.111	.60
家庭收入中位数	.108	收
人口	-.018	公布

图3

在选定的北美城市中，与疼痛相关的推文与积极情绪的比例。直径越大的圆圈表示在包含“痛苦”一词的推文中，积极情绪的比例越高。

图4

24小时内包含积极情绪的日期和时间戳的与疼痛相关的推文的百分比。时间根据地理位置从UTC调整为当地时间。

基于twitter的疼痛相关社交网络的社区结构

在平均分布在11个搜索词中的16,500条推文中，48.28%(7967/16,500)涉及转发网络。通过对转发网络的视觉分析，与“苹果”、“曼联”和“奥巴马”相比，与“痛苦”相关的转发网络表现出更大的稀疏性和更低的连通性( 图5)．奥巴马网络拥有最多的转发节点数(964)，曼联网络拥有最多的边数(n=827) ( 多媒体附件6)．网络直径、平均路径长度和网络密度在比较网络之间没有太大差异。与特定对象相比，情感术语的弱连接网络组件的数量与节点总数的比例更大，从曼联的最低0.14到痛苦的0.37，快乐的0.43和疲惫的0.45。相比之下，客观项总体上保持了其节点在巨型组件中的最大百分比( 图6)．曼联网络中47%的节点保持在巨型组件中，其次是奥巴马的29%和苹果的25%。情感词汇的比例较低，“痛苦”为9%，“痛苦”为4%，“悲伤”为3%，“快乐”为2%。这一趋势的一个重要例外是恐惧网络，它在巨大的组件中保持了56%的节点

与弱连接网络组件的结果类似，与客观术语如苹果(0.26)、奥巴马(0.25)和曼联(0.14)相比，情绪术语如累(0.45)、高兴(0.43)和悲伤(0.4)的模块化社区数量与节点数的比例更大。图7)．所有术语的最大程度中心性得分均大于程度外中心性得分，但所有术语中心性得分的中位数均保持在0至1之间( 多媒体)．客观词汇的最大程度中心性得分高于情感词汇。特别是，“apple”和“pain”之间的差异具有统计学意义(平均得分差= - 65， P =.003，效应量=0.10)，“兴奋”和“疼痛”(平均得分差=−70， P=。001，effect size=0.10), “Manchester United” and “pain” (mean score difference=−167, P<。001，effect size=0.23), and “fear” and “pain” (mean score difference=−175, P<。001，effect size=0.23) for in-degree centrality. For out-degree centrality, there were statistically significant differences between “Manchester United” and “pain” (mean score difference=182, P<。0001，effect size=0.25), “fear” and “pain” (mean score difference=163, P<。001，effect size=0.21), “Obama” and “pain” (mean score difference=79, P= <。001effect size=0.10), and “apple” and “pain” (mean score difference=65, P=。002，effect size=0.10). For total degree centrality, there were only statistically significant differences between “Obama” and “pain” (mean score difference=79, P<。001，effect size=0.13), and tired and pain (mean score difference=−37, P =.002，效应量=0.10)( 多媒体附件8)．

在检查疼痛术语网络中100个样本转发者中其他情感和客观术语的频率时，我们首先确定了这些人发布的5967条其他推文。值得注意的是，在本样本语料库中，“疼痛”一词仅被提及35次( 表3)．与“痛苦”相比，“快乐”一词出现的频率增加了两倍多，“悲伤”和“恐惧”的出现频率分别为“痛苦”一词的86%和69%。尽管它们的转发网络结构更加复杂，但“苹果”(3%)、“曼联”(0%)和“奥巴马”(14%)的转发频率与痛苦的比例要比情感词汇低得多。

表3

100名用户的痛苦网络推特用户中情绪词汇的出现情况。^一个

术语	频率	频率与疼痛成比例
疼痛	35	1
快乐	73	2.09
兴奋	1	0.03
悲伤的	30.	0.86
恐惧	24	0.69
累了	10	0.29
痛苦	0	0．00
苹果	1	0.03
曼彻斯特	0	0．00
奥巴马	5	0.14

^一个从疼痛术语网络中抽取100名用户，这些用户提交了包含“疼痛”的推文，并转发了推文或向某人提及。请求这些人每人最多100条最近的推文。收集了5967条推文。搜索所有这些术语的文本。

图5

(A)痛苦，(B) #痛苦，(C)快乐，(D)兴奋，(E)悲伤，(F)恐惧，(G)疲惫，(H)痛苦，(I)苹果，(J)曼联，(K)奥巴马。每个圆表示一个节点或Twitter用户，连接圆的每条线表示一条边，或在另一个用户的推文中提到一个用户。每条边都是有方向性的，因为它从初始Twitter用户“指向”到接收Twitter用户。节点大小反映了节点的中心性程度，线粗反映了节点之间的连接数，颜色反映了节点的连通性群落。

图6

转发网络中的总节点(蓝色)和巨大的组件节点(红色)。

图7

每个转发网络的节点数(蓝色)和模块化社区数(红色)。

讨论

这里提出的结果表明，与疼痛相关的推文具有特殊的特征，反映了独特的内容和推文之间的交流。大多数推文似乎都是在描述关系中的疼痛，尽管肯定有一些主题表示具体的身体疼痛。这些数据支持了这样一个假设，即推特上关于疼痛的讨论确实集中在一系列身体和非身体的话题上，而不仅仅是作为一种医疗状况。大约三分之一的与疼痛相关的推文被量化为包含积极的整体情绪，这一比例因地理位置和一天中的时间而不同，这支持了我们的第二个假设，即与疼痛相关的推文中有积极和消极情绪的混合。我们的研究结果也支持了关于转发网络与疼痛有关的独特连接模式的假设。

疼痛相关推文的自动内容分析为研究人员、政策制定者和医疗保健专业人员提供了几个潜在的应用。例如，生物心理社会因素和推文内容之间的潜在联系可能有助于预测急性和慢性疼痛的结果。通过使用超大的推文数据集，对与疼痛相关的推文进行更深入的探索，可能会更好地区分疼痛的身体来源和情感来源，尽管这种区分需要通过外部数据收集方法进行校准，以将内容确定为任何程度的情感来源和身体来源。可用推文的数量，加上它们的时间和位置标签，可以分析疼痛密度的季节性和时间变化及其与环境和地缘政治事件的关系[ 22］．事实上，之前的研究表明，推特情绪评分可能会领先民意调查几天，因此提供了一种间接评估公众看法的廉价方法[ 68］．

也有可能使用这种方法作为确定社区健康状况的流行病学平台，以及与疼痛相关的卫生保健需求的晴雨表，类似于实验性地使用Twitter内容作为流感监测工具[ 69］．这种基于政策的疼痛监测方法可以帮助指导疼痛管理资源在时间和位置上的分配。补充每年或半年对未满足的疼痛需求的调查，这里提出的方法可以允许每月，甚至每周，对疼痛政策变化的影响进行审查。尽管受到一些关键因素的限制，例如区分急性和慢性疼痛，从扭曲的社交媒体用户群体收集数据，以及与疼痛相关的上下文关系，但对疼痛等情感术语的使用和情绪进行流媒体测量可能会为这些方法提供低成本、实时的补充。虽然这样的举措可能只提供可能纯粹出于学术兴趣的协会级别的数据，但至少可行的是，将这种方法与既定的、稳健的(有时成本高昂的)数据收集措施进行校准，可能会使这种基于社交媒体的数据收集方法具有一定的价值，特别是在青少年和Y一代等目标人群中。正如Greaves等人提出的[ 70]，基于推特的情绪分析也可以帮助发现与疼痛相关的医疗服务质量低下。这可能会导致一种有效的、可广泛部署的辅助手段，用于评估患者对疼痛控制的满意度的现行医疗保健提供者和系统的医院消费者评估(HCAHPS)方法。值得注意的是，这一特定领域的现有工作指出了住院期间患者疼痛管理经验的广泛地理差异，以及医院的社交媒体评级与HCAHPS措施之间的一致性，从而指出了社交媒体抽样以补充现有数据收集方法的机会[ 50， 71］．

情绪的量化，尤其是在一份充斥着缩写和俚语的140个字符的文档中进行测量，对分类器的准确性和可重复性提出了有效的问题。之前使用相关推文情绪量化方法的工作表明，这种情绪分析可以很好地跟踪重要的社会文化事件，尽管情绪变化的幅度可能很小，而且倾向于负面情绪的增加而不是积极情绪的增加[ 16， 29］．令人欣慰的是，即使在没有包括机器学习组件的情况下，使用单词列表也证明了这种词汇的准确性，并且已被报道用于针对“幸福”等情感结构的情感分析项目[ 72］．

鉴于样本城市的选择缺乏严谨性，我们对正面推文比例与城市人口统计数据之间相关性的分析是探索性的。平均高温和纬度之间的相关性是合理的，因为较高的温度和较低的纬度可能与更多的阳光照射和更多的积极影响有关[ 58］．推文情绪的地理差异与最近的一项研究是一致的，该研究通过测量2011年收集的1000万条带有地理标记的推文的整体情绪，比较了美国城市的“幸福感”，尽管这种比较仅限于存在差异，因为这项研究没有考察纬度和温度与城市“幸福感”之间的关系[ 20.］．在审查这些问题时，重要的是要考虑生态谬误的风险，因为个人和群体同时采取措施。

我们的研究结果表明，关于疼痛的推文的情绪在24小时内是不同的。这与Thelwall等人之前的工作是一致的[ 29这表明，市场情绪在上午晚些时候和下午晚些时候似乎最为消极。然而，这与多德等人的研究形成了对比。 18]的调查结果显示，在上午5点至6点之间，以及在1900年至2000年之间，积极情绪有小幅上升。我们的结果同样显示了积极情绪在0500和2000年的峰值，以及在1200年的补充峰值和2000年之后的持续增长。有趣的是，在美国，与疼痛相关的推文情绪最低的时间间隔通常是在用餐时间之前。

在这一探索性分析中注意到的一个有趣的观察是，与疼痛相关的推文的积极情绪与没有医疗保险的个人比例高的地区之间的联系。有可能社交媒体用户的人口统计学扭曲也可能是那些没有医疗保险的人，这与先前将慢性疼痛与获得医疗服务联系起来的数据不一致[ 73］．这可能进一步指出了疼痛作为一种疾病状态与社交媒体平台中疼痛概念的表现之间的差异。

除了内容分析，检查与疼痛相关的推文还可以揭示那些把疼痛作为一种话语发布推文的推特用户的在线社交网络信息。近年来，多个团队探索了社交媒体平台，因为它们与身体和心理健康挑战的社会支持系统有关[ 12， 23， 26， 42- 46］．事实上，对患者疼痛相关推文的自动化社交网络分析可能有助于量化和监测许多以患者为中心的潜在结果的治疗进展。这种方法可以同时应用于个体患者和整个社区，从而帮助决策者衡量大规模治疗干预措施的有效性，并为资源分配提供决策支持。

关于“疼痛”的推文转发模式比关于客观主题的推文产生更小的讨论社区。那些参与痛苦相关讨论的用户通过规模较小的大型组件进行弱连接，更有可能参与到数量更多的小型模块化社区中。综上所述，这些结果表明，推特用户倾向于不推广他人关于疼痛的言论，就像他们可能会推广体育或政治等主题的推文一样。值得注意的是，这与“苹果”甚至“曼联”的转发网络在结构上并没有太大的不同，尽管痛苦转发的组件规模确实要小得多。

与之前关于使用社交媒体渠道进行社会支持系统的工作相反，我们的研究结果表明，与疼痛有关的此类出版物可能不会像发表关于体育或政治的声明那样引发社交媒体上的“对话”[ 12， 23， 26， 41- 46］．对于痛苦和其他情感词汇，大多数转发都是路径长度为1的“死胡同”表达。然而，对于客观术语网络，转发似乎在多个连续社区中“呼应”先前的内容，导致更长的路径长度。推特用户希望看到关于疼痛的推文得到回应，他们可能会对推特世界缺乏同理心感到惊讶。

齐藤和增田[ 74]证明了两种受欢迎的推特用户:第一种有很多粉丝，但自己只关注少数人，而第二种保持着大量的粉丝和关注来源的社区。疼痛和#pain转发网络大多遵循Saito和Masuda的类型1原理图，客观术语网络以类型2原理图为主。另一些人则把转发行为区分为“传播者”，即有很多粉丝但自己关注的来源很少的人，和“恶棍”，即有很少粉丝但关注很多来源的人。在这里，我们再次看到与疼痛相关的推文遵循了一种邪恶的转发模式，而客观术语网络则遵循了广播公司的转发模式，它将之前的推文转发到多个社区。 9］．

缺乏关于疼痛的转发可能确实会限制Twitter在研究疼痛相关讨论方面的效用，至少作为一个有限的数据集是如此。另一方面，在关于疼痛的推文总体流行率较低的情况下，关于疼痛的推文的存在可能提供了一个重要的洞察特定推文用户对疼痛的关注。为此，早期关于社交媒体和慢性疾病的研究表明，替代社交网络媒体，如Facebook，包含的医疗保健小组比Twitter上的要多。 75］．之前对失禁相关推文的研究发现，这些推文缺乏“有用的内容”，这表明一些以医疗为导向的推文缺乏合适的对话基质[ 21］．鉴于Kumar等人的发现[ 76这表明讨论的话题在很大程度上影响了用户参与推特讨论的兴趣，这可能只是推特用户对讨论与疼痛有关的话题不感兴趣。无论如何，观察到的与疼痛相关的推文缺乏社交推广，可能会限制Twitter作为一种媒介，促进那些因慢性疼痛而社交网络受损的人的社交互动。

这项工作为疼痛研究提供了几种有趣的可能性。可用推文的数量，加上它们的时间和位置标签，可以分析疼痛密度的季节性和时间变化及其与环境和地缘政治事件的关系[ 57］．这种基于政策的疼痛监测方法可以帮助在时间和地点直接分配疼痛管理资源，类似于自然灾害期间基于twitter的资源分配[ 4， 16， 17， 23- 28］．这里提出的方法可以允许每月，甚至每周对疼痛政策变化的影响进行审查，而不是每年或每半年对未满足的疼痛需求进行调查。正如Greaves等人提出的[ 70]，基于推特的情绪分析也可以帮助发现与疼痛相关的医疗服务质量低下。然而，这些好处必须在搜索大量推文以识别与疼痛相关的材料，然后将这些材料加工成可用于研究和/或决策支持的相关信息的复杂任务的背景下看待。

考虑到我们项目的范围，我们积累了一些与基于twitter的研究方法相关的局限性。首先，考虑到使用Twitter的主要是对科技更熟悉的年轻人，我们的结果并没有占到普通人群的大部分。皮尤研究中心2012年的一项调查显示，16%的互联网用户使用Twitter, Twitter对18至29岁的成年人、非洲裔美国人和城市居民“尤其有吸引力”。 77］．然而，对于疼痛研究中的志愿者研究也是如此，传统上主要从年轻成年人群中取样[ 73］．我们的研究只调查了公开的推文;当然，即使在社交媒体用户中，上述结果也可能存在偏差，因为社交媒体用户在推特上讲述自己的疼痛经历时，可能会因为这个话题的个人性质而选择保持帖子的私密性。我们的工作同样局限于只使用英语推文;因此，我们的数据可能无法代表所有来自非英语国家的推文。在检查术语组时，我们使用默认社区模块化系数可能导致在上层社区中出现了不适当的大量术语。然而，这种方法还允许封装更广泛的主题，并将主题填充多个社区的可能性降至最低。评分者之间的kappa系数公认较低，但与之前的情绪分析评分者注释分数一致[ 11， 56， 57指出了情感分析的主观性。研究所选城市的决定是根据经验做出的，是基于对一系列地理区域的城市以及农村与城市特征的研究。尽管具有更广泛特征的更大样本会很有吸引力，但考虑到所研究的疼痛间过渡语料库的大小严重紧张计算资源，这是不现实的。

总之，我们的结果表明，对疼痛相关推文的图表和情感分析可以为当今社会普遍存在的社交媒体话语中疼痛的角色提供重要的见解。事实上，我们的研究中确定的情感和心理疼痛参考文献的优势表明，未来的研究将重点放在与疼痛的物理表现相关的术语上，以探索疼痛研究的这一重要方面是必要的。此外，未来语义网络分析的实际应用应该包括增强功能，如词干、n-gram和同义词列表，以提高分类的准确性。有必要进一步研究地缘政治事件和季节变化如何影响推特用户对疼痛的感知。 37以及这种看法如何影响疼痛治疗。

多媒体附件1

疼痛推文语料库生成。

多媒体附件2

减轻疼痛推文语料库中最常见的术语。

多媒体

具有最高总度中心性的术语。

多媒体附件4

人类比率和分类方法之间的一致性统计，用于分类器性能的其他细节，包括敏感性和特异性的具体信息。

多媒体

疼痛相关的推文量按小时计算。

多媒体附件6

Graph-level指标。

多媒体

节点级指标。

多媒体附件8

转发网络的入度、出度和总度中心性的效应量。

缩写

API

应用程序编程接口

全球定位系统(GPS)

全球定位系统

类似hcahp

医疗保健提供者和系统的医院消费者评估

我们要感谢科里·阿斯特罗姆在准备这份手稿时给予的巨大帮助。这项研究部分由Patrick J Tighe (NIH K23 GM 102697)资助。

没有宣布。

https://business.twitter.com/en/basics/what-is-twitter/ 2014

2014-05-22

什么是Twitter? https://business.twitter.com/twitter-101

6 plslpqgg

理发师

乔丹

二部网络中的模块化与团体检测

Phys Rev E Stat Nonlin软物质物理 2007 12 76 6 Pt 2 066102

18233893

他们批判

Guillaume

J-L

Lambiotte

Lefebvre

社区在大型网络中快速展开

J Stat Mech 2008 10 09 2008 10 P10008

10.1088 / 1742 - 5468/2008/10 / P10008

咀嚼

Eysenbach

推特时代的流行病:2009年H1N1爆发期间推特的内容分析

《公共科学图书馆•综合》 2010 5 11 e14118

10.1371 / journal.pone.0014118

21124761

PMC2993925

Lancichinetti

一个

Fortunato

年代

社区检测算法的比较分析

Phys Rev E Stat Nonlin软物质物理 2009 11 80 5 Pt 2 056117

20365053

Borgatti

用

一个

黄铜

Labianca

社会科学中的网络分析

科学 2009 02 13 323 5916 892 5

10.1126 / science.1165821

19213908

323/5916/892

Csardi

Nepusz

复杂网络研究的图例软件包

复杂系统 2006 1695

早

韦伯斯特

Shiell

一个

用于导航社会网络分析领域的术语表

流行病学，社区卫生 2004 12 58 12 971 5

10.1136 / jech.2003.014530

15547054

58/12/971

PMC1732636

•克里

吉尔

Arlitt

米

一些关于Twitter的唧唧声

第一次在线社交网络研讨会论文集 2008

Acm sigcomm 2008

2008年8月17-22日

西雅图,华盛顿州

纽约

ACM的新闻

19 24

10.1145/1397735.1397741

莫雷

米

里德

具有给定度序列的随机图的巨大分量的大小

Combinator Probab Comp 1998 7 3. 295 305

10.1017 / S0963548398003526

尼噶的

赫斯特

米

朝着一个强有力的意见度量

AAAI春季研讨会论文集:探讨文本中的态度和影响:理论和应用 2004

AAAI春季研讨会:探讨文本中的态度与影响:理论与应用

2004

加利福尼亚州斯坦福大学

Omurtag

吉梅内斯

Ratts

Odem

库珀

基于“增大化现实”技术

社交网络的艺术:SART成员诊所如何与患者在线联系

Fertil杂志 2012 01 97 1 88 94

10.1016 / j.fertnstert.2011.10.001

22088209

s0015 - 0282 (11) 02667 - 7

PMC4074916

阿普费鲍姆

莱托

程ydF4y2Ba

梅塔

党卫军

氮化镓

术后疼痛经验:一项全国调查的结果表明，术后疼痛仍未得到充分控制

Anesth Analg 2003 08 97 2 534 40、目录

12873949

康纳斯

房颤小

道森

Desbiens

支持首席研究员。一项改善重症iii期住院患者护理的对照试验:了解预后、结果偏好和治疗风险的研究(SUPPORT)

《美国医学会杂志》 1995 274 1591

推进疼痛研究、护理和教育委员会，医学研究所

在美国减轻疼痛:转变预防、护理、教育和研究的蓝图 2011 06 29

华盛顿特区

国家科学院出版社

博伦

毛

曾

推特情绪预测股市

计算科学 2011 2 1 1 8

10.1016 / j.jocs.2010.12.007

Borondo

莫拉莱斯

Losada

贝尼托

在Twitter的背景下描述和建模选举活动:2011年西班牙总统选举作为案例研究

混乱 2012 06 22 2 023138

10.1063/1.4729139

22757545

多兹

哈里斯

Kloumann

即时通讯

幸福

丹弗斯

厘米

全球社交网络中幸福和信息的时间模式:幸福计量学和推特

《公共科学图书馆•综合》 2011 6 12 e26752

10.1371 / journal.pone.0026752

22163266

玉米饼- d - 11 - 01360

PMC3233600

梅尔维尔

Gryc

劳伦斯

理查德·道金斯

结合词汇知识和文本分类的博客情感分析

KDD '09第15届ACM SIGKDD知识发现和数据挖掘国际会议记录 2009

第15届ACM SIGKDD知识发现和数据挖掘国际会议

2009年6月28日至7月1日

法国巴黎

纽约

ACM的新闻

10.1145/1557019.1557156

20.

米切尔

弗兰克

先生

哈里斯

多兹

丹弗斯

厘米

幸福的地理:将推特的情绪和表达、人口统计和地方的客观特征联系起来

《公共科学图书馆•综合》 2013 8 5 e64417

10.1371 / journal.pone.0064417

23734200

玉米饼- d - 13 - 07723

PMC3667195

普拉博沃

Thelwall

米

情感分析:一种综合方法

J Informetr 2009 3. 143 157

10.1016 / j.joi.2009.01.003

博伦

佩佩

一个

毛

模拟公众情绪和情感:推特情绪和社会经济现象

第五届国际AAAI博客和社交媒体会议论文集 2011 07

第五届国际AAAI博客和社交媒体会议

2011年7月17日至21日

西班牙巴塞罗那

Dufty

利用社交媒体建立社区抗灾能力

Austral J Emerg管理 2012 27 1 40 45

库马尔

年代

巴比尔

Abbasi

米

刘

推特追踪器:人道主义和救灾的分析工具

第五届国际AAAI会议 2011 07

AAAI博客和社交媒体会议

2011年7月17日至21日

西班牙巴塞罗那

1 2

Manyez-Ortiz

米

Albo-Portero

紧急情况下推特。遵循我们的路线图

BMJ 2012 345 e4814

22826588

Prochaska

Pechmann

金

莱昂纳特

Twitter =半途而废呢?分析Twitter戒烟社交网络

钻头扭矩控制 2012 07 21 4 447 9

10.1136 / tc.2010.042507

21730101

tc.2010.042507

PMC3310933

年青男子

一个

塞格雷

我

Polgreen

点

在甲型H1N1流感大流行期间，美国使用Twitter追踪疾病活动水平和公众关注

《公共科学图书馆•综合》 2011 6 5 e19467

10.1371 / journal.pone.0019467

21573238

玉米饼- d - 10 - 02464

PMC3087759

沙利文

施耐德

AG)

Cheang

连续波

托

李

红色头发的人

病房

年代

艾哈迈德

哦

麦克罗里

公关

“发生了什么?”Twitter上脑震荡相关流量的内容分析

运动医学 2012 03 46 4 258 63

10.1136 / bjsm.2010.080341

21406451

bjsm.2010.080341

Thelwall

米

巴克利

Paltoglou

推特事件中的情绪

J Am Soc Inf科学 2010 12 06 62 2 406 418

10.1002 / asi.21462

30.

Forgeron

巴勒斯坦权力机构

麦格拉思

史蒂文斯

埃文斯

迪克

芬利

遗传算法

卡尔森

患有慢性疼痛的青少年的社会信息处理:我的朋友并不真正理解我

疼痛 2011 12 152 12 2773 80

10.1016 / j.pain.2011.09.001

21963240

s0304 - 3959 (11) 00540 - 9

卡普

摩根富林明

Shega

马龙

不

维纳

老年人持续性疼痛的机制和管理研究进展

Br J麻醉剂 2008 07 101 1 111 20.

10.1093 / bja / aen090

18487247

aen090

PMC2841779

洛克

EYC

Mok

程

连续波

张

成立分公司

类风湿关节炎患者精神障碍的患病率和决定因素

心身医学 2010 51 4 338 338. e8

10.1176 / appi.psy.51.4.338

20587762

s0033 - 3182 (10) 70705 - 2

麦克斯韦

巴奈特

Kokokyi

年代

梁

余

成Bril

Katzberg

高清

多发性神经病患者社会支持与生活质量的关系

J外围神经系统 2013 03 18 1 37 43

10.1111 / jns5.12005

23521642

Meldrum

毫升

曹

JC-I

Zeltzer

路

“我不能成为我想成为的人”:儿童对慢性疼痛经历和治疗结果的叙述

疼痛医学 2009 09 10 6 1018 34

10.1111 / j.1526-4637.2009.00650.x

19594848

PME650

PMC2758095

Saariaho

作为

Karila

Joukamaa

心肌梗死

芬兰成人慢性疼痛患者和对照样本的早期适应不良模式

斯坎德J精神病 2011 04 52 2 146 53

10.1111 / j.1467-9450.2010.00849.x

21054422

Soklaridis

年代

-卡特米尔

卡西迪

慢性疼痛中受伤工人的传记中断

Disabil Rehabil 2011 33 23 - 24日 2372 80

10.3109 / 09638288.2011.573056

21504406

阻止

慢性疾病患者的社会心理干预

Biopsychosoc地中海 2012 6 1 2

10.1186 / 1751-0759-6-2

22293471

1751-0759-6-2

PMC3299618

卡尔

莱托

莫菲特

木菠萝

社会剥夺对慢性背痛结果的影响

慢性Illn 2005 06 1 2 121 9

17136918

摩尔

罗姆尼

正义与发展党

夏朝

Rusch

情感词汇语义结构的普遍性:文化间和文化内差异的研究方法

Amer Anthropol 1999 101 529 546

10.1525 / aa.1999.101.3.529

罗姆尼

正义与发展党

摩尔

Rusch

文化共性:测量英语和日语情感术语的语义结构

美国国立自然科学研究院 1997 05 13 94 10 5489 94

9144265

PMC24706

Heaivilin

尔贝特

页面

我

吉布斯

莱托

通过推特对牙痛进行公共卫生监测

J登特保留区 2011 09 90 9 1047 51

10.1177 / 0022034511415273

21768306

0022034511415273

PMC3169887

Linnman

Maleki

一步

Borsook

偏头痛推文——网上行为能告诉我们关于疾病的什么信息?

头痛 2013 01 33 1 68 9

10.1177 / 0333102412465207

23136208

0333102412465207

PMC3808841

麦克尼尔公司

Brna

点

戈登

柯

推特时代的癫痫:需要重新推特我们对癫痫的看法

癫痫Behav 2012 02 23 2 127 30.

10.1016 / j.yebeh.2011.10.020

22134096

s1525 - 5050 (11) 00618 - 4

尼科尔森

微博上的姑息治疗:关注谁就能开始

Int J Palliat Nurs 2013 01 19 1 6 7

10.12968 / ijpn.2013.19.1.6

23354427

奥基夫

Clarke-Pearson

传媒委员会

社交媒体对儿童、青少年和家庭的影响

儿科 2011 04 127 4 800 4

10.1542 / peds.2011 - 0054

21444588

peds.2011 - 0054

Sajadi与加雷熟识

高盛

乙肝

社交网络缺乏治疗失禁的有用内容

泌尿外科 2011 10 78 4 764 7

10.1016 / j.urology.2011.04.074

21862115

s0090 00706 - 0 - 4295 (11)

程

Caverlee

李

你在哪里发推:一种基于内容的Twitter用户地理定位方法

第19届ACM信息与知识管理国际会议论文集 2010 10 26 - 30日

第19届ACM信息与知识管理国际会议

2010年10月26日至30日

在多伦多

赫克特

在香港

Suh

气

嗯

贾斯汀·比伯发自内心的推文:用户档案中位置字段的动态

2011 05 7 - 12

计算机系统中的人为因素SIGCHI会议论文集

2011年5月07-12日

温哥华公元前

纽约

ACM

李塔鲁

王

年代

Padmanabhan

一个

摇了摇

绘制全球Twitter心跳图:Twitter的地理位置

调频 2013 5 06 18 5 4366

10.5210 / fm.v18i5.4366

Tighe

Fillingim

赫尔利

美国医院消费者对医疗保健提供商和系统疼痛管理经验评分的地理空间分析

疼痛 2014 155 1016 1026

庞

李

意见挖掘和情感分析

信息检索中的FNT 2008 2 1 - 2 1 135

10.1561 / 1500000011

尼尔森

足总

一种新的评价方法:微博情感分析词表评价

ESWC会议记录 2011 05 30.

CEUR研讨会论文集

5月30日

伊拉克里翁,克里特岛

Davidov

提苏尔

导演奖。

一个

使用推特标签和笑脸符号增强情绪学习

第23届国际计算语言学会议论文集 2010 08 汽车出行

第23届国际计算语言学会议

2010年8月23-27日

中国,北京

241 249

Kouloumpis

威尔逊

摩尔

推特情绪分析:好的，坏的，还有OMG!

第五届国际AAAI博客和社交媒体会议论文集 2011 07 17-21

AAAI博客和社交媒体会议

2011年7月17日至21日

西班牙巴塞罗那

1 4

刘

K-L

李

W-J

郭

米

用于推特情绪分析的Emoticon平滑语言模型

第26届AAAI人工智能会议记录 2012 07 22日至26日

第26届AAAI人工智能会议记录

2012年7月22日至26日

在多伦多

Balahur

一个

斯坦伯格

重新思考新闻中的情感分析:从理论到实践再回到实践

WOMSA在2009年第13届西班牙人工智能协会年会上的会议记录 2013 11 13

西班牙人工智能协会第十三届年会

2009年11月

西班牙塞维利亚

Bermingham

一个

Smeaton

房颤

意见检索中注释者间一致性的研究

第32届国际ACM SIGIR信息检索研究与发展会议论文集 2009 07

第32届信息检索研究与发展国际ACM SIGIR会议

2009年7月20-22日

都柏林

凯勒

弗雷德里克森

提单

她

象牙海岸

年代

约翰逊

米克尔

康威

一个

赌

一颗温暖的心，一个清醒的头脑。天气对情绪和认知的偶然影响

Psychol Sci 2005 09 16 9 724 31

10.1111 / j.1467-9280.2005.01602.x

16137259

PSCI1602

贾米森

安德森

斯莱特

妈

天气变化和疼痛:当地气候对慢性疼痛患者疼痛投诉的感知影响

疼痛 1995 05 61 2 309 15

7659442

0304 - 3959 (94) 00215 - z

2010年美国人口普查 2015-03-16

http://www.census.gov/2010census/

6 x50uni9g

美国人口调查局 2014

2014-05-22

小区域健康保险估算 http://www.census.gov/did/www/sahie/data/interactive/index.html

6 pltksyd8

国家气候数据中心，国家海洋和大气管理局 2015-03-16 1981-2010年美国气候常态 http://www.ncdc.noaa.gov/data-access/land-based-station-data/land-based-datasets/climate-normals/1981-2010-normals-data

6 x511xklf

绅士

基于R的twitteR客户端 2014

2014-05-22

http://cran.r-project.org/web/packages/twitteR/

6 plste6in

Borgatti

埃弗雷特

毫克

中心性的图论观点

社交网络 2006 28 466 484

10.1016 / j.socnet.2005.11.005

弗里曼

信用证

社会网络的中心性概念澄清

社交网络 1978 1 215 239

10.1016 / 0378 - 8733 (78) 90021 - 7

Brandes

一种更快的中间中心性算法

数学学会 2011 25 163 177

10.1080 / 0022250 x.2001.9990249

Tarjan

深度优先搜索和线性图算法

SIAM J计算 1972 1 146 160

奥康纳

Balasubramanyan

劳特利奇

史密斯

从推特到民意调查:将文本情绪与公众舆论时间序列联系起来

网络日志和社交媒体国际AAAI会议论文集 2010

网络日志和社交媒体国际AAAI会议

2010年5月23-26日

华盛顿特区

122 129

保罗

乔丹

Dredze

米

你就是你的推特:为公共卫生分析推特

人工智能 2011 265 272

格里夫斯

Ramirez-Cano

米勒特

Darzi

一个

唐纳森

利用患者体验云:使用社交媒体来检测质量差的医疗保健

英国医学杂志Qual Saf 2013 03 22 3. 251 5

10.1136 / bmjqs - 2012 - 001527

23349387

bmjqs - 2012 - 001527

Bardach

Asteria-Penaloza

Boscardin

达德利

类风湿性关节炎

美国商业网站评级与传统医院绩效指标之间的关系

英国医学杂志Qual Saf 2013 03 22 3. 194 202

10.1136 / bmjqs - 2012 - 001360

23178860

bmjqs - 2012 - 001360

PMC4074426

多兹

丹弗斯

厘米

测量大规模书面表达的幸福感:歌曲、博客和总统

J幸福螺柱 2010 11 441 456

10.1007 / s10902 - 009 - 9150 - 9

赫尔姆

理查德·道金斯

吉布森

克龙比式

本土知识

老年人的疼痛

疼痛的流行病学 1999

西雅图,华盛顿州

IASP新闻

斋藤

那一定很有意思

两种类型的Twitter用户拥有同样多的粉丝

《公共科学图书馆•综合》 2014 9 1 e84265

德拉Torre-Díez

我

Diaz-Pernas

Anton-Rodriguez

米

Facebook和Twitter上慢性病社交群的内容分析

Telemed J E Health 2012 18 6 404 8

10.1089 / tmj.2011.0227

22650380

库马尔

年代

Morstatter

Zafarani

刘

我该跟着谁?在危机期间识别相关用户

HT '13第24届ACM超文本和社交媒体会议论文集 2013

第24届ACM超文本和社交媒体会议

2013年5月1日至3日

法国巴黎

139 147

达根

米

布伦纳

社交媒体用户的人口统计- 2012 2013 02 14

2014-05-22

华盛顿特区

皮尤互联网和美国研究项目

http://www.pewinternet.org/2013/02/14/the-demographics-of-social-media-users-2012/

6 plthw8dc