发表在第13卷第4期(2011):10 - 12月

推文能预测引文吗?基于Twitter的社会影响度量及其与传统科学影响度量的相关性

推文能预测引文吗?基于Twitter的社会影响度量及其与传统科学影响度量的相关性

推文能预测引文吗?基于Twitter的社会影响度量及其与传统科学影响度量的相关性

本文作者:

冈瑟Eysenbach1 2 3

编辑

1大学卫生网络,全球电子卫生创新中心和技术研究所,加拿大安大略省多伦多

2多伦多大学卫生政策、管理和评估研究所,安大略省多伦多

3.卡塔尔世界杯8强波胆分析JMIR出版公司,多伦多,安大略省,加拿大

通讯作者:

Gunther Eysenbach,医学博士,公共卫生硕士,FACMI

大学卫生网络

全球电子卫生创新和技术研究所中心

伊丽莎白街190号

多伦多,ON, M4L3Y7

加拿大

电话:1 416 7866970

传真:1 416 340 3595

电子邮件:geysenba@uhnres.utoronto.ca


相关的文章这是更正后的版本。更正声明见://www.mybigtv.com/2012/1/e7

背景:同行评议文章中的引用量和影响因子是普遍接受的科学影响的衡量标准。Web 2.0工具(如Twitter、博客或社交书签工具)提供了构建创新文章级或期刊级指标的可能性,以衡量影响和影响力。然而,这些新指标与传统指标(如引用量)之间的关系尚不清楚。

摘要目的:(1)探索通过分析社交媒体上的热议来衡量学术文章的社会影响和公众关注的可行性,(2)探索与学术文章发表相关的动态、内容和推文的时间,以及(3)探索这些指标是否足够敏感和具体,以预测高引用的文章。

方法:从2008年7月到2011年11月,所有包含医学互联网研究杂志(JMIR)文章链接的推文都被挖掘出来了。对于2009年3月至2010年2月期间发表的55篇文章的1573条推文,计算了不同的社交媒体影响指标,并与17至29个月后Scopus和谷歌Scholar的后续引用数据进行了比较。验证了通过推文指标预测每期被引用最多的文章的启发式方法。

结果:共有4208条推文引用了286篇不同的JMIR文章。文章发表后30天内推文的分布遵循幂次定律(Zipf、Bradford或Pareto分布),大多数推文在文章发表当天(1458/3318,占60天内所有推文的43.94%)或第二天(528/3318,15.9%)发送,随后迅速衰减。推文和引用之间的Pearson相关性是中等的,具有统计学意义,对数转换的谷歌学者引用的相关系数在0.42到0.72之间,但Scopus引用和排名相关性不太明显。以时间和推文为显著预测因子的线性多元模型(P < .001)可以解释27%的引用变化。高推文的文章被高引用的可能性是低推文文章的11倍(9/12或75%的高推文文章被高引用,而只有3/43或7%的低推文文章被高引用;率比0.75/0.07 = 10.75,95%置信区间3.4-33.6)。引用最多的文章可以从推文最多的文章中预测出来,特异性为93%,敏感性为75%。

结论:Tweets可以在文章发布的前3天内预测高引用的文章。社交媒体活动要么增加了引用量,要么反映了文章的潜在质量,这些质量也预测了引用量,但这些指标的真正用途是衡量社会影响的独特概念。基于推文的社会影响指标被提出来补充传统的引用指标。提出的两个影响因子可能是一个有用和及时的度量标准,以衡量研究成果的吸收,并实时过滤与公众产生共鸣的研究成果。

中国医学杂志,2011;13(4):e123

doi: 10.2196 / jmir.2012

关键字



科学家、研究机构和资助机构需要衡量研究影响的指标。同行评议的文章中引用其他文章的次数是被广泛接受的衡量科学影响力的指标。引用量是h指数[1]及其衍生物,用于评估个别研究人员的生产力和影响力,或用于评估期刊的科学影响力的影响因子[2].然而,引用量作为一个度量标准有很多缺点,包括它们需要很长时间来积累。它们也很难获得(在大多数研究仍然不能开放获取的环境中),而且往往只能在专有数据库中获得;因此,这些指标不一定是透明的或可重复的。例如,研究人员的h指数根据计算数据库的不同而有很大差异,而期刊影响因子的计算也因不透明而受到批评[3.4].最后,引文只能衡量科学界内部的吸收和对科学界的影响,而不能衡量对知识使用者(决策者、患者和普通公众)的影响或传播。虽然这对于某些用例可能是可取的,但其他应用程序和涉众需要更广泛的影响定义。诸如对社会的影响、社会影响、现实世界的影响、知识的转化和公众的吸收等概念应该是每一项研究评估工作的一部分,但众所周知,这些概念很难衡量[5].已建议使用调查问卷等工具来衡量出版物的“社会影响因子”[6],但尚不清楚这些需要人工数据收集的仪器是否可扩展到大量出版物。

在这篇论文中,我提出了新的指标和新的数据来源——推特——可以用来衡量社会影响,补充传统的引文分析,试点测试和说明了一组文章来自医学互联网研究杂志(JMIR)。

网络引文分析曾被用于衡量文章或观点在网络上被提及的程度[7].例如,Vaughan和同事已经展示了链接指标之间的关系[8]或网上提及[910]和传统的影响指标。Kousha和同事提出了一个“综合在线影响指标”[11],将一系列在线资源整合为一个指标,衡量其在网络上的影响力,包括课程阅读清单、谷歌博客、PowerPoint演示文稿[12]、谷歌书籍[13].

Web 2.0工具,如Twitter和博客,以及社交书签工具和基于Web的参考管理工具,如CiteULike和Mendeley,提供了从其他来源收集新指标的机会,这些来源以结构化格式提供数据,可通过应用程序编程接口(api)访问[1415].这些指标——有时被称为替代指标[16]或(在更广泛的背景下)信息流行病学指标[1718——可以用来衡量诸如受欢迎程度、热度、社会影响或新信息的吸收等概念。潜在的共同观点是,科学家和公众在搜索或使用信息时,会在互联网上留下数字痕迹,而网络“使以前不可测量的东西变得可测量”。18指的是对特定信息的需求或使用,以及通过网络传播的信息的传播。信息流行病学是应用于公共卫生的新兴科学领域[1718]及其他广泛的范畴[19例如,有研究表明,搜索引擎查询可以预测流感[20.21],即H1N1大流行期间的推文与发病率相关[22),而关于一部电影的推文甚至在电影上映之前就能准确预测它的票房成功[23].

类似于公共卫生2.0的应用[17]、经济及其他领域[19],有一个明显的应用信息流行病学或信息监测2.0科学计量学24],目的是研究围绕科学出版物的热议,以衡量甚至预测研究的影响。

基于社交媒体的科学计量学(替代计量学,信息流行病学计量学)领域尚处于起步阶段,许多悬而未决的问题需要解决。可能这些新指标衡量的是完全不同的概念,而这些概念与其他传统指标(如引用)并不相关,但也可能是学术文献中的重要出版物首先在博客圈(和其他Web 2.0场所)引起了可衡量的轰动,然后,几年后,这种轰动也反映在增加的引用和/或政策变化和社会影响上。

具体问题包括:(1)如何测量嗡嗡声?(2)什么时候(就文章的发表而言),我们应该测量多长时间?(3)如果我们可以测量一些东西,这些指标与引用等传统指标的关系如何,嗡嗡声是否敏感到足以预测引用的增加?(值得注意的是,预测引用量不一定是最终目标,缺乏相关性也不一定是失败,因为很明显,这些指标为衡量影响力增加了一个新的维度。)

缺乏探索和显示这种关系的经验数据,这对发展基于社交媒体的科学计量学领域是具有开创性的。虽然学者们在推特上引用的内容已经被证明,学者们这样做的原因也已经被探索过了[24],目前还不清楚一篇文章或期刊级别的出版物如何吸引推文,以及是否可以得出有意义的指标。

有一小部分文献关注Twitter在学术上的应用,但数量在迅速增长。24-29].大多数论文都专注于分析会议期间收集的Twitter流[25-27],而在期刊层面上几乎没有证据。公共科学图书馆(PLoS)期刊提供了一些文章层面的影响指标,学者们已经开始分析这些指标[30.,但公共科学图书馆最近才开始统计推文。

在JMIR,我们在2008年开始了目前的实证、前瞻性研究,当时很少有期刊出版商或学者考虑Twitter在分析影响方面的潜力。当前研究的目标是(1)探索讨论或提及研究文章的推文的内容和特征,以及它们相对于文章发表日期的时间,(2)确定合适的指标来描述通过社交媒体网络传播的新证据,以及(3)探索拟议的指标如何与科学界的传统吸收指标(传统引用)相关联。


JMIR推特数据集和推文计数

JMIR是一个领先的、高引用的开放获取期刊,汤森路透(前ISI)的3年影响因子为4.7,5年影响因子为5.0 (journal Citation Reports, 2010)。2008年7月,它是第一个开始系统地挖掘提及其发表文章的推文的期刊,并在JMIR的“热门文章”页面上实时显示这些推文图1).使用Twitter搜索API收集数据。

出于本文的目的,我将推文中的引用(提到期刊文章的URL)称为“推文”,以区别于期刊文章中的引用(这是我比较推文的指标)。由于一条推文可以有多个推文(一条推文包含多个引用不同文章的不同url),推文的数量不一定与推文的数量相同,尽管在我们的示例中,具有多个推文的推文非常罕见,因此我有时会使用微博而且tweetations互换。只有url直接链接到期刊文章的推文才会被捕获——也就是说,提到JMIR上发表的研究的报纸文章的链接或不在JMIR网站上的JMIR文章的链接(例如,PubMed Central中的实例,或指向数字对象标识符[DOI]句柄的链接)——不被计算在内。其他用户转发同一条推文或发送修改后的推文将被视为多条推文,同一用户包含相同URL的多条推文也将被视为多条推文。

图1所示。文章排名靠前医学互联网研究杂志(JMIR)(按2011年11月推文最多的文章排序)。
查看此图

引用计数

引文计数来自Scopus和谷歌Scholar。目前的研究是基于2011年11月获得的引文计数,这是在被引用论文发表17-29个月之后。

分析

对于推文分布分析,包括JMIR在2008年7月24日至2011年11月20日期间发送和存档的所有推文(多媒体附件1).

对于推文引用相关性分析,我只包括了2009年3月至2010年2月发表的文章的推文,即2009年7月22日至2010年6月30日发表的所有55篇文章的推文(多媒体附件2).我选择这段时间是因为早期文章的推文率太稀疏,而后期文章截至2011年11月没有足够的累计引用量。

计算原始数据和对数转换数据的Pearson相关性,以及Spearman等级相关性。数据使用自然对数进行对数转换,因为推文和引用数据高度倾斜。由于0的日志是未定义的,所以引用和推文的计数增加了1。

对于分类分类分析(试图从推文高的文章中预测高被引用的文章),“高被引用”的文章被定义为排名前25的文章th每期文章的百分比(按引用数排名的文章),“推文量高”的文章被定义为排在前25位的文章th每个问题的百分比(按推文排名)。

分析以每期每季度为基础进行分层,以调整时间作为混杂因素,因为Twitter的受欢迎程度(以及JMIR追随者的数量)会随着时间的推移而增加(较老的文章会比较新的文章拥有更少的推文),而且较老的文章会比最近的文章拥有更多的引用。按期刊发行进行分层可以确保相互比较的文章都是在同一个季度(3个月窗口)内发表的。

在另一项分析中,我包括了所有期刊的文章,但通过进行线性回归分析,将时间作为潜在的混杂因素进行了调整,引用的对数作为因变量,时间(距离我们数据集中最早的文章发表的天数)和推文的对数作为自变量。

请注意,当本文中提到文章id时(见图),它们是DOI的一部分;每篇文章都可以在Web浏览器的地址栏中输入http://dx.doi.org/10.2196/jmir.{articleID}来识别。


每篇文章的平均推文数

共识别出4208条推文,总共引用了286篇不同的JMIR文章,每篇文章平均收到14条推文(中位数为9)。然而,这些平均值应谨慎解释,因为JMIR自1999年以来已发表文章(共560篇)。在推文中引用的286篇文章中,有很多文章发表于数据收集开始之前,甚至在Twitter存在之前。由于这些较老的文章只收到零星的推文,平均值和中位数并不能反映最近的文章。

2009年3月至2010年2月发表的55篇文章在文章发表后356天内平均收到21.2次推文(中位数12次,范围0-149次),7天内平均收到13.9次推文(中位数8次,范围0-96次)。图2显示这些文章在7天内的累计推文数(tw7)。

图2。文章发布后7天内的推文数,每个文章ID。文章id旁边的星号表示该文章是被引用最多的(参见图8):** Scopus和谷歌Scholar的前25个引用百分比*仅根据谷歌Scholar的前25个引用百分比,(*)仅根据Scopus的前25个引用百分比。
查看此图

微博动态

与文章的发表日期相关,推文是什么时候发生的?图3显示所引用文章发表后60天内发送的所有推文(n = 3318)的一般分布,按天计算。图中,第0天为文章发表的日期,第1天为文章发表的第二天,以此类推;左y轴显示了当天发送的推文数量(推文率),与60天内所有推文的比例;右边的y轴(和红线)表示累计比例。大多数推文是在文章发表当天(1458/3318,43.9%)或第二天(528/3318,15.9%)发送的。只有5.9%(197/3318)的推文是在发布后的第二天发出的,而且下降趋势还在继续,直到第5天和第7天之间出现一个平台期(约占60天推文的2%)。第8天和第9天有所下降,这可能是由于JMIR在一周的不同日子发表文章,但周五稍微多一些,因此第8天和第9天会在下一个周末。第10天之后(66/3318,2%),新推文率迅速下降。

图4显示了每天新推文的相同曲线,但这次用对数水平轴和垂直轴重新绘制。现在出现了一个有趣的模式,显示出很强的规律性:在对数-对数图上,前30天的推文分布遵循一条直线,这表明了帕累托分布,也称为齐夫定律或布拉德福德分布,据说它们遵循幂律[31].在我们的样本中,文章在发表后的前30天内每天的推文数可以通过公式ln(tw) = -1.53 * ln(d) + 7.25来预测,其中tw是第d天的新推文数,d是自发表以来的天数(发表日期=第一天)。

这个模型非常适合(R2= .90)。虽然这个公式的截距并不重要(它取决于推文的总数),但-1.53被称为alpha或幂律指数(对数-对数图中线性曲线的斜率)。

我们可以把图案分成两部分图4我把前30天称为“网络传播阶段”,新信息通过Twitter社交网络传播。30天之后,网络传播阶段让位于我所说的“零星推文阶段”,在这个阶段,只有零星提及旧文章,以及小规模的局部信息传播爆发。

图5显示JMIR第1/2010期所有文章的推文动态。注意,当图4显示了每天的推文数(推文率,正在急剧下降),图5以累积的方式显示它们。该图说明了一些文章仅在第一天吸引推文,而其他一些文章则继续吸引推文,并被广泛转发。顺便说一句,这些文章往往被高度引用,如下所示的更详细。

图3。Tweetation动力学。蓝色阴影区域(左y轴)显示了推文率(每天新推文数占前60天内所有推文数的比例[tw60])。红线(右y轴)表示累积推文。
查看此图
图4。推文动态随时间的对数-对数尺度。所有的推文都是根据被引用文章发表的时间(x轴)进行分类的,其中1是文章发表的日期。
查看此图
图5。某一期文章发表后7天内的推文动态。4位数字是文章标识符(DOI的最后一位),括号中的数字是引用计数(根据谷歌Scholar, 2011年11月),最后一个数字是第7天(tw7)的推文(累计)数量。
查看此图

其他的规律

此外,推文还遵循幂律。推文来自1668个不同的推特账户(推文作者)。大多数推文(n = 370)是由JMIR的推特账户@JMedInternetRes发送的。如果我们根据他们发送的推文数量对这些账户进行排名,并将它们与每个账户的推文数量进行对比,幂律分布如图所示图6出现了。一半的推文(2105/4208,50%)是由132位不同的推文作者发送的,也就是所有推文作者的8%。前20%的推文作者(推文数量排名1-334的人)占所有推文的63.4%(2676/4208)。这种不均匀的工作分布是典型的帕累托分布,这种观察有时被通俗地称为80/20规则,大约80%的结果来自20%的原因。

我研究的第三次幂律是我最期待的,因为这种分布通常是在引用中观察到的,并且可以在Zipf图中证明,在Zipf图中,被引用的数量n被引用次数最多的论文与排名n (图7(左)。推文的分布也非常相似(图7,对吧)。

图6。推特密度的帐户。每个Twitter账户的排名是根据发送的推文数量,并在x轴上按排名绘制。y轴显示了每个排名账号发送的推文数量。例如,排名第一的推特账号@JMedInternetRes发送了370条推文。注意对数对数尺度上的线性模式,这意味着幂律。
查看此图
图7。左图:JMIR文章2009年3月至2009年12月的Zipf图(n=405),引用数(y轴)与排名文章的关系。右图:Zipf图显示了2009年4月3日至2011年11月15日期间发表的所有JMIR文章(n=206)在第一周(tw7)的推文数量(y轴)与排名文章的对比。例如,推文排名第一的文章有97条推文,排名第十的文章有43条推文,排名102的文章有9条推文。
查看此图

引用

我们的推文-引用子集中的55篇文章在Scopus上的平均引用数为7次(中位数为4),在谷歌Scholar上的平均引用数为13次(中位数为9)。图8显示了截至2011年11月,谷歌学者的所有55篇文章在推文/引用分析中的引用计数。

首先,将Scopus的被引用数与谷歌Scholar的被引用数进行关联,以检验两个数据库来源之间的一致性。结果一致,Pearson相关系数为。87 (P< .001)。由于谷歌学者的引用计数更高,似乎更稳健,这里提供的大多数结果是指谷歌学者的引用计数,除非另有说明。

图9比较了典型的引用和推文曲线,说明了推文与学术文章中引用的非常不同的动态。学术文章的引用量在文章发表1年后才开始积累,而推文量则主要在文章发表后的头几天内开始积累。

图8。谷歌学者引用计数为2009年3月至2010年2月期间发表的所有文章。每期被引最多的文章(第75百分位)被标记为**(谷歌Scholar和Scopus引用最多的文章),*(谷歌Scholar仅限),或(*)(Scopus仅限)。
查看此图
图9。高被引(和高推)文章的引用和推文动态[文章ID 1376];根据Scopus的引用。
查看此图

推文与引用的相关性

对于每期期刊,我分别绘制散点图,并计算原始计数的Pearson相关系数、日志和Spearman秩相关系数,以建立引用和推文之间的相关程度。

我的主要推文指标是tw7(文章发表后7天的累计推文数,第0天是发表日期),我也称这个指标为tw7twimpact因素或TWIF7(见下文)。

Pearson积矩相关系数(r)的原始引用计数与tw7推文计数在所有期刊的5%水平上具有统计学意义,范围为0.57至0.89 (表1).当不同议题的文章被合并时,除了Scopus引用数和推文数之间的等级相关外,引文日志和推文日志之间的Pearson相关性以及Spearman等级相关系数都具有统计学意义。当按期刊问题进行分层时,一些问题的相关性在某些计算中具有统计学意义,而对其他问题则不具有统计学意义,可能是由于样本量小。一般来说,谷歌学者引用比Scopus引用与推文的相关性更好(表1).斯皮尔曼排名相关性(引用排名与tw7排名)仅在一个问题上具有统计学意义,rho = .51,P第2/2010期= .04。

我还对其他推文指标(tw0、tw1、tw2、tw3、tw4、tw5、tw6、tw7、tw10、tw12、tw14、tw30和tw365)进行了分析,并推导出各种指标(tw365 - tw7,即后期推文;tw7 - tw0, tw0/tw7等),产生了非常相似的相关系数(数据未显示)。

表1。相关系数
期刊(论文数量)
3/2009 (n = 19) 4/2009 (n = 11) 1/2010 (n = 8) 2/2010 (n = 17) 全部(n = 55)
r或ρ P价值 r或ρ P价值 r或ρ P价值 r或ρ P价值 r或ρ P价值
皮尔逊相关(r
CitGo-Tweets一个 .57 * * . 01 .89 * * * <措施 .76 * 03 .68点* * .003 i = * * * <措施
CitSc-Tweetsb .33 大于* * . 01 主板市场 。08 .51 * .04点 54 * * * <措施
logCitGo-logTweets 。08 .51 标识* .045 49 * .048 点* * 04
logCitSc-logTweets 03 .90 .41点 口径。 53 票价 06 。31 * 02
斯皮尔曼秩相关
CitGo-Tweets 07 .14 .68点 .51 * .04点 36 * * .006
CitSc-Tweets 06 结果 .76 无误 低位 .10 口径。

一个引用计数根据谷歌学者(CitGo)与推文计数(tw7)。

b引用计数根据Scopus (CitSc)与推文计数(tw7)。

P< .05, **P< .01, ***P<措施。

多变量分析

在一个线性回归模型中,我试图从推文数量和时间(55篇文章样本中第一篇文章发表后的天数)的对数中预测谷歌学者引用数的对数。回归方程为log(cit + 1) = 0.467 * log(tw7 + 1) + -。001 *天+ 0.817,其中cit为引用数,tw7为第7天的累计推文数。两个自变量均为显著预测因子(P< .001),该模型解释了27%的引用变化(R2= 10)。

二元分析

根据观察,推文主要是在发表后的早期发送的,我假设tw7,即到第7天的累计推文数(可能最早在第3天),可以用作预测高引用文章的诊断测试。高度推而且被引用次数被定义为75篇文章th-100年th每期期刊的百分比;因此,什么是高推文或高引用的分界点因事件而异(推文:11、19、34.8、28.5;谷歌学者引文:3/2009、4/2009、1/2010和2/2010期分别为15、9、22.75、15)。

表2是一个2 × 2的表格,将文章分为四组。不常被推特且不在引用前四分位数的文章被解释为真正的否定(tn,左下象限)图10而且表2).高推文和高引用的文章是真正的积极因素(tp,右上象限图10而且表2).被大量推文但被引用次数不多的文章属于左上象限,被称为假阳性(fp)。最后,推特不高但被引用率高的文章是假阴性(fn)。

使用推文状态(高推文与低推文)作为引用状态的预测测试,该测试确定了43篇被引用率不高的文章中的40篇,转化为93%的特异性(真阴性率,tn/[tn + fp], 40/43)。该测试能够正确识别12篇高被引论文中的9篇,对应75%的灵敏度(tp/[tp + fn], 9/12)。另一种表达这些结果的方式是,正预测值(tp/[tp + fp])或精度为75%,这意味着如果一篇文章被高度推特(社交媒体影响测试呈阳性),那么这篇文章最终有75%的可能性在同一问题的所有文章中排名前四分之一(按引用排名)。负预测值(tn/[tn + fn])为93%(40/43),这意味着如果一篇文章没有被高度推特(社交媒体影响测试为阴性),那么它只有7%(3/43)的机会进入被引用文章的前25%。然而,另一种表达这些结果的方式是,高推文的文章被高引用的可能性几乎是低推文文章的11倍(9/12,75%的高推文文章被高引用,而只有3/ 43,7%的低推文文章被高引用;率比0.75/0.07 = 10.75,95%置信区间3.4-33.6)。

引用状态和推文状态之间存在高度统计学意义上的相关性(Fisher精确检验,P<措施)。

我对一系列不同的指标(如tw)重复了这一分析n(之后的累计推文数n天数,n = 0, 1-10, 12, 14, 30,或365),以及晚反应推文数tw365-tw7。从第3天(tw3)开始,启发式开始识别与tw7相同的顶部推文文章,这表明该测试早在发表后3天就具有预测性。选择较晚的日期(让推文累积超过7天)或晚反应的推文并不能改善测试结果(数据未显示)。

图10。2011年11月的引用量(谷歌Scholar)与截至第7天的早期推文累积数量(tw7)之间的相关性。注意对数刻度。这里不显示tweet数为0或引用数为0的文章,因为没有定义0的日志。然而,从概念上讲,它们都属于左下象限。
查看此图
表2。2 × 2表使用推文最多的文章作为预测引用最多的文章
引用较少(后75%)
N = 43
高度引用(前25%)
N = 12
高度推
(前25%)
N = 12
《外交政策》一个(n = 3)
[Article ID 1223, 1163, 1281]
tpb(n = 9)
[Article ID 1252, 1303, 1270, 1249, 1337, 1376, 1371, 1350, 1549]
少推
(75%)
N = 43
tnc(n = 40) fnd(n = 3)
[Article ID 1086, 1256, 1357]

一个假阳性。

b真正的优点。

c真正的底片。

d假阴性。

提议的基于twitter的社会影响度量

这里报道的研究集中在一个期刊的文章上。但是,我建议这里介绍的度量标准应该有助于衡量任何文章(或文章集或文章集)在Twitter上的影响,衡量用户对文章主题的关注程度,衡量问题和/或结论如何与Twitter用户产生共鸣,并最终将它们用作社会影响的代理。虽然这里我以Twitter为例,但这些指标也可以用于其他社交媒体(如Facebook状态更新)。这里提出的指标也可以泛化,并应用于衡量任何问题(不仅是学术文章,还包括时事和报纸文章)对社交媒体用户群体的影响。

tw7影响因子(tw7)

使用原始推文数量来比较不同文章的影响是有问题的,因为推文数量是自发表以来时间的函数。虽然数据表明,在最初的30天内,推文通常只会零星地出现,但在比较不同日期发表的文章时,不应使用原始推文数量。自发表以来每月的平均推文数是可以计算的(目前显示在JMIR热门文章网页上,请参阅图1),但由于幂律分布高度倾斜,这个平均值总是倾向于最近(上个月)发表的文章。

因此,我建议使用(并在本文中使用了)twimpact factor twn作为衡量社交媒体即时影响的指标,它被定义为在社交媒体上的累计推文数量n发布后的天数(例如,tw7表示n = 7天后的总推文数)。Tweetations可由URL提及如果我们将此指标应用于其他社交媒体(URL是特定文章的URL或URL集)。

作为Twitter上一篇文章的标准tw7影响因子指标,我建议(JMIR将来也会使用)tw7,即一篇文章每天收到的绝对累计推文数7这也是一个非常实用的指标:使用相对较短的时间使得twimpact factor更容易计算,因为Twitter流只需要被监控7天。

我已经证明,新推文的数量在发表后迅速下降,即使是被引用率最高的论文。即时的社交媒体反应与随后的社交媒体反应高度相关;因此,很可能可以忽略延迟响应。更短的时间(3天)tw3在样本中已经足够区分高被引文章和低被引文章,但我建议有一个标准n7,它的优点是总是包括一个周末;因此,在周末发表的期刊文章较少受到周末效应的影响。

任何一篇文章,也包括一篇文章的集合,都可以有两个影响因子(例如,在期刊或问题层面)。JMIR现在正在监测collective twimpact f演员ctwn/对于每期期刊(其中n发布后的推文天数累积起来了吗是百分位数),例如,ctw7/50是中位数(50thtw7的百分位)用于集合中的所有文章。JMIR第2期的ctw7/75是29,这意味着第2期的前25%的推文最多的文章在第一周被推了29次以上。我们宁愿报告75th百分比,而不是平均值或中位数(ctw7/50),因为权力分布,因为它似乎是一个有用的分界点,以预测引用最多的文章。至少在我们的样本中,集体tw7/75影响因子ctw7/75的实际意义是,在某一期期刊中,tw7大于ctw7/75的文章有75%的可能性被引用最多(最终在同一期所有文章中排名前四分之一)。

注意,twimpact factor是一个计算tweets的绝对度量;因此,就像期刊影响因子一样,需要注意。首先,它是高度特定的学科,所以如果在期刊之间甚至是同一期刊的文章之间进行比较,它们应该在一个狭窄的学科类别内进行比较。社交媒体上的一篇文章比一篇关于分子生物学的文章更有可能被社交媒体收录。虽然在一个特定的领域内,双重影响因子可以预测引用量(预测哪篇文章更有可能被高引用),但将社交媒体上一篇文章的双重影响因子与一篇关于分子生物学的文章的双重影响因子进行比较,并得出社交媒体文章更有可能被引用的结论是不合法的。

其次,类似于期刊影响因子不应该在不同年份之间进行比较的警告,因为总引用数量在不断增长,只有在相似时间范围内发表的文章才应该相互比较(甚至1年也太长了;因此,我们在每季度一期内进行比较)。这是因为推特的用户数量和期刊的追随者数量都会随着时间的推移而增长。

推半衰期

推特的半衰期(THLn)被定义为文章发表后,有一半的推文在第一次发布后的时间点n天发生。作为n我使用了30天——也就是说,作为分母,我选择了在发布日期之后的30天内推文的累计总数。THL的n这些推文中有一半是在这一天发生的。

在我们的样本中,THLn被引用较少的文章为0(53%的推文是在第0天发布的),而THLn被高引用的文章是1篇(第0天,37%的推文发生了,第1天,21%的推文发生了,第1天的推文总数为58%)。图11说明了这一点。乍一看似乎令人惊讶的是,被引用较少的文章似乎在第一天表现出更快和比例更高的反应,但应该记住的是绝对被引用次数高的文章的推文数量要高于被引用次数低的文章。低影响力的文章主要在第0天和第1天被推特和转发。高引用的文章继续被广泛转发,这降低了相对0-3天的推文比例。

图11。推文曲线:累计推文(twn),占30天内所有推文的比例。
查看此图
Twindex

作为最后一个度量标准,我建议(JMIR将使用)twindex(推文索引),这是一个从0到100的度量标准,表示一篇文章与其他文章相比的相对地位。我定义了twindex7当所有的文章(具体的文章和来自比较组的文章)按tw7影响因子进行排名时,该文章的排名百分比。比较文章应该是在相似的时间窗口内发表的类似文章(例如,同一期的其他文章,或之前在同一期刊上发表的19篇文章)。如果一篇文章在比较文章中tw7的影响因子最高,那么它的tw指数为100。如果它具有最低的twimpact factor,则twindex为0。在这项研究中,带有双引号> 75的文章通常也被证明是被引用最多的文章。


主要研究结果

据我所知,这是第一个系统的、前瞻性的、纵向的文章和期刊级别的调查,研究学术文章在社交媒体上的提及(引用或推文)是如何随着时间的推移而积累的。这也是第一个相关研究altmetrics到后来的引用。我发现了一些重要的规律,这些规律将对其他对应用和开发基于社会媒体的影响指标感兴趣的人非常有用,而不仅仅是在科学计量学的背景下。

这篇论文表明,博客圈中的热议是可测量的,并且可以推导出与引用相关的度量标准。谷歌Scholar的引用似乎比Scopus的引用与推文更密切相关,这可能反映了谷歌Scholar包含了更广泛的引用来源,特别是来自非期刊文献的事实[32].Spearman排名相关性比Pearson相关性差,可能是因为在推文较少的文章中,推文很少,通常只有1或2条推文就会对文章的排名产生影响。然而,这种相关性足够强,以至于我们可以做出令人惊讶的准确的二元预测,即高度推文的文章最终被高度引用的可能性是前者的11倍。

相关性不是因果关系,而且很难确定额外的引用是否是一个因果关系结果对于社交媒体的热议,或者是一篇文章的潜在质量或新闻价值推动了热议和引用,它很可能是两者的结合。在Twitter上的曝光会带来一些额外的引用,这并不是不可想象的:科学家经常使用社交媒体来“捕捉有用的引用……否则学者们就不会接触到“[24许多科学家看到了Twitter的价值,即它是一种从同行中众包的持续实时文献提醒服务。推文包含文章的超链接,超链接可能会影响在谷歌等搜索引擎中的排名,增加研究人员的知名度。

基于twitter的指标的局限性

我建议将tweet、twindex和twimpact factor作为指标,JMIR将发布和推广这些指标。这些主要应被视为衡量社会影响(嗡嗡声、注意力或受欢迎程度)的指标,并作为研究人员、期刊编辑、记者和公众筛选和识别热门话题的工具。关注问题是社会变革的先决条件[3334],而推文是衡量特定学术出版物关注度的有用指标。这里提供的数据还表明,社会影响在一定程度上与科学影响相关,但有一些重要的警告。这种相关性远非完美(正如人们所期望的那样),而且互补需要强调的是度量标准的性质(顺便说一句,补充性质也是本文作者不喜欢替代度量标准这个术语的原因——这些度量标准可能不是一个度量标准替代,但补充传统引用)。受欢迎程度——这是推特指标衡量的一个维度——对于娱乐行业等商业企业来说是一个非常有用的(也是预测收入的)指标,但如果它们没有得到其他指标的认可或补充,将受欢迎程度的指标应用于健康和科学领域就会存在巨大的陷阱。虽然对于资助机构、期刊编辑和研究机构来说,知道哪些主题与公众产生共鸣(受欢迎和关注)可能是非常有价值的,即使它们没有收到很多引用(假阳性组中的文章),但存在一个真正的危险,即研究主题或发现不够时髦,无法与Twitter人群产生共鸣——例如,影响弱势群体的研究——这些群体在推特上没有代表性——被边缘化了。有趣的是,其中一个假阴性(引用很多,但推文很少)包括了一篇关于低收入老年人口的论文[文章ID 1256]——正是推特上代表性不足的人群。另一方面,“性感”、时髦或有趣的出版物可能在Twitter上获得大量曝光,但可能(也可能不)具有有限的科学价值(这一概念也并不总是通过引用来准确衡量)。

尽管如此,如前所述,对于资助组织、编辑和学术机构来说,监控这些数据具有巨大的潜在价值,特别是要注意假阳性(高推文,低引用),因为它们可能指向应该关注的主题或问题。在我们的样本中,有3篇推特量高但引用量不高的文章(假阳性;文章id 1223,1163, 1281)都有耐心的一面,消费者可能是推文的来源。社交媒体的信息监视可以被视为公众参与讨论“重要”研究的工具。

最后,必须承认,有一些期刊特有的混杂因素可能会限制twimpact指标的使用,特别是在不同期刊之间进行比较的情况下(目前还没有这样做,但可能是未来的情况)。期刊迎合不同的社区和社交网络,当比较信息如何通过在线社交网络传播时,我们可能是在衡量这些网络的结构和这些社区的属性,而不是信息本身的属性。换句话说,推文的数量不仅仅是研究文章内在属性的函数;相反,它还受到相关因素的影响,这些因素包括期刊或期刊发表的地点,围绕期刊建立的社区,以及期刊如何营销学术信息。但话又说回来,引用也是如此。

本研究的局限性

虽然这里提出的结果和指标可能是通往基于社交媒体影响指标的新领域的关键,而JMIR将越来越多地使用这些方法,但最大的问题是我们的结果和方法是否可以应用于其他期刊。JMIR是一个理想的期刊,因为它有一个相对较高的影响因子(即许多传统的引用事件)和作为一个期刊关于互联网和社交媒体——它有一个成熟的读者群体,通常在采用Web 2.0工具方面走在前面。然而,这也限制了这些结果的泛化性:适用于该期刊的方法可能不适用于其他期刊,特别是很少被引用(影响因子低)且没有活跃Twitter用户群的期刊。JMIR是一本关于信息技术的期刊,它的读者可能比其他期刊的读者更熟悉社交媒体。发表非互联网相关文章的期刊每篇文章的推文率可能要低得多,而且人们也不太可能在推特上发布非开放获取的文章。事实上,有人认为开放获取的一个关键优势是它促进了非研究用户之间的知识传播[35],而且那些影响力较低、无法为大量用户所访问的订阅期刊的文章也不太可能吸引到类似的推文水平。另一方面,如果订阅期刊上出现了关于论文的推文(例如,高影响力的期刊,如科学自然),它们很可能是由有权访问文章的专家用户(科学家)发布的;因此,它们可能对引用更有预测性,因为普通公众不是(或在较小程度上)对话的一部分。

这里提出的结果应该得到关于其他期刊的推文以及未来JMIR文章的证实,我们的小组目前正在与其他数据集进行比较分析。他们的假设是,只要有足够大的Twitter用户群,这些结果就可以在其他期刊上复制。

还有更多针对jmir的警告。首先,如图所示图1, JMIR在其网站上对推文最多的文章进行排名,每当有新文章进入任何一个月度类别的前10名时,JMIR就会自动发出推文;两者都可能加强并放大了推特用户的反应。此外,推文是衡量社交媒体反应的一个指标;因此,期刊的社交媒体策略可能会对结果产生影响。具有活跃社交媒体和推特提醒的期刊,如JMIR,将有更高的吸收率。JMIR追随者只需点击一个按钮就可以转发或修改这些警报(种子微博).不为每篇文章发送提醒的期刊可能有非常不同的推文特征(例如,更多的后期推文)。此外,推文的特征和速率几乎肯定会受到期刊粉丝数量的影响(JMIR目前有超过1000名粉丝),甚至更大程度上受到列表和Twitter机器人将内容重新分发到特定社区的影响。

有兴趣使用这种新方法和指标来比较不同期刊的研究人员也应该意识到,文章发表的时间和频率可能会影响推文动态和率(并可能影响推文和引用之间的相关性强度)。JMIR在文章准备好后立即在一周的不同工作日发布。随着人们在周末发推文的减少,推文曲线如图所示图2总是在周一出版的期刊(下降可能不太明显)与总是在周五出版的期刊(下降可能更明显)可能略有不同。然而,tw7指标(一周内的累计推文量)可能足够稳健,可以比较不同出版时间表的期刊。季节性影响也很明显。例如,第5/2010期(没有显示,也不包括在我们的分析中)是圣诞节前不久出版的主题期刊,在这一期中,所有文章都是一次性发表的,而不是分散在好几天里;因此,这一期主题文章的推特率非常低。

目前的报告不包括对推文内容的系统定性分析。然而,粗略地浏览一下所有的推文就会发现,绝大多数推文只是包含了文章标题或关键结论的变体,很少包含明确的积极情绪(比如“很棒的文章!”)或更不常见的消极情绪(比如“可疑的方法”——我没有看到任何后者的例子)。这可能是因为仅仅在twitter上(重新)发布一篇文章的行为通常是一种隐含的认可或推荐,读者通过它表达了他们对特定主题的兴趣和热情,支持研究问题和/或结论,或者只是想让他们的追随者注意到这篇文章。并不一定需要额外的评论来表示这种隐含的赞同。此外,由于大多数推文都是在论文发表当天发布的,很少有读者会有时间仔细阅读和评估除了标题和摘要之外的整篇论文。虽然我们最初想做一个自动化的情绪分析,但评论的稀疏性并没有使这种方法看起来有希望获得更具体的数据,尽管未来的研究可能会使用具有大量推文的期刊或文章来仔细研究这个问题。

未来的研究可能还会试图通过关注特定类型的twitter用户,或考虑推文作者的网络结构和相对影响力来增加特异性和敏感性。JMIR在其“热门文章”页面上发布了推文影响因子图1),它不仅考虑了推文的数量,还考虑了发送这些推文的用户的影响力。用户的影响力可以通过他们的粉丝数量和/或他们的推文被转发的频率来计算,需要更多的研究来确定这些次要指标是否会引发额外的信息,还是已经反映在原始推文计数中。

另一个限制是,目前的分析只考虑了一阶推文。推文可能包含到博客的链接,这些博客反过来谈论文章,或者可能包含到报道新研究发现的新闻文章的链接(二级推文)。根据Priem和Costello的说法,大约50%是二阶推文[24].这一分析并没有捕捉到这些,因为我们的工具严格地观察了直接链接到JMIR文章的推文。我们也没有捕获到JMIR文章可能托管的其他网站的链接,包括PubMed、PubMed Central或DOI解析器。最后,twitter用户通常使用URL缩短器,虽然我们检索了一些缩短的URL(通过URL缩短器,如bit.ly),但我们可能没有捕获到URL被不太常见的缩短器缩短的推文。因此,真实的推文总数可能比这里报道的要高。另一方面,没有理由相信不计算这些推文会产生偏见。

在当前的分析中,每条独特的推文都被算作1条推文。因此,同一用户就同一篇文章发送的多条推文将被计算多次。在当前的分析中,这不是一个问题,因为同一用户使用同一个URL的多条推文是相当罕见的。然而,从理论上讲,这是可能的——特别是如果推文成为一种更常见的排名和过滤文章的方法——作者可能会开始“游戏”系统,通过发送关于自己文章的多条推文来为他们的文章创造更多的曝光率。因此,对于任何对作者有重大影响的用例(例如,如果推文成为更被接受和更常见的社会影响早期指标),推文应该定义为由独特的唯一用户提到的URL。

结论

Twitter用户的集体智慧可以在有限的范围内预测通常需要数年积累的引用量,这是一个有趣而令人信服的发现。

需要再次强调的是,既不应期望也不应希望完全相关。推文主要应被视为衡量社会影响力和知识转化(新知识被公众接受的速度)的指标,以及衡量公众对特定主题的兴趣(公众关注的内容)的指标,而引用主要是衡量学术影响力的指标。两者都有点相关,但推文和引用衡量的是不同的概念,衡量的是不同受众的吸收或兴趣(图12).这些受众之间的相互联系和相互作用表现在图12使用双向箭头,从“社交媒体热议”指向“引用”(科学家受到社交媒体热议的影响),从“科学家使用”指向“社交媒体热议”(科学家在Twitter上制造热议),说明这些受众和指标的相互影响。

因此,如果(主要)不能作为引用的代理或早期指标,那么应该或可以如何使用推文呢?用例是什么?

首先,学者、机构和期刊可以很容易地使用社交媒体指标来及时监测研究的整体影响,记住上面列出的注意事项和限制。其次,这些指标可以用来评估不同的知识传播方法。人们可以设计研究,评估不同的推广文章的方法(或其他url,例如公共卫生干预网站),以tw影响因子作为结果衡量标准。第三,社交媒体影响指标也可以作为一个过滤器,引导用户到公众或研究团体正在关注的研究文章。一个显示实时社会影响指标的网站,例如当前研究文章的两个影响因子,可能对广泛的潜在受众有用,包括记者、期刊编辑、研究人员、公共卫生官员和患者,将他们引导到与公众产生共鸣的主题和研究。

图12。社会影响和研究影响指标之间关系的模型。
查看此图

长期征稿

为了科学计量学目的或信息流行病学研究中的其他用例,需要进行更多的研究来评估这些社交媒体指标的稳健性,以及它们在社交媒体闲聊的噪声中检测信号的能力。如前所述,这里提出的指标和规律不仅适用于科学计量学,还可以用于测量Twitter或社交媒体上讨论的其他问题或事件的动态和“半衰期”。

为了刺激和鼓励这一领域的创新、研究和发展,JMIR特此发出长期论文征集,欢迎关于信息计量学或信息流行病学指标(或替代指标,在科学计量学的背景下)这一广泛主题的经验和观点论文,特别是与健康相关领域或期刊的具体用例和数据。我们期待着发表更多的研究,我们认为这些研究是在互联网研究和科学2.0领域中利用众包和集体智慧主题的重要方法基础。

致谢

作者希望感谢Phil Cairns所做的编码工作,Cynthia Chew协助运行一些统计分析,两位JMIR同行审稿人提供了非常有价值和建设性的反馈,所有JMIR的作者继续向JMIR提交令人惊叹的工作,以及JMIR的追随者和其他帮助传播他们工作的twitter用户。

利益冲突

作者是JMIR的编辑和出版人,也是拥有和出版JMIR的JMIR Publications Inc.的股东。卡塔尔世界杯8强波胆分析他目前没有从JMIR出版公司拿工资,但他的妻子有(她抱怨工资不够)。卡塔尔世界杯8强波胆分析卡塔尔世界杯8强波胆分析JMIR Publications Inc.还拥有域名twimpact.org、twimpactfactor.org和twimpactfactor.com,可能的目标是为出版物和出版商创建计算和跟踪twimpact和twindex指标的服务,并可能直接或间接地从这些服务中获利。

多媒体附件1

2008年7月24日至2011年11月20日期间提及JMIR文章的4208条推文数据集。所有JMIR文章的实时、每日更新摘要文章级别指标,包括引用和推文计数、twi影响因子、twindex等,可从//www.mybigtv.com/stats/articles?format=csv下载。鼓励有兴趣使用和进一步分析这些数据的研究人员与作者联系。

XLSX文件(Microsoft Excel文件),540KB

多媒体附件2

包括引用。

PDF档案(adobepdf档案),443KB

  1. 赫希我。量化个人科研成果的指标。中国科学院学报2005年11月15日;102(46):16569-16572。[CrossRef] [Medline
  2. 期刊影响因子的历史与意义。中国医学杂志2006年1月4日;295(1):90-93。[CrossRef] [Medline
  3. 罗斯纳M,凡·埃普斯H,希尔e,给我数据。中国细胞生物学杂志2007 12月17日;21 (6):1091-1092 [免费全文] [CrossRef] [Medline
  4. 公共科学图书馆编辑。影响因子游戏。是时候找到一种更好的方法来评估科学文献了。PLoS Med 2006年6月;3(6):e291 [免费全文] [CrossRef] [Medline
  5. 衡量研究的社会影响。英国医学杂志2001 9月8日;323(7312):528 [免费全文] [Medline
  6. Niederkrotenthaler T, Dorner TE, Maier M.基于与科学家的焦点小组讨论,开发了一种衡量出版物对社会影响的实用工具。英国BMC公共卫生2011;11:588 [免费全文] [CrossRef] [Medline
  7. 网络计量学导论:社会科学的定量网络研究。见:信息概念、检索和服务综合讲座。美国旧金山:Morgan and Claypool出版社;2009.
  8. Vaughan L. Web链接计数与ISI影响因子相关:来自两个学科的证据。美国信息科学与技术学会学报2005;39:436。[CrossRef
  9. Vaughan L, Shaw D.书目和网络引用:有什么区别?美国信息科学与技术学会学报2003;54(14):1313-1322。[CrossRef
  10. Vaughan L, Shaw D.影响评估的Web引用数据:四个科学学科的比较。信息科学与技术学报2005;56(10):1075-1087。[CrossRef
  11. 柯珊珊,李丽霞,李丽霞。利用网络进行研究评价:综合在线影响指标。信息科学学报,2010;4(1):124-135。[CrossRef
  12. Thelwall M, Kousha K.在线演示作为科学影响的来源?:引用学术期刊的PowerPoint文件分析。美国信息科学与技术学会,2008;59(5):805-815。[CrossRef
  13. Kousha K, Thelwall M.谷歌图书检索:社会科学和人文科学的引文分析。美国信息科学与技术学会学报2009;60(8):1537-1549。[CrossRef
  14. Priem J, Hemminger BM。科学计量学2.0:研究学术对社会网络影响的新指标。2010年第一个星期一;15(7):7-5 [免费全文
  15. 李霞,李文杰。基于网络参考文献管理的学术影响力评估。2011年发表于:ISSI 2011年会议;2011年7月4日至7日;德班。
  16. 普里姆,杜波列利,葛洛斯,倪兰。alt-metrics:声明URL:http://altmetrics.org/manifesto/[访问2011-12-11][WebCite缓存
  17. 信息流行病学和信息监测跟踪在线卫生信息和网络行为,为公共卫生服务。Am J Prev Med 2011 5月;40(5增刊2):S154-S158。[CrossRef] [Medline
  18. 信息流行病学和信息监测:一套新兴的公共卫生信息学方法的框架,用于分析互联网上的搜索、传播和发布行为。中国医学杂志,2009;11(1):e11 [免费全文] [CrossRef] [Medline
  19. 哈伯德DW。脉搏:利用互联网热点追踪威胁和机遇的新科学。新泽西州霍博肯:威利;2011.
  20. 信息流行病学:在网上跟踪流感相关搜索以进行症状监测。美国医学会年鉴2006:244-248。[Medline
  21. Ginsberg J, Mohebbi MH, Patel RS, Brammer L, Smolinski MS, Brilliant L.利用搜索引擎查询数据检测流感流行。自然杂志2009年2月19日;457(7232):1012-1014。[CrossRef] [Medline
  22. Chew C, Eysenbach G.推特时代的流行病:2009年H1N1爆发期间推特的内容分析。PLoS One 2010;5(11):e14118 [免费全文] [CrossRef] [Medline
  23. Asur S, Huberman BA。用社交媒体预测未来。:惠普实验室网址:http://www.hpl.hp.com/research/scl/papers/socialmedia/socialmedia.pdf[访问2011-12-04][WebCite缓存
  24. Priem J, Costello KL.学者如何以及为什么在推特上引用。美国信息科学与技术学会学报2010;47:1-4。[CrossRef
  25. 李蒂尔斯,帕桑特A,德克尔S,布雷斯林JG。了解Twitter是如何被用来传播科学信息的。2010年发表于:网络科学会议论文集(WebSci10):在线扩展社会前沿;2010;罗利,北卡罗来纳州,美国http://journal.webscience.org/314/2/websci10_submission_79.pdf
  26. Weller K, Dröge E, Puschmann C.推特中的引用分析:在科学会议期间定义和测量推特内信息流的方法。2011.第一次微信释义工作坊网址:http://ceur-ws.org/Vol-718/paper_04.pdf[访问2011-12-12][WebCite缓存
  27. 罗斯C,特拉斯M,沃里克C,威尔士A. UCL,自我存档的草案版本。2011.启用反向通道:数字人文主义者使用会议推特网址:http://www.ucl.ac.uk/infostudies/claire-ross/Digitally_Enabled_Backchannel.pdf[访问2011-12-12][WebCite缓存
  28. 韦勒K,普希曼C.科学传播的Twitter:如何识别和衡量引用/参考文献?在:海报会议的会议记录。2011年发表于:网络科学会议;2011;德国Koblenzhttp://journal.webscience.org/500/1/153_paper.pdf
  29. Priem J, Costello K, Dzuba T. Twitter在学者中的流行和使用。2011年发表于:计量学:信息计量学与科学计量学研究研讨会;2011;美国,洛杉矶,新奥尔良网址:http://jasonpriem.org/self-archived/5uni-poster.png
  30. Priem J, Piwowar H, Hemminger B.野外的Altmetrics:基于社交媒体的影响指标的探索性研究。2011年发表于:计量学:信息计量学和科学计量学研究研讨会;2011;美国,洛杉矶,新奥尔良。
  31. 牛曼MEJ。幂律,帕累托分布和齐夫定律。当代物理2005;46:323-351。[CrossRef
  32. Kousha K, Thelwall M.谷歌科学引文索引之外的学者引文来源:四个科学学科的比较。科学计量学2007;74(2):273 - 294。[CrossRef
  33. Ripberger JT。社会科学研究网络。2010。公众关注及基于搜索的资讯监察网址:http://papers.ssrn.com/sol3/papers.cfm?abstract_id=1539137[访问2010-06-17][WebCite缓存
  34. Ripberger JT。捕捉好奇心:使用互联网搜索趋势来衡量公众的注意力。政策研究,2011;39(2):239-259。[CrossRef
  35. 开放获取的优势。中国医学网络学报,2006;21 (2):334 [免费全文] [CrossRef] [Medline


API:应用程序编程接口
ctw7/75:一组文章中所有文章在发布后7天内累计推文的第75百分位的集体双影响因子
DOI:数字对象标识符
fn:假阴性
外交政策:假阳性
JMIR:医学互联网研究杂志
公共科学图书馆:公共科学图书馆
THLn:推半衰期
tn:真正的负
tp:真阳性
太瓦n内累计推文数n文章发表天数,第0日为文章发表日期;Tw7也被称为twimpact factor


编辑:A费德勒;提交22.11.11;M Thelwall, J Priem同行评审;对作者11.12.11的评论;订正版本收到12.12.11;接受12.12.11;发表16.12.11

版权

©Gunther Eysenbach。最初发表于《医疗互联网研究杂志》(//www.mybigtv.com), 2011年12月16日。

这是一篇开放获取的文章,根据创作共用署名许可(http://creativecommons.org/licenses/by/2.0/)的条款发布,允许在任何媒介上无限制地使用、分发和复制,前提是正确引用最初发表在《医学互联网研究杂志》上的原创作品。必须包括完整的书目信息,//www.mybigtv.com/上的原始出版物的链接,以及此版权和许可信息。


Baidu
map