JMIR J医疗互联网服务 医学互联网研究杂志 1438 - 8871 卡塔尔世界杯8强波胆分析 加拿大多伦多 v20i5e171 29748161 10.2196 / jmir.9683 短论文 短论文 贡献者经验对维基百科健康相关文章质量的影响 Eysenbach 冈瑟 劳伦特 迈克尔 齐默尔曼 玛丽亚 霍尔兹 彼得 我是心理医生菲尔 1
IWM莱布尼茨研究所für Wissensmedien(知识媒体研究中心) 知识建设实验室 Schleichstraße 6 图宾根,72076 德国 49 7071979303 49 7071979105 p.holtz@iwm-tuebingen.de
http://orcid.org/0000-0001-7539-6992
Fetahu Besnik 理学硕士,rer nat博士 2 http://orcid.org/0000-0002-3343-7992 Kimmerle 约阿希姆 Dipl Psych, rer nat博士 1 http://orcid.org/0000-0002-6345-9498
1 IWM莱布尼茨研究所für Wissensmedien(知识媒体研究中心) 知识建设实验室 图宾根 德国 2 L3S研究中心 汉诺威莱布尼茨大学 汉诺威 德国 通讯作者:Peter Holtz p.holtz@iwm-tuebingen.de 05 2018 10 05 2018 20. 5 e171 18 12 2017 18 1 2018 9 2 2018 14 3. 2018 ©Peter Holtz, Besnik Fetahu, Joachim Kimmerle。最初发表于《医疗互联网研究杂志》(//www.mybigtv.com), 2018年5月10日。 2018

这是一篇开放获取的文章,根据创作共用署名许可(https://creativecommons.org/licenses/by/4.0/)的条款发布,允许在任何媒介上无限制地使用、分发和复制,前提是正确引用最初发表在《医学互联网研究杂志》上的原创作品。必须包括完整的书目信息,//www.mybigtv.com/上的原始出版物的链接,以及此版权和许可信息。

背景

在互联网上咨询与健康相关的信息是一个普遍而广泛的现象,而维基百科可以说是与健康相关的信息最重要的资源之一。因此,确定影响维基百科健康相关文章质量的因素是相关的。

客观的

在我们的研究中,我们假设了贡献者体验对与健康相关的维基百科文章质量的积极影响。

方法

我们挖掘了维基百科英文版健康与健身门户网站类别中列出的所有(截至2017年2月)18805篇文章的编辑历史。我们在文章的编辑历史中确定了标签,这些标签表明了有关文章质量或中立性的潜在问题。在所有抽样的文章中,99篇(99/ 18805,0.53%)的文章在某个时刻至少收到了一个这样的标签。在我们的分析中,我们只考虑了那些编辑最少10次的文章(总共10,265篇;96篇,占0.94%)。此外,为了验证我们的假设,我们构建了贡献者配置文件,其中一个配置文件由贡献者编辑的所有文章和相应的编辑数量组成。我们没有区分回滚和具有新内容的编辑。

结果

非参数Mann-Whitney u检验表明,非标记文章的编辑者先前编辑过的文章数量更高(标记平均排名2348.23,未标记平均排名5159.29;U = 9.25, P<措施)。然而,我们没有发现贡献者的编辑总数有显著差异(平均排名标记4872.85,平均排名未标记5135.48;U = 0.87, P=点)。使用逻辑回归分析,以文章的编辑次数和编辑次数为协变量,只有编辑文章的数量对文章的标记状态和无标记状态(假编码;Nagelkerke R2 对于完整模型=.17; B(SE B) = -0.001 (0.00);瓦尔德 c2 [1] = 19.70; P<.001),而我们再次发现仅仅编辑次数没有显著影响(Nagelkerke R2 对于完整模型=.15; B(SE B) = 0.000 (0.01);瓦尔德 c2 [1] = 0.01; P=总收入)。

结论

我们的研究结果表明,贡献者经验对与健康相关的维基百科文章的质量有影响。然而,只有以前编辑过的文章数量可以预测文章的质量,而仅仅是编辑的数量不能预测文章的质量。需要更多的研究来理清贡献者经验的不同方面。我们讨论了我们的研究结果对确保合作知识建设平台中健康相关信息质量的影响。

维基百科 信息在网上 协同知识构建 贡献者的特点
简介 网上健康资讯

关于互联网上健康相关信息质量的讨论可以追溯到20世纪90年代末[ 1 2]并在最近继续[ 3.- 5].在互联网上查阅与健康相关的信息无疑已成为一种普遍而广泛的现象[ 6 7].在过去几年中,维基百科已成为网络上最重要的健康相关信息知识资源之一[ 4 8 9].在本文中,我们(1)描述了与健康相关的维基百科文章中社区应用标签所指示的潜在质量问题,(2)分析了贡献者体验对与健康相关的维基百科文章质量的重要性。

维基百科作为资源

维基百科在很大程度上依赖于同行评审,以确保其协作构建的知识语料库的质量,维基百科的贡献者被期望并被邀请纠正其他贡献者的错误[ 9].有争议和冲突的问题将由贡献者进行辩论,直到达成共识[ 10 11].引发此类讨论的一种方法是应用几个维基百科模板消息中的一个 标签)到一篇文章,这表明质量相关的问题,如文章有偏见,误导,或事实错误。在我们的研究中,我们将一篇文章的编辑历史中至少出现一个质量问题标签作为潜在质量问题的代表。

尽管维基百科不是由专家组织管理的,但维基百科中与健康相关的文章的质量并不一定比专家生成的互联网内容差[ 12].人们一再呼吁有经验的医疗专业人员更积极地参与提高与健康相关的维基百科文章的准确性[ 13 14].然而,有经验证据表明,尽管维基百科竭尽全力确保知识质量,但它的文章可能是有偏见的;例如,由于以男性为主的维基百科作者低估或贬低了女性的显著成就( 性别偏见) [ 15].另一种形式的偏见是,关于维基百科作者自己国家群体的信息呈现出比关于其他群体的信息更积极的方式( 派系的偏见) [ 16].与之前的研究一致[ 17 18],我们假设,这种扭曲的一定比例是由于缺乏经验的一方,各自的文章的贡献者。

方法

在这项研究中,我们挖掘了维基百科门户网站类别中列出的18805篇文章的完整编辑历史(截至2017年2月) 健康与健身 19]在维基百科的英文版本中。我们开发了自己的公开代码来挖掘数据[ 20.].我们首先在文章的编辑历史记录中确定了标记或模板消息的出现,这表明了质量问题。这些标签是 违反中立观点策略(样本42例), 矛盾的内容(13), 不平衡的内容(12), 混乱的内容(17), 不准确的内容(23)。文章各自讨论页中的标签没有被考虑在内。标签,例如 违反中立观点策略而且 不平衡的内容指违反维基百科的客观性标准,这可能是由社会偏见造成的,如群体偏见或性别偏见,而其他标签则与一般的质量问题有关。在所有抽样文章中,99篇(99/ 18805,0.53%)文章在某个时刻至少收到了上述标签中的一个。为了比较有标签的文章和没有标签的文章,我们只使用了由至少10次编辑组成的文章,尽管可以想象,一些精心制作的维基百科文章是由相对较少的相对实质性的编辑产生的。这一限制使文章总数减少到10,265,而标记文章的总出现次数从99次减少到96次(96/10,265,0.94%)。

对于每个在样本文章中至少编辑过一次的贡献者,我们构建了贡献者的个人资料,包括所有维基百科文章的编辑总数以及该贡献者到目前为止编辑过的文章总数。我们对编辑的质量不做任何区分;因此,我们以相同的方式处理具有新内容的回滚和编辑。所有统计分析均采用SPSS 22软件包。所有报告的显著性检验都是双面的,我们将显著性水平设置为 P= . 01。

结果 标签物品的内容

99篇带标签的文章被手动分配到分析中出现的四个不同的内容类别之一: 立法和政治(41篇文章;例子包括“伊朗堕胎”、“自由市场医疗”和“禁烟”), 医学有关的话题(21篇文章;例子包括“抗菌素耐药性”、“肥胖”和“齐多夫定”), 与替代医学相关的话题(19篇文章;例子包括“占星术和健康”、“捏脊术”和“悉达医学”), 还有地点、人物和事件(18篇文章;例如“2009年墨西哥流感大流行”、“贝特莱姆皇家医院”和“阿诺德·施瓦辛格”)。详情见 多媒体附件1

这99篇文章的平均总编辑数为940.60 (SD 1458.67),作者平均为186.27 (SD 251.97)人。与18,706篇无标记文章相比(平均编辑49.67,SD 194.56;平均编辑16.16,SD 38.26),标记文章的编辑数量显著高于( t98.02= 6.10; P<措施; d=1.08),并且它们的作者数量明显更高( t98.02= 6.72; P<措施; d= 1.17)。这些差异的部分原因可以解释为,大量没有标记的文章都是“存根”,只不过是一个文章标题。这样的存根(少于10次编辑)从所有进一步的分析中被省略。因此,标记(mean editits 969.75, SD 1472.23;平均编辑量191.96,SD 253.81)和非标记文章(平均编辑量88.13,SD 257.66;平均编辑27.30,SD 49.16),包括10个或以上的编辑,就平均总编辑次数而言( t95.06= 5.87, P<措施, d=1.07)和编辑( t95.07= 6.36, P<措施, d=1.09)可以在一定程度上降低,但差异仍然显著。

贡献者经验的影响

剩余的10265篇文章平均编辑数为100.12次(SD 311.00),平均作者为29.79名(SD 57.97)编辑。根据他们的用户资料,这些文章的编辑在1033.42 (SD 648.71)篇维基百科文章中平均编辑了32,031.05 (SD 27,513.01)次。根据Kolmogorov-Smirnov检验,编辑总编辑数和编辑文章数均呈正偏,且非正态分布( P值<措施)。因此,我们使用曼-惠特尼u检验来分析96篇文章的作者之间的差异,这些文章由至少10次编辑组成,并且收到了至少一个表明质量问题的标签,而那些没有标签的文章的作者则与编辑之前的编辑活动有关。我们发现在编辑文章总数方面存在显著差异(平均标记秩为2348.23,平均未标记秩为5159.29; U= 9.25, P<.001),而总编辑数的差异不具有统计学意义(平均标记rank为4872.85,平均未标记rank为5135.48; U= 0.87, P=点)。

为了解释包含10个或更多编辑的标记文章和未标记文章之间的显著差异,关于平均编辑总数和编辑人数(见上文),我们进一步使用逻辑回归分析(逐步)检验我们的初步发现,以标记文章与未标记文章的状态(虚拟编码)为因变量,各自文章的总编辑数和总编辑数为控制变量,并以投稿者的编辑总数和编辑文章数(分别)作为独立预测因子。这种方法控制了一篇文章的编辑或编辑的数量可能产生的混淆线性效应。我们再次发现,贡献者编辑的文章总数显著地预测了文章的状态(Nagelkerke R2对于完整模型=.17; B(SE B) = -0.001 (0.00);瓦尔德 c2 1) = 19.70; P<.001),而贡献者编辑的总数并没有产生显著的影响(Nagelkerke R2对于完整模型=.15; B(SE B) = 0.000 (0.01);瓦尔德 c2 1) = 0.01; P=总收入)。

讨论 主要结果

维基百科中与健康相关的最大类别的文章在编辑历史中一度收到了一个用户应用标签,表明质量问题集中在政治和立法问题的主题上。其他文章涉及替代医学、一般医学主题以及具体事件和人物。

有标签文章的作者(平均而言)编辑的维基百科文章比没有标签文章的作者少。然而,我们并没有发现仅仅是贡献者以前编辑的数量有显著差异。假设作者的能力与维基百科文章收到质量问题标签的概率之间存在关系,这可能表明仅仅是活动的量并不能表明维基百科作者的能力,而是一定的经验广度。这一发现,如果得到证实,可能会对维基百科(和其他平台)的编辑系统以及协作式知识建设平台的质量管理产生影响。例如,由编辑撰写的文章,其以前编辑的文章范围相对较窄,可以自动识别并标记以便进行进一步的质量检查,作为确保和改进与健康相关文章质量的一种手段。然而,还需要更多的研究来理清维基百科贡献者活动的不同方面对维基百科文章质量的影响。

限制

我们研究的一个主要限制因素是,相对较少的文章收到至少一个表明质量问题的标签。在未来的研究中,为了重复我们的发现,解决这个问题的一种方法是使用基于文章特征的质量指标,如长度、段落数量和图片数量[ 21].还应该注意的是,有标签和无标签文章的作者(平均而言)在几百篇文章中进行了几千次编辑,因此是相对有经验的维基百科贡献者。需要进一步的研究来分析不同级别的编辑经验(或经验不足)对维基百科文章质量的影响。为本研究采样的文章仅构成维基百科上可用的医疗内容的一部分[ 22].未来的研究需要在更广泛的与健康相关的维基百科文章和英语以外的其他语言的文章中复制我们的发现。

结论

与以往的研究一致[ 4 13 21],我们的发现凸显了维基百科作为健康相关信息的宝贵资源的潜力。然而,维基百科文章的质量依赖于有经验和知识渊博的贡献者愿意承担编辑和改进维基百科文章的无偿劳动。鼓励有经验的专业人士进一步参与维基百科内容的一种方法是为此类活动提供奖励(例如,以继续医学教育学分的形式)[ 22].

多媒体附件1

被标记文章的概述。

这项工作得到了欧盟研究计划“地平线2020”(项目“AFEL -日常学习分析”;项目没有。687916)。

没有宣布。

Eysenbach G Diepgen T 互联网医疗信息的质量管理:信息的评估、标签和过滤 BMJ 1998 11 28 317 7171 1496 1502 10.1136 / bmj.317.7171.1496 西尔伯格 WM Lundberg GD Musacchio 类风湿性关节炎 评估、控制和保证互联网医疗信息的质量:警告的讲师和观众——让读者和观众当心 《美国医学会杂志》 1997 04 16 277 15 1244 5 9103351 Cajita 心肌梗死 罗德尼。 T J Hladek H 在线心力衰竭信息的质量与健康素养需求 心血管护理杂志 2017 32 2 156 164 10.1097 / JCN.0000000000000324 26938508 PMC5010526 Fahy E Hardikar R 狐狸 一个 麦凯 年代 互联网上患者健康信息的质量:回顾一个复杂和不断发展的景观 澳大利亚医学J 2014 7 1 24 8 10.4066 / AMJ.2014.1900 24567763 20141900 PMC3920473 Scholten 先生 Kelders SM GJE 自我引导的基于web的干预:对用户需求的范围审查和嵌入式会话代理解决这些需求的潜力 J医疗互联网服务 2017 11 16 19 11 e383 10.2196 / jmir.7351 29146567 v19i11e383 PMC5709656 首歌 H Omori K J Tenzek 莫雷 沪江 W Y 荣格 J 信任社交媒体作为健康信息的来源:比较美国、韩国和香港的在线调查 J医疗互联网服务 2016 03 14 18 3. e25 10.2196 / jmir.4193 26976273 v18i3e25 PMC4810010 狐狸 年代 达根 皮尤互联网和美国生活项目 2013 2018-04-16 华盛顿特区 健康在线2013 http://www.pewinternet.org/2013/01/15/health-online-2013/ 劳伦特 先生 维氏 TJ 在线寻找健康信息:维基百科重要吗? 美国医学信息协会 2009 16 4 471 9 10.1197 / jamia.M3059 19390105 M3059 PMC2705249 Jirschitzka J Kimmerle J Halatchliyski Hancke J Meurers D 水芹 U 观点的富有成效的冲突?文章和作者观点之间的相互作用,以及他们在一个有争议的领域对维基百科编辑的影响 《公共科学图书馆•综合》 2017 12 6 e0178985 10.1371 / journal.pone.0178985 28575077 玉米饼- d - 16 - 25823 PMC5456356 Oeberst 一个 Halatchliyski Kimmerle J 水芹 U 维基百科中的知识建构:系统建构主义分析 学习科学 2014 04 30. 23 2 149 176 10.1080 / 10508406.2014.888352 Greving H Oeberst 一个 Kimmerle J 水芹 U 维基百科关于人为和自然事件的负面文章中的情感内容 心理学郎科 2017 06 29 0261927 x1771756 10.1177 / 0261927 x17717568 Rajagopalan 女士 卡纳 V 莱特 Y 斯托特 肖沃特 T 做小生意 一个 劳伦斯 Y 互联网上以患者为导向的癌症信息:维基百科和专业维护的数据库的比较 J Oncol实践 2011 09 7 5 319 23 10.1200 / JOP.2010.000209 22211130 3714338 PMC3170066 Heilman JM Kemmann E Bonert Chatterjee 一个 Ragar B 胡子 通用汽车 Iberri DJ 哈维 托马斯。 B 跺脚 W Martone 曼氏金融 洛奇 DJ Vondracek 一个 德沃尔夫 摩根富林明 书籍 C 格罗弗 SC 维氏 TJ Mesko B 劳伦特 先生 维基百科:促进全球公共卫生的重要工具 J医疗互联网服务 2011 13 1 e14灯头 10.2196 / jmir.1589 21282098 v13i1e14 PMC3221335 Masukume G Kipersztok l 达斯 D Shafee 蓝玉 劳伦特 先生 Heilman JM 医学杂志和维基百科:全球健康问题 柳叶刀全球健康 2016 11 4 11 e791 10.1016 / s2214 - 109 x 30254 - 6 (16) 27765289 s2214 - 109 x 30254 - 6 (16) 瓦格纳 C 加西亚 D Jadidi Strohmaier 这是男人的维基百科?在在线百科全书中评估性别不平等 2015 04 21 第九届国际AAAI网络和社交媒体会议 2015年4月21日 牛津大学,英国 454 463 Oeberst 一个 水芹 U 回来 是个好 年代 水芹 U Moskaliuk J H 个人与合作信息处理:维基百科偏见的案例 大众合作与教育 2016 可汗,CH 施普林格国际出版 165 185 凯恩 GC 维基协作中信息质量的多方法研究 ACM Trans Manage Inf系统 2011 03 01 2 1 1 16 10.1145/1929916.1929920 见鬼 QV Ignat CL 衡量协作编辑文档的质量:以维基百科为例 2016 2016 IEEE第二届协作与互联网计算国际会议(CIC) 2016年11月 宾夕法尼亚州匹兹堡 10.1109 / cic.2016.044 维基百科 2018 2017-11-30 门户:健康和健身 https://en.wikipedia.org/wiki/Portal:Health_and_fitness Fetahu B Github库我们的维基百科文章解析功能 2018 2018-02-07 https://github.com/bfetahu/utils Blumenstock 规模很重要 2008 04 WWW 2008:第17届国际会议万维网会议 2008年4月 中国,北京 10.1145/1367497.1367673 Heilman JM 西 AG) 维基百科和医学:量化读者、编辑和自然语言的重要性 J医疗互联网服务 2015 17 3. 10.2196 / jmir.4069 25739399 v17i3e62 PMC4376174
Baidu
map