这是一篇开放获取的文章,根据创作共用署名许可(https://creativecommons.org/licenses/by/4.0/)的条款发布,允许在任何媒介上无限制地使用、分发和复制,前提是正确引用最初发表在《医学互联网研究杂志》上的原创作品。必须包括完整的书目信息,//www.mybigtv.com/上的原始出版物的链接,以及此版权和许可信息。
在互联网上咨询与健康相关的信息是一个普遍而广泛的现象,而维基百科可以说是与健康相关的信息最重要的资源之一。因此,确定影响维基百科健康相关文章质量的因素是相关的。
在我们的研究中,我们假设了贡献者体验对与健康相关的维基百科文章质量的积极影响。
我们挖掘了维基百科英文版健康与健身门户网站类别中列出的所有(截至2017年2月)18805篇文章的编辑历史。我们在文章的编辑历史中确定了标签,这些标签表明了有关文章质量或中立性的潜在问题。在所有抽样的文章中,99篇(99/ 18805,0.53%)的文章在某个时刻至少收到了一个这样的标签。在我们的分析中,我们只考虑了那些编辑最少10次的文章(总共10,265篇;96篇,占0.94%)。此外,为了验证我们的假设,我们构建了贡献者配置文件,其中一个配置文件由贡献者编辑的所有文章和相应的编辑数量组成。我们没有区分回滚和具有新内容的编辑。
非参数Mann-Whitney u检验表明,非标记文章的编辑者先前编辑过的文章数量更高(标记平均排名2348.23,未标记平均排名5159.29;U = 9.25,
我们的研究结果表明,贡献者经验对与健康相关的维基百科文章的质量有影响。然而,只有以前编辑过的文章数量可以预测文章的质量,而仅仅是编辑的数量不能预测文章的质量。需要更多的研究来理清贡献者经验的不同方面。我们讨论了我们的研究结果对确保合作知识建设平台中健康相关信息质量的影响。
关于互联网上健康相关信息质量的讨论可以追溯到20世纪90年代末[
维基百科在很大程度上依赖于同行评审,以确保其协作构建的知识语料库的质量,维基百科的贡献者被期望并被邀请纠正其他贡献者的错误[
尽管维基百科不是由专家组织管理的,但维基百科中与健康相关的文章的质量并不一定比专家生成的互联网内容差[
在这项研究中,我们挖掘了维基百科门户网站类别中列出的18805篇文章的完整编辑历史(截至2017年2月)
对于每个在样本文章中至少编辑过一次的贡献者,我们构建了贡献者的个人资料,包括所有维基百科文章的编辑总数以及该贡献者到目前为止编辑过的文章总数。我们对编辑的质量不做任何区分;因此,我们以相同的方式处理具有新内容的回滚和编辑。所有统计分析均采用SPSS 22软件包。所有报告的显著性检验都是双面的,我们将显著性水平设置为
99篇带标签的文章被手动分配到分析中出现的四个不同的内容类别之一:
这99篇文章的平均总编辑数为940.60 (SD 1458.67),作者平均为186.27 (SD 251.97)人。与18,706篇无标记文章相比(平均编辑49.67,SD 194.56;平均编辑16.16,SD 38.26),标记文章的编辑数量显著高于(
剩余的10265篇文章平均编辑数为100.12次(SD 311.00),平均作者为29.79名(SD 57.97)编辑。根据他们的用户资料,这些文章的编辑在1033.42 (SD 648.71)篇维基百科文章中平均编辑了32,031.05 (SD 27,513.01)次。根据Kolmogorov-Smirnov检验,编辑总编辑数和编辑文章数均呈正偏,且非正态分布(
为了解释包含10个或更多编辑的标记文章和未标记文章之间的显著差异,关于平均编辑总数和编辑人数(见上文),我们进一步使用逻辑回归分析(逐步)检验我们的初步发现,以标记文章与未标记文章的状态(虚拟编码)为因变量,各自文章的总编辑数和总编辑数为控制变量,并以投稿者的编辑总数和编辑文章数(分别)作为独立预测因子。这种方法控制了一篇文章的编辑或编辑的数量可能产生的混淆线性效应。我们再次发现,贡献者编辑的文章总数显著地预测了文章的状态(Nagelkerke
维基百科中与健康相关的最大类别的文章在编辑历史中一度收到了一个用户应用标签,表明质量问题集中在政治和立法问题的主题上。其他文章涉及替代医学、一般医学主题以及具体事件和人物。
有标签文章的作者(平均而言)编辑的维基百科文章比没有标签文章的作者少。然而,我们并没有发现仅仅是贡献者以前编辑的数量有显著差异。假设作者的能力与维基百科文章收到质量问题标签的概率之间存在关系,这可能表明仅仅是活动的量并不能表明维基百科作者的能力,而是一定的经验广度。这一发现,如果得到证实,可能会对维基百科(和其他平台)的编辑系统以及协作式知识建设平台的质量管理产生影响。例如,由编辑撰写的文章,其以前编辑的文章范围相对较窄,可以自动识别并标记以便进行进一步的质量检查,作为确保和改进与健康相关文章质量的一种手段。然而,还需要更多的研究来理清维基百科贡献者活动的不同方面对维基百科文章质量的影响。
我们研究的一个主要限制因素是,相对较少的文章收到至少一个表明质量问题的标签。在未来的研究中,为了重复我们的发现,解决这个问题的一种方法是使用基于文章特征的质量指标,如长度、段落数量和图片数量[
与以往的研究一致[
被标记文章的概述。
这项工作得到了欧盟研究计划“地平线2020”(项目“AFEL -日常学习分析”;项目没有。687916)。
没有宣布。