卡塔尔世界杯8强波胆分析|卡塔尔世界杯4强波胆分析

JMIR

J医疗互联网服务

医学互联网研究杂志

14388871

卡塔尔世界杯8强波胆分析JMIR出版公司

加拿大多伦多

v16i1e10

24425598

10.2196 / jmir.2875

原始论文

在线健康论坛的信息来源和行为模式:观察性研究

Eysenbach

冈瑟

Denecke

Kerstin

史密斯

凯瑟琳

Sudau

费边

MSc 1

计算机科学研究所根大学哥廷根

Goldschmidtstraße 7

哥廷根,37077

德国 49 551 39 172022 49 551 39 14415 fabian.sudau@cs.uni-goettingen.de

Friede

蒂姆

博士学位 2 格拉博夫斯基

延斯

博士学位 1 Koschack

叫亚

博士学位 3. Makedonski

菲利普

MSc 1 Himmel

沃尔夫冈

博士学位 3.

¹ 计算机科学研究所根大学哥廷根

哥廷根

德国 ² 医疗统计部大学医疗中心Göttingen

哥廷根

德国 ^3. 全科科室大学医疗中心Göttingen

哥廷根

德国

通讯作者:Fabian Sudau fabian.sudau@cs.uni-goettingen.de

01 2014

14 01 2014

16 1

e10汽油

12 08 2013 10 09 2013 24 10 2013 11 11 2013

©Fabian Sudau, Tim Friede, Jens Grabowski, Janka Koschack, Philip Makedonski, Wolfgang Himmel。最初发表于《医疗互联网研究杂志》(//www.mybigtv.com)， 2014年1月14日。

2014

这是一篇开放获取的文章，根据创作共用署名许可(http://creativecommons.org/licenses/by/2.0/)的条款发布，允许在任何媒介上无限制地使用、分发和复制，前提是正确引用最初发表在《医学互联网研究杂志》上的原创作品。必须包括完整的书目信息，//www.mybigtv.com/上的原始出版物的链接，以及此版权和许可信息。

背景

越来越多的患者在网上论坛上大声疾呼。这种转变是受欢迎的，因为这是一种患者自主的行为，反映在“专家患者”一词中。与此同时，人们相当担心患者很容易被伪科学研究和辩论误导。关于与健康相关的在线论坛所使用的信息来源、用户如何应用这些信息以及他们在此类论坛中的行为，人们知之甚少。

客观的

该研究的目的是确定(1)在线健康相关论坛中使用的信息来源，以及(2)活跃论坛访问者在介绍和传播这些信息时的角色和行为。

方法

这项观察性研究使用了德国最大的多发性硬化症(MS)在线论坛作为数据库，分析了用户对最近提出的有争议的慢性脑脊静脉功能不全(CCSVI)假说的争论。在提取所有帖子并过滤2008年1月1日至2012年8月17日期间的相关CCSVI帖子后，我们首先确定了文章中使用或引用的科学出版物和其他信息源的超链接。用人 k-均值聚类，然后我们分析了用户对信息来源的偏好和他们的一般发帖习惯。

结果

在11,997个帖子中的139,912个帖子中，有8628个帖子讨论或至少提到了CCSVI。我们在31个帖子中发现了指向ccsvi相关科学出版物的超链接。相比之下，论坛上有2829个不同的url，最常见的是指社交媒体，如YouTube或Facebook。我们总共确定了6种不同角色的超链接海报，包括社交媒体粉丝，组织追随者和平衡源用户。除了“普通用户”这一庞大且非特异性的残差类别外，还确定了几个特定的行为模式，例如CCSVI- focused Responders或CCSVI Activators的小而相关的群体。

结论

大部分观察到的贡献都不是基于科学结果，而是基于各种社交媒体来源。这些来源似乎主要包含观点和个人经历。一小群具有不同行为模式的人在推动关于CCSVI的讨论中发挥了核心作用。

网络利用率信息传播数据挖掘社交媒体社交网络多发性硬化症 CCSVI

简介

在过去的几十年里，我们目睹了一场向积极、自我管理和负责任的患者转变的强大运动，这就是所谓的“专家患者”[ 1， 2］．这一进程的一个关键因素是不受限制地获取和明智地使用与健康有关的信息，特别是在互联网上的网站和网上论坛以及在线社交媒体上广泛提供的信息[ 3.- 6］．这场运动对传统的信息传播方式产生了影响。今天，非专业人士、自立团体、患者倡导者和其他利益相关者可以发出他们的声音，甚至可以影响公共和科学辩论。这种转变是受欢迎的，因为这是患者自主和自由的行为，可以寻求标准治疗方案和家长式的医患关系的替代方案。与此同时，还有相当大的担忧是，患者很容易被伪科学研究误导，因为他们通常不具备评估科学信息可靠性的专业知识，而且由于他们的情况，他们往往会接受任何建议的解决方案，不管它看起来多么不可能和不现实。奈特尔顿等人[ 7]要求进行严格的实证分析，以审查人们使用在线卫生资源的情况。

这一领域的大多数研究都调查了人们使用互联网检索健康信息的频率[ 8]，以及他们如何在互联网上获取健康资讯[ 9]，在使用互联网资源处理健康问题时，哪些因素对非专业人士比较重要[ 10]，以及如何评估网上为非专业人士提供的健康资讯的质素[ 11］．还有一个研究领域似乎很有前景——社会网络分析[ 12］．健康相关在线社区作为一种社交网络形式，被认为可以发展自己的健康状况准专业知识[ 12]以及个性化的支持[ 13］．继在市场营销中的应用之后，研究还调查了成功新产品的扩散过程，目的是瞄准网络中“有影响力的”成员[ 14］．例如，在医学领域，最近的一项研究表明，父母的社会网络如何以不利的方式影响疫苗接种的决策[ 15］．类似的担忧源自Twitter上关于需要抗生素治疗流感的错误信息。 16］．

然而，什么样的信息传播机制是有效的，人们在网络论坛上依靠什么样的信息来源，他们如何形成他们的观点，他们如何行动，我们仍然知之甚少。更好地了解这些机制可能有助于评估它们对俗人的影响，并预测这些新形式的信息传播和交流的好处和危险。

此类研究的一个有前途的领域是最近提出的多发性硬化症(MS)慢性脑脊静脉功能不全(CCSVI)假说及其对患者群体的影响。简而言之，这个假说最初是由Paolo Zamboni [ 17]，他认为颈部和脊髓静脉引流阻塞[ 17]，称为慢性脑脊髓静脉功能不全，与多发性硬化有关[ 18， 19］．虽然MS与CCSVI的超声特征之间的关系是可变的[ 18]，一些机构甚至开始提供CCSVI的血管成形术和静脉内支架植入术，在商业上常被称为“解放手术”[ 20.］．CCSVI争论的激烈程度达到了这样的程度，以至于介入放射学会发布了一份关于CCSVI血管内管理的立场声明[ 21];加拿大MS协会资助了一项关于颅外静脉狭窄患病率的研究，该研究既没有发现CCSVI高患病率的证据，也没有发现CCSVI与MS的因果关系的证据[ 22］．一些研究报告了静脉支架和血管成形术后的并发症[ 23， 24］．CCSVI假说也在在线患者社区中引起了激烈的争论，例如德国多发性硬化协会的在线论坛(DMSG, Deutsche Multiple Sklerose Gesellschaft) [ 25]及英国MS协会网上论坛[ 26]，以及互联网上许多其他专门的网站和博客[ 27， 28］．它甚至被流行的视频分享网站YouTube收录。 29]，截至2013年7月，该网站发布了超过23,800个视频，其中一个视频的播放量超过20万。CCSVI的波动似乎已经平静下来，一些人认为这个假设——回顾CCSVI的炒作——是在浪费宝贵的时间、金钱和智力。 30.];其他人强调，争论刺激了研究的需要，这些研究应有助于更好地理解颅外静脉系统的功能和作用[ 31］．

在我们可以就这些众多的信息源和意见是否以及如何有助于一些参与者在辩论中获得启发或其他人的困惑做出声明之前，我们需要更多地了解在线健康论坛中使用的信息来源，以及用户和参与者如何使用这些信息，包括他们在这些论坛中的不同角色和贡献行为。为了检验这些问题，我们可以参考英国在线自残论坛上的一项研究[ 32］．使用“社交网络指标”，作者发现了不同类型的在线讨论参与者和角色:看护者(总是保持警惕，在一定程度上参与讨论，但不会在讨论中发起很多新的话题)，蝴蝶(频繁登录，快速浏览，然后再次退出)，讨论者(发起很多讨论话题)，还有这里为你(发起很少的讨论话题，但发表最多的评论)。

我们的观察性研究利用免费访问与多发性硬化症相关的大型德国在线论坛的优势，目的是确定(1)在线健康论坛中使用的信息来源，以及(2)积极参与论坛的人在介绍和传播这些信息时的角色和行为模式。

方法设计

在这项观察性研究中，我们使用Web爬虫的自定义实现从一个在线健康论坛提取内容，目的是从一个在线健康论坛收集一个大型讨论数据库。此外，我们使用信息检索算法(专门为这一特定任务设计和实现)来识别处理CCSVI的帖子的综合样本。

有关职位资料库及检索

该研究的数据库包括发表在德国多发性硬化症协会(DMSG，德国多发性硬化症协会)在线论坛上的文章[ 25］．在其网站上，DMSG将自己描述为MS患者及其家庭的非营利性利益相关者，由MS临床和科学专家于1952年成立。它是一个注册的慈善机构，有16个地区分支机构和900多个社区联系小组。除此之外，DMSG在其网站上提供了两种不同类型的免费论坛:一个是专家论坛，专家和用户之间就不同问题进行限时聊天(例如，MS的认知缺陷或MS的怀孕)。另一个论坛是非结构化的，没有管理，并且开放匿名注册。它的目标受众是外行，主要是多发性硬化症患者。论坛由一系列帖子组成。这些帖子可以包含超链接，并可以引用任何数量的以前的帖子。这篇文章的截图显示在图1．

在2008年1月1日至2012年8月17日期间，从11,997个线程中抽取了139,912个帖子。因为论坛一般是关于MS的，所以只有一小部分提取的帖子是关于CCSVI的。初步分析表明，“一个话题讨论一个话题”的假设在所观察的论坛中并不成立。相反，随着时间的推移，用户倾向于偏离最初的主题。因此，开发了一种自定义的信息检索算法，将单个帖子分类为相关(“至少部分讨论CCSVI”)或不相关。关于算法设计、训练和评估的详细信息，请参见多媒体附件1．该算法确定了8628个相关职位，这对进一步的分析步骤产生了重要的区别。

图1

一个论坛帖子的截图。

搜寻科学刊物

由于“专家患者”一词意味着对科学信息的智能使用，我们旨在评估论坛中对科学来源的使用程度。用户偶尔会在他们的帖子中加入超链接，这些链接指的是用户基于他们的观点的内容。我们分析了这些链接中哪些被定义为科学论文的引用，以获得被引用论文类型和时间引用模式的概述。这一鉴定过程需要两个步骤。

首先，我们生成了一份大概详尽的涉及CCSVI的出版物列表。从Zamboni的原始出版物开始，使用CiteXplore Web服务构建了一个引用网络[ 33］．CiteXplore是PubMed搜索引擎的一个接口，使用它是因为引文易于访问。这些出版物随后与通过Entrez接口在PubMed数据库中搜索“CCSVI”获得的第二个列表合并。 34］．合并算法删除了由它们的midd标识号标识的重复发布。我们最终的出版物列表不包括涉及CCSVI但不包括CCSVI首字母缩写的出版物，或者没有出现在引文网络中。我们假设这个数量的出版物比较少，并且比起手工方法，我们更喜欢我们的方法。

其次，一个程序从语料库中获取每个超链接(也包括那些“无关”帖子中的超链接)，从引用的网页或PDF文档中提取文本内容，并从出版物列表中搜索标题或出版物id。在命中的情况下，其中一名作者核实是否确实引用了其中一份出版物，如果是，则是哪一份。每个匹配也被分为直接参考或间接参考。在这方面，间接参考资料被视为仅讨论或解释某一出版物的资源，不包括基于该出版物的其他工作。链接到出版物本身的直接引用。

搜索使用的其他网络资源及其分类

除了在帖子中搜索科学信息来源外，我们还努力确定帖子中使用或引用的其他信息来源。为了获得广泛的参考网站的概述，我们定义了一个分类方案。首先，我们将压缩后的语料库中找到的每个URL缩减为URL的基本域部分(即，只使用“domainname.com”—如果URL在域名之后包含额外的内容，如目录、文件夹、网页、文件扩展名，则该内容将从URL中删除)。其次，我们将剩余的域分为8个类，如表1．这些类是根据各自域中提供的内容类型和作者身份定义的。然后生成一个图表，显示每个班级每月发布的url数量。

表1

主要域类。

组织	在更广泛的意义上，包括基金会、协会和工会。这些有时是专业的，经常推动某种议程。
商务	出售不包括治疗的产品或服务的私营企业。
新闻	商业新闻提供商。
其他	各种不适合其他类别的内容。
个人	一个人的静态内容。
科学	科学工作和知识的来源，包括维基百科。我们将后者包括在这个类别中，因为它的可靠性是在[中建立的 35］．我们相信，维基百科，与其他类别的来源相比，被大多数用户视为事实来源。
社会	围绕交流和用户生成内容的社交媒体网站。
卫生保健提供者	医生办公室，诊所，专业人士问答。不仅限于多发性硬化症。

用户行为

为了描述用户行为，我们尝试识别不同的行为模式。由于事先对论坛用户的行为模式一无所知，我们采用了探索性数据分析的方法来揭示可能的模式。聚类算法根据用户的相似度根据一组预定义的特征对用户进行分组。因此，我们想定义两个独立的特征集，目的是描述用户行为的两个不同方面，并通过聚类揭示这些特征中的模式。我们雇佣了最受欢迎的 k-means聚类算法(最初提出于[ 36])，根据用户在欧氏超空间中彼此的接近程度，将表示用户的数据向量分组在一起。该算法的选择是由于它的简单性和广泛的应用。因此，一个集群内的用户被认为表现出类似的行为模式，与其他集群中普遍存在的模式不同。我们根据手动检查描述性集群统计信息定义了用户集群名称。

通过单独的聚类，我们特别详细地分析了两个行为方面:(1)对所讨论信息来源的偏好，以及(2)一般的贡献行为或发帖习惯。在第一个集群中，我们主要关注8个域类中的每个类的超链接。用户由8维空间中的向量表示:例如，值3表示2^nd维度意味着用户已经发布了3个来自域类“组织”的超链接。第二个聚类集中在9个定量特征上，描述了用户发布的内容和方式。特征(度量)要么取自文献中讨论的类似方法[ 37或者根据以前没有使用过的元数据定义。具体来说，文献没有使用基于主题和主题之外的谈话之间的区别的度量，也没有使用可能有深刻见解的元数据，如超链接或引用。特性及其背后的原因描述在表2．所有这些都是在整个贡献期内定义的。

在这两种情况下， k-means聚类算法采用自定义形式实现。我们采用启发式初始化步骤来补偿初始质心放置不良的不利影响。当不再更改集群成员时，集群终止。所采用的算法请参见多媒体附件2．

在第一个聚类中，我们必须补偿用户的不同一般活动水平，因为我们只想根据用户的信息源偏好对用户进行分组。我们将每个向量除以它的欧几里得范数，以获得只显示“品味”(偏好)而不显示“活动”的单位向量。在第二次聚类中，不同特征具有不同的尺度。例如，用户经常显示几百天的活动，但根据定义，他们启动的线程的比例不能超过1。因此，我们执行了 z-score对第二次聚类前的数据进行归一化。这意味着我们修改每个用户向量的每个特征值，如下所示。首先，我们减去特征均值(对所有用户)，然后除以特征标准差。的 k-means算法要求簇数( k)已预先指定。初步实验用不同的值 k显示, k=6在这两种情况下都是一个很好的选择，通过人工检查内部集群评估指标和最终的集群大小来判断。

我们在雷达图中可视化了产生的星团[ 38]，也被称为蜘蛛图或kiviat图。雷达图的每个特征都有一个“辐条”;辐条的数据长度与数据点的变量大小成正比，相对于所有数据点上变量的最大大小，因此可以显示和比较具有任意数量变量的多变量观测结果。星形图形表示一个集群成员之间的标准化特征均值。虽然很难从视觉上比较不同辐条的长度，但可以很容易地捕捉到集群之间的显著差异和共同点，因此不同集群的特征很容易进行比较。我们根据对雷达图的人工评估和对的表格为这些簇命名多媒体．这些名称的定义是基于给定集群中哪些特征值“突出”。

表2

行为特征的定义。

测量	定义	基本原理
平均消息长度(从[ 39])	不计算引用的平均帖子内容长度。	消息长度是用户在帖子中投入精力的一个指标，它也告诉我们一些关于用户讨论风格的信息。一些用户更喜欢精心设计的、像文章一样的文章，而另一些用户则以更对话的方式使用论坛。
每日平均帖数(由[ 32])	用户每天发布的平均帖子数。	这是用户最重要的活动特征，它还提供了对用户选择性的洞察。在很长一段时间内每天发布大量帖子的用户可能会成为常客，他们会不顾外部事件而发布帖子。
每篇文章的平均引用数	一篇文章中包含的唯一引用的平均数量。	该特性描述了用户为论坛带来新的信息来源的趋势，也可能描述了用证据支持用户立场的能力。
平均每天线程数(从[ 32])	用户每天发布的平均不同线程数。	虽然这也是一个活动特性，但它提供了对用户感兴趣的焦点的洞察。低值可能表示倾向于只讨论特定主题，而高值可能表示倾向于加入任何类型的讨论。
活动天数(由[ 39])	第一个帖子和最后一个帖子之间的天数。	该特性表明了用户的贡献行为和发布习惯的一致性，是解释其他特性时重要的上下文信息。
被引用的文章比例	文章至少被引用一次的比例。	虽然只能假设用户在使用引用功能时试图表达什么，但该功能有望显示出引发其他论坛参与者直接回应的趋势。
相关职位比例	被信息检索算法分类为相关的帖子的百分比。	该特性是用户对CCSVI感兴趣的可靠指标^一个．虽然不能仅从这一特征推断用户是支持CCSVI还是反对CCSVI，但对CCSVI有高度兴趣的用户相信这一假设似乎是合理的。
初始化线程的百分比(从[ 37])	基于用户贡献的线程总数的用户发起的线程的百分比。	这个功能衡量用户开始讨论的倾向，这通常与向论坛介绍新信息有关。
每篇文章相关部分的用户覆盖率	用户讨论CCSVI的用户数除以用户发布的总帖子数。连续的相关帖子被认为是一个单一的讨论。在这些讨论中同时出现的用户被视为讨论伙伴。	这一特征可以被描述为CCSVI意见交换的效率。

^一个CCSVI:慢性脑脊髓静脉功能不全

结果搜寻科学刊物

我们在31个帖子中发现了指向ccsvi相关科学出版物的超链接。多媒体附件4给出论坛用户引用的13种不同出版物。每个出版物都显示在一个单独的区域中，其中红星表示出版日期，绿色菱形表示发布出版物链接的日期。浅绿色菱形表示间接引用。有趣的是，Zamboni的原始出版物[ 17在发表后不迟于两个月被带到论坛，并被反复引用，通常是间接引用。另外4篇支持CCSVI假说的论文[ 40- 432010年9月被引用。出版物的位置是人工确定的。仅从引用的科学出版物来看，忽略文章内容和其他参考文献，从2009年7月到2010年9月这段时间可以被描述为论坛CCSVI假说的“繁荣阶段”。然而，在2010年9月之后，批评性的出版物出现并被带到论坛。事实上，除一份参考刊物外，其余均在2010年9月以后出版[ 44- 50)强烈反对CCSVI。在这个时候，一系列重复引用Zamboni的原始出版物停止了。

搜索使用的其他网络资源及其分类

图2显示每个域类每个月有多少超链接被发布，按整体域类流行度排序。在任何给定的时间点上，社交媒体网站都是使用最广泛的Web资源类型。与被引用的科学出版物数量较少类似，基于科学的资源通常不经常使用。大约有一半来自域类“scientific”的超链接指向维基百科的文章。与组织相关的网站和新闻网站是第二和第三重要的网站。

每月发表的参考文献总数的巨大差异大致与相关文章总数相关。有趣的是，最高点(2010年9月- 2010年11月)出现在上述相位转移的时候。引起其他重大波动的外部事件尚不清楚。但是，当发布的引用总数从一个给定时间点上升到另一个时间点时，更改通常反映在所有域类中，这表明外部事件的某种响应同样影响不同类型的资源。这张图还显示了这个话题在非专业人士论坛上迅速流行起来的速度，从2012年发布的一些参考文献可以看出，用户似乎已经对这场辩论失去了兴趣。

图2

为每个域类发布超链接的时间轴。

用户行为

我们只在集群中包含了一小部分用户，因为我们希望关注那些参与CCSVI讨论的用户。此外，还需要关于每个用户的足够数量的信息。因此，在使用超链接的情况下(第一次聚类)，我们只对发布了至少5个相关超链接的用户进行聚类。在发布习惯(第二次聚类)的情况下，我们只包括至少发布了5个相关帖子的用户。中滤波过程如图所示图3的结果集所示图4．活跃到足以进行有意义分析的用户比例相当低，这是在线社区的典型情况。近三分之二的DMSG论坛用户只发帖一次。

第一次将用户聚类为6组显示的聚类如图所示图5．大约一半的用户(29/64)可以被描述为社交媒体粉丝。图6显示每个集群成员首选的信息源。例如，社交媒体粉丝更喜欢视频分享网站(如YouTube.com)、Facebook页面和博客，而不是更传统的来源。用户同样经常引用不同类别的资源，包括科学资源。组织关注者主要指组织发布的内容;我们还确定了一个使用不适合分类方案的资源的小组。主页推动者发布链接到网站，其中包含由单个人撰写的静态内容。这些传统网站在互联网早期就已经存在了。寻求医疗保健的人讨论医生和诊所。不常见资源的用户集中在宗教、秘教、补充或替代医学，或不相关的资源。

聚类用户，谁发表了至少5个相关帖子，显示6组显示图7．中的对应表中手动派生集群名称，而没有预先指定的算法多媒体从图8，表示归一化到[0;1]范围内的特征均值。大约三分之二的用户只能用“一般”来形容。这意味着它们并不突出，但是这些用户的特征为与其他用户角色进行比较提供了基准。28名用户是ccsvi重点响应者，他们平均活跃时间不到一年。定义它们的是每天帖子的低水平，启动线程的低比例，以及与ccsvi相关的帖子的高比例。10个用户是高度活跃的关系海报，他们表现出最高水平的发帖活动(每天大约4个帖子)。他们在很多不同的话题上发帖，但很少主动发起。另外17个用户是CCSVI激活者，他们因其较高的启动线程比例、与CCSVI相关的帖子比例以及他们包含的引用数量是平均用户的3倍而脱颖而出。众所周知，这4位资深贡献者的帖子长度是普通用户的3倍，引用量是普通用户的5倍。剩下的4个短暂的CCSVI垃圾邮件制造者只活跃了几天，在他们短暂的贡献期内，创建了许多关于CCSVI的帖子。 The posts were short and included few references.

图3

聚类抽样程序流程图。

图4

显示聚类中使用的用户集的维恩图。

图5

引用每个集群中用户数量的使用集群(n=64个包含案例)。

图6

雷达图显示每个聚类的聚合域类使用(属于聚类的用户向量被总结)。每个簇向量被归一化为一个单位向量。辐条的长度与它所代表的值成正比。

图7

发布行为，根据第二次聚类，每个聚类的用户数(n=171个包含案例)。

图8

雷达图显示贡献行为聚类的特征均值(聚类内的总体用户)。均值最小-最大归一化至[0;1]范围。辐条的长度与它所代表的值成正比。

讨论主要调查结果摘要

大部分观察到的贡献都不是基于科学结果，而是基于各种社交媒体来源。这些来源似乎主要包含观点和个人经历。一小群具有不同行为模式的人在推动关于CCSVI的讨论中发挥了核心作用，这是由他们的行为确定的。这群人的识别是我们探索性分析技术的意外结果。我们的识别方法是行为驱动的，因此为论坛中基于影响力的所谓“意见领袖”识别提供了一种可行的替代方案，如[ 51- 54］．

结果意义及与文献比较

科学出版物在CCSVI讨论的“繁荣阶段”被带到论坛，随后是批评观点的阶段，从2010年9月开始，CCSVI假设的反对者在论坛中占了上风。虽然科学和非专业人士的话语似乎是齐头并进的，但很明显，科学出版物和科学来源，如维基百科，最终在非专业人士论坛中只扮演了一个次要的角色。相反，社交媒体是最重要的信息来源。社交媒体内容的性质各不相同，但我们认为社交媒体通常是关于个人经历和意见交流的。我们确定的参考使用模式(如社交媒体粉丝或主页推广者)进一步说明了这一点。我们建议将这种外行话语的性质更多地描述为基本话语或话语间话语[ 55而不是专门的或科学的论述。

我们的6组发帖行为是基于对不同特征的仔细考察，与5个自残网络论坛的参与者相似[ 32］．以ccsvi为重点的响应者，其特点是每天的帖子水平较低，启动线程的比例较低，与ccsvi相关的帖子的比例较高，可能与Here For You用户相比[ 32)，他在自残论坛上非常支持。开始( 32]可能会与我们的CCSVI激活者相比，后者因其高比例的启动线程、高比例的CCSVI相关帖子以及他们的介绍和引用而脱颖而出。与Jones等人相比，高度活跃的关系发帖者，他们非常积极地发布帖子，但很少发起帖子。 32看护人。短命的CCSVI垃圾邮件制造者让我们想起Jones等人[ 32蝴蝶。这4个复杂的贡献者让我们想起了研究人员和在线专家患者群体的出现[ 12］．大部分贡献者只能被归为“一般”。

只有一小部分用户表现出足够的活跃度，适合对他们的行为进行有意义的描述。这与普遍观察到的社交媒体参与不平等现象是一致的。通常情况下，活跃程度以幂次定律为特征，约1%的用户对社区具有核心影响力[ 56］．例如，Chomutare等人研究了在线糖尿病论坛的社区结构[ 57]发现非常低的用户参与率，并表明少数积极参与的用户水平很高。大约37%(63/171)参与CCSVI讨论的用户在他们的发帖行为中表现出不同的模式:28个以CCSVI为重点的响应者似乎在等待CCSVI讨论的出现，然后进行贡献。这样做，他们在ccsvi相关信息传播的后期效率是所有角色中最高的。这似乎是一个有趣的新方面，通常执行网络分析在在线论坛。在这些分析中，这种疾病的知识和个人经验在获得中心地位和成为权威方面发挥了重要作用[ 57， 58］．显然，对科学信息来源的良好掌握可能也是一群有影响力的人物的特征之一。

高度活跃的人际关系海报被认为是重要的社区建设者，因为大量的个人“闲聊”都归功于他们。有趣的是，一组17人的CCSVI激活者在推动关于CCSVI的讨论中发挥了核心作用，因为他们经常发起关于CCSVI的讨论，并包含许多超链接。尽管人们相当担心，社交媒体和互联网应用程序允许少数人传播错误信息，并破坏有益的互动，正如最近讨论的反疫苗接种主义案例[ 59]，我们的研究结果表明，微软论坛中的CCSVI讨论遵循了科学辩论的起伏，并没有促进危险的实践或阻止新技术达到危险的程度。

我们发现了一些资深贡献者，但这些人并不经常参与CCSVI的讨论。此外，还发现了4个非常短命的、以ccsvi为重点的账户。一种可能的解释是，它们是一些用户临时使用的替代账户。

本研究的优势和局限性

这项研究的一个主要优势是它的观察性质。以一种不引人注目的方式观察真实世界的数据。我们分析了一个公共互联网论坛，这是一个非结构化和无节制的，超过3年的CCSVI讨论期。因此，我们避免了自我报告的偏见和人为设置。此外，我们应用了机器学习方法，以阐明用户交互的复杂本质。

然而，有几个限制。没有论坛用户的人口统计数据，甚至有可能有些人使用了不同的账户。此外，在2010年8月27日之前，用户可以为每一份个人贡献自由选择他们的别名。由于缺乏登录机制，有可能不同的人在同一个名字下发布。

相关内容的识别不是微不足道的，并没有100%的准确性，这导致数据库可能存在偏见。将url减少到基本域是一种简化。在评估用户模式时，我们必须处理小样本量(N=64和N=171)。聚类方法本身依赖于几个假设。我们假设恒定的行为模式存在，我们定义了适当的特征来描述它们，并且它们在特征空间中是线性可分的。对指定角色的解释是主观的，但仅基于本研究中记录的定量数据。

我们必须决定如何在帖子中确定科学的信息来源。为了安全起见，我们只接受发布带有科学出版物链接的url作为科学出版物的使用。当然，其他用户可能以一种相当精心的方式讨论科学出版物，而没有发布url。此外，出版物通常隐藏在付费墙后面，这可能会使发布url不受欢迎。它们也是用英语写的，这可能会造成语言障碍。我们的方法低估了在线健康论坛中对科学出版物的讨论，但在确定科学出版物的介绍方面非常具体。

我们对在线健康论坛参与者的描述完全基于“指标”，类似于Jones等人的研究[ 32］．要全面而可靠地描述与会者的观点，就需要对他们的贡献进行详尽的语义分析。

启示与未来研究

在帖子和论坛讨论中，科学来源远不如社交媒体重要。虽然一些未发现的证据可能表明，科学结果在一个在线健康论坛中成功地传播到非专业人士的讨论中，但科学结果在所研究的特定论坛中所讨论的信息源中所占的比例非常小。这是否预示着“专家病人”的崛起，仍有待进一步研究。论坛上的一些参与者，尤其是资深贡献者，根据他们的贡献行为和整体行为的性质，可以被认为是专家，他们的帖子相当广泛，通常包括科学和其他参考文献。然而，他们也只代表了一小部分，在我们得出可靠的结论之前，我们需要对他们的陈述进行语义分析。相比之下，大多数用户倾向于依赖基于社交媒体的信息来源，这些信息通常包含个人经历和观点。

卫生保健系统可以被描述为一个双边网络:一个由通过多个平台相互连接的大型组件组成的网络，这样临床医生、卫生保健机构和公司就可以与患者和社区互动[ 12］．我们在研究这个网络的一个组成部分以及它如何受到另一个网络的影响的同时，还应该进一步研究这个双面网络的组成部分之间的相反方向和相互影响。

我们的研究使用了一些复杂的方法来提取在线论坛中发帖行为的信息，以解决这一领域的重要问题。为了消除该研究的一些局限性，并更准确地确定论坛贡献者在科学信息方面的作用和行为，需要一种定性方法，最好是对在线健康论坛中的社会交流过程和辩论策略进行话语分析，类似于加拿大对赌博者在线社会支持论坛的研究，其中参与者的互动，他们的共同讨论，并分析了他们如何构建身份和协商合法性[ 60］．由于技术的发展，我们正处于一场变革之中，在这样一种环境中，个人和社区对自己的健康和治疗变得更有能力和更负责任，医疗保健服务和教育可以越来越多地受益于使用网络。 61］．

多媒体附件1

论坛信息检索。

多媒体附件2

K——集群。

多媒体

聚类结果数据表。

多媒体附件4

参考科学出版物。

缩写

CCSVI

慢性脑脊髓静脉功能不全

DMSG

德国多发性硬化症协会

女士

多发性硬化症

我们感谢Lara Weibezahl对论文最终稿的批判性意见和审查，以及Richard Nicholas博士对CCSVI的神经学观点。

大学医学中心伦理委员会Göttingen证实(参考文献11/5/13)，由于数据的性质(匿名数据的二次数据分析)，伦理批准是不必要的。

使用的一些方法和结果是在线可获得的硕士论文的一部分[ 62］．

没有宣布。

唐纳森

专家患者为NHS带来了一个新的机遇时代

BMJ 2003 06 14 326 7402 1279 1280

10.1136 / bmj.326.7402.1279

12805129

326/7402/1279

PMC1126164

格林哈尔希

慢性疾病患者和公众的参与:超出专家患者的范畴

BMJ 2009 338 629 631

19223339

Hoffman-Goetz

Donelle

汤姆森

医学博士

关于糖尿病的临床指南和退休人员在线健康论坛中同行信息的准确性

告知卫生社会保健 2009 03 34 2 91 99

10.1080 / 17538150902865136

19412842

910919475

《

纽豪斯

电子健康传播的新方向:机遇与挑战

病人教育计数 2010 03 78 3. 329 336

10.1016 / j.pec.2010.01.013

20202779

s0738 - 3991 (10) 00022 - 4

麦克马伦

米

患者使用互联网获取健康信息:这如何影响患者与健康专业人员的关系

病人教育计数 2006 10 63 1 - 2 24 28

10.1016 / j.pec.2005.10.006

16406474

s0738 - 3991 (05) 00315 - 0

万斯

豪

Dellavalle

社会互联网网站作为公共卫生信息的来源

北京医学中国 2009 04 27 2 133 136

10.1016 / j.det.2008.11.010

19254656

s0733 - 8635 (08) 00108 - 3

Nettleton

年代

洞穴

奥马利

日常使用互联网促进健康的世俗现实，以及它们对媒体融合的影响

社会健康疾病 2005 11 27 7 972 992

10.1111 / j.1467-9566.2005.00466.x

16313525

SHIL466

Kummervold

体育

Chronaki

Lausen

普罗科什

胡

拉斯穆森

桑塔纳

年代

Staniszewski

一个

Wangberg

2005-2007年欧洲电子保健趋势:基于人口的调查

J医疗互联网服务 2008 10 4 e42

10.2196 / jmir.1023

19017584

v10i4e42

PMC2629359

Sillence

布里格斯

哈里斯

公关

斐

患者如何评估和利用在线健康信息?

社会科学与医学 2007 05 64 9 1853 1862

10.1016 / j.socscimed.2007.01.012

17328998

s0277 - 9536 (07) 00016 - 0

Lemire

米

削减

Sicotte

哈维

互联网作为个人健康信息首选来源的决定因素

国际医学杂志 2008 11 77 11 723 734

10.1016 / j.ijmedinf.2008.03.002

18434246

s1386 - 5056 (08) 00039 - 7

威尔逊

如何发现好的，避免坏的或丑陋的:一个简短的指南，评估工具在互联网上的健康信息质量

BMJ 2002 03 9 324 7337 598 602

11884329

PMC1122517

格里菲思

洞穴

Boardman

任

Pawlikowska

球

克拉克

一个

科恩

一个

社交网络——医疗保健服务的未来

社会科学与医学 2012 12 75 12 2233 2241

10.1016 / j.socscimed.2012.08.023

22985490

s0277 - 9536 (12) 00630 - 2

维斯

简森-巴顿

伯纳

西文

约翰逊

Giuse

达

墨菲

英航

Lorenzi

纳米

在线社区、网络和团体中社会支持的设计、实施和评估建议

J生物医学信息 2013 12 46 6 970 976

10.1016 / j.jbi.2013.04.004

23583424

s1532 - 0464 (13) 00047 - 6

肯普

jonkleinberg

缓慢的E

通过社交网络最大限度地扩大影响力

2003

Proc 9th ACM SIGKDD Int Conf Knowl discoverv Data Min

24.08.2003

华盛顿特区

137

范甘迪

埃克

社会网络对父母接种疫苗决定的影响

儿科 2013 05 131 5 1397 1404

10.1542 / peds.2012 - 2452

23589813

peds.2012 - 2452

Scanfeld

拉森

埃尔

通过社交网络传播健康信息:推特和抗生素

感染控制 2010 04 38 3. 182 188

10.1016 / j.ajic.2009.11.004

20347636

s0196 - 6553 (10) 00034 - 9

PMC3601456

Zamboni

Galeotti

我想

Malagoni

我

Tacconi

达尔'Ara

年代

Bartolomei

我

Salvi

多发性硬化症患者的慢性脑脊髓静脉功能不全

神经外科精神病学 2009 04 80 4 392 399

10.1136 / jnnp.2008.157164

19060024

jnnp.2008.157164

PMC2647682

塔帕尔

一个

车道

尼古拉斯

Friede

埃利斯

米

Assenheim

富兰克林

戴维斯

啊

多发性硬化症超声慢性脑脊静脉功能不全的系统回顾

静脉学 2011 12 26 8 319 325

10.1258 / phleb.2011.011098

22021635

phleb.2011.011098

塔帕尔

一个

车道

交易

尼古拉斯

慢性脑脊液静脉功能不全:它是多发性硬化症的一个实体和子集

血管和血管内争议更新 2012

伦敦

格林哈尔希RM

696 705

20.

特纳

在“医疗旅游”之外:加拿大公司营销医疗旅游

全球健康 2012 8 16 11

10.1186 / 1744-8603-8-16

22703873

1744-8603-8-16

PMC3503750

Vedantham

年代

Benenati

摩根富林明

茶室

年代

黑色的

厘米

墨菲

Cardella

摩根富林明

介入放射学会加拿大介入放射学协会

多发性硬化患者慢性脑脊髓静脉功能不全的介入血管内治疗:由加拿大介入放射学会认可的介入放射学会的立场声明

血管间期放射性醇 2010 09 21 9 1335 1337

10.1016 / j.jvir.2010.07.004

20800776

s1051 - 0443 (10) 00705 - 0

Traboulsee

艾尔

诺克斯

狩猎台

赵

绮

我

拉舍尔

一个

Klass

Szkup

大谷

Kopriva

拉拉

年代

李

Sadovnick

多发性硬化症患者、其兄弟姐妹和不相关健康对照组导管静脉造影颅外静脉狭窄的患病率:一项盲法病例对照研究

《柳叶刀》 2013 10 8 e8

10.1016 / s0140 - 6736 (13) 61747 - x

24119384

s0140 - 6736 (13) 61747 - x

帝国理工学院CCSVI调查小组塔帕尔

一个

车道

Pandey

Shalhoub

马利克

埃利斯

米

富兰克林

尼古拉斯

戴维斯

啊

慢性脑脊髓静脉功能不全静脉成形术后颈内血栓形成

静脉学 2011 09 26 6 254 256

10.1258 / phleb.2011.011052

21803799

phleb.2011.011052

伯顿

Alikhani

Goyal

米

科斯特洛

白色

(

贝尔

山

医学博士

国外CCSVI手术后MS患者的并发症(卡尔加里，AB)

J Neurol Sci 2011 09 38 5 741 746

21856578

M2153726237UU554

德国多发性硬化症协会 2013-08-06 DMSG-Forum http://www.dmsg.de/multiple-sklerose-forum/index.php?kategorie=msforen

6 ifnceh1v

英国多发性硬化症协会论坛主页| 2013-08-06

http://www.mssociety.org.uk/forum

6 ifnlvi4i

加拿大CCSVI基金会 2013-08-06

http://www.ccsvifoundationcanada.org/

6 ifnrwcgu

CCSVI定位器-定位CCSVI社会网络站点 2013-08-06

http://ccsvi-ms.ning.com/

6 ifnxh8gx

CCVSI - YouTube 2013-08-06

http://www.youtube.com/results?search_query=ccsvi

6 ifof8kzq

30.

Ghezzi

一个

资助CCSVI研究是浪费宝贵的时间、金钱和智力:是的

乘sci 2013 06 19 7 855 857

10.1177 / 1352458513479825

23712524

19/7/855

Zivadinov

Weinstock-Guttman

资助CCSVI研究是浪费宝贵的时间、金钱和智力:不是的

乘sci 2013 06 19 7 858 860

10.1177 / 1352458513480252

23712525

19/7/858

琼斯

萨基

年代

史密森

福特

埃曼

Hewis

捆

欧文斯

使用指标来描述论坛内成员的参与立场

J医疗互联网服务 2011 13 1 e3

10.2196 / jmir.1591

21239373

v13i1e3

PMC3221352

CiteXplore 2013 05 31

2013-12-20

http://www.ebi.ac.uk/citexplore/webservice.jsp

6 m0vmbswa

塞耶斯

国家生物技术信息中心 2008

2013-12-20

Entrez编程实用程序有帮助 http://www.ncbi.nlm.nih.gov/books/NBK25501/

6 m0w3mlp4

不要

走向维基百科的认识论

J Am Soc Inf科学技术 2008 1662 1674

MacQueen

多变量观测数据分类分析的几种方法

1967

Proc第五伯克利Symp数学统计概率

1967

加州大学伯克利分校

281 297

陈

海斯

戴利

新兴市场

使用用户角色分解讨论论坛和公告板

2010

AAAI Conf Weblogs Soc Media

2010

华盛顿特区

215 218

钱伯斯

克利夫兰

图基

巴勒斯坦权力机构

数据分析的图形方法 1983

克斯伯里

克斯伯里出版社

158 162

刷

王

特纳

史密斯

妈

评估Usenet社会会计元数据的差异使用情况

2005

程序SIGCHI配置Hum因子计算系统

2005

俄勒冈州的波特兰

889 898

辛格

Zamboni

多发性硬化症的异常静脉血流和铁沉积

J脑血流meta 2009 12 29 12 1867 1878

10.1038 / jcbfm.2009.180

19724286

jcbfm2009180

Zamboni

Galeotti

我想

Malagoni

我

Gianesini

年代

Bartolomei

我

Mascoli

Salvi

慢性脑脊髓静脉功能不全血管内治疗的前瞻性开放标签研究

血管外科 2009 12 50 6 1348 1358

10.1016 / j.jvs.2009.07.096

19958985

s0741 - 5214 (09) 01568 - 7

al omari

Rousan

拉

多发性硬化患者颈内静脉形态和血流动力学的研究

Int Angiol 2010 04 29 2 115 120

20351667

R34102559

Malagoni

我

Galeotti

我想

Manfredini

Basaglia

Salvi

Zamboni

慢性疲劳是与多发性硬化相关的静脉功能不全的症状吗?纵向先导研究

Int Angiol 2010 04 29 2 176 182

20351673

R34102460

Doepp

保罗

Valdueza

主要

以下两

多发性硬化症患者无脑颈静脉充血

安神经 2010 08 68 2 173 183

10.1002 / ana.22085

20695010

Wattjes

国会议员

范Oosten

格拉夫

王

Seewann

一个

机器人

范登伯格

Uitdehaag

波尔曼

Barkhof

颅静脉异常引流与多发性硬化无相关性:磁共振静脉造影和血流定量研究

神经外科精神病学 2011 04 82 4 429 435

10.1136 / jnnp.2010.223479

20980483

jnnp.2010.223479

Yamout

Herlopian

一个

伊萨

哈比卜

Fawaz

一个

Salame

Wadih

一个

Awdeh

与穆

电鲶

Al-Kutoubi

一个

颅外静脉狭窄不太可能是多发性硬化的原因

乘sci 2010 11 16 11 1341 1348

10.1177 / 1352458510385268

21041329

16/11/1341

Bastianello

年代

吉普赛

一个

Viselner

Tibaldi

电子商务

Giugni

阿尔提耶里

米

Cecconi

Mendozzi

淀粉

米

马里安尼

Galassi

一个

Quattrini

曼奇尼

米

Bresciamorra

Lagace

一个

麦当劳

年代

波诺

Bergamaschi

多发性硬化患者的慢性脑脊静脉功能不全:来自多中心研究的临床相关性

BMC神经 2011 11 132 e7

10.1186 / 1471-2377-11-132

22029656

1471-2377-11-132

PMC3221625

Baracchini

Perini

花茎甘蓝

米

Causin

里纳尔蒂

加洛

多发性硬化发病时无慢性脑脊髓静脉功能不全的证据

安神经 2011 01 69 1 90 99

10.1002 / ana.22228

21280079

迈耶

Pfeilschifter

洛伦兹

兆瓦

Nedelmann

米

Bechmann

我

斯坦梅茨

Ziemann

完美的犯罪?CCSVI在多发性硬化症中没有留下痕迹

神经外科精神病学 2011 04 82 4 436 440

10.1136 / jnnp.2010.231613

21296899

jnnp.2010.231613

PMC3061048

Centonze

Floris

Stefanini

米

罗西

年代

粒入球

年代

卡斯泰利

米

Marziali

年代

卢卡雷利

一个

莫塔

Garaci

成品

贝尔纳迪

Simonetti

提出的慢性脑脊静脉功能不全标准不能预测多发性硬化症的风险或严重程度

安神经 2011 07 70 1 51 58

10.1002 / ana.22436

21786298

翟

徐

贾

识别BBS中的意见领袖

2008

Int Conf Web Intell Intell Agent Technol WI-IAT08 IEEEWICACM

2008

悉尼

398 401

张

越南盾

虚拟社区中意见领袖的识别方法

总线管理 2008 3. 7 21 27

肖

夏

了解布告栏系统中的意见领袖:结构和算法

2010

2010 IEEE第35届本地计算机网络会议

2010

丹佛

结构和算法。2010 IEEE第35次会议本地计算网络LCN 2010. -

1062 1067

章子怡

京

慢性疲劳综合症

Donghong

年代

永丰

网络社区意见领袖的识别方法研究

2013

第4 IEEE Int Conf软件工程服务科学ICSESS

2013

北京

934 937

Waldschmidt

一个

克莱因

一个

Tamayo科特

米

Dalman-Eken

年代

日常生活中的话语——话语的日常生活:社会科学中基于经验的话语研究方法论[德文]

社会质量论坛FQS 2007 8 2 e29

霍洛维茨

Elatable 2013-08-06 创造者、合成器和消费者 http://blog.elatable.com/2006/02/creators-synthesizers-and-consumers.html

6 ifoi4gna

Chomutare

Arsand

Fernandez-Luque

Lauritzen

Hartvigsen

推断医疗保健论坛的社区结构。实证研究

方法 2013 52 2 160 167

10.3414 / me12 - 02 - 0003

23392282

12-02-0003

迪亚斯

一个

Chomutare

Botsis

探索糖尿病论坛的社区结构

种马健康技术通知 2012 180 833 837

22874309

威尔逊

-凯兰

社交媒体和医疗技术反对者的赋权:反疫苗接种主义的案例

J医疗互联网服务 2013 15 5 e103

10.2196 / jmir.2409

23715762

v15i5e103

PMC3668617

Mudry

强大的

在线恢复

合格健康证书 2013 03 23 3. 313 325

10.1177 / 1049732312468296

23208202

1049732312468296

Denecke

布鲁克斯

医学和保健领域的网络科学

方法 2013 52 2 148 151

23508344

13020148

Sudau

计算机科学研究所应用计算机科学硕士论文，ZAI-MSC—04,ISSN 1612-6793 2013

2013-12-21

乔治-奥古斯特-大学Göttingen

在线论坛有争议的辩论分析-在DMSG外行人论坛CCSVI讨论的展示分析 http://www.swe.informatik.uni-goettingen.de/publications/analysis-controversial-debates-online-fora-showcase-analysis-ccsvi-discussion-dmsg

6 m2em93xk