这是一篇开放获取的文章,根据创作共用署名许可(http://creativecommons.org/licenses/by/2.0/)的条款发布,允许在任何媒介上无限制地使用、分发和复制,前提是正确引用最初发表在《医学互联网研究杂志》上的原创作品。必须包括完整的书目信息,//www.mybigtv.com/上的原始出版物的链接,以及此版权和许可信息。
越来越多的人访问在线健康社区以寻求健康信息。在这些社区中,人们与其他人分享经验和信息,通常还附有不同网站的链接。了解人们如何分享网站可以帮助我们了解在线健康社区中患者的需求,并改善患者在线分享健康信息的方式。
我们的目标是了解(1)哪些类型的网站被共享,(2)共享网站的信息质量,(3)谁共享网站,(4)网站共享行为的社区差异,以及(5)患者共享网站的环境。我们的目标是在在线健康社区中找到网站共享实践的实际应用和影响。
我们使用正则表达式从10个WebMD在线健康社区中提取url。然后,我们根据url的顶级域名对其进行分类。我们统计了每个网站的信任代码(例如,认证机构的正式评估和PubMed作者的机构)的数量,以评估信息质量。我们使用描述性统计来确定网站共享活动。为了理解正在讨论的URL的上下文,我们对5个线程进行了简单的随机选择,这些线程至少包含来自每个社区的URL的一篇帖子。收集了这些帖子中的所有其他帖子,结果得到了387篇用于开放编码分析的帖子,目的是了解网站共享发生的动机和情况。
我们总共提取了25448个网站。共享网站最多的是。com网站(59.16%,15,056/25,448)和WebMD内部网站(23.2%,5905/25,448);分享最少的网站是社交媒体网站(0.15%,39/25,448)。高级别社区成员和版主比低级别社区成员发布更多带有信任代码的网站。与其他社区相比,心脏病社区的网站包含信任代码的比例最高。成员利用网站传播信息、支持性证据、社会支持资源和其他沟通方式。
在线卫生社区可作为患者和护理人员的重要卫生保健信息资源。我们的发现为患者的健康信息共享活动提供了信息。这些信息有助于卫生保健提供者、信息学家、在线卫生信息企业家和开发人员帮助患者和护理人员做出明智的选择。
增加对在线健康信息的获取可以使患者更好地管理健康。一项针对美国癌症患者的调查显示,92%的患者认为互联网使他们能够更好地做出健康决定,并帮助他们与医生沟通。
在线健康社区的成员,除了同伴患者的心理社会支持外,越来越多地共享健康信息资源,例如网站链接。古斯塔夫森等人[
这些研究指出了在在线健康社区中研究健康信息共享实践的重要性。然而,我们缺乏关于哪些类型的信息资源被共享的知识。在在线健康社区中,我们很容易获取的一种共享信息资源是以网页链接的形式共享的网站。我们不知道什么样的网站作为信息资源被共享,也不知道这些资源是如何被共享的。
分析在线健康社区共享的网站应该包括这些网站的质量和目的,谁发布这些网站,是否存在社区差异。调查在线健康社区中共享网站的这些问题,将为开发患者如何适当地浏览在线环境以定位相关的高质量健康信息提供启示。
我们的研究问题是:
网站类别:在线健康社区共享的网站类型是什么?
信息质量:在线健康社区中共享网站的信息质量如何?
海报信息:谁在这些网站上发帖?
社区差异:社区如何以不同的方式发布网站?
网站共享的环境:网站共享的环境是什么?
为了回答我们的研究问题,我们选择了WebMD在线健康社区来调查网站共享实践。我们选择WebMD是因为社区帖子是公开的,它是最活跃的在线健康社区之一。我们选择了10个WebMD在线健康社区,涉及成瘾、注意力缺陷/多动障碍(ADHD)、乳腺癌、糖尿病、减肥、健康儿童、心脏病、多发性硬化症(MS)、疼痛管理和性健康。我们选择这些社区的入选标准包括在总发帖活动方面排名前15的社区中,并且至少有一名健康专业版主和一名工作人员版主。
WebMD (
我们下载了10个WebMD社区的所有帖子,其中包括从2007年6月到2014年2月的288349篇帖子。我们收到了来自西北大学机构审查委员会(IRB)的一封信,该研究不受IRB的监管,因为我们的研究相当于对公共行为的观察。
为了提取WebMD在线健康社区中共享的网站,我们使用如下所示的正则表达式模式从每个帖子中提取url:
“https ?: / / (- w) * (d +) ?
([w /_-.=?&%+@^~!#$]*)?
(^ www) | www。(d +) ?
([w / _ -, = ?
&%+@^~!#$]*)?[^ www)。”
正则表达式是文本字符模式的正式表示形式,它表示出现在文本文档中的字符序列,具有集操作(例如,联合、交集、否定)、边界匹配、量词(例如,至少一次,精确)等功能
从数据采集到URL提取和分析的过程描述。
然后,我们开发了一种机制,根据其顶级域名(TLD)名称对从url中识别的网站进行分类[
为了评估每个网站共享信息的质量,我们使用了分配给该网站的信任代码总数。
由于提取的url数量庞大,我们开发了一种系统的方法来有效地检查信息质量。如果一个网站被至少一个WebMD社区提及3次或更多,我们就手工编码信任代码的分配。然后,我们从被识别为包含信任代码的网站的url中收集了一个常见关键字列表。例子包括“med”、“help”、“doc”、“Rx”和“MD”。为了评估一个社区中被提到少于3次的网站的有效性,我们只选择了那些url包含前面列出的关键字的网站。两名作者(CN和AKA)手工编写了被提到至少3次或url包含这些关键字的网站的信任代码。根据kappa为这1229个url分配信任代码的注释者之间的协议为.948 (95% CI .932-.964),这被认为是非常好的协议[
为了了解网站分享的海报特征,我们将社区成员分为3组:患者成员、工作人员版主和卫生专业版主。我们使用WebMD网站上的工作人员版主和卫生专业版主的用户名列表来确定这3个海报组。然后,我们根据患者的总发帖频率对所有患者进行排名。然后,我们将患者成员分组如下:(1)高发帖成员(列表的上四分位数的帖子),(2)中等发帖成员(列表的四分位数之间的帖子),(3)低发帖成员(列表的下四分位数的帖子)。我们还保留了帖子来自哪个社区的信息(例如,糖尿病vs心脏病)。
为了定性地了解社区成员何时以及如何共享URL,我们在10个社区的对话线程中进行了简单的随机选择,这些线程在线程发起的帖子或每个社区的回复中至少包含一个URL,结果总共有50个线程。这些帖子的回复数量在2到15之间,导致定性分析的帖子总数为386篇。我们使用开放编码分析来分析文章内容[
我们从所有10个社区的288349个帖子(3.02%)中的8714个独特帖子中提取了25448个url
随后,我们描述了共享网站的类别,共享网站的信息质量,以及关于帖子组和社区在网站共享行为中的差异的发现。我们以总体上频繁共享的网站和这些url共享的上下文结束。
我们使用顶级域名的分类标准分为6类(从高到低的外观顺序):.com网站,WebMD网站,.org网站,.gov网站,.edu网站和社交媒体网站。
信任代码点跨网站类别。x轴表示网站类别,y轴表示信任代码点网站的百分比。
在总共提取的25448个url中,有15056个(59.16%)属于。com网站。这类网站包括搜索引擎、药物或医学测试的信息门户网站、个人博客和商业网站(例如chemosavvy [
在25,448个网址中,共有5905个(23.20%)属于WebMD网站。因为我们的数据来自WebMD在线健康社区,这些社区成员经常分享他们从WebMD找到的资源。为了消除这种偏见,我们将WebMD网站的url单独划分为一个类别,而不是将其作为。com网站的一部分。确定的WebMD网站包括各种疾病的信息、药物信息、健康新闻或危机援助资源。
25448个url中有3369个(13.24%)属于。org网站。此类别中的url包括代表社区成员疾病焦点的非营利组织(例如CHADD [
在25,448个网址中,930个(3.65%)属于政府网站(例如,美国疾病控制与预防中心[CDC] [
25,448个url中有149个(0.59%)属于教育网站(例如,宾夕法尼亚大学佩雷尔曼医学院[
最后,25448个url中有39个(0.15%)属于社交媒体网站,包括社交网站如Facebook,媒体分享应用程序如YouTube [
我们在4875个url中发现了至少一个信任代码:32.38%(191 /5872)的。com网站共享的所有url, 99.38%(5836/5872)的WebMD网站共享的所有url, 25.20%(849/5872)的。org网站共享的url (
对于其余的网站类别,所有930个(100%)的。gov网站的url,所有149个(100%)的。edu网站的url,以及所有39个(100%)的社交媒体网站的url不包含任何信任代码。造成这一结果的一个潜在原因是,社交媒体网站上的信息可以在未经验证的情况下发布。
为了检验。edu网站在传播健康相关研究方面的专业知识和现有工作的质量,我们调查了PubMed中发表和索引的系统评论的数量。我们专注于系统综述,因为它们代表了综合证据的作者的机构,而不是专注于原始文献。我们的算法首先使用PubMed中的临床查询过滤器检索了所有266,296篇系统综述(截至2015年11月11日)的摘要[
我们还将.gov顶级域名从从系统评论关联语句中提取的顶级域名列表中分离出来,并对列表进行排序,如图所示
信任代码点跨网站类别。x轴表示网站类别,y轴表示信任代码点网站的百分比。
高级委员9671人,中级委员19362人,低级委员9671人。88名工作人员主持人和31名保健专业主持人。
我们发现,在高级别成员发布的所有url中,46.11%(4459/9671)至少存在一个信任代码,在中等级别成员中,6.67%(1911/19,362),在低级别成员中,10.11%(978/9671)。对于审核员,我们发现66%(58/88)的员工审核员发布的所有url和23%(7/31)的卫生专业审核员发布的所有url至少包含一个信任代码(
各个成员组之间的信任代码点。x轴表示成员组,y轴表示信任代码点网站的百分比。
每个WebMD社区的帖子总数、包含url的帖子、url和每个帖子的平均url。
社区 | 总帖子 | 包含url的帖子,n (%) | 总url | 每篇文章的url |
心 | 14033年 | 3107 (22.14) | 16146年 | 1.15 |
糖尿病 | 71168年 | 2079 (2.92) | 3586 | 0.05 |
减肥 | 58344年 | 956 (1.64) | 1474 | 0.03 |
乳腺癌 | 26653年 | 729 (2.74) | 1376 | 0.05 |
性健康 | 68113年 | 677 (0.99) | 849 | 0.01 |
女士 | 28267年 | 527 (1.86) | 848 | 0.03 |
注意力缺陷多动症 | 9637 | 363 (3.77) | 697 | 0.07 |
疼痛 | 8108 | 203 (2.50) | 373 | 0.05 |
上瘾 | 3806 | 61 (1.60) | 95 | 0.02 |
适合孩子们 | 220 | 12 (5.5) | 17 | 0.08 |
在信息质量方面,心脏病社区的url包含至少一个信任代码的比例最高(61.60%,9947/16146)。紧随其后的是健康儿童社区(41%,7/17),其次是减肥社区(31.47%,464/1474),疼痛社区(28.4%,106/373),成瘾社区(27%,26/95),性健康社区(20.8%,177/849),糖尿病社区(18.07%,648/3586),乳腺癌社区(11.7%,66/566),MS社区(10.5%,89/848)和多动症社区(7.2%,50/697)(
各种在线健康社区中的信任代码点。x轴表示在线健康社区,y轴表示信任代码点网站的百分比。
在我们用于内容分析的数据集中,一些线程有多个包含url的帖子。有64个帖子包含url(平均1.28个,每个帖子包含2.06个url)。成员以多种方式使用url:传播信息(41/ 64,64%),寻找替代通信方式(5/ 64,8%),扩大社会支持(6/ 64,9%),并将其用作支持证据的资源(12/ 64,18%)。在64个包含url的帖子中,有13个是WebMD版主发布的,他们这样做主要是为了传播信息(7/ 13,54%)和帮助成员扩大社会支持(4/ 13,31%)。WebMD版主也发布url作为支持证据的资源(2/ 13,15%)。64个包含帖子的url中只有3个(7%)是线程发起的帖子,这表明在我们的内容分析样本中,成员共享url是为了回应其他人的问题,而不是自愿传播信息。
“传播信息”是出现频率最高的主题。这个主题包括解决方案和问题的答案、新闻、新的研究结果、产品信息和新会员的教育材料。例如,WebMD疼痛管理社区的一名成员就一篇反对向FDA请愿修改阿片类药物标签的文章发起了一个帖子。请愿书呼吁限制非癌症患者使用阿片类药物,这将引起疼痛患者的关注。成员们就这类请愿的有效性展开了激烈的辩论。
另一个传播信息的例子是,成员提出表明他们早期病情的问题,其他成员分享新患者需要了解的资源。在WebMD乳腺癌社区,一名成员发帖说,她刚刚被告知要么做活组织检查,要么切除肿块。对于这篇文章,另一名成员回复了有关保险信息的url,以及网站(例如breastcancer.org)和电话号码,该成员可以在新诊断出患有乳腺癌时拨打电话寻求额外帮助。
成员们还发布了url,允许其他交流方式,比如一个单独的论坛或线程来分享经验。在WebMD健康儿童社区,一名成员发布了一个WebMD论坛链接,其他成员可以通过该链接分享他们的想法,例如,与孩子一起做饭,以帮助他们做出健康的饮食选择。一名成员在帖子中写道:“主题是和孩子一起做饭!你如何和你的孩子在厨房里玩得开心,并帮助他们学习健康的选择?在这里分享你最喜欢的想法和食谱![URL]”
对于那些寻求社会支持的发帖者,成员们回复了网址,通过这些网址,成员们可以寻求进一步的情感和信息支持。例如,在WebMD性健康社区,一名成员发布了她的担忧,她的fiancé对人类免疫缺陷病毒(HIV)呈阳性,尽管她爱他,但她担心他们未来的性健康。在这篇文章中,另一名成员提供了一个艾滋病毒社区的链接,说她可以在那个社区得到更好的支持。
最后,成员们使用url来支持、添加或澄清他们在帖子中陈述的论点。标准、指南和定义(例如,儿童的食物分量)都来自权威的政府网站。成员们在谈论某些治疗方法的疗效时,还使用PubMed上列出的研究文章作为证据。在回复者中,有时url被用来辩论相反的观点。例如,在WebMD上的多动症社区,成员们根据链接到url的研究结果讨论药物是有害的还是良性的。
总之,成员们以多种方式使用url来触发对话,丰富他们的讨论,支持论点,并为共享的各种类型的信息增加有效性。
在所有社区共享频率最高的50个网站中,86%(43/50)包含健康信息(例如www.hrspatients.org, www.healingwell.com);这些提供健康信息的网站中,有50%(21/43)是.gov网站或经信任代码认证的网站(例如,NIH [
十大分享最多的网站。
网站 | 出现,n |
WebMD ( |
1739 |
梅奥诊所[ |
544 |
HeartSite.com [ |
446 |
HealingWell.com [ |
290 |
myOptumHealth [ |
216 |
心律学会[ |
112 |
美国心脏协会[ |
104 |
健身( |
94 |
ehealthMD [ |
89 |
美国国家医学图书馆[ |
88 |
在本文中,我们介绍了在线健康社区用户的网站共享实践。通过客观指标,如发布频率、TLD和信任代码分配,我们了解了分享网站的种类、这些网站的信息质量、这些网站的海报以及社区差异。我们还展示了这些网站被共享的上下文。随后,我们讨论了我们的发现的含义和实际应用。
大多数被分享的网站是。com网站。社区成员很少分享流行社交媒体网站的链接。这些。com网站包含了各种各样的内容领域,从新闻、门户网站的访问到个人博客。大约三分之一的这些。com网站至少有一个信任代码分配,这意味着至少三分之一的这些。com网站属于经过验证的健康信息共享网站。考虑到大多数共享的网站是。com网站,更复杂的检测网站内容的方法将有助于我们了解社区成员试图共享的信息类型。例如,可以进一步分析TLD,以了解它是否包含与健康相关的关键字。主页上的内容可以被抓取并自动分析,生成在线健康社区中共享网站的主题分布。这些信息可以告知社区成员以及研究人员和从业人员,他们的目标是开发更好的系统,帮助患者获得高质量的信息。
WebMD网站被评为第二大共享网站。这一发现表明,社区成员越来越多地使用其母网站中的资源。这一发现表明了选择父网站环境建立在线健康社区的重要性。在线健康社区共享网站的信息质量会受到母网站质量的影响。
在这项研究中,我们专注于客观、有效的方法来理解网站共享实践。我们的技术范围包括使用(1)发布频率来了解各种网站共享实践的总体流行程度,(2)tld(极其有限的信息)来对网站进行分类,以及(3)分配信任代码来评估信息质量。该方法有助于对信息质量进行客观有效的评估。然而,我们在检测.gov、社交媒体和.edu网站类别的质量时遇到了一些困难。在WebMD网站和其他健康信息门户的情况下,他们的主要目标是向患者提供健康信息。这样的健康网站不可避免地需要添加信任代码,以确保访问者了解网站的质量。.gov和.edu网站一般没有认证,但如果与信誉良好的机构联系在一起,则可能值得信任[
为了进一步发展自动化信息质量检测,我们需要重新思考什么是高质量信息。
我们对共享网站的信息质量的测量并没有解决没有信任代码的网站可以为患者提供的潜在的意想不到的好处。例如南比山[
未来的研究应该针对每个网站类别和网站共享的环境来研究信息质量的方法。我们对网站分享环境的定性分析表明,信息质量只在人们分享网站的一半时间起作用——只有当他们想要传播信息并将网站作为支持证据时才会起作用。在对共享资源的信息质量做出统一决策之前,我们需要能够识别这些不同需求的系统。
在一些帖子中,成员们在分享了网站后交换了赞赏和问候。在这种情况下,网站本身就充当了会员之间社交网络的催化剂。成员们还分享了与社交媒体链接的网站,作为分享健康信息的平台。成员们发布了仅限化疗患者分享各种经验和信息的Facebook网页,由独立组织维护的社交媒体档案,以协助医疗保健决策,以及由研究小组维护的网站,以帮助其他人探索高级医疗保健主题。社交媒体网站可以在传播我们传统上认为的“有效信息”以及赋予权能的轶事方面发挥重要作用。
根据海报的活跃程度,网站的质量和数量可能有所不同。与中低频率发帖者相比,高频率发帖者和版主分享了更多分配信任代码的网站。这可能是因为发帖高的用户和版主比发帖低的用户分享更多的健康信息相关网站。另一种解释是,高级用户和版主承担了信息传播的角色,这迫使他们分享经过验证的健康信息网站。福克斯等人[
我们了解到,心脏社区共享的网站数量最多,使用信任代码的网站也最多。心脏病,由于其潜在的治疗紧迫性,可能会促使社区成员分享专注于已验证的健康信息的网站。另一方面,ADHD社区分享信任代码的网站比例最低。注意力缺陷多动障碍患者和护理人员经常在诊断和治疗方面与他们的提供者存在分歧[
我们的研究结果为许多利益相关者提供了信息,包括卫生保健从业人员、患者和护理人员、研究人员以及在线卫生信息系统企业家和开发人员。我们讨论了如何在在线健康社区的健康信息共享中解决环境质量问题。
医疗保健从业人员可以从我们经常共享的网站和描述结果中了解患者浏览的信息类型。基于我们的发现,医疗保健从业者可以将他们的患者引向或鼓励他们应该谨慎的网站或进一步调查。患者和护理人员可以使用我们的发现来指导他们未来使用在线健康社区,并思考在使用在线健康社区时应该做哪些准备。
研究人员应该进一步研究如何提高信息质量检测和理解情境质量,信息质量是一个合适的指导方针,取决于疾病背景和共享信息的动机。在线健康社区企业家和开发人员在帮助改善在线健康社区的信息共享实践时应考虑以下问题:
使用我们的技术对共享网站的类别和信息质量进行实时评估:这些信息可以用于版主提高帖子的质量。
开发方法进一步分类。com网站有意义的方式。
开发一个基于发帖特征、顶级域、信任代码和发帖上下文(例如,帖子发起者发帖与回复)的情境信息质量评估工具。
聚合和总结所有网站,供所有社区成员使用。
在分享网站的摘要列表时,反映网站来自的帖子的位置上下文。
这项研究的局限性之一是,由于WebMD的隐私设置,我们无法收集患者的人口统计信息。这样的患者档案可以进一步增加患者共享网站的情境需求。此外,许多成员只发布了网站的名称,而没有提到url。我们的算法忽略了不遵循我们设计的正则表达式模式的网站。由于我们在网站上对信任代码进行半自动搜索,有可能我们遗漏了一些包含信任代码的网站。更复杂的信息质量评估方法可以使用我们的发现。
在线健康社区已成为患者获取医疗信息资源和社会支持的核心场所之一。我们观察到,共享网站在在线健康社区成员之间建立网络方面发挥了至关重要的作用。我们分析了网站分享发生的不同背景,以及不同的网络资源是如何服务于会员的信息和情感需求的。我们总结了10个在线健康社区中最常见的Web资源。医疗保健从业人员、内容开发人员和信息学家可以利用我们的研究结果进一步了解患者如何在线分享网站。我们的发现可能有助于这些利益相关者设计系统,帮助患者和护理人员做出更明智的选择。
十个不同的在线健康社区共享的前50个网站的列表。
教育网站分类频率系统审查电子邮件地址。
政府网站分类频率系统审查电子邮件地址。
注意缺陷/多动障碍
国家代码顶级域名
疾病控制和预防中心
美国食品和药物管理局
人类免疫缺陷病毒
院校检讨委员会
多发性硬化症
美国国立卫生研究院
顶级域名
这项工作得到了国家医学图书馆拨款R00 LM011389和K01 LM011980的支持。
没有宣布。