这是一篇开放获取的文章,根据创作共用署名许可协议(https://creativecommons.org/licenses/by/4.0/)的条款发布,允许在任何媒介上不受限制地使用、分发和复制,前提是正确引用了首次发表在JMIR Cancer上的原创作品。必须包括完整的书目信息,http://cancer.www.mybigtv.com/上的原始出版物的链接,以及此版权和许可信息。
癌症患者及其亲属(即海报)在癌症在线社区中分享的内容已经通过各种方式进行了研究。在过去的十年中,研究人员除了使用人工编码方法外,还使用了自动分析方法。患者、提供者、研究人员和卫生保健专业人员可以向有经验的患者学习,前提是他们的经验是可以找到的。
本研究的目的是系统地回顾所有分析在线癌症社区中用户生成内容的相关文献。我们回顾了现有研究的质量,以及发帖者在互联网上相互分享的内容类型。
计算机化文献检索通过PubMed (MEDLINE)、PsycINFO(5星和4星)、Cochrane中央对照试验登记册和ScienceDirect进行。最后一次搜索是在2017年7月。包括以下术语的论文被选择:(癌症患者)和(支持团体或健康社区)以及(在线或互联网)。我们选择了27篇论文,然后将它们纳入由2名研究人员独立评分的14项质量检查表。
所选研究的方法学质量各不相同:16项研究质量较高,11项研究质量适当。在这27项研究中,15项为手动编码,7项为自动化编码,5项采用了多种方法的组合。在结合两种分析方法的论文中可以看到最好的结果。分析的职位数目从200万至150万不等;被分析的海报数量从75到9万不等。分析大量帖子的研究主要与乳腺癌有关,而分析少量帖子的研究则与其他类型的癌症有关。共有12项研究涉及部分或完全自动分析用户生成的内容。所有作者都提到了两个主要的内容类别:信息支持和情感支持。总共有15项研究只报道了内容,6项研究明确报道了内容和社会方面,6项研究关注了情绪变化。
在未来,越来越多的用户生成的内容将会出现在互联网上。内容分析的结果,特别是大型研究的结果,可以详细了解患者的担忧和担忧,然后可以用于改善癌症治疗。为了使这些分析的结果尽可能可用,自动内容分析方法将需要通过跨学科合作来改进。
近年来,概念
如今,针对癌症和其他疾病的在线健康社区越来越多,每个社区都有自己的特定目标。作为一种潜在的威胁生命的疾病,新患者和幸存者人数不断增加[
对参与在线社区(对个人的影响)的研究大致可以分为两种主要变体:首先,研究人员可以要求社区参与者完成一份或多份问卷,从而衡量参与对个人的影响;其次,研究人员可以分析由个人产生的内容——这个过程被称为“内容分析”。
近年来,癌症患者及其亲属参与在线癌症社区(即海报)已成为科学调查的主题。我们最近回顾了参与在线社区对患者报告结果的影响(问卷)[
在这篇系统综述中,我们关注在线癌症社区(群体空间)的内容分析,而不是博客(个人空间)。内容分析的定义是“一种系统的、可复制的技术,用于根据明确的编码规则将许多文本单词压缩到更少的内容类别中”,摘自Stemler的论文[
内容分析的价值在于,它使人们(例如研究人员和患者)能够在文本中找到相关主题,并随着时间的推移将这些文本与其他文本进行比较。内容可采用定性、定量或混合方法进行分析[
在本系统综述中,我们提出以下问题:
分析癌症患者及其亲属发布的用户生成内容的现有研究的质量如何?
如果研究的质量足够,那么在互联网上发布者之间会分享什么样的内容?例如,癌症、治疗、个人或情感信息的内容。
在这项系统综述中,我们纳入了同行评议的出版物,描述了在线癌症社区海报参与的内容分析。在某些情况下,在线社区是更广泛的在线电子健康服务的一部分,因此参与者还可以参加其他基于web的活动,例如回答问卷或参加有指导的在线支持小组。这种更广泛的在线电子健康服务的一个例子是CHESS应用程序(健康增强系统研究中心),具有信息、社会支持和解决问题的工具[
我们搜索了PubMed (MEDLINE)、PsycINFO、Cochrane中央对照试验登记册和ScienceDirect(最后一次搜索是在2017年7月),搜索条件如下:(癌症患者)和(支持团体或健康社区)以及(在线或互联网),没有任何日期参数。PubMed自动添加了医学主题标题术语(用于索引和编目生物医学信息的分层组织术语)和搜索术语的同义词,以便更好地选择PubMed文献。随后,在2017年7月,我们试图用以下额外的术语来扩展我们的结果:“在线论坛”或“留言板”或“公告板”。我们手动检查了前100个最相关的结果,这些结果没有产生任何新的论文。
为了专注于我们的审查主题,我们决定根据以下所有标准纳入研究:(1)出版物是原创的同行评议论文(例如,没有系统评论、书籍章节、论文、海报摘要、社论或给编辑的信);(2)它是用英语写的;(3)对癌症社区用户生成内容进行内容分析。符合以下标准之一的研究被排除:(1)涉及癌症患者和幸存者以外的患者群体;(2)他们学习了结构化的在线健康干预或由专业人员主持的社区;(3)他们开发案例研究、概念或内容分析模型,或(4)他们研究基于网络参与的患者报告结果。
这些纳入和排除标准应用于我们最初的1619篇论文。在删除重复和不符合纳入标准的记录后,保留了121条记录。获得了这些研究的纸质副本,并由两名研究者(ME和FM)彼此独立地审查。两位研究者都根据我们预先确定的纳入和排除标准详细检查了论文。每个人都做出自己的决定,如果他们不同意,他们就互相讨论,以达成最终决定。两位审稿人还使用引文跟踪来识别其他可能符合纳入条件的论文。这并没有产生任何新的记录。两位研究者在最终的论文选择上达成了一致意见:有27篇论文符合纳入本综述的条件。
研究人员(ME和FM)使用14项标准化检查表评估了每项选定研究的方法学质量,该检查表基于已建立的系统评价标准
最高分数是9分。然后将论文按任意定义的质量类别进行分类。达到最高分数(≥7.0分)75%或以上的论文被认为是“高质量”。得分在55% - 75%(5.0-6.5分)之间的研究被评为“质量合格”。得分等于或低于可达到的最高分数的55%(≤4.5分)的研究被认为是“低质量”。
文献检索流程图。
评估研究方法学质量的标准清单。
项目编号 | 项 | Quality-points |
1 | 数据收集年份 | 0.5 |
2 | 注明网站网址或平台名称 | 0.5 |
3. | 表示职位数量 | 0.5 |
4 | 注明海报数量 | 0.5 |
5 | 包括对社区人口(健康/人口)的至少三个变量的描述 | 0.5 |
6 | 至少包括两个团体变量的描述 | 0.5 |
7 | 描述了纳入和/或排除标准 | 1 |
8 | 有病人的参与率,并有50多张海报 | 0.5 |
9 | 研究规模为2年内至少1500篇文章(任意选择) | 0.5 |
10 | 比较2组以上的结果 | 1 |
11 | 描述了数据收集过程 | 1 |
12 | 描述了数据分析过程 | 1 |
13 | 数据被描述了 | 0.5 |
14 | 报告了主要发现的统计证明 | 0.5 |
|
总计 | 9 |
根据我们的纳入标准,本综述共纳入27项研究[
在27项研究中,16项(59%)被认为是高质量的[
这些研究发表于1998年至2016年,其中大部分(15)是在2011年或之后(
在17项研究中[
大多数研究描述的职位数量从大约200个[
以往研究[
公认的分析方法是对内容(即书面文本或口头文字)进行系统的人工编码,并在此编码的基础上检索相关主题,以便能够进行报告[
均分分析法。
分析方法 | 平均质量分数 |
所有文件 | 6.8 |
手动编码:[ |
6.6 |
自动编码:[ |
6.9 |
组合:( |
7.4 |
在15项研究中,研究人员仅手动编码内容[
在列出了纳入研究的特征和质量之后,我们现在将进一步调查这些研究的结果。
大多数作者使用他们自己的编码系统来分析内容(
总之,发帖者分享了各种各样的主题信息。除了信息支持外,他们通常还提供并获得情感支持。海报分享了有关各个方面的信息、意见和经验,包括他们的疾病、治疗、副作用和其他后果、临床医生的质量、替代治疗、他们的情绪和他们的关系。
一些研究人员将内容分析结果与患者特征相结合。大部分基于海报特征预测内容差异的研究质量较高。总体而言,男性患者更倾向于信息支持,女性患者更倾向于情感支持[
一些高质量的论文也采用了语言学的方法。邵氏等[
在一项研究中,用户生成内容的质量(帖子中的正确/不正确的陈述)是一个重要问题。Esquivel等人的研究[
自动化内容分析的一个实际限制可能是工具的“智能”。计算字母和单词数量相对简单,但为了生成与上下文相关的反馈,该工具必须结合帖子的特征,并将它们与编码标签联系起来。这需要使用机器学习方法,这些方法必须由计算机科学家与不同研究领域的内容专家密切合作设计和编写。波蒂埃等[
患者及其亲属越来越多地在在线癌症社区分享经验,使其成为不仅对患者,而且对医疗保健提供者、研究人员和医疗保健专业人员非常有价值的资源。本文系统地列出了患者在线分享的信息类型,以及研究人员分析这些用户生成内容所使用的方法。我们回顾了27项研究,其中15项研究是手动编码的,7项是自动化的,5项使用了方法的组合。在使用两种分析方法的论文中可以看到最好的结果。所有作者都提到了两个主要的内容类别:信息支持和情感支持。
这篇综述表明,完全自动分析用户生成的癌症海报内容仍然相对罕见。在27位作者中[
很难比较各种分析方法,因此也很难比较它们的结果。研究人员陈述了计算机工具的名称(见
对我们来说,如果不了解内容,自动分析内容准确性几乎是不可行的。为了确定准确程度,对主题领域的详细了解和对帖子的正确解释是必不可少的,因此,需要专家参与这个过程。对于自动化分析系统来说,正确解读内容仍然是非常困难的。
当专业人员知道用户生成内容的准确性是可行的时,他们可以将患者推荐给在线社区。这些信息不是基于证据的,但它可以帮助个体患者增强[
这次审查的结果揭示了有趣的机会,不仅是相关应用,可以使患者和医疗保健专业人员受益[
自动化分析还能够将互联网上已验证的医疗信息与讨论组和博客或Twitter和Facebook上的用户生成的相同主题内容进行比较[
在线社区中用户生成内容的内容分析是一种新兴的学术研究形式。毕竟,直到大约20年前,癌症患者才开始在网上分享他们的疾病信息:例如,1995年,通过癌症在线资源协会或Acor网站的邮件列表(仅针对癌症)[
本综述的局限性在于,我们使用相同的质量标准检查表对定性和定量研究进行了比较。特别是q标准14(主要发现报告的统计证明)可以说更适用于定量研究而不是定性研究(尽管15篇定性研究方法论文中有6篇实际上满足这一标准)。
我们没有包括其他用户生成内容类型的论文。学术文献中很少有对其他类型的用户生成内容进行分析的出版物,例如博客作者以及Facebook和Twitter的癌症海报。他们也分享可能与其他患者和护理人员相关的经验。他们中的一些人有很多追随者,因此,也有比较大的影响。此外,像博客、Facebook和Twitter这样的资源可以通过自动化很容易地合并。
综上所述,本文所收录的论文均为中等质量(11篇)或高质量(16篇)。人工和自动内容分析相结合的论文具有最高的质量。随着癌症患者人数的增加[
这项综述的结果揭示了有趣的机会,不仅可以为相关应用造福患者和医疗保健专业人员,而且也为学术研究人员。
同行评议出版物的特征和质量评分。
健康促进系统研究中心
语言探究与字数统计
没有宣布。