发表在第24卷第9期(2022):9月

本文的预印本(早期版本)可在https://preprints.www.mybigtv.com/preprint/37757,首次出版
妇科癌症幸存者的社会心理需求:混合方法研究

妇科癌症幸存者的社会心理需求:混合方法研究

妇科癌症幸存者的社会心理需求:混合方法研究

原始论文

1美国伊利诺伊州芝加哥市西北大学范伯格医学院

2美国俄亥俄州哥伦布市俄亥俄州立大学韦克斯纳医学中心

3.布里格姆妇女医院,哈佛医学院,波士顿,马萨诸塞州,美国

4美国康涅狄格州纽黑文,耶鲁大学医学院,耶鲁癌症中心

通讯作者:

伊丽莎白J亚当斯,文学士

范伯格医学院

西北大学

苏必利尔大街420号

芝加哥,伊利诺伊州,60611

美国

电话:1 312 503 8649

电子邮件:elizabeth.adams@northwestern.edu


背景:互联网和社交媒体平台提供了对癌症幸存者及其护理人员的生活经历的深入了解;然而,可获得的叙述数据量往往难以进行彻底的分析。妇科癌症的幸存者有独特的需求,例如与未来癌症的遗传易感性、癌症对性健康的影响、许多人被诊断为晚期以及新治疗方法的涌入有关的需求。

摘要目的:本研究旨在提出一种独特的方法,利用基于互联网平台的大量数据进行混合方法分析。我们分析了美国癌症协会网站上妇科癌症幸存者发表的讨论板帖子,特别关注评估幸存者的心理社会方面。

方法:所有来自美国癌症协会癌症幸存者网络的卵巢癌、子宫癌和妇科癌症(不包括卵巢癌和子宫癌)讨论版的帖子都被包括在内。文章是使用Python从网络上抓取的,并根据癌症幸存者护理质量框架中描述的社会心理主题进行组织。生成与每个主题相关的关键字并进行验证。关键词识别与预定心理社会主题相关的帖子。定量分析使用Python和R Foundation for Statistical Computing软件包完成。对一部分员额完成了定性分析,作为概念的证明。通过潜狄利克雷分配(LDA)(一种无监督主题建模技术)发现的主题被评估,并与预定的感兴趣主题进行比较。

结果:对6436名妇科癌症幸存者和护理人员在2000年7月至2020年2月期间发表的125,498个帖子进行了评估。在125,489个帖子中,23,458个(18.69%)与癌症的心理社会体验有关,并被纳入混合方法心理社会分析。定量分析(23,458个帖子)显示,所有妇科癌症讨论板的幸存者最常讨论的是朋友和家人在护理中的作用,以及疲劳,癌症对人际关系的影响,以及健康保险状况。在帖子中最常使用的与幸存者心理社会方面相关的词汇包括“家庭”、“希望”和“帮助”。定性分析(23458个帖子中的20个)同样表明,幸存者经常讨论应对策略、痛苦和担忧、家庭和护理人员在癌症治疗中的作用,以及管理财务和保险问题的代价。使用LDA,我们发现了8个主题,没有一个与生存的心理社会方面直接相关。在LDA识别的56个关键字中,“睡眠”和“工作”这两个(4%)被包括在我们独立设计的关键字列表中。

结论:基于网络的讨论平台提供了一个很好的机会来了解患者的生存经验。我们的新方法加快了对这些可靠数据的定量和定性分析,这可能用于更多的患者群体。

中国医学杂志,2018;24(9):e37757

doi: 10.2196/37757

关键字



背景

妇科癌是一种广泛的疾病类别,包括宫颈癌、子宫癌、卵巢癌、阴道癌和外阴癌,它们在表现、病理、治疗、预后和生存轨迹方面各不相同。据估计,2021年约有116,760例新发妇科癌症病例和34,080例新死亡病例[1].子宫癌及卵巢癌的5年总生存率现时分别为81%及48% [1].尽管通过早期发现和改进治疗,这些生存率还有很大的提高空间,但随着时间的推移,在妇科癌症患者的管理和生存方面已经取得了显著的进展。因此,现在妇科癌症的幸存者比以往任何时候都要多。随着妇科癌症幸存者人数的不断增长,迫切需要研究方法来评估和实施以生存为中心的护理,以诊断和生活在妇科癌症中的幸存者为中心。

2006年,在具有里程碑意义的出版物“从癌症患者到癌症幸存者:迷失在过渡中”中首次描述了癌症幸存者[2],概述了积极癌症治疗与积极癌症治疗结束后生活之间的护理差距。自2006年以来,在生存能力方面进行了大量工作,重点是从癌症诊断之日开始的生存能力。这反映在国家癌症研究所对生存的定义中:“癌症患者从诊断到生命结束的健康和幸福”[3.].因此,幸存者护理关注的是与治疗癌症本身没有直接关系的健康和健康的各个方面。

国家综合癌症网络提供了提供生存护理的指导方针,并概述了生存护理的7个方面,包括预防新发和复发性癌症,预防癌症和治疗的后期影响,监测癌症复发,筛查新发癌症,评估和治疗癌症和治疗的后期影响,协调提供者之间的护理,以及规划持续的生存护理[4].其他指南,如美国癌症协会(ACS)、美国临床肿瘤学会和安大略省癌症护理协会的指南,都断言类似的组成部分是幸存者护理的基本方面[5-7].癌症幸存者护理质量框架通过对幸存者护理指南的迭代审查定义了幸存者护理的领域,该指南得到了关键专家访谈的支持[8].所有指南都强调考虑幸存者心理社会方面的重要性,美国国家癌症研究所将其定义为“疾病的精神、情感、社会和精神影响”以及癌症的心理社会影响,包括“患者思维方式、感觉、情绪、信仰、应对方式以及与家人、朋友和同事关系的变化”[9].癌症和癌症治疗的心理社会效应是一个重要的探索领域,因为它们对每种癌症类型、癌症治疗方法和个体患者都是独特的。

离生存

由于幸存者是肿瘤护理中一个相对较新的组成部分,该领域继续开发新的干预措施,并修改现有的举措,以最好地满足幸存者的需求。直接从幸存者的声音中学习是为这些幸存者服务提供信息的一个重要步骤。基于网络的讨论板和社交媒体平台已经成为研究人员和临床医生利用关于癌症幸存者的公开讨论的工具,提供了大量来自幸存者的坦率和自发的想法和意见[10].高等[11最近证明了调查Instagram上与头颈部癌症相关的帖子的实用性,他们报告说,患者发布的大多数帖子都集中在预约、治疗和副作用上。类似的分析也在推特上进行过。12]和Facebook [13更多癌症类型。以讨论为基础的论坛,包括Facebook群组[14]及美国癌症学会网站[15],研究人员也对这些数据进行了分析,以便从癌症幸存者的角度更好地了解生存率。虽然这些先前的研究证明了分析幸存者的帖子和讨论的实用性,但每一项研究都是通过手工主题分析进行的。手工组织和分析基于文本的帖子和讨论的可行性有一个上限,这破坏了探索此类帖子的最大优势之一——可用的数据量。为了克服这一问题,其他研究人员使用了自动化技术,如无监督主题建模,以确定网络和社交媒体帖子中最流行的主题[16-18].然而,这一过程并不一定确定对研究人员重要的主题,例如当主题与幸存者护理的特定方面相关时,并且不检测感兴趣的预定主题。

客观的

美国癌症协会癌症幸存者网络有专门针对癌症类型的讨论板,幸存者和护理人员可以通过帖子进行互动。为了展示一种新的方法来扫描这些帖子的广泛汇编,并对它们进行主题组织,我们分析了ACS妇科癌症讨论板,包括卵巢癌、子宫癌和妇科癌症(不包括卵巢癌和子宫癌)讨论板。我们的方法使用前面描述的癌症生存护理质量框架,对>125,000个讨论板帖子进行了自动化分析,并特别关注框架内的主题社会心理效应领域的监测与管理8].我们的目标是证明这种新方法的实用性,以加速对来自妇科癌症幸存者和护理人员的大量基于讨论的数据的指导性定量和定性分析,这些数据基于预先确定的感兴趣的主题,例如癌症幸存者护理质量框架中的主题。


研究设计

本研究采用混合方法,特别是顺序解释设计[19].序贯解释研究在分析中涉及两个阶段。首先,进行定量分析,为第二个定性分析阶段提供信息[1920.].利用整合策略将第一次定量分析和第二次定性分析的信息进行整合。根据标准的顺序解释性研究设计,数据整合分为两个阶段,第一个阶段发生在定量分析结束后。这是通过确定哪些主题在数据集中最普遍来完成的,这使我们能够将研究的定量成分与定性成分联系起来。第二阶段的数据整合发生在定性分析完成后,在此期间,我们比较了定量和定性的结果,分享了报道的结果[1920.].将定量分析和定性分析的结果视为对结果的贡献相同,但方式不同,称为互补立场整合[21].为了实现这一点,我们完成了以下迭代过程,这将在以下段落中详细说明:识别预定的感兴趣的主题,web抓取,开发关键字以在基于web的文本中捕获主题,验证关键字的有效性和可靠性,将关键字应用于数据集,并分析数据输出。

这个过程是在主题建模的初步探索之后开发的,特别是潜在狄利克雷分配(LDA)。主题建模是一种无监督的机器学习方法,用于确定大量文本中相关单词的模式,从而独立地发现程序基于概率确定的重要主题[22].Python包gensim而且LDAvis用于促进主题发现。为了确定我们数据集的最佳主题数量,一致性度量(CV)使用[23].从2到40个主题的不同数量的模型以2为增量进行开发,最高的CV8个主题评分为0.52。LDAvis包中的相关性指标用于评估最相关的关键字,而不仅仅是最流行的关键字,因为根据讨论板数据的性质,特定单词(例如“癌症”)的频率很高。基于与人类可解释性的相关性,λ的值设置为0.6 [24].研究团队对这8个主题的语义达成了共识。这些主题建模生成的主题与癌症生存护理质量框架中的主题进行了比较[8].第二次尝试使用LDA生成了一个包含16个主题的模型,其中C值第二高V得分,作为一种更紧密地模拟癌症生存护理质量框架中心理社会主题数量的手段,以获得主题更狭窄的主题。

预定的兴趣主题

癌症存活者护理质素架构[8]具有多个质量域,包括社会心理效应领域的监测与管理物理效应的监测和管理;而且护理协调域,其中包括在这个分析中,我们关注的是社会心理效应领域的监测与管理.每个领域包含几个建议的质量指标,以评估幸存者护理的不同方面;例如,在社会心理效应领域的监测与管理在美国,评估癌症幸存者护理的建议质量指标包括“疲劳”和“压力”,以及“财务毒性”和“生育能力”。虽然这些指标可以用来评估存活者护理的质量,但我们认为它们概括了所有相关的主题,这些主题是妇科癌症存活者可能在ACS讨论板上讨论的。因此,为了我们的研究目的,我们将参考框架中列出的指标社会心理效应领域的监测与管理“主题”。我们使用这些主题来证明我们的新方法的实用性,通过检测这些主题在妇科癌症幸存者和护理人员之间的交流中存在。

网页抓取

所有来自卵巢癌、子宫癌和妇科癌症(不包括卵巢癌和子宫癌)ACS讨论板的125,498个帖子都进行了评估。分析中包含的帖子创建于2000年7月21日至2020年2月24日,即网络抓取完成的日期。帖子要么是添加到现有对话中的回复,要么是讨论板上的“对话启动者”。网络抓取,或简称“抓取”,是一种技术,用于从基于网络的平台提取感兴趣的内容,以便使用计算机软件进行分析,本质上是“下载”它,以供研究人员使用。Python是一种计算机编程语言,它可以自动执行计算机上的特定操作,例如web抓取过程。通过创建一个自定义Python脚本,自动抓取>125,000个帖子的过程。Python有多个包,允许软件执行不同的操作。在我们的分析中,我们特别使用了Python包urllib而且美丽的汤从ACS讨论板上的讨论帖子中导航和提取文本。首先,urllib被用来连接ACS网站并抓取网页。接下来,美丽的汤4用于解析从ACS网页获得的HTML代码。这使我们能够提取帖子中包含的提交文本、帖子的日期和帖子的用户名。在从卵巢癌、子宫癌和妇科癌症(不包括卵巢癌和子宫癌)讨论板上删除帖子后,它们被保存到CSV数据文件中,用于进一步的下游分析。

使用关键词捕获感兴趣的主题

我们设计了一个“关键词”列表,从癌症生存护理质量框架中捕获每个预定主题社会心理效应领域的监测与管理文本框1).每个主题都有多个关键字,这些关键字是由同义词、相关短语和相关单词创建的。关键字列表使用截断的根词来捕获给定关键字的所有变体;的1个主题社会心理效应领域的监测与管理就是“就业不足,失业,重返工作岗位。”捕捉这一主题的众多关键字之一是基于词根“失业”。通过使用词根词“失业的”,该方法捕获了它的所有变体,包括“失业的”、“失业的”和“失业的”。这使我们能够捕捉到幸存者可能讨论过与基本词“失业”相关的话题的所有实例。

关键字列表的目的是能够确定哪些ACS帖子讨论了任何预定的感兴趣的主题。我们的方法扫描数据,检测关键字何时被使用。使用特定主题的关键字表明ACS帖子讨论了特定主题。该软件记录了在每篇评估的ACS帖子中,每个预定主题的关键词出现的次数。因此,每个ACS帖子都为每个主题分配了一个“主题评分”。这使得我们可以根据主题关键词出现的次数来确定在给定的帖子中哪些主题最流行,而无需首先阅读它。同时,主题评分让我们能够立即识别哪些ACS帖子讨论了感兴趣的特定主题。这加快了过程,因为我们能够快速调出与特定主题相关的所有帖子,从而加快了额外的审查和定性分析。

关键字列表。

监测和管理社会心理影响主题和关键词

心理

“心理”和“心理学”

乏力

“疲劳”,“累”,“累”,“疲劳”,“排气”,“午睡”和“休息”

压力

" Stress "和" stressed "

创伤后压力

"创伤后应激" "创伤"和"创伤"

创伤后成长

“创伤后成长”,“创伤”和“创伤”

痛苦

“苦恼”,“抑郁”,“沮丧”,“感觉低落”,“悲伤”,“悲伤”,“眼泪”,“哭泣”,“心烦意乱”,“心碎”,“心碎”,“扳手”,“内疚”,和“哭泣”

焦虑

"焦虑" "焦虑"和"恐慌"

害怕复发

“害怕复发”与“复发”

睡眠障碍

“睡眠”、“失眠”、“醒来”、“睡着”、“打扰”、“不安”和“睡眠障碍”

应对

"应付" "应付"和"应付"

担心

" Worry " " worried " " worrying "和" worries "

疾病侵扰性

“生活方式”,“侵入性”,“疾病侵入性”,“干扰”,“尴尬”,“羞耻”,“羞耻”和“扰乱”

认知变化

“雾”,“记忆”,“集中”,“集中”,“集中”,“认知”,“认知”和“模糊”

教育问题

“教育问题”、“学生”、“学习困难”和“学校问题”

不合群

"社会退缩" "社会退缩" "社会孤立" "社会孤立" "孤独"和"社会退缩"

金融与就业

“财务”,“财务”,“雇佣”,“工作”,“全职”,“全职”,“兼职”和“工作量”

金融的毒性

“财务毒性”、“债务”、“成本”、“账单”、“昂贵”、“费用”、“钱”、“金钱麻烦”和“财务麻烦”

就业不足,失业,重返工作岗位

“未充分就业”,“失业”,“重返工作岗位”,“回归全职”,“回归全职”,“回归兼职”,“下岗”,“下岗”,“解雇”,“辞职”,“被解雇”

工作效率

“工作效率”,“工作有成效”,“努力工作”,“努力工作”,“落后”,“落后”和“落后”

学校的效率

“学校生产力”、“学习”和“学校学院”

保险状况

“保险”,“被保险”,“医疗补助”,“医疗保险”和“自费”

人际关系

“人际关系”、“男朋友”、“丈夫”、“配偶”、“女朋友”、“妻子”、“重要的人”、“fiancé”、“伴侣”和“关系”

性与亲密

“性”,“亲密”,“亲密”,“性交”,“性”和“性”

生育能力

“生育”,“可育”,“不孕”,“不育”,“保存”,“怀孕”,“怀孕”,“受孕”,“流产”,“流产”,“试管婴儿”,“体外”,“卵母细胞”,“胚胎”,“冷冻”,“冷冻”,“卵子”,“精子”,“冷冻”

家庭和照顾者关系

“母亲”、“母亲”、“父亲”、“父亲”、“姐妹”、“兄弟”、“儿子”、“女儿”、“朋友”、“配偶”、“丈夫”、“妻子”、“伴侣”、“孩子”、“家庭”、“照顾者”、“关系”、“友谊”、“伙伴关系”、“婚姻”、“离婚”、“分开”、“订婚”和“fiancé”

所提供的推荐评估(如实验室检测、成像或转诊专科护理)

“心理评估”,“社会历史”,“推荐给治疗师”,“推荐给心理医生”,“推荐给心理医生”,“推荐给社会工作”,“推荐给社会工作”,“推荐给社会工作”,“推荐给心理医生”

所提供的治疗(如药物、治疗或运动)

“心理治疗”,“心理药物治疗”,“咨询”,“治疗”,“支持小组”,“左洛复”,“阿普唑仑”,“拉西普罗”,“西莱克萨”,“安非他酮”,“德昔瑞尔”,“百忧解”,“阿得拉”,“安定”,“欣百达”,“文拉法舒”,“思瑞康”,和“Depakote”

完成治疗依从性评估

“坚持”、“坚持”、“按照指示”、“坚持”和“坚持”

在规定的时间间隔或治疗阶段对症状和状况进行重新评估

“心理症状再评估”、“心理症状再评估”、“心理症状复查”、“心理症状复查”

文本框1。关键字列表。

字确认

为了确定我们的关键词是否有效,我们从妇科癌症讨论板上随机选择了20个帖子,完成了两步验证过程。验证过程的目标是:(1)检查计算机程序是否根据文章中出现的关键字的数量将关键字适当地分类到他们预期的兴趣主题中;(2)验证计算机程序根据哪个主题代表的关键字数量最多来确定关键字的个人naïve是否会将文章分类为与同一主题最相关的主题。对于关键字验证的第一步,研究团队成员(EA)使用关键字列表手动将20个随机选择的帖子分配到他们的心理社会主题,并注意到哪个主题在帖子中出现的关键字最多。EA创建了关键字列表,因此熟悉关键字。这一步用于验证计算机程序是否根据给定文章的关键字数量正确捕获了每个主题。

关键字验证过程的第二步由另一个研究团队成员(MH)完成,他以前从未见过关键字列表。MH盲目地将每个帖子分配到一个主题社会心理效应领域的监测与管理不使用关键字。该步骤用于验证EA为每个主题创建的关键字社会心理效应领域的监测与管理被恰当地捕获了。

为了确定EA和MH的反应是否与计算机程序将20个帖子分类为最相关的主题(主题得分最高的主题)的反应一致,另一个研究小组成员(DT)比较了EA、MH和计算机程序对20个帖子的主题指定。这个关键字验证过程是成功的,有一些小的差异被认为是可以接受的,因为一些预先确定的主题是非常密切相关的(例如,幸存者可能会担心他们的“工作效率”可能会导致他们失去工作并成为“失业者”,这是两个不同但密切相关的主题)。在程序和研究人员之间出现的几次差异中,程序仍然在研究人员选择的主题上给帖子打了很高的分,这意味着帖子在很大程度上仍然反映了研究人员和计算机程序选择的主题。因此,如果查询ACS中讨论由研究人员或计算机程序指定的主题的帖子,就会突出显示该帖子。

应用关键词

一旦我们确信我们的关键字和方法捕捉了主题社会心理效应领域的监测与管理,我们对所有125,489个职位使用了广泛的方法。为了自动为所有文章和所有预定的感兴趣的主题生成“主题评分”,我们使用基本字符串库创建了另一个Python脚本。每个帖子都有一个主题得分,主题得分反映了主题关键词在帖子中出现的次数。

接下来,我们能够为每个主题对帖子的主题得分进行排序。这样做是为了在给定的主题中找到最相关的帖子。同时,我们可以看到哪些主题在某篇文章中最流行。为了让我们考虑一篇文章与特定主题“相关”,我们将主题得分设置为3(一篇文章必须包含至少3个主题关键字的实例)。设置最小主题分数可以最小化用户以与预定主题无关的方式使用关键字的次数;例如,一个幸存者在他们的帖子中写一次“失业”就不会提示计算机程序将其标记为与“就业不足,失业,重返工作”主题相关。

伦理批准和数据使用

根据人类研究保护办公室的规定,公开可用的数据,如ACS讨论板上的帖子,不构成以人类为研究对象的研究。因此,进行数据分析、解释和传播调查结果不需要机构审查委员会的审查批准,如45CFR46:102所支持的[25].这符合参与分析的所有附属机构的机构审查委员会的程序。

分析

定量分析

使用我们的方法进行网络抓取和数据收集的过程生成了各种定量数据点,并使用R和ggplot2绘图包;例如,我们确定了在卵巢癌、子宫癌和妇科癌症(不包括卵巢癌和子宫癌)讨论板上最常讨论的预定主题。我们还从讨论主题的角度考察了讨论板上的趋势。我们通过将与特定主题相关的帖子数量除以该年的帖子总数来确定每个主题的流行度。

除了预先确定的兴趣主题和各自的关键词外,我们希望以图片的形式展示幸存者和护理人员在他们的帖子中使用的词语。为了捕捉这一点,我们创建了一个图表,描绘了ACS帖子中所有125,498个帖子中最常用的40个单词。

定性分析

通过使用关键字列表并通过主题评分在给定的帖子中捕获最突出的预定主题,我们可以轻松确定哪些ACS帖子与特定的感兴趣的主题相关。这促进了进一步的定性分析;例如,如果我们想看如何幸存者和护理人员谈到了“就业不足、失业、重返工作岗位”的主题,然后我们可以对所有125498个ACS帖子进行分类,以确定哪些帖子在“就业不足、失业、重返工作岗位”的主题得分最高。因此,这将简化质量审查,以便已经确定与感兴趣的主题有关的选定员额,并可以迅速加以分析。

为了证明我们的方法如何在一个非常大的基于讨论的数据集中加速定性分析,我们定性分析了20个帖子。根据先前描述的定性研究建议,样本量为20个[2627].我们选择了这20篇文章,因为它们在所有预定主题中拥有绝对最多的关键字实例。换句话说,对于每个ACS帖子,我们将所有主题的“主题得分”(关键字出现在给定主题中的次数)相加。当把所有单独的主题得分加在一起时,定性评论的20个帖子的总分最大。由于许多ACS的帖子在讨论区相当活跃,分析中最多包括每个用户5个帖子。如果一个帖子中的第六个帖子根据其主题评分符合纳入条件,那么它就会被排除在外,而另一个独特用户的下一个帖子则会被纳入。

这些定性分析由2个研究小组成员(EA和MH)完成。每一篇文章都被单独审查,审稿人指出了他们认为与文章主题最相关的引文社会心理效应领域的监测与管理.审稿人(EA和MH)之间任何无法解决的差异都由第三个审稿人(ML)解决,以确定最终分配的主题。EA和MH还收集了ACS发布的关于幸存者或看护者的任何人口统计信息。


定量分析

共有125,498篇文章被定量分析,其中61,699篇(49.16%)来自子宫癌讨论板;57,011人(45.43%)来自卵巢癌讨论区;6788例(5.41%)来自妇科癌症(卵巢和子宫癌除外)讨论区。这些帖子是由6436个独特的帖子创建的,每个独特的帖子平均创造19.5 (SD。107.4,范围1-2397)的职位。帖子总数在2008年经历了大幅增长,并在2011年达到最大值,其中卵巢癌讨论区是最多产的。子宫癌讨论区在2011年和2016年经历了帖子的显著增长,妇科癌症(除卵巢癌和子宫癌外)讨论区随着时间的推移有稳定的帖子数量,如图所示图1.此后,卵巢癌讨论区帖子数明显减少,而子宫癌讨论区帖子数保持较高,并保持上升趋势。

在125,489个帖子中,23,458个帖子(18.69%)与癌症的心理社会体验有关,并基于至少3分的主题得分进行了进一步调查社会心理效应领域的监测与管理.如图2,主题来自社会心理效应领域的监测与管理随着时间的推移,子宫癌的讨论越来越普遍。随着时间的推移,卵巢癌和妇科癌症(卵巢和子宫癌除外)讨论板中这些感兴趣的心理社会主题的流行率有所下降;然而,这可能是由于这两个讨论区中帖子总数的减少。幸存者在所有妇科癌症讨论板上发布的最常讨论的预定主题与(1)朋友和家人在护理中的作用,(2)疲劳,(3)人际关系的影响,以及(4)健康保险状况有关。其他普遍感兴趣的主题被注意到与压力、性和生育有关。

从所有被评估的讨论区帖子中看到的最常见的单词,不管它们与预定的心理社会主题的相关性如何,都被描绘在一个图表中(图3).在美国癌症协会的帖子中,幸存者和护理人员使用的大多数词汇都与癌症的治疗有关,包括“癌症”、“化疗”、“治疗”、“手术”和“放疗”。幸存者使用的许多词汇都与基于心理社会主题的幸存者有关,包括“家庭”、“希望”、“帮助”和“痛苦”。

图1。讨论区随时间变化的帖子数量。
查看此图
图2。社会心理主题随时间的流行。
查看此图
图3。帖子中最常用的词。
查看此图

定性分析

在我们的概念证明定性分析中包含的20个帖子包括238个被确定为感兴趣的引用。这20篇帖子来自8位不同的用户,他们要么是卵巢癌或子宫癌患者的幸存者,要么是他们的护理人员。在这20个帖子中,大多数关注的是与预定的主题有关的兴趣社会心理效应领域的监测与管理与应对痛苦和担忧、家庭或照顾者关系以及癌症带来的经济困难有关。文本框2包括讨论这些突出主题的代表性引用。

在探索观察到的心理社会职位的定性方面时,额外的细微差别显现出来。与痛苦和担忧的心理社会主题相关的大量讨论与对疾病复发、进展或转移的担忧有关。这也让我们深入了解了应对的主题,我们观察到两种显著的方法:在护理中发挥积极作用,在精神上发挥作用。通过在护理中发挥积极作用来应对是很明显的,因为海报上要求对治疗方案提出意见,彼此分享和解释主要文献,请求帮助为他们的医生设计问题,并头脑风暴自我宣传的策略。其中一个明显的因素是鼓励其他人寻求第二种意见,正如子宫癌讨论板的海报所示:

第二个意见可能会挽救你的生命。尽管有这个令人失望的消息,但你还有很多选择,所以不要让一个忙碌的医生把你排除在外。也不要自暴自弃。如果你必须倒下,那就战斗下去。为了你自己,为了你的丈夫,为了你的梦想。

除了增强自我效能,应对的另一个组成部分是精神。许多人分享了这种信仰给他们带来的安慰,让他们能够适应晚期诊断,并接受一个人的死亡。一位转移性卵巢癌患者分享了以下内容:

与其他人可能选择相信的相反,虽然我知道上帝可以医治许多人,但他没有义务这样做。我在这里不是要挑战任何人的信仰,只是告诉你们我来自哪里,因为这与我自己的第四期诊断有关。

幸存者还经常讨论他们与家人和护理人员的关系,其中一个重要因素是帮助亲人在情感上适应患者的癌症诊断、治疗和预后。一位卵巢癌幸存者发表了一篇关于配偶、父母、成年子女、朋友和同事如何支持患癌症的亲人的帖子,其中包括(1)团结支持网络,分配任务,增加整体支持,(2)记住照顾好自己,以便更好地支持患者,(3)参加照顾者的支持小组。另一篇引人注目的帖子来自一位患有卵巢癌的女性的丈夫,他向他的妻子咨询如何与她谈论她的癌症和预后,而她却否认了这一点。一名幸存者回答说,建议如下:

告诉她你在研究她的癌症。如果她还问,就告诉她更多。如果她想否认现实,那是她的选择。如果她变得足够好奇,问得更多,这可能是一个更深入对话的开端。理想情况下,你们两个人需要能够一起面对现实。她将会是那个在生理和心理上都受到影响的人。你肯定会受到情感上的折磨。而且believe me, she wants to live as much as you want her to live...As a caregiver, I know your heart aches.

另一个普遍存在的主题是金融毒性和保险状况的交集,它为幸存者的生活经历提供了有趣的见解。谈话的重点是获得治疗方案。一位子宫癌的幸存者发帖如下:

在这期间,我的保险公司拒绝支付阿瓦斯丁的费用。我不知道要花多少钱。

另一名幸存者给出了以下建议:

他们会理所当然地否认,除非他们有争议。人们总是被拒绝,在一些纠纷后被推翻……他们从否认开始,然后看看医生是不是真的想这么做……你真的真的必须去你的医生办公室,弄清楚到底提交了什么,你的保险要求是什么,为什么被拒绝,让你的医生反抗。你不应该……但你真的真的很在乎。

这为患者可能面临的经历提供了见解,这些经历影响了他们在癌症本身之外的生活质量。

如前所述,定性分析提供了对如何幸存者讨论了他们感兴趣的特定主题,并深入了解了这些主题是如何相互关联的。值得注意的是,这20篇文章中绝大多数被分析的引用都触及了>1的主题社会心理效应领域的监测与管理.最不常见的社会心理生存感兴趣的主题与坚持治疗、教育和职业困难以及社会退缩有关。

引用来自定性分析。

讨论区帖子的主题和引用

应对

“我是42。我为我可能失去的几年时间而哭泣,以它增长的速度,我担心我现在只有几个月了。”

苦恼和担忧

“我是一名四期癌症患者,我知道我已经遭受了什么影响,我不会为了再活三个月而‘再试一次’,在这段时间里,不会没有很多副作用。我只是代表我自己说话,但我已经下定决心了!”

生理影响的心理方面

“这通常会让人很虚弱。我们甚至会在副作用似乎无法忍受的时候感到绝望。”

保险状况和金融毒性

“孩子,真让人讨厌。很抱歉你要和钱的事抗争。你要担心的已经够多了。他们不知道这有多紧急和重要吗。与此同时,这也证明了你是一个多么伟大的斗士。我真的希望你能澄清这一点,这样你就能得到你需要的治疗。”

家庭和照顾者关系

“(作为照顾者),允许他们发泄,不要往心里去,要知道这是困惑和疾病在说话,是他们所有的恐惧……要坚强。不要自找麻烦,但要现实地预测和每天的计划,在战斗中态度很重要,活在当下,积极是关键。”

文本框2。引用来自定性分析。

主题建模

虽然LDA能够将帖子分成不同的主题,但结果的主题很广泛。研究一个发现了16个而不是8个主题的模型,可以得出更具体的主题,尽管许多主题被认为是随机的和不相关的;因此,我们继续对8主题模型进行分析。LDA发现的8个主题从流行度最高到流行度最低分别是支持、治疗副作用、诊断、研究和临床试验、治疗、卵巢癌、帮助和时间。这些发现总结在多媒体附件1,以及将主题建模的关键字配对在一起为每个主题。值得注意的是,在lda生成的关键字和使用我们的主要混合方法方法开发的关键字之间,有2个关键字重叠:睡眠在“治疗副作用”的发现主题和工作在“时间”之内发现了主题。


主要研究结果

本研究应用了一种新的方法,该方法是使用混合定性和定量方法来检查大型基于网络的、基于叙述的数据集。这种方法提供了使用定量技术描述和利用大量数据的能力,同时指导和简化定性分析。我们在之前发表的癌症生存护理质量框架的背景下演示了该方法的实用性,重点是该框架社会心理效应领域的监测与管理.我们能够观察每个讨论区每年发布的帖子数量,以及自讨论区成立以来特定主题的趋势。这让我们对该平台的用户粘性有了一个全面的了解。定量分析显示,幸存者经常讨论朋友和家人在护理中的作用,以及疲劳、人际关系的影响和健康保险状况。幸存者在帖子中使用频率最高的词与诊断和治疗有关。使用频率最高的词汇与框架中我们感兴趣的主题相关社会心理效应领域的监测与管理分别是"家庭" "希望"和"帮助"定性分析还表明,幸存者经常讨论应对、担忧、痛苦、家庭和照顾者关系,以及护理的保险和财务方面。定性分析提供了更深入的见解如何幸存者受到这些主题的影响,并对幸存者未得到满足的担忧的细微差别提供了更深刻的见解。

与之前工作的比较

社交媒体和基于讨论的平台可以提供癌症和其他健康状况患者的宝贵信息;然而,社交媒体帖子中可用的数据量对其在研究中的使用构成了障碍[1128].尽管除了我们在本文中介绍的方法之外,还有其他自动方法对大量书面文本数据进行主题分类,例如主题建模[1617],他们经常使用电脑软件来生成和聚类软件认为重要的主题。不幸的是,正如我们在分析中所经历的那样,这些主题往往没有足够的意义来回答特定的研究问题或探索已知的主题。当我们希望探索生存的心理社会方面时,LDA发现的主题还不够具体,不足以有意义地告知我们的研究问题。为此,我们的方法确保捕获感兴趣的主题,同时仍然是一个自动化的过程。另一种对大量基于文本的数据进行主题分析的方法,确保准确捕获感兴趣的主题,涉及手动提取数据[11-1315].然而,当希望分析基于web的平台上可用的大量数据的整体时,手动抽象通常是不可行的。我们在本报告中提出的方法提供了自动化主题分析的效率,同时保留了人工数据抽象的准确性和周到性。

本报告中提出的方法可用于为临床医生和研究人员提供宝贵的见解、意见和癌症幸存者自己以有效和低成本的方式提出的建议。在论坛和社交媒体平台上公开的幸存者之间坦诚的对话可能会为未来的幸存者努力和计划提供信息,因为它们揭示了幸存者诚实和自发的担忧、态度和偏好。本报告有助于从ACS讨论板中提取的不断增长的知识体系,包括我们小组的先前出版物[1529].其他文章支持通过ACS讨论板帖子探索癌症幸存者观点的丰富机会,正如Fallon等人所证明的[30.他发现25%的ACS癌症幸存者网络用户至少每月访问一次该网站,其中大多数人与讨论区互动。利用幸存者坦诚的话语,将使幸存者倡议了解对幸存者最重要的是什么,并可能使临床医生了解目前在幸存者护理中缺失的东西。

先前的工作已经探索了妇科癌症患者独特的生存需求。DeRooij等[31]通过半结构化访谈,从患者、护理人员和医疗保健提供者的角度探讨了妇科癌症患者未满足的生存需求。几乎所有参与者都希望在治疗副作用、预期随访计划和心理社会支持方面获得更多资源。我们的分析有助于了解什么心理社会支持对妇科癌症幸存者及其照顾者最有用。事实上,Beesley等人[32]发布了一项调查,以确定未满足生存需求的妇科癌症幸存者的数量,结果发现有43%的幸存者满足了需求,他们的大多数担忧与生存的心理社会方面有关。最常见的未满足需求包括对癌症进展的恐惧,帮助朋友和家人适应他们的癌症诊断,未来的未知,疲劳,以及无法完成他们以前喜欢的任务和活动[32].这些发现与我们的非常相似,特别是我们发现幸存者在ACS讨论板上讨论的最大担忧与他们对癌症进展、转移或复发的恐惧有关。此外,关于癌症如何影响亲人的担忧是突出的,因为许多帖子都与如何帮助护理人员适应亲人的诊断或护理人员如何最好地支持患有癌症的亲人有关。总之,我们的工作补充并进一步告知现有文献关于妇科癌症幸存者未满足的心理社会需求。

限制

虽然我们的分析得到了来自ACS讨论区20年帖子的数据集的加强,但我们承认,在这段时间内,患者的癌症护理和生存需求发生了巨大变化。因此,必须对研究结果进行独立评估,以确定如何将其应用于当前和未来的生存计划。由于定性分析是作为概念的证明,我们要强调的是,这个项目的定性分析并不是对所有职位的全面分析;相反,它演示了如何使用这种技术进行讨论如何讨论了特定的主题。因此,定性分析中探讨的报价可能不能反映数据集中的所有帖子。此外,我们承认定性分析的20篇文章的作者的多样性有限。

结论

妇科癌症幸存者之间基于互联网的讨论为未满足的心理社会生存需求提供了宝贵的见解,这些需求可以在未来的生存计划中得到解决。大多数情况下,妇科癌症的幸存者讨论了朋友和家人在护理中的作用,以及疲劳,癌症对人际关系的影响,以及健康保险状况,这些都是通过分析的定量阶段发现的。补充定性分析告知了这些主题如何影响幸存者,显示了可能解决的幸存者护理的具体差距。这种信息丰富和可定制的方法可能会继续应用于临床环境和患者群体,利用大量患者生成和以患者为中心的互联网数据进行实证调查。

利益冲突

没有宣布。

多媒体附件1

通过潜狄利克雷分配发现主题和关键字。

PNG文件,75kb

  1. 美国癌症协会。美国癌症协会癌症统计2021年报告。中华核医学杂志2021 Mar;62(3):12N [免费全文] [Medline
  2. 国家研究委员会,医学研究所,国家癌症政策委员会,癌症生存委员会:改善护理和生活质量。从癌症患者到癌症幸存者:迷失在转变中。美国华盛顿:国家科学院出版社(美国);2006.
  3. NCI词典-生存权。国家癌症研究所,2022年。URL:https://www.cancer.gov/publications/dictionaries/cancer-terms/def/survivor[2022-09-08]访问
  4. NCCN存活治疗指南:癌症相关晚期和长期影响的存活治疗。国家综合癌症网络,2020。URL:https://www.nccn.org/patients/guidelines/content/PDF/survivorship-crl-patient.pdf[2022-09-08]访问
  5. C.癌症幸存者的后续护理模式。指引2019 [免费全文
  6. 美国癌症协会癌症幸存者指南。美国癌症协会,2022年。URL:https://www.cancer.org/health-care-professionals/american-cancer-society-survivorship-guidelines.html[2022-09-08]访问
  7. 幸存者护理指南。美国临床肿瘤学会,2022。URL:https://www.asco.org/news-initiatives/current-initiatives/cancer-care-initiatives/survivorship-compendium/guidelines[2022-09-08]访问
  8. Nekhlyudov L, Mollica MA, Jacobsen PB, Mayer DK, Shulman LN, Geiger AM。开发癌症存活者护理质量框架:对临床护理、研究和政策的影响。中华肿瘤学杂志2019年11月1日;11 (11):1120-1130 [免费全文] [CrossRef] [Medline
  9. NCI词典-社会心理效应。国家癌症研究所,2022年。URL:https://www.cancer.gov/publications/dictionaries/cancer-terms/def/psychosocial[2022-09-08]访问
  10. Falisi AL, Wiseman KP, Gaysynsky A, Scheideler JK, Ramin DA, Chou WY。乳腺癌幸存者的社交媒体:文献综述。中华癌症杂志2017年12月11日(6):808-821。[CrossRef] [Medline
  11. 高瑞伟,史密斯JD,马洛伊KM。头颈部癌症和社交媒体:患者体验和癌症幸存者。喉镜2021年4月;131(4):E1214-E1219。[CrossRef] [Medline
  12. 萨顿J,沃斯SC,奥尔森MK,伍兹C,科恩E,吉布森CB,等。推特上的肺癌信息:内容分析和评估。J Am Coll Radiol 2018年1月;15(1 Pt B):210-217。[CrossRef] [Medline
  13. 米卡尔JP, MJ Beckstrand, Parks E, Oyenuga M, Odebunmi T, Okedele O,等。乳腺癌患者的在线社会支持:乳腺癌诊断和过渡治疗后Facebook使用的纵向变化中国癌症杂志,2020年6月;14(3):322-330。[CrossRef] [Medline
  14. Erfani SS, Abedin B, Daneshgar F.卵巢癌Facebook社区交流的定性评估。载于:国际信息社会会议论文集。2013年发表于:i-Society '13;2013年6月24-26日;加拿大多伦多,第270-227页。
  15. Smith A, Fogarasi M, Lustberg MB, Nekhlyudov L.青少年和年轻成人癌症幸存者的观点:社区讨论板的回顾。J Cancer survival(即将出版)2021年9月2日。[CrossRef] [Medline
  16. 刘志,方浩,徐旭,童伟。基于无监督学习技术的FDA药品标签挖掘——主题建模。BMC Bioinformatics 2011 Oct 18;12增刊10:S11 [免费全文] [CrossRef] [Medline
  17. Jones J, Pradhan M, Hosseini M, Kulanthaivel A, Hosseini M.将患者生成的数据聚类为可操作主题的新方法:基于web的乳腺癌论坛的案例研究。JMIR Med Inform 2018年11月29日;6(4):e45 [免费全文] [CrossRef] [Medline
  18. Lee YJ, Park A, Roberge M, Donovan H.社交媒体可以告诉我们患者症状:在线卵巢癌论坛的文本挖掘方法。癌症护理杂志2022;45(1):E27-E35。[CrossRef] [Medline
  19. 韦德尔一世,Kaur N, Hong Q, El Sherif R, Khanassov V, godar - sebillotte C,等。为什么和如何在初级卫生保健研究中使用混合方法。Fam Pract 2019年5月23日;36(3):365-368 [免费全文] [CrossRef] [Medline
  20. 整版JW。研究设计:定性,定量和混合方法方法。第四版。美国加州千橡市:Sage Publications;2013.
  21. Pluye P, Gagnon MP, Griffiths F, Johnson-Lafleur J.混合研究综述中评价混合方法研究的评分系统,并同时评价定性、定量和混合方法的主要研究。中华儿科杂志2009,4,46(4):529-546。[CrossRef] [Medline
  22. 布利DM,吴艾,Jordan MI。潜狄利克雷分配。J Mach Learn Res 2003; 3:93 -1022。
  23. 罗德德,李文杰,李文杰。主题连贯测量空间的探索。在:第八届ACM网络搜索和数据挖掘国际会议论文集。2015年发表于:WSDM '15;2015年2月2日至6日;中国上海,第399-408页。[CrossRef
  24. 雪莉·k·戴维斯:一种可视化和解释主题的方法。见:交互式语言学习、可视化和界面研讨会论文集。2014年发表于:WS '14;2014年6月27日;巴尔的摩,马里兰州,美国,第63-70页。[CrossRef
  25. 人类研究保护办公室(OHRP)。2022.URL:https://www.hhs.gov/ohrp/regulations-and-policy/index.html[2022-09-08]访问
  26. 定性研究的样本量。Qual Mark Res 2016年9月12日;19(4):426-432。[CrossRef
  27. Braun V, Clarke V.成功的定性研究:初学者实用指南。美国加州千橡市:Sage Publications;2013.
  28. Berry MW, Mohamed A, Yap BW。数据科学的监督和无监督学习。瑞士占姆:施普林格;2020.
  29. 王勇,王亚妮,王志强,等。了解在线癌症幸存者社区的话题和情绪。中华肿瘤学杂志2013年12月;2013(47):195-198。[CrossRef] [Medline
  30. Fallon EA, Driscoll D, Smith TS, Richardson K, Portier K.在线社交网络社区的描述、描述和评估:美国癌症协会的癌症幸存者网络®。中华癌症杂志2018年10月12日(5):691-701。[CrossRef] [Medline
  31. de Rooij BH, Thomas TH, Post KE, Flanagan J, Ezendam NP, Peppercorn J,等。妇科肿瘤生存期护理计划——来自患者、护理人员和卫生保健提供者的观点。J Cancer survival 2018 Dec;12(6):762-774 [免费全文] [CrossRef] [Medline
  32. Beesley V, Eakin E, Steginga S, Aitken J, Dunn J, Battistutta D.妇科癌症幸存者未满足的需求:发展社区支持服务的意义。2008年4月17日(4):392-400。[CrossRef] [Medline


ACS:美国癌症协会
简历:相干度度量
LDA:潜在狄利克雷分配


A Mavragani编辑;提交05.03.22;Y Xie, S El kefi, W Ceron, R El Sherif同行评审;对作者27.06.22的评论;订正版本收到17.07.22;接受11.08.22;发表20.09.22

版权

©Elizabeth J Adams, David Tallman, Marcy L Haynam, Larissa Nekhlyudov, Maryam B Lustberg。最初发表于《医疗互联网研究杂志》(//www.mybigtv.com), 20.09.2022。

这是一篇开放获取的文章,根据创作共用署名许可(https://creativecommons.org/licenses/by/4.0/)的条款发布,允许在任何媒介上无限制地使用、分发和复制,前提是正确引用最初发表在《医学互联网研究杂志》上的原创作品。必须包括完整的书目信息,//www.mybigtv.com/上的原始出版物的链接,以及此版权和许可信息。


Baidu
map