这是一篇开放获取的文章,根据创作共用署名许可协议(https://creativecommons.org/licenses/by/4.0/)的条款发布,允许在任何媒介上不受限制地使用、分发和复制,前提是正确引用了首次发表在JMIR Cancer上的原创作品。必须包括完整的书目信息,http://cancer.www.mybigtv.com/上的原始出版物的链接,以及此版权和许可信息。
世界范围内癌症的发病率正在上升,预期寿命的延长是主要原因之一。然而,30%至50%的癌症病例是可以预防的,早期发现有助于更好的预后。这使得卫生传播战略至关重要。Facebook是2017年和2018年世界上使用最多的社交网站,可以成为传播关于健康促进、预防和早期发现的强有力信息的有用工具。
我们的目标是(1)提供优化Facebook上关于癌症的健康信息的方法,重点关注风险因素、预防、治疗、早期诊断和治愈等主题,以及(2)调查这些信息的哪些方面能产生更大的参与度。
为了验证是什么在Facebook上吸引了更多与癌症相关的话题,我们分析了16个以癌症为主题的巴西页面。我们对文本、内容和参与率进行了手工分析。最后,我们开发了一个软件程序来操作分析Facebook帖子。我们设计的工具旨在自动分析任何以癌症为主题的Facebook页面。
我们在1个月内分析了712个帖子。我们将这些帖子分为以下8类:“证词或现实故事”、“团结”、“周年纪念”、“科学与健康”、“事件”、“制度”、“风险因素”和“美丽”。这些页面还根据它们所属的简介类型(即,医院或基金会、信息、非政府组织和个人页面)被组织成组。结果显示,在巴西产生更大参与度的类别并不是那些癌症相关内容百分比最高的类别。例如,在“信息”组中,“证词或现实生活故事”类别产生了79.5%的粘性。然而,在相关时间段内,只有9.5%(25/261)的内容涉及此类主题。另一个例子涉及“科学与健康”类别。尽管它是帖子数量最多的网站(129/261,49.4%),但在用户参与度方面排名第五。这项调查为开发一种自动分析Facebook页面的工具提供了基础。通过分析生成的类别和关键字列表被用于为系统提供信息,然后系统能够对出现在Facebook页面上的帖子进行分类。我们对163个帖子进行了测试,只有34个分类错误,错误率为20.8%(准确率为79.2%)。
我们通过分类帖子和计算参与率进行的分析表明,Facebook页面的潜力往往没有得到充分利用。这是因为产生最大粘性的类别通常不是最常用的类别。在这项研究中开发的软件可以帮助癌症相关网页的管理员更容易地分析他们的帖子,从而提高公众的兴趣。
癌症是一个总称,包括一组200种疾病,这些疾病的共同特征是细胞侵入组织和器官的紊乱生长[
为了预防目的,必须重申,改变人们的生活方式和习惯可以减少疾病发作的可能性。据Anand等人报道,“在所有癌症病例中,只有5%-10%可归因于遗传缺陷,而其余90%-95%则源于环境和生活方式。”生活方式因素包括吸烟、饮食(油炸食品、红肉)、酒精、日晒、环境污染、感染、压力、肥胖和缺乏运动。
除了采取健康的生活方式进行预防的重要性外,对已经出现疾病症状的个人增加早期发现也至关重要。事实上,当某些类型的癌症在早期阶段被诊断出来时,治疗成功和治愈(至少在诊断后5年内)的机会大大增加。根据
Facebook是目前活跃用户数量最多的社交网站;2017年6月,月活跃用户达到20亿[
积极搜索健康信息与更多的健康知识和积极的行为改变有关;也就是说,当个人获得更好的信息时,他们往往会变得更健康[
使用Facebook作为传播癌症治疗、早期诊断和预防健康信息的平台,在科学文献中被忽视了。研究这一主题的为数不多的论文之一
在美国进行的一项相关研究[
2017年发表的另一项研究[
最后,另一篇论文[
尽管有上述研究,但在巴西和世界范围内,几乎没有关于让公众参与社交媒体卫生传播的最佳方式的研究。与癌症相关的交流方面的学术分析甚至更少;这可能会对医院、非政府组织(ngo)和信息组织的Facebook页面产生负面影响,最终可能会影响到比其潜力更低的受众比例。因此,这项研究的目标是提供优化Facebook上关于癌症的健康信息的方法,特别强调风险因素、预防、治疗、早期诊断和治愈等主题,并调查这些信息的哪些方面能在受众中产生更大的参与度。值得注意的是,Facebook用户粘性的衡量标准是基于帖子的反应、分享和评论数量。
这项研究包括定性及定量研究[
为了验证是什么让Facebook上的癌症相关话题更多人参与,我们分析了16个以癌症为主题的巴西页面。2017年,我们在1个月内研究了这些页面2次,从3月14日到4月14日,然后从4月15日到5月15日。对于本次研究的页面选择,我们进行了如下的步骤:
我们在Facebook的内部搜索引擎中输入单词“癌症”(葡萄牙语为“câncer”),然后选择“页面”选项。
我们忽略了那些不是用巴西葡萄牙语写的页面。我们也忽略了将“巨蟹座”作为星象的页面。为了确保这些页面实际上是巴西的,我们还阅读了帖子,以更好地识别页面的地理来源;这是通过识别葡萄牙语的写作方式(即通过观察欧洲、非洲或巴西葡萄牙语之间的差异)或看到作者自己提到在巴西生活。
为了选择页面,我们首先考虑关注者数量较多的页面,然后查看更新情况。值得注意的是,要进入我们的调查,页面应该在选定的4周期间内至少每周更新2次。我们最终选择了15个页面,分为以下几类:个人页面、通讯、医院或基金会以及非政府组织。
最后,我们分析了我们创建的一个Facebook页面,该页面的目的是向公众宣传癌症的预防和早期诊断。我们称这个页面为“Acubens, museu de cancer”(英文为“Acubens,癌症博物馆”)。
值得注意的是,在我们的研究中,我们没有选择专门针对预防或早期检测的页面。我们的目的是确定巴西的Facebook页面是如何处理癌症相关话题的。我们包括每个页面的名称,2017年的关注者数量和内容描述
对于我们的分析,我们使用了社交媒体监控工具Quintly (quintly.com),因为它允许同时监控多种媒体,即使用户不是相关页面的管理员。Quintly以图表和表格的形式组织所有页面的公开信息(即关注者、反应、评论和分享的数量),例如,显示某个页面获得了多少新关注者,或者在选定的时间段内创建的帖子数量。该服务还为用户提供了所有选定页面的完整帖子列表,将数据收集到表示帖子日期、时间和类型的表中。帖子类型分为以下类别:照片(任何图像文件)、视频、事件(活动邀请,可选择接受或拒绝)、状态(纯文本帖子)或链接(包含重定向到外部页面的Web地址的帖子)。这些帖子类型定义反映了Facebook本身提供的定义。
这些职位的分析是根据Bardin [
在内容分析过程之后,两位研究人员为每个类别创建了一个关键词列表。同一个词不可能出现在多个类别中。此外,“癌症”或“化疗”等可以归入任何一类的非常笼统的词汇都没有被考虑在内。在两位研究人员各自创建了他们的列表后,他们见面检查了相似点和不同点,最终在共识的基础上创建了一个独特的列表。
为了更全面地了解这些类别,我们还确定了每个类别的总影响,即“参与率”。这个值考虑了每个页面的3个指标。我们计算了16个相关页面中每个帖子的加权平均反应、份额和评论,为反应分配了0.05权重,为份额分配了0.2权重,为评论分配了0.75权重[
我们之前对Facebook页面的分析[
该工具由JavaScript开发的软件程序组成,允许用户根据指标组织不同类型的Facebook帖子。虽然其中一些指标是公开可用的(例如,反应、分享和评论),但其他指标只能由页面管理员访问。我们的软件采用的指标如下:帖子触及率(有多少人浏览了该帖子);发布点击量(有多少用户点击阅读全文);帖子隐藏(有多少人在阅读帖子后隐藏了页面内容,或报告该页面为垃圾邮件);反应;股票;评论;用户粘性(加权平均用户粘性=点击数+反应数× 0.05 +分享数× 0.2 +评论数× 0.75);以及用户粘性(游戏邦注:即用户粘性除以用户接触范围)。 The software then enables the creation of a ranking according to each of these metrics. The ranking can be created by considering all the posts published in a relevant period or by filtering according to the categories to be analyzed.
此外,在软件中,我们创建了一个类别数据库和关键字字典,这是由研究人员在这项工作的早期阶段开发的;这个列表是可编辑的,类别或单词可以在任何时候添加或删除。值得注意的是,我们的系统只能“阅读”完整的单词,而不考虑复合词或词根词。这意味着关键字列表包含特定单词的所有可能变体——单数、复数、阳性和阴性。从这些数据中,系统能够标记帖子并将它们归类。如果一个帖子使用的关键字属于多个类别,系统将把该帖子放入显示最多关键字的类别中。
我们的软件还能够根据特定页面上之前帖子的参与度来预测一个帖子的参与度。更具体地说,如果一篇文章的关键词在以前的文章中产生了很高的粘性,那么这篇新文章的粘性也会增加。
我们分析的16个Facebook页面在相关的1个月内共产生了712个帖子。如上所述,所有页面都按照所属的概要(即,医院或基金会、信息、非政府组织和个人页面)分组。
在我们之前的研究中[
尽管我们在后面的分析中添加了新的页面,但我们不必针对上面列出的那些页面创建新的类别,这表明尽管作者和页面管理员不同,但癌症主题中的主题范围仍然相似。
研究结果载于
我们为Facebook帖子的内容分析及其分类开发的软件具有简单而直观的界面,如下所示
最初,我们在软件中输入了我们创建的8个类别,以及与每个类别对应的关键字。然后,我们通过分析“Acubens,癌症博物馆”页面来测试软件,这是由我们的研究小组在6个月内创建的
误差的百分比被认为是可以接受的。事实上,根据文献[
16个页面的平均反应、分享和评论以及加权平均参与度。
集团 | Post, n (%) | 反应,意味着 | 股票,的意思是 | 评论,说 | 加权平均用户粘性 | |
|
||||||
|
团结 | 11 (10) | 524 | 346.9 | 21.4 | 111.6 |
|
周年纪念 | 0 (0) | N/A一个 | N/A | N/A | N/A |
|
机构 | 57 (52.2) | 825.1 | 161.3 | 56.4 | 115.8 |
|
证词或真实的故事 | 2 (1.8) | 179 | 26.5 | 3. | 16.4 |
|
科学与健康 | 20 (18.3) | 1263.3 | 440.5 | 47 | 186.5 |
|
事件 | 18 (16.5) | 283.7 | 52.5 | 13.8 | 35.1 |
|
美 | 0 (0) | N/A | N/A | N/A | N/A |
|
风险因素 | 1 (0.9) | 219 | 57 | 12 | 31.3 |
|
||||||
|
团结 | 19日(7.3) | 1400.7 | 227.9 | 43 | 147.9 |
|
周年纪念 | 29 (11.1) | 2209.9 | 717.4 | 27 | 274.2 |
|
机构 | 26日(9.9) | 397.3 | 72.8 | 5.7 | 38.7 |
|
证词或真实的故事 | 25 (9.6) | 1976.5 | 79.9 | 108.8 | 196.4 |
|
科学与健康 | 129 (49.4) | 143.4 | 50.7 | 3.8 | 20.1 |
|
事件 | 28日(10.7) | 114.8 | 28.4 | 30.4 | 34.2 |
|
美 | 1 (0.3) | 85 | 19 | 3. | 10.3 |
|
风险因素 | 4 (1.5) | 76.2 | 26.5 | 2.2 | 10.8 |
|
||||||
|
团结 | 76 (48.7) | 559.8 | 24.3 | 16.2 | 45.0 |
|
周年纪念 | 8 (5.1) | 1641 | 108.3 | 33.8 | 129.1 |
|
机构 | 27日(17.3) | 620.6 | 37.8 | 15.7 | 50.4 |
|
证词或真实的故事 | 11 (7.1) | 505.8 | 24.5 | 11.3 | 38.7 |
|
科学与健康 | 0 (0) | N/A | N/A | N/A | N/A |
|
事件 | 33 (21.1) | 305.3 | 84.2 | 18 | 45.6 |
|
美 | 1 (0.6) | 124 | 0 | 4 | 9.2 |
|
风险因素 | 0 (0) | N/A | N/A | N/A | N/A |
|
||||||
|
团结 | 53 (28.5) | 1885.2 | 32.8 | 48.9 | 135.5 |
|
周年纪念 | 9 (4.3) | 1320.7 | 10.8 | 29.7 | 90.5 |
|
机构 | 26日(13.9) | 340.2 | 8.7 | 7.4 | 24.3 |
|
证词或真实的故事 | 68 (36.6) | 236.6 | 18.4 | 26.7 | 35.6 |
|
科学与健康 | 0 (0) | N/A | N/A | N/A | N/A |
|
事件 | 10 (5.3) | 401.6 | 8.8 | 11.6 | 30.5 |
|
美 | 19日(10.2) | 149.7 | 8.3 | 5.9 | 16.6 |
|
风险因素 | 1 (0.5) | 20. | 1 | 2 | 2.7 |
一个N/A:不适用。
“帖子”选项卡的截图,显示页面帖子的完整列表。(来源:Corbata Informática, 2016)。
“热图”选项卡的截图,显示特定页面上较高参与度的天数和时间。(来源:Corbata Informática, 2016)。
“单词云”选项卡的截图,显示在给定页面上使用频率较高的单词。(来源:Corbata Informática, 2016)。
结果自动化分析的页面“Acubens, cancer museum”的错误数与人工分析比较。
类别 | 工具分析的岗位,n (%) | 每类错误,n (%) |
美 | 1 (0.6) | 1 (2.9) |
科学与健康 | 95 (57.2) | 4 (11.7) |
周年纪念 | 17 (10.2) | 10 (29.4) |
奖状 | 25 (15) | 14 (41.1) |
事件 | 1 (0.6) | 1 (2.9) |
风险因素 | 11 (6.6) | 1 (2.9) |
机构 | 6 (3.6) | 1 (2.9) |
团结 | 10 (6.0) | 2 (5.8) |
在这项研究中,我们观察到产生更高参与度的类别并不是那些帖子比例最高的类别。例如,在“信息页面”组中,“证词或现实生活故事”类别产生了196.4的参与度。然而,在分析期间,只有9.6%(25/261)的页面内容涉及此类主题。"信息类"中职位数量最多的类别是"科学和保健" (129/261,49.4%);然而,这一类别在用户粘性方面仅排在第六位。
我们在“非政府组织”组中观察到类似的模式。虽然产生最大粘性的类别是“周年纪念”(129.1),但只有5.1%(8/156)的页面内容属于这一类别。在这组页面中,最常见的类别是“团结”,占48.7%(76/156)。然而,这些帖子的平均参与度为45,比最成功的类别低2.8倍,在平均参与度排名中排名第四。
在所分析的职位中,另一个存在率相对较低的类别是"科学和保健";这一类别与“危险因素”一起,与癌症预防、健康和早期诊断等主题直接相关。在“非政府组织”组和个人页面上,没有任何关于这个主题的文章。然而,在“医院或基金会”组中,这一类别在平均参与度方面排名第二,这表明寻找医院和基金会信息的人比访问其他癌症相关页面的人更有可能对这些话题感兴趣。因此,我们建议医院或基金会的管理者在他们的Facebook页面上投入更多的空间来讨论这个主题。
此外,为了增加用户的参与度,页面管理员采取策略来激励用户更频繁地评论是至关重要的,因为这是一种需要更大智力努力的参与类型。考虑到评论的用户在一篇文章上投入了更多的时间,这可能就是为什么评论的平均数量低于所有类别的平均分享和反应数量的原因。
在Facebook上产生更多评论的一些最常用策略包括向用户提问并回复所有评论[
“科学与健康”类别有最多的帖子(n=95),但这也是软件犯了少量错误的一个类别——只有2个。尽管该软件不能利用出版物附带的图像或视频,但文本分析证明足以满足我们的目的。在“风险因素”类别中,11个帖子中只有一个错误。正确归入"科学和健康"类别的文本示例如下:
癌症可以通过健康受试者的细胞移植来对抗。科学家们发现,通过使用健康人免疫系统中的细胞,并将它们移植到患有癌症的人体内,可以对抗癌症肿瘤。这项研究由荷兰癌症研究所和挪威奥斯陆大学共同进行,并于上周发表在《科学》杂志上。研究人员指出,在实验室中,通过将健康捐赠者的免疫系统细胞组件插入癌症患者的细胞中,就有可能让患者的身体识别肿瘤并攻击它们。这项研究是在3名黑色素瘤患者身上进行的,黑色素瘤是一种皮肤癌。阅读更多:http://goo.gl/FgJNvv。
虽然文本包含属于其他类别的词,如“捐助者”(“团结”),但软件能够将该职位归类到适当的类别中,因为这一节中的大多数词都涉及“科学和健康”。
该软件之所以出现分类错误,很大程度上是因为该工具无法分析句子周围的上下文。例如,下面的帖子被解释为“周年纪念”,尽管研究人员将其归类为“机构”:
任何一天都是打破禁忌的一天。让我们来谈谈癌症。今天的信息是由马诺埃尔·戈麦斯录制的,他建议我们以更积极的方式看待世界。点击下面的链接观看视频[链接]了解@户田诗诗[链接]。
这个错误可能是因为“day”这个词出现了2次,而且它是这篇文章中唯一一个出现在关键字列表中的词。在出现这个错误后,我们可以考虑将“项目”一词纳入“机构”类别,因为该类别中“Acubens,癌症博物馆”的一些出版物包含了这个词。
关于内容分析,其中一个限制是我们将研究限制在巴西葡萄牙语的页面上。我们这样做是出于兴趣,希望更好地了解巴西社交媒体上关于癌症的内容,以及是什么引起了巴西人的参与。但是,今后的研究应更广泛地分析以其他国家和语言产生的内容。
关于软件,一个限制是难以为每个类别选择词语,因为有些词语可能属于不止一个类别。在许多情况下,我们必须根据研究人员的评估标准做出选择。然而,有不同经历和写作风格的人很可能会把单词归入其他类别。上面已经提到的另一个限制可能是软件不理解上下文,因此无法捕捉讽刺、笑话、含糊不清的措辞或比喻性的语言。此外,该系统无法识别常见的键入错误。
尽管存在这些限制,但我们的软件可以帮助许多研究小组和Facebook页面管理员更好地了解他们的受众想要什么,以及什么会产生粘性。该软件的其他功能,如“热图”,在这个过程中也将有很大的价值。
对帖子进行分类并计算参与率可以发现,Facebook页面的潜力往往没有得到充分利用。这可能是因为产生最大粘性的类别并不是使用最频繁的类别。相反,我们注意到,在某些情况下,最吸引人的用户粘性类别往往是最少发表的。例如,值得注意的是,许多网页在“科学和健康”类别中只有几篇文章,尽管这是最受欢迎的类别之一。事实上,与“风险因素”一起,“科学与健康”包括与公共卫生问题最相关的类别,如癌症预防、早期诊断和福祉。考虑到大量癌症病例与环境和生活方式问题有关,在社交媒体上更多地谈论预防和危险行为是至关重要的。
然而,这项研究表明,个人页面和“非政府组织”组没有产生任何关于“科学与健康”的信息。“非政府组织”小组也未能提供任何有关“危险因素”的内容。我们的研究结果表明,非政府组织应该包含更多关于科学、健康和风险因素的信息,并开始更积极地推广这些信息。
在“医院或基金会”组中,“科学与健康”类别产生的加权平均参与度最高。然而,这组页面中只有18.3%(20/109)的帖子属于这一类别。我们建议医院或基金会的网页管理员给这个主题更多的空间。
在这项研究中开发的软件肯定可以帮助对研究癌症相关主题感兴趣的研究小组。此外,关于癌症的关键字词典可以帮助那些有兴趣深入研究这一主题的人。此外,愿意创建新类别和字典的研究人员和团体可以利用我们的工具来更好地了解什么类型的内容能在目标受众中产生更大的参与度,从而收集信息以生成更有吸引力的基于web的内容。
每页名称,2017年关注人数,内容描述。
非政府组织
这项研究得到了(巴西)国家科学和技术发展委员会、巴西癌症基金会和Carlos Chagas Filho基金会(Fundação Carlos Chagas Filho de Amparo à Pesquisa do Estado do里约热内卢de Janeiro)的支持。
没有宣布。