这是一篇根据创作共用署名许可协议(https://creativecommons.org/licenses/by/4.0/)发布的开放获取文章,允许在任何媒介上不受限制地使用、分发和复制,前提是正确引用了首次发表在JMIR公共卫生和监测上的原创作品。必须包括完整的书目信息,https://publichealth.www.mybigtv.com上的原始出版物的链接,以及此版权和许可信息。
世界范围内肥胖人数不断增加,这一事实让人们对媒体向公众提供信息的努力产生了质疑。本研究试图确定主流数字新闻报道肥胖病因和与肥胖负担相关的疾病的方式。
本研究的双重目标是获得对肥胖的新闻报道的理解,并通过扩展先入为主的理论来探索数据中的意义。
从2010年到2019年的10年新闻文本比较了中国大陆、香港和台湾肥胖相关报道的发展及其对其认知的潜在影响。以9家中国主流报纸的数字新闻报道为样本,对其进行了分析。提出了一种自动内容分析工具DiVoMiner。该计算机辅助平台旨在根据单词出现和术语发现的模式组织和过滤大量数据。另一种编程语言Python 3用于探索聚合交互创建的连接和模式。
自2016年以来,共有30968条新闻受到越来越多的关注。报纸对肥胖传播的报导强度最高的地区是台湾。总体而言,人们更关注肥胖的两个共同诱因是压力(n=4483, 33.0%)和烟草使用(n=3148, 23.2%)。肥胖和心血管疾病的负担被认为是最大的,尽管边缘中心性的聚合相互作用显示“癌症”和肥胖之间的联系最高。这项研究超越了传统的新闻研究,扩展了计算和可定制的基于网络的文本分析框架。这可能会为从事数据项目的研究人员和从业者树立一个标准,他们主要是为了进行创新尝试。
与以往的研究相似,肥胖流行和个人痛苦之间的论述是最强调的方法。我们的研究还表明,将健康问题归咎于个人因素的倾向可能会限制解决这一问题的社会和政府责任。
全球范围内,包括中国在内的肥胖患病率都在上升,中国是世界上人口最多的国家。最近一份关于中国的报告显示,4640万女性(14.9%)和4320万男性(10.8%)肥胖,这反映了一个重大的健康挑战[
新闻在向普通读者或订阅的同行传播可靠信息方面发挥着重要作用。目前的文献在报道新闻内容时采用了框架理论,该理论强调了新闻故事中主题的某些方面,以帮助定义健康问题[
在这项研究中,肥胖问题从两种方法来解决:首先,我们面临着媒体权力的新的集中,导致了关于数据地理位置和不同数据相关实践的新的不平等和不安全感[
其次,关于健康问题新闻内容分析的研究中,英语以外语言的研究相对较少[
本研究通过解析非结构化数据的含义来指导决策,研究了与肥胖相关的推理的原因和强度。这项研究的双重目标是了解肥胖是如何在新闻中被报道的,以及肥胖传播的时间表,以及新闻话语对病因、痛苦问题和与肥胖负担相关的疾病的说法。我们借鉴了计算文本分析的最新进展,开发了一种大规模数字课程演绎分析的混合方法[
分析包括对中国大陆及其两个邻近地区(台湾和香港)的数字新闻工作进行比较。考虑到中国文明中不同的政府路径和社会经济发展,这种比较是有意义的。新闻内容还突出了媒体环境和公众传播的重点,这可能会影响读者对医疗管理的看法。
将机器计算的概念基础应用于文本分类。对一类已建立的大型文本语料库进行了理论辅助(驱动和计算机)分类。鉴于数字媒体的自然话语,语言预处理是否能提高分类质量一直存在争议。因此,为了研究网络读者的肥胖传播趋势和模式以及肥胖报道的中介关系,提出了6个研究问题:
肥胖流行报道的趋势是什么?随着时间的推移,数字新闻报道的模式是如何发展的?
新闻报道的肥胖与哪些病因有关?
新闻报道中提到了哪些与肥胖有关的疾病?
哪些与肥胖相关的病因和疾病被忽视了?
通过考虑总效应(直接和间接变量的组合),与肥胖负担相关的可观察变量(病因和疾病)的相关性强度如何?
健康新闻采用什么类型的消息框架(主题或情节)?
研究方案包括通过检索网络来源定义新闻文本文档,并测试数据的深度和规模。以往的研究强调了将计算和人工技术相结合的重要性,以保持传统内容分析的优势和大数据分析的创新大规模能力[
机器计算算法被用于一个提议的平台,DiVoMiner。文本处理工具是一种用于自动内容分析的现代技术。它的设计目的是根据单词共现和术语发现的模式来组织和过滤大型文档档案[
自动内容分析以识别突出问题已成为一种常用的方法,特别是在传播科学中[
其中一项任务是让新闻文章更容易被发现。因此,每篇包含关键字、句子中的短语或关于肥胖的断言的文章都进行了采样和筛选。该过程涉及先导编码、后续修改和双重编码,可以提高编码效率和数据质量[
DiVoMiner计算机辅助分类混合与自动内容分析的工作流程。
数字新闻工作的抽样标准与以往研究的标准一致,考虑了以下三个标准:新闻媒体的高发行量、数字档案的可访问性以及来自人口最多且肥胖问题严重的城市[
例如,中国大陆的三家抽样报纸着重于揭示国家影响对新闻生产的潜在影响。它可以被认为是政府的喉舌。不过,相对于国有和受控制的媒体,台湾和香港以商业为导向的新闻机构被取样,以了解它们的编辑运作,这可能符合它们所期望的投资组合。
总共选出了9份报纸:
确定关键字的过程包括通过pkusseg - python将单词收集并提取到意义组中。因此,分词工具包提供了可接受的准确性,以满足本研究中中介关联的要求[
在中文词典中,许多涉及肥胖及其因果关系的词汇似乎是可以互换的,尽管“原因”一词通常用于表达一个因素对其结果承担责任,而“导致”则用于表达某种行为或事件的结果。因此,从新闻角度为与肥胖相关的传播开发了一个包含关键词、短语、因果关系、病因推断和可能与肥胖相关的疾病的定制码本。代码本与手动注释一起以快速、简单、但更有效和令人满意的方式进行了多次测试。
起草的代码本由13个目标词、13种病因和7类非传染性疾病(NCDs)组成,改编自以往的研究[
我们的结果包括11个目标词、11种病因和4种与肥胖覆盖率特别相关的疾病类别。修订后的代码手册维持了中国报纸将肥胖疾病列为非传染性疾病的框架。中显示了肥胖目标词、因果关系相关术语、肥胖病因和疾病的中文和英文翻译列表
为了确保机器分析的有效性和可靠性,使用了手动程序来确保生成的文本的计算过程更可靠,包括常用术语、主题和因果联系[
之前的沟通研究建议编码员之间的一致性为80%作为可接受的最低限度[
因果关系是一种语篇分析,通过提取原因和结果之间的语义关系来学习和预测句子的结构[
对于相关性和总效应分析,使用Python3 NetworkX检查网络。以与肥胖相关的术语概念为节点,以文章号为权重。介间中心性是通过考虑网络中所有对的最短路径[
共有13个目标词、11种病因和4类疾病与肥胖报道密切相关,这维持了中国报纸将肥胖疾病作为非传染性疾病的框架。基于语义学的对比分析,情景主题强调了6个变量,包括个体与压力、吸烟、过度饮酒、身体活动减少、饮食不当和吸毒相关的行为。相比之下,主题主题包括遗传疾病、环境污染、家庭状况、贫穷的经济状况以及社会和经济制度5个变量。在新闻中,心血管疾病、代谢性疾病、癌症和自身免疫性疾病等四种主要疾病被确定为与肥胖有关的主要致病因素。
从2010年到2019年,共确定了30968篇关于肥胖及其因果推理的病因学的文章,这表明随着时间的推移,人们的关注度有明显的增加趋势。为了便于在不同媒体发展过程和文化之间进行比较,中国大陆与邻近的港台地区肥胖相关文章的数量和排名存在显著差异(
2010 - 2019年中国大陆、香港和台湾地区新闻报道中肥胖与因果关系的趋势和发展。
总体分析显示,与肥胖流行相关的新闻文章在2019年达到峰值(n=5183, 16.7%),其次是2018年(n=4890, 15.8%)和2017年(n=4432, 14.3%)。肥胖及其病因及相关疾病的平均覆盖率为3097篇/年。相比之下,在台湾的新闻话语中观察到高于平均水平的报道。从2010年到2017年(范围从1746篇到2744篇),报告出现了低于平均水平的趋势。台湾(n=15,571)的新闻报道强度最高,其次是香港(n=8103)和中国大陆(n=7294)。
2010 - 2019年中国大陆、香港和台湾的中文报纸上与肥胖相关的新闻文章的分布情况。
一年 | 与肥胖相关的新闻文章,n (%) | |||
|
中国大陆(n=7294) | 台湾(n = 15571) | 香港(n=8103) | 所有(n = 30968) |
2010 | 453 (6.2) | 602 (3.9) | 691 (8.5) | 1746 (5.6) |
2011 | 673 (9.2) | 985 (6.3) | 616 (7.6) | 2274 (7.3) |
2012 | 798 (10.9) | 994 (6.4) | 693 (8.6) | 2485 (8.0) |
2013 | 759 (10.4) | 797 (5.1) | 716 (8.8) | 2272 (7.3) |
2014 | 431 (5.9) | 1652 (10.6) | 661 (8.2) | 2744 (8.9) |
2015 | 650 (8.9) | 922 (5.9) | 650 (8.0) | 2222 (7.2) |
2016 | 519 (7.1) | 1520 (9.8) | 681 (8.4) | 2720 (8.8) |
2017 | 927 (12.7) | 2367 (15.2) | 1138 (14.0) | 4432 (14.3) |
2018 | 1077 (14.8) | 2643 (17.0) | 1170 (14.4) | 4890 (15.8) |
2019 | 1007 (13.8) | 3089 (19.8) | 1087 (13.4) | 5183 (16.7) |
在最初收集的30968篇(54.9%)文章中,有16991篇提出了肥胖覆盖率的病因学属性。报纸对肥胖病因的报道强度最高的地区是台湾(n=8090, 47.6%),其次是中国大陆(n=5584, 32.9%)和香港(n=3317, 19.5%)。总体而言,人们更加关注肥胖的3个共同的致病推论,如压力(n=4483, 26.4%)、吸烟(n=3148, 18.5%)和基因(n=2418, 26.4%)。
相比之下,肥胖的一个常见因果属性,社会和经济制度(n= 7,0.2%)在所有报纸上的报道最少。在中国大陆(n= 47,1.1%),在中国大陆(n= 24,1.6%)和香港(n= 12,2.1%),一种导致社会经济贫困的病因(n= 24,1.6%)的覆盖率也很低。简而言之,受管制的新闻媒体和以商业为导向的新闻媒体之间的共同肥胖原因的数量和排名有显著差异(
在三个方面使用情景(个人)与主题(非个人)代理的模式是相似的。在总计16,991篇文章中,与主题条件的影响(n=3404, 20.0%)相比,偶发性风险因素构成了肥胖的主要原因(n=13,587, 80.0%)。具体而言,与肥胖相关的偶发性主题数量在台湾地区最高(n=6563, 48.3%),其次是中国大陆(n=4283, 31.5%)和香港(n=2741, 20.2%)。在所有报纸上,包括压力、吸烟和过度饮酒在内的病因与肥胖报道密切相关。
在语义概念对比分析中,与肥胖相关的主题数量也以台湾地区最多(n=1527, 44.9%),其次是中国大陆地区(n=1301, 38.2%)和香港地区(n=576, 16.9%)。遗传导致了61.6%-80.7%的肥胖。
2010 - 2019年中国大陆、香港、台湾地区2个主题的新闻报道中肥胖的因果属性比较
肥胖的因果属性 | 新闻文章,n (%) | ||||||||
|
Mainland China | 台湾 | 香港 | 所有 | |||||
|
4283 (100) | 6563 (100) | 2741 (100) | 13587 (100) | |||||
|
压力 | 1523 (35.6) | 2046 (31.2) | 914 (33.3) | 4483 (33.0) | ||||
|
烟草的使用 | 944 (22.0) | 1635 (24.9) | 569 (20.8) | 3148 (23.2) | ||||
|
酒精滥用 | 863 (20.1) | 1121 (17.1) | 430 (15.7) | 2414 (17.8) | ||||
|
缺乏体育活动 | 500 (11.7) | 1102 (16.8) | 552 (20.1) | 2154 (15.9) | ||||
|
不当的饮食 | 406 (9.5) | 590 (9.0) | 262 (9.6) | 1258 (9.3) | ||||
|
药物使用 | 47 (1.1) | 69 (1.1) | 14 (0.5) | 130 (1.0) | ||||
|
1301 (100) | 1527 (100) | 576 (100) | 3404 (100) | |||||
|
遗传疾病 | 801 (61.6) | 1152 (75.4) | 465 (80.7) | 2418 (71.0) | ||||
|
环境污染 | 348 (26.7) | 278 (18.2) | 76 (13.2) | 702 (20.6) | ||||
|
家庭地位 | 63 (4.8) | 71 (4.6) | 19日(3.3) | 153 (4.5) | ||||
|
社会经济不景气 | 88 (6.8) | 24 (1.6) | 12 (2.1) | 124 (3.6) | ||||
|
社会经济体系 | 1 (0.1) | 2 (0.1) | 4 (0.7) | 7 (0.2) |
中国报纸中与肥胖传播相关的疾病主要有心血管疾病、代谢性疾病、癌症和自身免疫性疾病4类。在最初收集的30968篇文章中,关于肥胖相关疾病的新闻报道有20111篇(64.9%)。台湾地区对肥胖相关疾病的新闻报道强度最高(n= 10622, 52.8%),其次是中国大陆(n=5432, 27.0%)和香港(n=4057, 20.2%)。
最受关注的疾病类型有三种:心血管疾病(n=8477, 42.2%)、代谢性疾病(n=6869, 34.2%)和癌症(n=4762, 23.7%)。自身免疫性疾病与肥胖相关的报道相对较少(n= 3,0.0%),而其他疾病(如肌肉骨骼或神经系统疾病)则完全被忽略。与肥胖相关的疾病在9份报纸中也有显著差异(
为了检验与肥胖相关的交流相关的疾病病因的强度,网络分析显示了由聚合相互作用创建的连接。由于对中介度EC的测量,因果效应与中介度中心性之间的秩相关为0.17。其中,“肥胖”与“癌症”两个词的聚合相互作用最高(EC=0.133),其次是“肥胖”与“代谢性疾病”的中介关系(EC=0.030),“肥胖”与“心血管疾病”的中介关系(EC=0.024)。
2010年至2019年中国大陆、香港和台湾的新闻报道中与肥胖相关的疾病类型。
疾病的类型 | 与肥胖相关的新闻文章,n (%) | |||
|
中国大陆(n=5432) | 台湾(n = 10622) | 香港(n=4057) | 所有(n = 20111) |
心血管疾病 | 2306 (42.5) | 4349 (40.9) | 1822 (44.9) | 8477 (42.2) |
代谢疾病 | 1951 (35.9) | 3593 (33.8) | 1325 (32.7) | 6869 (34.2) |
癌症 | 1175 (21.6) | 2678 (25.2) | 909 (22.4) | 4762 (23.7) |
自身免疫性疾病 | 0 (0.0) | 2 (0.0) | 1 (0.0) | 3 (0.0) |
结果显示,超重和肥胖与21种癌症以及11种行为和环境因素的风险增加有关。肾细胞癌(RCC)是肾癌发病率上升的主要类型;此外,正如新闻报道的那样,肥胖是RCC公认的危险因素之一。此外,个人行为的几个因素,如不良饮食和身体活动太少,而环境变量的因素,包括污染和贫穷的社会经济被观察到。
根据2010年至2019年中国大陆、香港和台湾的新闻文章中与肥胖相关的病因和非传染性疾病,每个顶点的中间中心性从最小(黄色)到最大(蓝色)进行颜色编码的直接图表。
肥胖的高患病率与巨大的医疗、社会和经济负担有关。随着时间的推移,中国的新闻报道对肥胖病因的因果推断显示出明显的增长趋势。这也表明,慢性压力与肥胖密切相关。压力和肥胖之间的联系会导致过度摄入高脂肪、高糖和高热量的食物,这反过来又会导致体重增加。在分析观察到的疾病负担和肥胖相关覆盖率之间的关联强度时,我们发现心血管疾病是最常见的疾病类型。相比之下,由肥胖引起的代谢功能障碍和炎症在新闻中被忽视,尽管科学证据表明,由肥胖引起的代谢功能障碍会导致各种各样的神经系统紊乱和影响[
同样明显的是,数字新闻经常将肥胖概念与“心血管疾病”、“代谢疾病”或“癌症”等非传染性疾病联系起来。目前中国新闻中流传的信息为广大公众敲响了警钟,他们一直不太认识到肥胖是一种疾病,而且是一种与非传染性疾病相当的危险疾病。此外,媒体内容仍然强调肥胖仅仅是生活方式的问题,或者更糟糕的是,由于缺乏意志力而导致的道德沦丧。因此,新闻报道中的沟通或建议通常只是少吃多运动,这对大多数肥胖患者来说可能是无效的,那些成功减肥的人往往很快就会反弹回来。这不是意志力的问题,而是身体已经进化出复杂的生理过程,通过代谢、激素和神经行为的变化来积极抵制减肥。
在对肥胖的2个共同的致病属性(如压力和吸烟)进行了更强烈的关注之后,另外3个致病推断(包括遗传疾病、过度饮酒和体育活动减少)也经常被提及。在所有报纸上,肥胖的四个主要原因是个人处理压力的责任、烟草、酒精和体育活动的减少。具体而言,饮酒与肥胖的因果推论在中国大陆突出,而压力、吸烟和体育活动减少在香港和台湾受到更多媒体关注。显示各种因果推论的模式可以理解为该地区肥胖交流的独特特征的指示。
与现有文献一致[
相对于商业驱动的新闻,国有媒体可能有一定的优势,健康教育工作者可能会考虑。例如,中国大陆的国有媒体可能比香港和台湾的商业和私营新闻机构拥有更多的读者。一份以市场为导向的报纸,如香港的《苹果日报》,将体育活动减少与肥胖联系在一起的次数最多的是随意推理,其次是遗传特征和肥胖担忧。相比之下,台湾的《联合报》更关注脂肪量和肥胖相关基因,其次是缺乏体育活动,这是肥胖的因果属性。同样,中国大陆的《广州日报》将肥胖与遗传疾病联系起来,其次是缺乏体育锻炼的后果。
本研究旨在了解关于肥胖的新闻报道的结果和影响的主题和场景是如何重建和采取行动的。调查性新闻报道的实质应该证明,当代数字新闻媒体的最佳特征是,它是一种关于肥胖及其潜在可传播性的叙述性短传播。如今,我们面临着新的权力集中,导致在数据所有权、数据地理位置和数据解释方面出现新的不平等和不安全。了解肥胖流行的报道可能会改变健康研究人员、记者和医疗专业人员的实践,因为肥胖相关疾病的严重程度将发生变化。
媒介文本中的因果联系可以是显性的,也可以是隐性的。在过去的十年中,对干预措施的许多因果推论和效果进行了评估[
其他观点与以前的报告一致。首先,健康新闻在促进公众健康方面可以发挥积极作用,也可以在引起不必要的恐惧方面发挥消极作用[
其次,中国新闻对肥胖疾病的基因解释频率最高(61.6% ~ 80.7%)。据报道,新闻报道经常通过夸大基因和肥胖之间的因果关系来歪曲遗传学[
有几个限制是值得注意的。本研究的目的是在新闻报道中确定肥胖传播的因果推断模式。对大量的新闻数据进行分类和考虑新闻特征帧的混合存在挑战和局限性。在新闻报道范围的变化中,新闻作为一个专业领域出现了重大问题。此外,在建议干预和促进媒体教育方面,读者的复杂性可能相当具有挑战性。基于互联网的新闻在移动设备上的快速传播也为链接传播效果带来了限制。
计算方法存在一些挑战,包括缺乏自动化内容测量及其信息解释的标准。虽然本研究中的隐性因果推论可能暗示或推断因果关系,但肥胖相关疾病的文章数量可能不完全具有代表性。在类似的研究中,这些都归因于语言的复杂性[
从以往的研究和肥胖干预等流行病学问题中获得的经验应有助于扩大所需的健康举措,并增加防止后代面临肥胖后果的可能性。包括肥胖沟通在内的干预措施不是直接的,而是以混杂因素为条件的。随着新特性的引入和编程语言的不断发展,数据新闻的高级量化研究、基于代理的建模和新闻研究的实验研究等混合方法被提出。
本研究调查了2010年至2019年有关超重的影响和影响及其与病因和疾病的潜在联系的新闻工作。我们的研究结果显示,随着时间的推移,关于肥胖的报道发生了变化,它所采取的路径,以及围绕这个话题的词汇和短语。共有21种癌症和11种行为因素被确定与超重和肥胖相关的沟通直接相关。总体而言,报道的增加趋势说明了新闻和公共健康问题在支持肥胖传播方面的相互作用。
与特定不健康行为相关的新闻内容出现在一半以上的文章中。与此同时,与肥胖流行相关的非传染性疾病也经常出现在60%以上的文章中。两种框架被认为是有益的讨论,结论是肥胖的框架涉及个人层面而不是社会层面的病因。在未来的研究中,我们提出了一个更普遍的框架,因为我们的研究结果表明,要比表面上的讨论复杂得多。
随着基于网络的新闻数量的增加和计算方法的结合,从大量数据中提取意义并将计算算法应用于非结构化数据成为可能。特别是,很少有研究关注中国的数据,因为实证和理论研究的代表性严重不足。然而,这项研究通过收集元数据来支持和反驳我们的怀疑,使媒体分析超越了传统内容分析的领域。
肥胖相关的中文关键词及英译
新闻媒体中概念术语的英译实例。
边缘中心
非传染性疾病
肾细胞癌
本研究由澳门大学(MYRG2019-00079-FSS和MYRG2018-00062-FSS)资助。作者要感谢Angus WH Cheong教授和Wenny Cao为使用DiVoMiner提供的帮助,以及匿名审稿人和编辑提供的宝贵意见。
AC设计了本研究的主要概念;PS构思了该研究并设计了代码本;AC、ML、WJ进行数据验证和数据分析;AC和WJ撰写并编辑了本文。所有作者都认可并推广了手稿。
没有宣布。