这是一篇在知识共享署名许可(https://creativecommons.org/licenses/by/4.0/)下发布的开放获取文章,该许可允许在任何媒介上不受限制地使用、分发和复制,前提是原始作品首次发表在《医学互联网研究杂志》上,并适当引用。必须包括完整的书目信息,到//www.mybigtv.com/上原始出版物的链接,以及版权和许可信息。
“数据拯救生命”是一项公众参与活动,强调大数据研究的好处,旨在建立公众对这一新兴研究领域的信任。
这项研究探讨了#DataSavesLives标签是如何在Twitter上使用的。我们关注的是英国政府及其机构采用#DataSavesLives来支持他们建立一个保存国民健康服务(NHS)用户医疗数据的新数据库的计划。
在2021年4月19日至7月15日期间发布的公共推文,使用标签#DataSavesLives使用NCapture for NVivo 12保存。所有的推文都被编码了两次。首先,每条推文都被赋予积极、中立或消极的态度。其次,进行归纳主题分析。专题分析的结果被划分为三种公众参与模式:赤字、对话和参与。
在1026条可用于定性分析的独特推文中,围绕#DataSavesLives的讨论大部分是积极的(n=716, 69.8%)或中立的(n=276, 26.9%),对该活动持有限的负面态度(n=34, 3.3%)。#DataSavesLives辩论的主题包括道德分享、积极吸引公众参与、与公众共同创造知识、利用潜力以及对大数据研究的理解。推特上的言论大多对竞选持积极态度。该标签主要由志同道合的推特用户使用,用于分享有关大数据项目的信息,并在出现公众争议时传播有关大数据研究的积极信息。这个标签通常由支持大数据研究的组织和个人使用。推特作者认识到公众应该积极参与大数据项目。竞选活动仍以英国为中心。结果表明,围绕大数据研究的交流是由专业社区推动的,并且仍然是单向的,因为公众成员很少使用标签。
研究结果显示了社交媒体的潜力,但也引起了人们的注意,即标签的使用通常局限于“Twitter泡沫”:一群志同道合的Twitter用户。
研究人员与公众分享知识的行之有效的方法包括学术出版物、演讲和媒体参与(仅举几例)。然而,先前的研究提出了一种担忧,即科学家和公众之间的交流需要比传统的参与活动更容易获得和互动[
大数据研究中的一个关键问题,也是公众长期争论的一个主题,是医疗数据的再利用。它通常被称为大数据,具有提供新的卫生解决方案和改善卫生不平等的潜力[
“数据拯救生命”是一项公众参与活动,强调大数据研究的好处,展示如何安全地使用患者数据来改善医疗保健[
2021年,英国政府及其机构采用了#DataSavesLives标签,以支持他们建立一个新的国家数据库的计划,该数据库包含国民健康服务(NHS)用户的医疗数据,在某些情况下,这些数据可以与第三方共享。
之前的研究探讨了公众对大数据研究的看法,但很少有人研究在线公众参与活动如何促进大数据研究的好处。一篇论文在Twitter上讨论了#DataSavesLives,但它的报道时间是从2016年9月到2017年8月[
科学传播作为一个研究领域出现在不同的领域,并为研究人员如何与公众接触提供了理论基础[
赤字模式是最古老的,也是现在备受批评的模式,因为它是一种过于被动的交流形式[
对话模式的发展是为了回应公众对一般研究(尤其是医学研究)的不信任,以及赤字模式在成功应对这一挑战方面的失败和被动[
参与式模式进一步改变了研究人员和公众之间的权力平衡,主张在交流中以公众为中心。研究人员和公众讨论研究议程,与对话模式相反,他们也共同寻找解决方案。这一进程的民主化被认为有可能提高信息的质量并使公众接触到这些信息[
在公众参与(赤字、对话和参与)模型的基础上,本研究旨在回答以下研究问题:
当英国政府在其竞选策略中使用#DataSavesLives标签时,该标签在Twitter上是如何使用的?
Twitter用户对使用#DataSavesLives的活动持什么态度?
推文是用b谷歌Chrome的NCapture软件记录的。这个网页浏览器扩展收集社交媒体数据,如推文(包括转发),并将其直接导入NVivo 12 (QSR International)进行分析。只有前一周的公开推文才能被记录。NCapture并不能保证所有的tweet都会被一次捕获,因为这取决于Twitter;因此,我们每周捕获两次tweet(周二和周四)以获得最大的覆盖率。如果一条推文被捕获两次,NVivo 12只会将其上传到数据集中一次。使用#DataSavesLives标签的推文被捕获了3个月,从2021年4月27日到7月15日。这涵盖了2021年4月19日至7月15日期间发布的推文。总共收集了3638条tweet(包括转发)。我们在NVivo 12中清理了数据集(见
为定性分析清理数据集的过程。
使用NVivo 12进行分析。NCapture将tweet作为1个数据集下载到NVivo 12软件中,这使我们能够将收集到的数据可视化。
描述性统计用于总结前40个用户位置,最活跃的账户,以及与#DataSavesLives一起使用的最热门标签,并确定最突出的推文(基于转发数量)。我们在分析中包括了推文和转发,以获得使用该标签的所有Twitter用户的更广泛的情况。
为了了解推特用户对活动目标的态度,每条原始推文都被手动划分为对活动和大数据研究持积极、中立或消极态度的类别。在内容分析中发现的原则和技术指导了这一过程[
其次,我们进行了归纳性专题分析[
利物浦大学伦理委员会(批准号:9815)获得了道德上的认可。所有捕获的数据都在网上公开。遵循既定惯例[
在此期间发布的所有推文(N=3638)中,排名前40位的地点(不包括“unknown”)都来自英国,这表明该标签的使用仍然主要集中在英国。其他国家包括美国、澳大利亚、德国、西班牙和比利时
其中最著名的一条推文被转发了56次,它讨论了一个关于大数据研究的新网络研讨会,以及对数据隐私的担忧。一些组织,如英国健康数据研究,经常使用标签[
与该活动一起使用的大多数标签都是中立或积极的。前10名包括#healthdata (n=239, 65.8%)、#covid (n=134, 3.7%)、#nhs (n=102, 2.8%)、#ai (n=101, 2.8%)、#healtac2021 (n=91, 2.5%)、#digitalhealth (n=89, 2.4%) #health (n=88, 2.4%)、#testmining (n=84, 2.3%) #research (n=81, 2.2%)和#data (n=65, 1.8%)。推特用户指责英国政府试图出售他们的医疗数据时使用的负面反运动标签#DataGrab在整个数据集中出现了9次,在原始推文中出现了5次,因此很少与#DataSavesLives一起出现,这两个标签之间几乎没有交叉。
使用#DataSavesLives的推特用户位置(N=3638条推文)。
国家 | 微博, |
联合王国 | 2247 |
欧盟(包括西班牙、德国和比利时) | 76 |
美国 | 56 |
澳大利亚 | 44 |
使用#DataSavesLives的10个最活跃的Twitter账户。
Twitter帐户 | 推文使用#DataSavesLives, n (%) | 运行该帐户的组织类型 |
@hdr_uk | 480 (13.2) | 非营利组织 |
@usemydata | 353 (9.7) | 非营利组织 |
@nhsx | 261 (7.2) | 公共机构 |
@nhsdigital | 132 (3.6) | 公共机构 |
@datasaveslives | 125 (3.4) | 非营利组织 |
@apha_analysts | 97 (2.7) | 网络 |
@uk_healtex | 85 (2.3) | 网络 |
@economics_unit | 68 (1.9) | 公共机构 |
@medconfidential | 66 (1.8) | 运动组织 |
@pioneer_hub | 63 (1.7) | 非营利组织 |
关于#DataSavesLives的讨论主要是积极的(n=716, 69.8%)或中立的(n=276, 26.9%)。在负面态度中有一些讽刺(n=34, 3.3%),但没有黑色幽默或人身攻击,这在其他一些Twitter研究中也有发现。这表明,与许多政治化的社交媒体讨论相反,辩论总体上是以专业的方式进行的[
积极的评论包括报告成功的、正在进行的或未来的项目,这些项目在使用大数据时使公众受益。
该大学正与来自英国各地的专家合作,启动一个耗资200万英镑的心理健康数据中心。该中心承诺加快对心理健康的研究,提高对弱势群体的包容性#心理健康#数据拯救生命#
在大数据如何帮助应对COVID-19大流行的例子中,可以看到这种公共利益的证据。
当2020年大流行来袭时,我们紧急研究了是否可以使用常规数据馈送来生成更快速的癌症数据集,以帮助量化COVID-19对癌症服务的影响。这是如何工作的一个例子,现在正在使用#DataSavesLives @PHE_uk https://t.co/4Eu1QgxXGm
Twitter用户经常强调他们在大数据研究方面的工作是多么重要或相关,从而将其与该活动的基本原理联系起来,即表明医疗数据的再利用可以改变甚至挽救人们的生命。
我们的中心正在努力改善健康数据,以便研究人员和创新者能够更好地利用它来实现改善人们生活的发现!了解更多信息:https://t.co/ZKQoaUWSos
通常,组织会引用涉众(例如,公众成员)来支持这些声明。有人呼吁更多的公众参与和更好的数据联系。
中性推特分享工作机会、即将召开的会议、网络研讨会或新出版物的信息,并要求人们参与有关大数据研究的调查或研究。
5月25日(星期二)10:00 -11:30,听取超级小组的演讲-一位研究人员访问患者数据的旅程。# datasaveslives # admindata
负面推文并不总是针对该活动本身,但引发了公众对英国新数据库计划选择退出期限缺乏信任的担忧。另一些人则注意到了这个标签中的措辞,指出这个标签只吸引专业人士,而不是公众,它利用情绪来试图获得公众的支持。
在我看来,这个计划的完全放肆的本质是如此可恶#DataSavesLives'经典的'诉诸情感'作为教条一再被推出,试图颠覆逻辑#DataAsAsset显然更接近现实
我们构建了5个相互关联的主题,分为5个子主题(
通过反身性主题分析,从推特上的#DataSavesLives辩论中衍生出主题和子主题。
主题 | Subthemes |
道德的分享 |
信任和透明度 保障个人权利 |
积极参与公众活动 | N/A一个 |
与公众共同创造知识 | N/A |
利用潜力 |
兴奋 改进空间 产生共鸣的座右铭 |
了解大数据研究 | N/A |
一个-不适用。
主题和子主题之间的关键连接器和关系。
总的来说,推特作者认为大数据有可能为患者带来好处(例如,在新药开发中)。利用大数据的潜力可以从以下三个主题中看到:兴奋、改进空间和共鸣座右铭。COVID-19大流行在这里是存在的,但只是作为大数据研究有助于应对新挑战的说法的额外论据。
推特的作者通常很兴奋地宣布新的研究项目和分享研究结果(特别是当展示它如何产生一些根本性的变化或对现实生活产生潜在影响时)。其中一些推文包括对这一主题充满热情的作者,以及对参与新研究感到兴奋的人。研究人员的成功得到了更广泛的研究界的认可和注意(例如,获得了奖项)。其他tweet指的是即将到来的事件,作者正在宣传他们的下一个演讲(这既指单个事件,也指会议)。
这是我近距离看过的最激动人心的飞行员之一。我们如何将患者数据联系起来,分析告诉我们什么,以及我们如何提供证据,为患者的利益做出改变。# datasaveslives
支持该活动的座右铭是,将数据和大数据研究联系起来,可以挽救并改善人们的生活。这是一个引起共鸣的座右铭,许多推特都在谈论医疗数据的使用如何产生影响并提供新的解决方案。推文要么是一般性的(与大数据研究的好处有关),要么是指具体的研究项目(包括已完成的和正在进行的)。
“数据让未知成为已知”@margaretgrayson @useMYdata @NHSConfed #NHSReset #datasaveslives
推特还主张进行一些改革,以确保大数据的最大效益。有人呼吁加大对大数据研究基础设施的投资,这表明大数据研究仍在发展中。
预测性数据建模可以带来更好的人道主义结果,但我们缺少所需数据的一半。是时候行动了!# DataSavesLives。
Twitter用户也认识到,为了从研究中获得更多好处,必须尽快做出一些改变。
在关键的七国集团会议之前,@NMRPerrin认为迫切需要在全球数据共享领域进行更好的协调https://t.co/aw8Apgw5Ku #datasaveslives @GS_Humphreys @royalsociety @GloPID_R
这个主题是关于接触他人(包括公众,但主要是其他专业人士、政策制定者和研究人员),并提供一个机会来更多地了解个别项目。
这个标签提供了一个号召人们行动起来、申请职位空缺(主要是研究相关的)和欢迎新团队成员的机会。一些推文要求其他研究人员支持大数据研究或回答正在进行的咨询或调查。
只剩下几天的时间来申请这个了!与优秀的团队合作,使#HealthData基础设施能够支持# covid - 19 #研究。欢迎借调,远程工作,工作地点灵活。# HealthData # DataSavesLives
这说明了志同道合的人是如何使用这个标签来宣传新的机会和事件的。
twitter还允许读者更多地了解大数据项目、参加活动、关注在线聊天以及阅读最近的博客或论文。这主要是被动的,侧重于传播而不是参与。
看看这个来自@HDR_UK的帖子,看看#DataSavesLives在整个6月是如何添加的
在大数据研究中,道德、安全和合法地共享数据的必要性以及正确使用数据的重要性是数据中的一个突出主题。两个分主题涉及实现这些目标的关键方面:保护个人权利以及信任和透明度。
人们一致认为,大数据研究为创新提供了新的机会。然而,对个人权利的影响仍然是主要的关切。这主要是关于如何使用数据,谁有权访问,数据的安全性,以及是否可以识别患者。许多组织试图通过告诉人们任何数据的使用都是安全和透明的来打消人们的疑虑。
有人担心,健康数据可能会出售给私营公司以获取利润。一些推文将这种担忧与英国人选择不使用他们的医疗数据进行研究的决定联系起来。一些人承认,公众没有适当或充分地参与到这些问题中来。
@Axelheitmueller,你完全正确,数据共享的好处对我们国家的健康是巨大的。出于某种原因,有一种说法认为我们打算从数据中获利。事实并非如此。我们没有,也不会出售数据!# datasaveslives
与个人权利相关的是信任和透明度,这是公众支持大数据研究的基础。推特的作者认为,公众信任是大数据研究成功的关键,数据共享的过程必须透明,并遵循既定的原则。否则就会失去信任,动摇国民的支持。”英国国内有人评论说,最近的政治事件破坏了这种信任,#DataGrab标签也表明了这一点。信任和透明度被视为成功研究项目的基石,往往是支持公众参与的基本原理。
分享我的数据可以帮助改善我和其他慢性病患者的医疗保健所需的研究。然而,确实需要更明确地保证数据不会被滥用,这样个人才能做出明智的选择。#GPDPR #nhsdataoptout #DataGrab #datasaveslives
推特上有一种推动,希望更好地与公众接触,并鼓励有关大数据研究的对话。解决这一问题的一些方法包括避免使用术语,并确保活动是免费参加的。还有一些媒体参与,推特用户分享了研究人员参加媒体采访的链接。此外,媒体机构被标记为Twitter用户,试图引起他们的注意。这些参与活动旨在帮助公众更好地了解大数据研究的价值。然而,如果他们把自己局限于只向公众解释大数据研究,他们可能会被视为遵循一种赤字参与模式,并伴有相关的局限性。
健康数据研究有时会令人困惑,充满了流行语和行话。本文清楚地解释了如何使用健康数据以及为什么它如此重要。如果你把你的数据捐赠给健康研究,你可以帮助改善未来的医疗保健。# DataSavesLives # DataScience
公共贡献者可以成功地参与大数据研究。他们是积极为研究项目做出贡献的公众成员,确保研究得以进行
推特指的是让公众成员参与大数据项目。在这个主题中,呼吁更多的公众参与。推特作者展示了一些例子,说明公众作为积极贡献者如何对他们的研究产生积极影响。
有人呼吁加强公共控制,感谢患者为研究分享他们的医疗数据(而不是选择退出),并呼吁在大数据项目中招募新的公共贡献者。
如果没有我们的数据信任委员会,这一切都不可能实现。数据信任委员会是一个由患者和公众组成的多元化和包容性的组织,他们审查每一个数据访问请求,并根据“五大安全”原则做出决定,最终以公众的最佳利益为基础。# datasaveslives
让患者参与登记或数据收集也很重要。还有公民,因为他们产生数据,因此,作为数据的所有者,他们也应该在“数据表”上占有一席之地。#患者参与#数据挽救生命#MTF2021
这项研究探讨了#DataSavesLives在Twitter上的使用情况。调查结果清楚地表明,辩论大多对竞选持积极态度。这并不奇怪,因为大多数参与者都是从事大数据研究的组织、学者和机构。我们的发现证实了之前对#DataSavesLives标签的研究——它被用来识别围绕大数据的类似项目,并传播对大数据研究的积极信息,尤其是在存在公众争议的情况下[
我们将主题分析的结果映射到公众参与的模型中。这表明,赤字模式和对话模式的主题数量最多,参与式模式中只有1个主题。每个模型都有其用途,而层次结构不一定是理解它们的最有用的方法[
标签的使用仍然局限于想法相似的Twitter用户——一个Twitter泡沫。结果表明,围绕大数据研究的交流是由专业社区推动的,研究仍然是单向的,因为公众很少使用标签。这证实了先前的研究表明,政府科学组织没有充分利用社交媒体的潜力与公众接触[
该活动于2019年在欧洲重新启动,但只有4条推特是用英语以外的语言发布的。我们的研究结果表明,该活动仍然以英国为中心,因为最活跃的Twitter账户都在英国。政府运营的英国组织的高度活跃提出了一个问题,即如果没有他们的参与,推特上的标签和活动能否继续下去。#DataSavesLives在Twitter上的使用仍然有限。但是,这可以通过在线发布的消息类型来解释。大多数人对这项运动持积极或中立态度,而社交媒体上的负面情绪比积极情绪传播得更快[
大数据研究的伦理挑战、信任和透明度问题仍是公众关注的问题[
根据我们的研究结果,PT参加了由欧洲患者论坛主办的推特聊天,作为他们在推特上关于大数据研究的常规对话的一部分。我们希望这将在对话模式下允许更多的在线参与。讨论讨论了网络运动以及社交媒体如何传播运动的信息[
英国的组织是下载推文的主要作者。这限制了我们对我们的研究结果在多大程度上反映了公众对这场运动的态度的理解,并质疑公众是否真的意识到了这一点。Twitter提供的用户统计信息有限。一些数据,如位置,是未知的(例如,在线位置是第三大最受欢迎的位置,被7.6%的Twitter用户使用),或者包括两个或更多的国家。此外,由于一些人口统计数据不可用,我们不能说不同年龄组或其他属性的使用情况是否不同。
自动Twitter账户(机器人)的活动可以影响Twitter的流量。机器人的目标是创建推文和转发,以扩大其信息的覆盖范围。我们手动编码了数据集,没有注意到这种活动,但这并不能保证它不存在。
数据收集是在英国出现新的数据库方案争议时进行的,这可能会影响一些流量和消息。未来的研究应该检查推特的讨论是否会根据上下文而变化。我们的研究只探讨了#DataSavesLives在英语中的用法,但在德语中也可以使用#DatenrettenLeben。我们的研究集中在Twitter上,这是主要的微博平台,用户经常在这里讨论有争议或政治话题。然而,这个标签也可以在其他社交媒体(Facebook和Instagram)上使用,未来的研究可以探索这些媒体的参与度是否与Twitter不同。其他研究也可以关注分享常规收集的健康数据的负面标签,比如已经提到的#DataGrab。
这项研究显示,当英国政府采用#DataSavesLives标签时,以及英国国内围绕数据链接和共享的争议期间,Twitter用户是如何使用#DataSavesLives的。资助者对研究人员与公众接触的期望越来越高。社交媒体活动,如#DataSavesLives,可能会为进一步实现这一目标提供机会。这项研究扩展了我们对#DataSavesLives活动的理解。结果显示了社交媒体的潜力,并认识到与更广泛的意见和不同的Twitter选区接触的必要性。因此,研究人员需要找到新的方式来积极吸引更广泛的公众。有必要将参与活动从赤字模式转变为对话和参与模式,包括研究人员和公众成员之间的积极双向参与,并真正使公众参与到有意义的参与中来。未来的研究可能会探索Facebook和Instagram用户是否以及如何使用这个标签。
国民保健服务。
我们要感谢项目沟通官Estefania Cordero(欧洲患者论坛)和项目协调员Gözde Susuzlu Briggs(欧洲患者论坛)协助我们了解#DataSavesLives活动的历史和背景。
我们还要感谢两位匿名审稿人,他们对本文的初稿版本提供了建设性的反馈。
本报告是由西北海岸国家卫生研究应用研究合作研究所(ARC NWC)资助的独立研究。本出版物中表达的观点是作者的观点,不一定是国家卫生研究所或卫生和社会保健部的观点。SER部分由美国国家卫生研究所(NIHR)西北海岸应用研究合作组织资助。
所有作者都为研究设计做出了贡献。PT起草了本文的初稿,SER、KF和LF参与了起草和编辑。所有作者都阅读并批准了最终稿件。
没有宣布。