这是一篇开放获取的文章,根据创作共用署名许可(https://creativecommons.org/licenses/by/4.0/)的条款发布,允许在任何媒介上无限制地使用、分发和复制,前提是正确引用最初发表在《医学互联网研究杂志》上的原创作品。必须包括完整的书目信息,//www.mybigtv.com/上的原始出版物的链接,以及此版权和许可信息。
互联网是健康相关信息的一个相关来源。互联网上的海量信息迫使用户积极地进行信息选择。先前在实验心理学领域进行的研究表明,信息选择本身可能促进错误信念的发展,即使收集到的信息并没有。
本研究的目的是评估信息搜索策略(即用于指导信息检索的线索)与健康因果推论之间的关系,同时控制附加信息特征的影响。
我们采用了一个标准的实验室任务,该任务以前曾用于偶发学习的研究,以模拟信息搜索情况。参与者(N=193)被要求收集信息,以确定一种虚构的药物是否会引起过敏反应。他们收集了个别证据,通过检查使用或不使用药物或出现过敏反应的个别病例,来支持或否定这两个事件之间的因果关系。因此,允许一组(原因组,n=105)根据潜在原因对信息进行抽样,而另一组(结果组,n=88)则允许根据结果对信息进行抽样。虽然参与者可以选择他们想要检查的医疗记录——使用或不使用药物的病例(原因组)或出现或不出现效果的病例(结果组)——但他们都收到了类似的证据,表明药物和反应之间没有因果联系。观察40例后,估计药物过敏反应的因果关系。
参与者使用不同的策略来收集信息。在某些情况下,参与者表现出与阳性检测相容的偏倚抽样策略,也就是说,他们需要高比例的证据,其中药物被施用(在原因组)或过敏反应出现(在效果组)。有偏见的策略产生了对某些证据的过度表征,而损害了对其他证据的表征,这与因果推论的准确性有关。因此,信息的收集方式(抽样策略)对因果推论有显著影响(
关于健康的错误信念可能产生于准确的信息,部分原因是信息收集的方式。例如,患者或个人在通过互联网收集健康信息时的自主性,可能会导致从准确的信息中产生错误的信念,因为搜索策略可能会有偏见。
近年来,我们目睹了麻疹等在西方世界几乎已被根除的疾病的增加[
事实上,互联网是健康相关信息的一个重要来源[
互联网具有可访问性、匿名性和互动性等优势,但这些优势并非没有风险。
当人们判断一种治疗方案的风险和收益时,他们会推断两件事之间的因果关系——治疗和效果。不幸的是,这类因果推论非常困难,因为除了其他原因外,因果关系不能直接观察到;相反,它必须从偶然性等线索中推断出来。
考虑一个最简单的例子,在这个例子中,一个人可能试图判断一个因素(原因)对一个给定结果(结果)的影响。为了简单起见,我们可以假设这两种原因,
Δ
Δ在哪里
以往研究[
权变矩阵,其中(A)显示了四种信息类型作为原因和结果是否存在的函数,(B)显示了一个结果的高概率为零权变的例子,(C)显示了一个原因的高概率为零权变的例子。
想象一下,有人担心疫苗和自闭症之间的潜在关系。通常,不可能通过接种和不接种疫苗以及观察结果来评估疫苗的效果,因为人们很少有机会进行随机对照试验。相反,人们会通过咨询专家、咨询朋友或搜索互联网来搜索有关疫苗和副作用之间关系的信息。
也许对网络信息最明显的担忧是缺乏质量控制。互联网用户可能会遇到并信任没有证据支持的信息;但是,寻求信息的行为可能引起额外和具体的关切。例如,担心疫苗接种安全性及其与自闭症关系的人可能会寻找有关疫苗的信息(探索其副作用和经历这些副作用的可能性等)。如果他们关心自闭症,他们可能会把研究重点放在自闭症上(探索哪些因素与自闭症的发展有关,或者在那些被诊断患有自闭症的儿童中接种疫苗的比例是多少)。在前者中,原因(即疫苗)是指导搜索的线索,而在后者中,结果(即自闭症)是指导搜索的线索。
抽样策略(人们如何搜索信息)将影响他们对疫苗接种和自闭症之间关系的最终推断。如果人们搜索关于疫苗的信息(即自闭症的潜在原因),他们可能会在搜索引擎上介绍疫苗的名称,他们会检索到a型和b型信息的实例。当潜在原因(即疫苗)出现时,这些信息将使他们能够对结果(即自闭症)的概率作出一般估计;然而,在这种情况下,他们的抽样策略偏向于原因,因此,在没有原因的情况下,没有关于结果的信息,无论是类型c还是类型d,都没有被收集到。这最终会影响他们的判断。事实上,即使采样不完全偏向原因,并且收集了一些c型或d型实例,也一再表明,对原因信息采样的倾向越高,高估因果关系的概率就越高[
在我们关于接种疫苗效果的例子中,尽管如此,这种策略可能被认为不是特别危险。自闭症谱系障碍的患病率实际上很低(每160名儿童中有1名)[
如前所述,人们也可能利用效应作为抽样的线索来收集信息;他们可能会搜索与结果相关的词语,而不是与原因相关的词语。如果人们使用这种抽样策略来收集信息,他们可能会了解到哪些因素与自闭症有关,并会发现在那些患有自闭症谱系障碍的儿童中,许多儿童都接种过疫苗。因此,信息抽样将是有偏见的,过度代表那些影响(即自闭症)存在的信息。从长远来看,这一策略将增加a型和c型信息的比例(相对于b型和d型),并将有利于抽样导致的对关系的高估(
疫苗接种和自闭症的例子很好地说明了信息采样如何成为建立和维持错误信念的关键因素;然而,抽样策略中的偏差可以扩展到广泛的健康问题;有兴趣评估任何常见行为和罕见疾病之间因果关系的人,如果他们在互联网搜索中使用影响作为线索,就会发现行为和疾病重合的信息比例很高。相应地,人们使用原因来指导他们的互联网搜索,最终可能会忽视结果的基础率,并在结果频繁时,最终高估因果关系[
信息抽样偏差也可能影响对治疗效果的推断;有偏见的抽样策略也可能导致一种低估了实际有效的治疗方法的看法,或一种高估了被临床试验证明并不比安慰剂更好的替代方法的有效性的看法。
如前所述,关于权变学习的研究已经证明了人们如何使用不同的信息来推断因果关系[
一个平均年龄为34.07岁(SD 11.41岁)的成人样本(N=193),包括女性(83/ 193,43.0%)、男性(109/ 193,56.5%)和一名(1/ 193,0.5%)非二元参与者,通过互联网平台[
出于伦理考虑,我们在实验中避免使用真实世界的例子,而是使用了因果学习研究中经常使用的简化虚构场景;我们调整了过敏任务[
我们调整了过敏任务[
该程序被设置为允许原因驱动和结果驱动的抽样,包括减少数量的变化。参与者被要求收集信息,以发现一种虚构的药物(即“Batatrim”)是否会引起虚构的过敏反应(即“Lindsay综合征”)。原因组的参与者可以根据潜在原因进行信息采样,因此可以根据患者的治疗(患者是否使用Batatrim治疗)选择检索患者的医疗记录,而结果组的参与者则可以根据效果进行信息采样,因此,可以根据综合征的发展情况(患者是否在住院期间出现林赛综合征)选择检索记录。关于这项任务的详细说明可以在
在原因组中,原因的概率受参与者控制,而在结果组中,结果的概率受参与者控制。所提供的资料客观地反映出这两个事件之间没有因果关系。结果在原因组的概率和结果在原因组的概率固定为0.75。这种设计允许在零偶然情况下评估依赖于抽样的因果错觉,结果(原因组)的概率很高,原因(结果组)的概率也很高。
我们预期因果估计会因抽样策略的不同而有所不同。对于原因组的参与者,我们预期随着参与者增加原因的概率,估计也会增加——参与者的行为越偏向于原因事件,经历因果错觉的概率就越高。类似地,对于效果组的参与者,我们期望随着参与者增加效果的概率,估计也会增加,这也导致经历因果错觉的可能性增加。本研究中使用的程序得到了德乌斯托大学伦理审查委员会的批准。
研究人员提供了一系列40份患者记录,每一份都在单独的试验中。每次试验都从一个屏幕开始,参与者需要在屏幕上按下两个按钮之一来表明他们想要查看哪种类型的医疗记录(
试验中呈现给原因组(左边的面板)和结果组(右边的面板)的事件顺序。
当参与者完成训练阶段时,他们被要求使用100分制对Batatrim和Lindsay综合征之间的因果关系进行全面估计。这个问题是朝着因果关系的方向制定的“你认为Batatrim在多大程度上导致了Lindsay综合征?”或因果关系"你认为琳赛综合症在多大程度上是由Batatrim引起的? "问题的格式在参与者中是随机的(
最后的筛选,评估Batatrim和Lindsay综合征之间的因果关系。问题的表达方式是因果关系(左)或因果关系(右)。
学习任务结束时的因果估计被用作因果推断的衡量标准[
如前所述,原因组的参与者可以根据患者治疗(使用Batatrim治疗或未使用Batatrim治疗的患者)选择记录,而结果组的参与者可以根据综合征的发展(出现或未出现综合征的患者)选择记录。参与者可以展示一种不带偏见的信息收集策略,要求在这两个类别中提供相似比例的记录;然而,参与者也有可能表现出有偏见的抽样策略,即优先要求一种类型的医疗记录比另一种更频繁。为了衡量信息抽样策略的偏倚,我们从训练反应中计算了一个抽样策略指数,作为选择使用Batatrim治疗的患者记录(在原因组)或发展为Lindsay综合征的患者记录(在结果组)的概率;因此,采样策略索引的范围可以在0到1之间。接近1的值表示强烈倾向于检查使用Batatrim治疗的患者或出现综合征的患者(取决于分组)的医疗记录。接近0的值表示相反的策略,即倾向于检查未使用Batatrim治疗或未出现综合征的患者的医疗记录。值为0.5表示无偏见策略,对两种策略中的任何一种都没有偏好。指数越高,就越有可能检索到潜在原因和后果相吻合的医疗记录(a类信息),从而产生因果错觉的可能性也就越大。
此外,考虑到参与者可以决定他们想要检查哪种类型的医疗记录,经验事故可能会偏离编程值(Δ
除非另有说明,
采用2×2方差分析(ANOVA)评估分组(原因与结果)和按钮位置(左与右)对信息抽样策略(抽样策略指数)的影响。
以群体(因果)和需要进行因果估计的方向性(因果关系或因果关系)为固定因素,以信息抽样策略(抽样策略指标)为协变量,确定对因果估计的影响,进行协方差分析(ANCOVA)。我们预期两组的因果估计会随着抽样策略指数的变化而变化——指数越高,对因果关系的因果高估就越强。此外,由于原因组中结果的概率和结果组中原因的概率固定在相同的高比率,
一个
为探索抽样策略,将学习阶段数据分为8个区块,每组5次试验,并为每个区块计算抽样策略指数。采用重复测量方差分析(repeated measures ANOVA)探讨分组(block,从1到8)和分组(group,因果关系)对抽样策略指标的影响。使用Bonferroni校正进行后置分析(28个比较)。
两组抽样策略指数均为0.50(中性策略),差异有统计学意义。在病因组,参与者优先检查使用Batatrim治疗的患者的医疗记录(平均0.54,标准差0.17;t104= 2.18,
2×2方差分析表明,两组间抽样策略指数无差异(
只有抽样策略指标(
预测因果估计变量的ANCOVA分析摘要。
效果 |
|
|
偏平方 |
抽样策略指数 | 32.53 (1185) | <措施 | 0.15 |
方向性 | 0.61 (1185) | 无误 | 0 |
集团 | 0.20 (1185) | 点 | 0 |
抽样策略指数×方向性 | 0.22 (1185) | .64点 | 0 |
抽样策略指数×组 | 0.01 (1185) | 公布 | 0 |
方向性×群 | 1.63 (1185) | .20 | 0.01 |
抽样策略指数×方向性×群体 | 1.60 (1185) | . 21 | 0.01 |
因果估计作为抽样策略指数和群体的函数。
请注意,任何包括经验丰富的偶发事件的分析都没有考虑5个表现出极端偏向策略的参与者(抽样策略指数=1)。
在经验偶然性和程序值之间没有发现差异(
重复测量方差分析显示阻断(
Posthoc比较。
比较 | 平均差 |
|
|
|
区块1 -区块2 | 0.12 | 4.43 (1337) | <措施 | <措施 |
街区1 -街区3 | 0.11 | 3.93 (1337) | .003 | <措施 |
街区1 -街区4 | 0.13 | 4.90 (1337) | <措施 | <措施 |
街区1 -街区5 | 0.10 | 3.82 (1337) | 04 | <措施 |
街区1 -街区6 | 0.11 | 4.12 (1337) | 措施 | <措施 |
街区1 -街区7 | 0.10 | 3.63 (1337) | .008 | <措施 |
街区1 -街区8 | 0.14 | 5.27 (1337) | <措施 | <措施 |
街区2 -街区3 | -0.01 | -0.50 (1337) | > .999 | .62 |
街区2 -街区4 | 0.01 | 0.47 (1337) | > .999 | .64点 |
街区2 -街区5 | -0.02 | -0.60 (1337) | > .999 | 55 |
街区2 -街区6 | -0.01 | -0.31 (1337) | > .999 | .76 |
街区2 -街区7 | -0.02 | -0.79 (1337) | > .999 | 点 |
街区2 -街区8 | 0.02 | 0.84 (1337) | > .999 | .40 |
街区3 -街区4 | 0.03 | 0.97 (1337) | > .999 | .33 |
街区3 -街区5 | -0.00 | -0.10 (1337) | > .999 | .92 |
街区3 -街区6 | 0.01 | 0.19 (1337) | > .999 | .85 |
街区3 -街区7 | -0.01 | -0.29 (1337) | > .999 | .77点 |
第3街区-第8街区 | 0.04 | 1.34 (1337) | > .999 | 只要 |
街区4 -街区5 | -0.03 | -1.08 (1337) | > .999 | 陈霞 |
街区4 -街区6 | -0.02 | -0.79 (1337) | > .999 | 点 |
街区4 -街区7 | -0.03 | -1.27 (1337) | > .999 | . 21 |
街区4 -街区8 | 0.01 | 0.36 (1337) | > .999 | 开市 |
街区5 -街区6 | 0.01 | 0.29 (1337) | > .999 | .77点 |
街区5 -街区7 | -0.01 | -0.19 (1337) | > .999 | .85 |
第5街区-第8街区 | 0.04 | 1.44 (1337) | > .999 | 酒精含量 |
街区6 -街区7 | -0.01 | -0.48 (1337) | > .999 | 点 |
街区6 -街区8 | 0.03 | 1.15 (1337) | > .999 | 二十五分 |
7号街区- 8号街区 | 0.04 | 1.63 (1337) | > .999 | .10 |
一个Bonferroni校正值;当
b未修正的值;当
原因组和结果组每组5次试验的平均抽样策略指数。缎带描述95%的CI。
本实验的主要目的是利用实验程序评估信息收集偏差和因果推论之间的潜在关系。因此,我们采用了一个标准的实验室任务,该任务以前曾用于因果错觉的研究,以模拟信息搜索情况。结果表明,因果错觉与信息抽样策略之间存在显著的关系。当使用潜在原因来收集信息时,当缺乏原因的信息抽样不足时,可能会高估因果关系。类似地,当效应是驱动信息收集的线索时,当缺乏效应的信息采样不足时,因果估计可能会被高估。
虽然我们没有明确地包括任何旨在偏向抽样策略的操作,但我们发现,检查使用Batatrim治疗的患者或出现综合征的患者(取决于组)的医疗记录是一种普遍偏好。我们可以将这种偏好解释为由确认偏误驱动的积极测试策略的结果[
由于积极测试策略被认为是一种通用的默认启发式方法,通常在缺乏特定信息的情况下使用,以确定某些测试比其他测试更相关[
为了确保对所涉及变量的强有力的实验控制和较高的内部效度,我们决定使用一种通常用于研究人们如何在实验室环境中进行因果推理的标准和非常简单的程序。然而,我们在目前情况下使用这一程序导致了与其生态有效性相关的局限性。我们的程序并不完全反映互联网用户搜索信息的方式。大多数互联网用户不会像在实验任务中那样按顺序选择个人信息;然而,收集信息的过程和随后对信息进行整合、组合和解释的过程在根本上是相同的。
参与者寻找并收集证据,这些证据最终被用来形成他们对事件之间关系的估计。同样,互联网用户可以使用网络搜索引擎,搜索引擎为他们提供离散的信息,这些信息被用作支持或拒绝所评估事件之间因果关系的证据。在我们的实验中,这些信息不如在现实环境中收集到的信息丰富,但它们确实包含了因果推断所需的核心信息。降低我们的程序的生态有效性确保了高水平的内部有效性——这一优势使我们的程序成为比其他自然主义范式更好的选择。最相关的优势是,它允许我们在控制额外信息特征的影响的同时探索信息抽样偏差。
真实情况包含高度的模糊性和微妙的信息细微差别,可能会通过削弱内部有效性来限制研究推论。例如,网站设计或作者的感知权威已被证明会影响基于网络的健康信息的信任和可信度[
既然抽样策略对因果推论的贡献已经在实验室环境中被记录下来,未来的研究可能会将我们的结果扩展到现实世界的情况下,以评估我们的发现在信息收集更复杂时的泛化性。这项研究可以被认为是建立干预措施的第一步,旨在保护人们在使用互联网搜索健康信息时的安全。
互联网已成为与健康有关的信息的一个相关来源[
基于实验室的偶然学习研究已被证明是解决现实生活问题的成功方法,因为它能够发现可能有助于因果推断的相关因素,但也因为它一直是设计和测试基于证据的干预措施的基础,这些干预措施已被证明在提高批判性思维技能方面有效,因此,在现实环境中减少潜在有害的因果误解[
过敏测试中使用的详细说明。
协方差分析
方差分析
本研究由RTI2018-096700-J-I00和PSI2016-78818-R资助
没有宣布。