这是一篇开放获取的文章,根据创作共用署名许可(http://creativecommons.org/licenses/by/2.0/)的条款发布,允许在任何媒介上无限制地使用、分发和复制,前提是正确引用最初发表在《医学互联网研究杂志》上的原创作品。必须包括完整的书目信息,//www.mybigtv.com/上的原始出版物的链接,以及此版权和许可信息。
在美国,每天大约有600万人在互联网上搜索健康信息。患者和护理人员都在搜索有关处方治疗方案的信息,在访问他们的提供者后未回答的问题,或饮食和锻炼方案。过去的文献表明,在互联网上可用的卫生信息质量方面存在潜在的挑战。然而,互联网上存在着各种各样的信息——从政府发起的网页到个人博客页面。然而,我们并不完全了解互联网上不同类型信息的优缺点。
本研究的目的是调查各种类型的在线健康信息的优势和挑战,并建议哪些信息源最适合各种问题类型。
我们收集了在线糖尿病社区发布的问题和他们收到的回复,并根据Rothwell的问题类型分类(事实、政策或价值问题)对它们进行了分类。我们选择了60个问题(事实、政策和价值各20个)以及来自社区的回答。然后,我们用搜索引擎搜索对同样问题的回答,并记录下答案
社区回复回答的问题比搜索结果总体上要多。搜索结果在回答价值问题时最有效,在回答政策问题时最无效。社区受访者对各种问题类型的回答比例相当,但大多数人回答了政策问题,而回答事实问题的人最少。价值问题大部分是由社区回答的,但社区提供的这些答案中有一些是不正确的。事实问题搜索结果在临床上最有效。
互联网是人们获取健康信息的普遍来源。人们在网上遇到的信息质量会对他们产生很大的影响。我们将介绍人们在网上提出的各种问题,以及各种信息来源在回答这些问题时的优点和缺点。本研究有助于解决人们的在线健康信息需求。
美国平均每天约有600万人在互联网上搜索健康信息[
人们作为病人或照顾者在互联网上查找健康信息[
因特网为用户提供无数与健康有关的资源,如政府和专业组织的网站、医学期刊、邮件列表、文章和在线支持小组[
在这项研究中,我们比较了互联网上两种常用的健康信息来源——来自其他患者的回答(例如,在线健康社区的回复)和互联网搜索结果(例如,查询搜索引擎Google.com)——各自的独特优势和劣势。我们讨论了如何进一步支持在线健康信息寻求者接受高质量信息的影响。根据健康信息搜索者的问题类型,搜索引擎可以提供比在线健康社区更有用的资源,反之亦然。确定最合适的互联网健康信息资源对患者来说是一个挑战。我们通过调查哪些信息来源最适合信息寻求者的问题类型来解决这一挑战。
2013年,皮尤研究中心发现,每10个与健康相关的查询中,就有8个是从搜索引擎开始的。
1996年,国家医学图书馆报告说,他们每年的互联网搜索中有700万次与健康有关[
互联网为健康状况相似的患者提供了相互联系的资源。与其他患者联系为他们提供了一个分享类似经历的出口,并获得信息和情感支持[
研究人员根据他们的研究背景和对问题进行分类的目的,以多种方式对问题进行分类[
根据辅导成绩单,尼尔森等人[
对于在社交媒体上提出的问题,Efron和Winget [
为了确定患者和护理人员在线询问的问题类型,我们需要一个分类模式,该模式可以包括之前工作中讨论的患者和护理人员的各种信息寻求需求[
罗思韦尔的问题分类[
为了在线提取患者的问题,我们使用了在线健康社区中的患者帖子。WebMD,全球排名前1000的网站之一,2012年报告[
向这些社区提出的问题可以深入了解患者对其健康问题的类型。由于患者问题的内容各不相同,回答这些患者问题的最佳来源和内容也各不相同。我们使用了患者在WebMD糖尿病社区上发布的问题,以了解这些问题如何从互联网上的两个主要健康信息来源中受益:搜索引擎和在线健康社区中同行的回复。我们的研究问题是(1)与在线健康社区相比,搜索引擎提供哪些健康信息?(2)与在线健康社区相比,搜索引擎中的信息在临床上的准确性如何?(3)对于不同类型的问题,最合适的健康信息来源是什么?
下面,我们将描述如何操作这些研究问题。
我们从WebMD在线糖尿病社区收集了患者的问题和社区回应。我们选择糖尿病社区而不是其他社区,因为糖尿病环境允许各种问题类型的问题数量平衡。
我们的数据集包含了2007年至2014年间的71,177个社区帖子。这些帖子包括9576篇线程启动帖子和61592篇对这些帖子的回复。帖子内容包括患者提问、寻求情感支持或信息传播[
我们反复修改Rothwell的问题分类,以开发以下代码本:
事实问题:这类问题询问某事是否属实,在多大程度上属实,要求提供客观、事实的信息(例如,“血糖的正常范围是多少?”“如果你嘴里有甜味,这意味着什么?”)。
政策问题:这些问题询问是否应该采取特定的行动来解决问题(例如,“我刚刚被诊断出患有2型糖尿病。接下来我该怎么办?”“一夜禁食后,我的血糖飙升。我该怎么做才能让它降下来?”)。
价值问题:这些问题要求对一个人的想法、对象或事件进行评估(例如,“有人经历过糖尿病的副作用是手指刺痛吗?”;“有人能描述一下他们做足部手术的经历和这种手术的愈合吗?”)。
然后我们选择了最近的100个线程启动帖子。一名编码员(从今往后称为非临床编码员)开始对这100篇帖子进行编码,以判断该帖子是否是一个问题,从最近的帖子开始。如果它是一个问题,这个编码器编码问题类型。编码器继续这个过程,直到每种问题类型下有20个问题。结果,我们总共有60个患者问题需要调查。从60个问题中随机选择一半的问题,并交给另一个编码员来衡量2个编码员之间的可靠性。
编码员之间的平均信度为0.79。然后我们开会解决分歧。我们放弃不同意的项目并重新编码,直到我们发现另一个事实问题,每个问题类型都有相同数量的问题,结果是20个事实问题,20个价值问题和20个政策问题。
为了确定搜索引擎会检索什么信息,我们在Google.com上查询了60个问题。我们选择Google.com是因为它是2015年使用最多的搜索引擎,根据网站(如alexa.com和amazon.com)基于页面浏览量和独立网站用户的综合测量来衡量搜索引擎流量。
用户搜索包括基于关键字的搜索和基于句子的搜索。老式的搜索引擎,如AltaVista或AOL,都是基于基于关键字的搜索模式。随着互联网使用的发展,搜索引擎开始支持基于句子的搜索,特别是在用户询问问题答案的情况下。因此,微软开发了一项分析常见问题页面搜索的专利[
研究表明,人们只会通过敷衍的搜索结果来探索最初的几个结果[
因为每个问题有3个在线搜索结果,所以每个类别有60个搜索结果。然而,一些搜索结果少于3个,而另一些搜索结果仅仅是原始的WebMD问题及其回答。这解释了以下事实类型问题中不到60个搜索结果(57个结果)。
对于每个问题,我们都返回到WebMD社区的原始帖子,并收集对这些帖子的回复。这些帖子的回复数量从0到30不等。我们收集了所有这些回复,包括对其他回复的回复。我们没有限制每个问题的社区回复总数,因为在线健康社区用户试图阅读对该问题的所有回复,除非用户认为这些回复与主题无关。
对于每个搜索结果和社区回应,非临床编码员回答了以下问题:(1)答案有多完整?(2)它提供了或没有提供什么样的信息?然后,我们将这些观察结果组织为每个搜索结果和社区反应的优点和缺点。第二个非临床编码员对四分之一的搜索结果和社区答案采用了相同的分析过程。这两名程序员互相检查了对方的分析并讨论了分歧。由此产生的讨论为第一个非临床编码器对其余搜索结果和社区答案的分析提供了信息。第三位编码人员——家庭护士从业人员——针对所有社区答案和搜索结果回答了以下问题:(1)信息是否回答了问题?(2)该信息的临床相关性如何?(3)该信息的临床有效性如何?第三个编码器也被给予了一个空间来添加开放式的、定性的评论。 This clinical coder will be referred to as clinician A from here onward.
我们定义
我们还有第四位编码员(今后称为临床医生B)——一位拥有注册护士证书和美国护理学会会员资格的护理教员。我们从总共60个问题中随机抽取15个问题,向第四个编码器提供样本,以评估临床医生之间的一致性。两位临床医生对搜索结果和社区发现采用了相同的编码方法。编码完成后,我们讨论了结果中的分歧和共同主题。
在本节中,我们将详细介绍每种问题类型的收集问题的内容。然后我们描述我们的编码结果。
在本节中,我们将描述我们的数据集在每种问题类型下包含的问题类型。
事实问题的搜索结果提供了各种各样的信息来源,包括视频、包含医疗保健提供者对患者问题的回答的问答网站、有关所要求主题的事实信息概述、供信息寻求者参考的示例以及指向其他潜在资源的网址,包括美国糖尿病协会网站等知名资源。一些人甚至发起了在线测试,帮助用户确定问题的答案(比如糖尿病前期测试)。
在这些搜索结果中,临床医生A认为19/57的结果正确地回答了问题。其余的被标记为错误回答问题,原因如下:信息与问题无关,没有直接解决问题,答案措辞不正确,出现在不可靠的小报或广告网页上,或者信息过时或陈旧。该临床医生还评论说,在搜索结果提供的信息中,信息的可访问性是一个潜在的挑战,例如需要很长时间下载的大型视频和高技术资源,会增加理解材料的复杂性。
临床医生A也发现28/57的搜索结果具有临床相关性,37/57的搜索结果具有临床有效性。例如,“胰岛素会改变香豆素治疗的疗效吗?”的搜索结果显示香豆素是什么。本页提供了该药物的仿制药(华法林)及其品牌药(包括香豆定)的概述。该页面由临床医生A编码为临床相关但不具有临床有效性。根据临床医生的说法,这是因为页面上的信息是正确的,但没有回答问题。
我们的分析表明,这些搜索结果提供了不同质量的信息,就回答问题的信息有多少而言:一些部分地解决了问题,另一些提供了完整和全面的答案,而一些给出了关于问题主题的概述,但没有完全解决问题。例如,一个帖子的问题是“Byetta是一种非胰岛素药物吗?它能和二甲双胍一起服用吗?”(原文如此)。”对于这个问题,排名第一的搜索结果是一个网站,其中包含治疗糖尿病的口服和非胰岛素注射药物的信息。该网站包含Byetta是一种非胰岛素药物的信息,但缺乏关于它是否可以与二甲双胍一起服用的信息,这是问题的一部分。
一些搜索结果根本没有回答这些问题。这些结果包括了与问题无关的信息,页面上有大量的文本,这对外行用户来说是压倒性的。由非临床编码员和临床医生A编码为没有回答问题的搜索结果显示了无关的信息,如课程学习指南、产品广告或对问题的回答,但不是在糖尿病背景下。一些搜索结果也不包括信息的来源或引用,从而使信息的有效性存疑。
社区对事实问题的回答包括个人经历、轶事和对其他应答者提供的信息的评估。社区的反应还包括对发帖者的安慰和赞美,在心理上支持他们。例如,对于“我是糖尿病新手。我注意到,当我锻炼时,我的血糖值[a]r会达到180-200。运动越剧烈,血糖值越高。有人知道为什么会这样吗?的帖子回应道:“锻炼是身体的一种压力。当你有压力时,你的肝脏就会分泌糖分。即使它在运动期间上升,你可能会注意到它在运动结束后下降。这种情况也会发生在我身上,我锻炼的时候一定要喝足够的水。” This conversation describes how a community response answers a poster’s question while also providing personal experience with the problem and a way to resolve it based on the responder’s own method. This was the most critical difference between the search results and community responses. Another prevalent answer to posters’ questions was responders asking the posters to discuss their questions with their health care providers in case it was something that needed medical intervention. The responders also assessed the accuracy of other people’s responses. Responders also denied answering questions due to the liability of the community.
临床医生A确定35/66的社区回复回答了事实问题。与事实问题搜索结果类似,那些被编码为不回答问题的社区回复包括对发帖者的一般性鼓励(例如,“你现在积极关注自己的健康真是太好了”),对发帖中涉及的其他人的对话的回应,或者只是临床不正确的回答。此外,37/66的社区反应是临床相关和临床有效的。
事实问题社区的反应不仅建议发帖者去看卫生专业人员,而且还提供了在这次访问中应该讨论的问题的建议,将发帖者推荐给外部资源,对发帖者正在经历的困难时期给予赞扬和保证,甚至提醒发帖者注意其他响应者提供的不正确或危险的信息。
总体而言,社区回复比搜索结果提供了更多与回答问题内容相关的信息。
最后,我们用Cohen kappa评分计算临床医生A和B的评分者间信度。事实问题的总体kappa为0.46,表明2名临床医生之间的一致性较弱[
政策问题的搜索结果包括糖尿病管理页面、博客、如何解决问题的逐步说明和患者论坛。然而,并不是所有的答案都可以通过搜索结果在一篇文章中找到——通常,信息(全部或间接地)出现在页面的讨论或评论部分。因为这些都是如何操作的问题,搜索结果也会引导到不同的社交媒体平台,如Facebook,在那里其他类似的问题完全或部分地回答了海报上的问题。例如,“嗨,我刚刚检查了我的血糖,是490,我怎么把它降下来?我的视力很模糊。”(原文如此)引发了Facebook 1型糖尿病页面帖子,讨论了一名25岁的1型糖尿病患者的视力波动。这篇文章并不是对发帖者问题的确切回答,但它部分地探讨了发帖者的问题。此外,Facebook帖子收到的评论可以帮助发布者得到他或她的答案。有些结果并没有回答所提出的问题。
我们的编码结果表明,通过搜索结果回答的政策问题数量非常少。在政策问题的搜索结果中,临床医生A发现有8/60的结果正确回答了问题。该编码器还发现,8/60的搜索结果具有临床相关性,但24/60的搜索结果具有临床有效性。
搜索引擎不会直接回答“我应该做什么或如何做某事”。”的问题。例如,一个人询问如何在早晨第一件事就是降低血糖,因为清晨的血糖值很高,他会被引导到一个描述“黎明现象”的页面——许多糖尿病患者都经历过这种情况,他们的早晨血糖水平比平时高。
其他搜索结果还包括与所提问题相关的讨论页面、对该问题的逐步回答(比如如何减肥)、外部资源、对发帖者下一步该做什么的建议(比如,诊断糖尿病的下一步),以及访问显示与发帖者相似情况的社交媒体页面的权限。
社区对政策问题的回应提供了遇到类似问题的个人经历,并为发帖者提供了如何处理问题的见解。这些回答也促使发帖者思考与这种情况相关的其他问题,建议他们去看他们的医疗保健提供者,提供额外的资源,让发帖者放心,他们并不孤单,并让他们意识到潜在的危险。例如,对于“有没有人能告诉我如何降低血糖”这个问题。我现在可以吃什么来降低血压。我摄入了很多碳水化合物,通常是202,通常是90到101 [sic]”,回复中写道:“嗨,让你的BG从峰值降低的唯一方法是锻炼和大量饮水。没有食物可以降低你的血糖水平。至少这是我微薄的经验,如果其他人有更好的想法,我希望他们能与你分享。祝你好运,小心吃碳水化合物。”
临床医生A观察到,30/49的社区回应回答了提出的问题,30/49的回应与临床相关,31/49的回应是临床有效的。出现这种临床相关性和临床有效性不平衡的原因是,有一位发帖者提出了一个关于血糖水平为490的问题,并询问如何降低血糖水平以消除视力模糊。一位回应者建议这个人应该洗手,然后再试一次,如果糖的读数仍然很高,应该立即拨打911或前往急诊室。这篇文章被标记为临床有效,因为它提供的所有信息都是临床准确的;然而,它没有被标记为临床相关,因为这些信息与实际提出的问题不相关,也无助于回答问题(即如何摆脱模糊的视觉)。
其他社区对政策问题的回应强调了发帖者可能面临的危险;提供潜在的解决方案,以帮助解决问题,包括建议家庭补救措施和建议海报去看卫生专业人员;提供个人故事、轶事和观点;并帮助从海报所呈现的情况中发现紧急情况。
最后,我们用Cohen kappa评分计算临床医生A和B的评分者间信度。政策问题的总体kappa为.52,表明临床医生之间的一致性较弱[
价值问题的搜索结果包括个人经历,因此,许多搜索结果只是部分回答了问题或提供了主题的概述。搜索结果包括产品及其评论,患者通过博客文章和论坛的故事。一个结果有助于缓解紧张,而另一个结果显示其他人也有类似的症状。部分问题涉及人们的医疗经验或健康问题(如上所述);因此,搜索结果指向这些产品的在线商店和评论,例如亚马逊,其他客户为健康信息搜索者提供评论。最后,回答了一些问题,但不一定是在糖尿病的背景下。例如,一个帖子的问题是“我上周做了第一次乳房x光检查,结果可疑。不得不做更多的超声波检查,现在又要做活组织检查。我早就吓死了。有人能帮帮我吗?” the first search result to this question led to a webpage discussion about mammograms in patients. This information provided encouragement to the poster as requested.
在价值问题的搜索结果中,临床医生A认为有23/60的结果正确回答了问题。该临床医生还发现23/60的搜索结果具有临床相关性,29/60的搜索结果具有临床有效性。这些结果表明,虽然一些问题得到了回答,但仍有一些问题是临床相关和临床有效的,但没有回答这个问题。
价值问题的其他搜索结果还包括对相关主题的全面概述;从可信来源讨论副作用;在一些网页上有讨论这个话题的评论区;帮助区分与问题相关的神话和事实;引导到问答页面,帮助回答提出的问题;针对特定产品的问题产生产品评论,从而告知发布者产品的质量和有效性;包括个人经历故事和鼓励,这减少了海报的紧张;其中包括一些有统计证据支持的结果。
另一方面,社区的回应包括了提问者应该注意的细节,提供了药物的副作用、技巧和建议,进行了在线搜索,并为帖子找到了答案。
人们热衷于提供他们的意见。这样做的缺点是无法验证所提供的答案。例如,一个海报提出了这样一个问题:“你们中有人用过拜耳等高线仪显示“HIGH”吗?”没有数字读数,只有“HIGH”。我怀疑这是一个非常糟糕的迹象。”对此的回应是,“大多数仪表读数高达500或600。如果高于这个值,它会简单地问候你并说“HI”。你洗手后又检测了吗?如果你真的打电话给你的医生,马上去看医生。这不好(原文如此)。”
对于社区反应,临床医生A指出,63/104的反应回答了提出的问题。此外,51/104具有临床相关性,47/104具有临床有效性。
关于价值问题的海报所收到的社区回应类型有助于他们对新趋势保持警惕;告知他们药物副作用,并提供关于如何获得这些信息的见解;提醒人们注意任何潜在的危险;提供个人经验、观点和轶事,以及帮助解决问题的技巧和解决方案;建议提问者去看卫生专业人员;纠正或澄清错误信息;重定向海报到更多的资源和信息;让发帖者对他或她的现状感到安心和鼓励。
最后,我们用Cohen kappa评分计算临床医生A和B的评分者间信度。事实问题的总体kappa为0.46,表明两位临床医生之间的一致性较弱[
可以注意到,两位临床医生之间的Cohen kappa评分不是很高,表明评分者之间的信度较弱。它们之间在编码方面的一些差异可以通过以下原因来解释。首先,我们发现许多网页上的搜索结果包含大量的文本,从而使在页面上定位响应的过程变得困难。这有时会导致一名临床医生将搜索结果编码为回答张贴的问题,而另一名则没有。这一观察描述了不同的人,包括临床医生,如何根据他们是否回答了所问的问题来解释不同类型的搜索结果。如果两个编码员对一个问题的编码不同,后续关于临床相关性和临床有效性的问题也倾向于遵循不同的路径。有时,在这种情况下,搜索结果被编码为回答问题,但答案的有效性或相关性被询问,因此导致2名临床医生之间的代码不同。这两名临床医生之间结果的可变性说明了问题的复杂性,也就是说,很难定义和评估互联网上的信息质量。
最后,两名编码员对某些回答的准确性和相关性的解释不同,因此导致kappa评分较低。这一结果表明了在互联网上分享和解释信息的方式的重要性,以及如何更好地指导和指导收集信息是必要的。这项研究有助于了解临床医生考虑的各种因素,以及这些因素如何导致他们的评估。
总结搜索结果与社区对在线糖尿病社区问题的回应的优缺点。
问题的类型 | 优势 | 缺点 | |
|
|
||
|
|
|
|
|
|
提供一些问题的答案。 | 并不总是为提出的问题提供答案。 |
|
|
提供主题的概述。 | 如果这个问题得到了回答,这可能只是部分回应。 |
|
|
多个网站提供了广泛的信息。 | 可以提供无关的回答。 |
|
|
外部链接可以将健康信息查找器路由到各种资源。 | 可以跳出它所处的上下文(即,跳出糖尿病的上下文)回答。 |
|
|
来自知名网站,如美国糖尿病协会的回复可以被认为是准确的。 | 反应的准确性并不总是清楚的。 |
|
|
提供一个测试来帮助发帖者确定他们的答案(例如,糖尿病前期测试)。 | 网站可能包含大量的内容,因此不容易找到响应。 |
|
|
|
有些结果是产品的广告,导致有偏见的信息。 |
|
|
|
不回答异常问题。 |
|
|
|
|
|
|
提供对与所提出的问题相关的讨论和对话页面的访问。 | 有些结果没有直接回答问题,让提出问题的人去做推断。 |
|
|
提供一步一步的回答所提出的问题(例如,如何减轻婴儿体重)。 | 有些结果不能提供必需的答案,即无关紧要。 |
|
|
为相关信息提供外部资源。 | 有些结果部分或间接地回答了问题。 |
|
|
提供海报的下一步步骤(例如,糖尿病诊断的下一步步骤)。 | 网站可能包含大量的内容,因此不容易找到响应。 |
|
|
提供对社交媒体结果的访问,如Facebook,展示类似的案例。 | 有些结果是广告,导致有偏见的信息。 |
|
|
|
|
|
|
有些回答准确地回答了问题。 | 有些结果不能提供必需的答案,即无关紧要。 |
|
|
有些结果可以很好地概述问题主题。 | 有些结果部分或间接地回答了问题。 |
|
|
一些回应讨论了来自可靠来源的副作用。 | 网站可以非常大,包含很多内容,从而防止容易定位响应。 |
|
|
网页的评论部分有助于讨论这个主题。 | 有些结果是广告,导致有偏见的信息。 |
|
|
答案可以区分神话和事实。 |
|
|
|
问答页面帮助回答招贴者的问题。 |
|
|
|
一些页面会引导产品评论来帮助回答这个问题。 |
|
|
|
不同结果页面上的用户体验和鼓励有助于缓解发布者的紧张情绪。 |
|
|
|
一些研究结果通过统计证据支持了这种说法。 |
|
|
|
||
|
|
|
|
|
|
提供个人经历、观点和轶事。 | 有些问题得不到回答。 |
|
|
建议海报去看健康专家。 | 无法检查响应的准确性。 |
|
|
提供示例和外部资源。 | 问题可能被转交给卫生专业人员,从而延误了答复。 |
|
|
为海报正在经历的困难时期提供赞美和安慰。 | 有些问题只得到了部分回答。 |
|
|
提醒潜在危险的海报(包括其他人的反应)。 | 由于论坛责任,无法回答。 |
|
|
重定向到具有更多信息的人员或资源。 | 不总是提供完整或相关的回答。 |
|
|
提供替代方案,外部资源,和潜在的谈话要点,以与一个人的医疗保健专业人员讨论。 | 有些反应是无关紧要的或有潜在危险的。 |
|
|
|
|
|
|
回应强调了形势的危险。 | 有些问题得不到回答。 |
|
|
提供解决问题的建议或解决方案。 | 没有办法检查回答的准确性。 |
|
|
提供个人经历、观点和轶事。 | 有些问题只得到了部分回答。 |
|
|
建议海报去看专业医护人员。 | 有些反应与其他反应不一致。 |
|
|
提供家庭补救措施。 |
|
|
|
检测紧急情况。 |
|
|
|
|
|
|
|
一些调查结果可以帮助发帖者对最新趋势保持警惕。 | 有些问题得不到回应或根本不相关。 |
|
|
一些结果提供了影响和副作用,以及关于如何发现这些信息的见解。 |
|
|
|
提醒海报潜在的危险。 | 没有办法检查回答的准确性。 |
|
|
提供个人经历、观点和轶事。 | 有些问题只得到了部分回答。 |
|
|
提供解决问题的建议或解决方案。 |
|
|
|
建议海报去看专业医护人员。 |
|
|
|
回复有助于澄清海报上的错误信息。 |
|
|
|
重定向到具有更多信息的人员或资源。 |
|
|
|
提供保证和鼓励海报。 |
|
由临床医生A评估所有社区答案和搜索结果。
问题的类型 | 回答问题 | 临床相关 | 是临床有效的 | ||||
|
|
不。 | % | 不。 | % | 不。 | % |
|
|
|
|
|
|
|
|
|
查册结果(n=57) | 19 | 33 | 28 | 49 | 37 | 65 |
|
社区反应(n=66) | 35 | 53 | 37 | 56 | 37 | 56 |
|
|
|
|
|
|
|
|
|
查册结果(n=60) | 8 | 13 | 8 | 13 | 24 | 40 |
|
社区反应(n=49) | 30. | 61 | 30. | 61 | 31 | 63 |
|
|
|
|
|
|
|
|
|
查册结果(n=60) | 23 | 38 | 23 | 38 | 29 | 48 |
|
社区反应(n=104) | 63 | 61 | 51 | 49 | 47 | 45 |
例如,这个问题“最近因为癌症失去了一个肾/输尿管。糖水平是适度变化的,我需要知道当我的身体适应只有一个肾的生活时,我可以预期的实际影响[原文如此]。的问题引出了网上的一本人体解剖学教科书,临床医生a认为这本教科书的价值“未知”。
另一方面,社区的回答在数量上有所不同,因为我们包括了对提出的问题的每个答案。以上所示的总数是每一类社区所收到的回复数。然而,有些问题根本没有答案,比如“救命”。我刚在晚餐前给腿打了针。它在我的腿上形成了一个巨大的肿块。胰岛素还会进入我体内吗?还是我需要再打一次?(原文如此)完全没有反应,因此临床医生A将其标记为“不适用”。
我们的分析显示,社区回复回答的问题比搜索结果回答的问题更多。这些社区反应比搜索结果更具有临床相关性。然而,临床效度有所不同,在事实和价值问题上,搜索结果比社区反应更具有临床效度,但在政策问题上,社区反应比搜索结果更具有临床效度。这些观察表明,这两种来源的答案都包含临床准确的信息,这并不一定能回答问题。
对事实问题的搜索结果显示,结果通常是临床有效的,但不具有临床相关性。事实问题搜索结果在所有问题类型中具有最高的有效性。即使搜索结果与临床相关,也只有一小部分结果完全解决了查询中的问题。没有回答的问题可以归因于不精确的问题措辞。措辞问题,使他们的意思是明确和简洁,将导致更相关的搜索结果比那些曲折和不清楚的内容的问题。我们需要一种机制来帮助患者在网上提出疑问和问题。
我们从政策问题的搜索结果中了解到,近一半的政策问题搜索结果包含临床有效信息。然而,这些信息大多与回答问题无关,而且信息是不完整的。这一发现的一个原因可能是政策问题的框架。这些问题需要关于在特定情况下如何做或需要做什么的信息。在一个人的问题中考虑多个变量会导致不同的搜索结果,没有一个能按要求回答问题。
对价值问题搜索结果的分析表明,搜索结果往往不能回答所提出的问题,也没有临床相关的信息。然而,更多的结果是临床有效的,这表明准确的信息并不总是能带来答案。这一观察结果与事实和政策问题的搜索结果一致,其中大量的结果是临床有效的,但没有回答提出的问题。
我们在社区对事实问题的反应中观察到类似的模式,其中更多的问题是临床有效和临床相关的,但较少的问题得到了回答。
对于社区对政策问题的反应,临床医生A观察到,与政策问题搜索结果相比,回答的问题数量要高得多。这显示政策问题的特殊性质,使它们更适合熟悉社会议题的读者,从而为海报提供所需的资料。
社区对价值问题的反应与事实和政策社区的反应相反。价值问题是唯一一种问题类型,社区提供了更多的答案,但所提供的信息的准确比例较小。相比之下,事实和政策问题往往会得到多余但临床有效的回答,导致更多未回答的问题。这一发现很重要,因为它描述了在线健康社区中未经检查的信息交换的风险。价值问题询问他人的个人经历和评价,这是对发帖者的一个警告,即信息的不节制性。
编码员和临床医生的综合分析表明,政策和价值问题比事实问题得到更多的社区回应。这可能是因为这两个类别要求应试者提供他们对某个情况的个人经历,知道或不知道问题的答案(就像事实问题一样)并不是一个标准。
社区的回应也会让问题发布者对自己的处境感觉更好,并通过安慰和赞美提醒他们,他们并不孤单。这些回答会提醒问题发布者注意潜在的危险行为或他们从其他回应者那里得到的错误建议。
我们还观察到,社区响应始终能得到较高的问题回答百分比。而不是搜索结果。因此,虽然过去的研究表明,人们上网搜索与健康相关的信息,但这些人更有可能通过与自己处境相似的在线社会支持小组得到问题的答案。
根据搜索结果和社区反应的优缺点(表1),对相关利益相关者有一些潜在的建议。
患者必须对他们通过搜索结果找到的信息保持警惕,跟踪网站的来源和所提供信息的有效性。搜索结果中提出的问题的构成也在得到的回答类型中起着作用;因此,在网上搜索结果时提出一个明确的问题是很重要的。社区答复是由类似的其他人提供的,也就是说,面临与问题发布者类似健康状况的其他个人。虽然这表示熟悉所提出的问题或所描述的情况,但重要的是要向医疗保健提供者核实与医疗相关的信息或要采取的步骤,以防止负面的健康后果。
引导患者了解通过搜索结果获得的准确信息,有助于提供者不必纠正患者通过搜索结果收集的信息所产生的误解。提供者指导患者在网上搜索信息并确定信息是否可信,这对患者是有帮助的。
在线健康社区在为经历类似健康问题的人提供社会支持方面发挥着关键作用。健康状况的自我管理在慢性疾病的管理中发挥重要作用[
研究人员应该比较不同的在线社区,以分析各种健康状况的信息共享。这样的健康信息可以帮助技术开发人员创建更有效的健康社区,为患者提供更多参与其中的机会和资源。一项重要的发现是,在线社区的其他参与者会分享不正确或危险的信息。开发人员可以根据其他用户提供的反馈创建一种标记危险帖子的方法,这将要求社区管理员评估此类帖子并根据需要纠正所提供的信息。基于我们的代码本的问题分类可以帮助研究人员和开发人员在未来标记需要专业评估的问题。对政策问题的回答为需要帮助的个人提供了方向,而对价值问题的回答则是对个人的评价,我们观察到这两者都有不正确的信息。在未来的研究中,研究人员还应该关注如何以最佳方式提出问题,以便通过搜索结果获得最准确的信息。此外,开发一种方法来帮助患者分析他们通过互联网搜索结果收集的信息是否准确也很重要。大量患者在网上寻找健康信息。因此,确保这些信息的准确性至关重要。
信息学家应该分析在线健康社区共享信息的方式,特别是通过这些社区参与者之间的关系。参与者在这些社区中的角色可以让我们深入了解关系是如何形成的,以及这些关系如何导致信息交换。这些见解包括他们分享和接收的信息种类,以及它在本质上是临床的还是社会的。此外,信息学家应该研究发布的问题,包括在互联网上搜索的问题和在网上社区发布的问题。这样的分析将被证明是有价值的,以确定哪些问题最适合通过搜索引擎来回答,而哪些问题最适合在在线社区中发布(即,这将为特定问题提供最准确和完整的信息)。
最后,我们的两位临床医生在不同地解释相似信息时所面临的麻烦,说明了在网上查找和评估健康信息是多么困难。这个发现很重要,所以未来的网站可以解决这个广泛的质量问题。
如上所述,由于搜索引擎中发布的问题来自糖尿病健康社区,并非所有的问题都提到了他们的糖尿病背景。社区成员假定这种糖尿病背景。例如,对特定饮食的评估不会要求成员记住该饮食是为糖尿病患者准备的,因为它是在糖尿病社区提出的。因为我们决定在搜索引擎中搜索未修改的问题,所以我们得到的答案可能会比我们修改问题以包括这个参数的效率更低(不是在糖尿病上下文中的答案)。未来的研究可能会明确上下文,以研究它会产生的答案的差异。
搜索完整的问题可能会误导搜索引擎。未来的研究可以集中在替代方法上,例如使用问题中的相关信息进行关键字搜索,而不是使用问题作为精确的短语搜索。
此外,搜索结果答案中可以包含3个以上的搜索结果。虽然大多数人不会冒险超出搜索引擎结果的第一页,即使在那里,他们只关注前几个搜索结果[
最后,谷歌的页面排名方法将高质量的网站排在相关主题(例如,来自美国疾病控制和预防中心等政府机构的传入链接的总数)的较低权威级别的网站的前面。因此,我们对前3个搜索结果中在线健康信息的高准确性的发现偏向于谷歌已经在该主题中排名为高权威的内容。然而,大多数搜索者会检查前两个搜索结果,从而纠正了这种不平衡[
我们评估了人们从2个不同的渠道获得他们在线搜索的健康信息:搜索引擎结果和在线社区响应。我们的研究结果表明,问题类型如何决定信息质量和来源。卫生保健从业人员、信息学研究人员和政策制定者应根据信息寻求者的问题类型考虑每个信息源的优缺点。我们的研究有助于提高在线健康信息质量,提高健康自我管理的效率,降低医疗专业人员和患者的成本。
每个类别的问题示例及其社区回应。
这项工作已由美国国立卫生研究院资助1 K01 LM011980-01。
没有宣布。