这是一篇开放获取的文章,根据创作共用署名许可(http://creativecommons.org/licenses/by/2.0/)的条款发布,允许在任何媒介上无限制地使用、分发和复制,前提是正确引用最初发表在《医学互联网研究杂志》上的原创作品。必须包括完整的书目信息,//www.mybigtv.com/上的原始出版物的链接,以及此版权和许可信息。
医生评级网站(PRWs)为医疗保健消费者提供了匿名评估他们的医生的机会。然而,医生的专业培训和经验造成了医生和患者之间在医疗问题上的巨大知识鸿沟。这引起了关于医疗保健消费者对医生绩效评价的相关性和重要性的伦理担忧。
为了确定医生评级网站应该提供的评估方面,本研究调查了医生及其实践与识别好医生相关的方面,以及医疗保健消费者是否有能力评估这些方面。
在第一步中,对来自4个专业的医生进行了德尔菲研究,测试各种指标以确定一个好医生。这些指标在理论上来自多纳伯迪安,他将卫生保健质量分为结构、过程和结果三个支柱。在第二步中,基于德尔菲研究中制定的指标,开展了针对瑞士医疗保健消费者的横断面调查(N=211)。参与者被要求评价这些指标的重要性,以确定一个好医生,以及他们是否觉得在第一次看医生后能够评估这些方面。根据医生和医疗保健消费者的评价和重要性,所有指标被排序到4×4网格中。医生和保健消费者之间的协议计算应用霍尔斯蒂的方法。
在大多数方面,医生和医疗保健消费者就哪些方面的护理对确定一个好医生是重要的和不重要的,以及患者是否能够对他们进行评估达成了共识,产生了74.3%的一致性。双方一致认为,基础设施、员工、组织和人际交往技能对一名好医生都很重要,并且可以由医疗保健消费者进行评估。医生的技术技能和护理结果也被认为非常重要,但双方同意,保健消费者不会对其进行评估。
瑞士的医疗保健消费者对医生批准的评估医疗保健绩效的标准的重要性评价很高,对他们评估医生的质量和绩效的能力也有一定的自我认知。这项研究支持,医疗保健消费者正在区分他们认为在看完医生后能够评估的方面(如结构属性和医生的人际交往技能),以及超出他们做出准确判断能力的其他方面(如医生的技术技能和护理结果)。
互联网创造了一个互动的空间,任何人只要有网络连接,就可以自由地就任何可以想到的主题发表意见。这个公共领域的一个特点是评级平台,让消费者可以评论线上和线下购买的商品和服务。
这种发展也在医疗保健领域得到了体现。所谓的医生评级网站(PRWs)有很多,要么是专门为医生提供的单独评级网站,要么是一个更大的评论平台的一部分,其他商品和服务也可以进行评估,甚至是医院员工目录网站的一部分。在医疗保健中,这种复查文化的发展与患者和医生之间关系的变化是同步的。医生和病人之间传统的家长式关系已经转变为一种更加以病人或客户为中心的方式,被动的病人已经成为积极的医疗保健消费者[
医患关系的这种变化也得到了倡议和相应的研究工作的支持。病人赋权[
从家长式模式向更加平等的合作模式转变,改变了今天医生和病人之间的关系。
医疗服务提供者担心不合理的负面评价[
尽管由于发布评论的匿名性,每个医生的评论数量低,以及缺乏法律法规,医生评级网站的性质存在争议[
专家和研究人员提出了不同的观点,认为prw可以帮助建立更透明的卫生保健系统和监督[
由于护理质量的复杂性,其定义和衡量具有悠久的历史。世界卫生组织将卫生保健质量描述为有效、高效、可获得、可接受、以患者为中心、公平和安全[
多纳伯底亚模式类似于Maribito将医疗保健分类为搜索、经验和信任属性[
本研究分为两部分:与医生进行的德尔菲研究和与成人保健消费者进行的电子问卷调查
德尔菲研究进行了两轮,咨询指南由von der Gracht [
在第一轮德尔菲研究中,医生被要求对每个指标进行两次评价:(1)该指标对确定其专业领域的优秀医生有多重要(1=完全不重要;5=非常重要),(2)患者在第一次就诊后如何评价这一护理质量指标(1=完全不;5 =非常好)。在调查的每个部分结束后,医生都有一个空白区域,可以对被质疑的指标进行评论,并添加尚未包含在问卷中的新指标。第一轮数据收集于2015年10月至12月。
通过电子邮件(包含研究信息和调查链接)或通过瑞士中部医师协会的合作伙伴,共邀请了120名医生参与德尔菲研究。在总数中,29名医生同意参与,并全部参加了第一轮德尔菲。19名医生也完成了第二轮。第一轮的样本包括9名全科医生(33.3%)、5名儿科医生(17.9%)、6名骨科医生(21.4%)、7名牙医(25.0%)和1名内科医生(3.6%)。参与者主要为男性(n=19, 66.6%),年龄在29至63岁之间(平均47.6岁,标准差9.6岁),平均工作经验为19.6年(范围3-37年,标准差10.1年)。
第一轮德尔菲问卷的结果使用SPSS 23.0统计软件(IBM Corp)进行分析。我们参考了von der Gracht出版的指南[
随后,针对医疗保健消费者发起了横断面电子问卷调查,调查的指标与第二轮德尔菲问卷保留的指标相同
该调查由Qualtrics公司于2016年4月至6月通过电子邮件和社交媒体进行雪球抽样。有资格参加的个人是(1)18岁以上,(2)居住在瑞士,(3)有互联网接入。共有211名参与者完成了调查。参与者主要是女性(63%),平均年龄38.24岁(19-74岁,标准差15.51岁),绝大多数是瑞士国籍(188/211,89.1%)。样本受过良好教育,其中53.9%的受访者接受过某种形式的高等教育(博士:12/211,5.7%;大学学历:74/211,35.1%;应用科学大学学历:29/211,13.7%;高中学历:33/211,15.6%;学徒:55/211,26%;中学:3/211,1.4%; and other: 5/211, 2.4%).
绝大多数参与者(82.9%)已经使用过评论网站,其中Tripadvisor是最知名和使用最多的网站(66.4%),其次是Booking(58.8%)、Amazon(49.8%)和Ricardo(48.8%)。大多数医疗保健消费者对医生评级网站持中立态度(48.8%),而36.0%的人赞成能够在线撰写和访问医生评级,15.2%的人反对。只有大约十分之一的参与者从事医疗行业(19/211,9.0%)。
在第三步中,计算医生和保健消费者之间的协议。对第二轮德尔菲研究和电子医疗保健消费者调查结果进行排序和分类(1)重要性和(2)医疗保健消费者评价能力。首先,清理了医疗保健消费者数据。计算平均值、中位数和标准差。然后,为了分类的目的,所有指标从5- 3分制(1和2=不重要或不可评估;3=不确定或有争议;4和5=重要或可评估)。如果满足以下决策标准,该指标被归类为重要指标:(1)如果至少有三分之二(66.66%)的样本投票认为某项指标重要或非常重要,(2)如果标准1不满足,该指标在5分制上的平均值必须高于3.5,标准差小于1。同样的决策规则被应用于评估一个指标是否可被医疗保健消费者评估。第一个标准改编自德尔菲研究,而第二个标准的构建是为了断言意见分歧不大。
在这些结果的基础上,对医生样本和保健消费者样本的指标排序为4类中的1类:(1)指标重要且可以评价,(2)指标重要但不能评价,(3)指标不重要但可以评价,(4)指标不重要且不能被保健消费者评价。指标排序进入4×4矩阵,水平维度表示医生的评估,垂直维度表示医疗保健消费者的评估(见
德尔菲研究产生了35个指标,这些指标符合从文献中得出的共识标准(见[
然而,总体而言,基础设施的重要性略低;特别是执业管理和医疗助理的能力方面被认为不太相关。对管理人员和工作人员打分不那么重要的医生说,从他们的观点来看,执业组织,特别是工作人员和执业助理的质量并没有提供关于医生质量的信息。他们认为,医生的素质、员工的素质和实践管理不应该混为一谈。从他们的观点来看,一个医生的素质是独立于其他列出的方面的。因此,他们认为这些指标的相关性不如他们的一些同事,他们认为管理、员工和基础设施的组成部分是识别一个好医生的不可分割的方面。
四个指标,即效率、卫生标准、患者满意度和提供适当数量的治疗方案,并没有被一致认为是重要的。特别提到的是TARMED,瑞士强制性的费用计算系统,规定了瑞士标准化水平的门诊治疗率(见[
医疗保健消费者关于哪些指标对确定一个好医生很重要以及这些指标在第一次就诊后是否可评估的答案与专家(医生)的答案进行了比较。针对医疗保健消费者和医生,详细列出了这两个维度的结果:
在我们编码的基础上,医疗保健消费者和医生以同样的方式评估了35个指标中的26个(
更仔细地观察数据,医生和医疗保健消费者都认为重要且可被医疗保健消费者评估的医生绩效方面包括:基础设施、组织和实践管理、员工的质量、教育和协作,以及医生的人际行为。医生和医疗保健消费者还就8个方面达成了一致,这些方面是双方评估为重要的,但在首次就诊后医疗保健消费者无法评估。主要是医生的技术能力和技能(如医生做出诊断的方式,治疗步骤是否正确执行,医生是否遵循卫生指南)和结果指标(例如,治疗是否有效)被评估为重要,但医疗保健消费者不能评估。
医生和医疗保健消费者的判断之间的分歧主要出现在医疗保健消费者评估某些医疗保健成分的能力方面。医疗保健消费者与医生的想法不同,他们无法判断自己是否被正确诊断,诊断是否及时,治疗是否迅速开始,以及他们的担忧是否得到保密处理。然而,医生认为医疗保健消费者没有能力评估必要的诊断仪器是否在实践中可用,以及医生是否已经有很多工作经验。
通过计算总体均数,对护理的不同维度进行调查,结果显示,保健消费者认为医生的技术技能是最重要的(平均4.70,标准差0.37),其次是人际交往技能(平均4.64,标准差0.38)和护理结果(平均4.46,标准差0.48)。基础设施(平均4.20,SD 0.56)、组织(平均4.00,SD 0.72)和员工素质(平均3.89,SD 0.57)被认为不那么重要。
在医疗保健消费者对医生的自我感知评估能力方面,他们认为自己对诊所组织和管理的评估能力最高(平均4.17,SD 0.79),其次是医生的人际交往能力(平均4.09,SD 0.66),以及基础设施和可达性(平均4.07,SD 0.67)。护理结果(平均3.85,SD 0.74)、员工质量(平均3.70,SD 0.63)和医生技术水平(平均3.46,SD 0.79)被认为更难判断。
一个4×4矩阵分类指标的重要性,以确定卫生保健质量和卫生保健消费者的评价能力。
指标一个 | 医生 | ||||
|
|
重要且可评估 | 重要但不可评估 | 不重要,但可以评估 | 不重要,也不可评估 |
|
重要的 |
1.4, |
1.2, |
|
|
重要,但 |
4.1 4.9 5.6 | 2.6, |
|
|
|
不重要 |
1.1, 1.3, |
|
|
|
|
不重要 |
|
2.3 |
|
|
一个在图表中分类的指标以数字形式列在
独立样本均值
医疗保健消费者认为重要方面的性别差异(独立样本)
指示器 | 性别 |
|
|
||
|
|
男性 | 女 |
|
|
1.3 | 病人的隐私得到保障 | 4.24 |
4.67 |
−3.569一个 | 127.56 |
1.4 | 这种做法干净卫生 |
4.58 |
4.86 |
−3.630b | 110.78 |
4.4 | 医生向病人提供适当和完整的治疗方案 | 4.31 |
4.69 |
−3.616b | 114.59 |
4.5 | 医生正确评估病人的缺陷,并向他或她提供适当的信息和治疗方案 | 4.35 |
4.62 |
−2.740一个 | 131.51 |
4.7 | 医生和他的团队遵守卫生指南 | 4.63 |
4.89 |
−3.280一个 | 102.49 |
5.3 | 医生能理解地传达有关诊断和治疗的所有重要信息 | 4.71 |
4.87 |
−2.644一个 | 126.01 |
5.7 | 医生以同理心对待病人 | 4.29 |
4.63 |
−3.255一个 | 128.52 |
一个
b
为了评估不同教育水平的个体是否对哪些方面的护理对确定一个好医生很重要以及医疗保健消费者是否可评估有不同的意见,样本被细分为2组。完成高等教育(即博士、大学和应用科学大学)的个体被标记为“高等教育”,而没有接受高等教育(即高中、学徒和中学)的个体被归类为“低教育”。
医疗保健消费者自我感知评价医生能力的性别差异(独立样本)
指示器 | 性别 |
|
|
||
|
|
男性 | 女 |
|
|
4.7 | 医生和他的团队遵守卫生指南。 | 3.38 |
3.90 |
−3.279一个 | 209 |
一个
独立样本的结果
重要性方面的教育差异(独立样本
指示器 | 教育水平 |
|
|
||
|
|
低 | 高 |
|
|
2.2 | 医疗实践助理乐于助人、友好 | 4.54 |
4.23 |
2.941一个 | 190.624 |
2.3 | 执业助理的工作经验丰富 | 3.55 |
3.22 |
2.355一个 | 204 |
2.5 | 这位医生与他的团队合作得很好 | 4.51 |
4.18 |
3.256一个 | 204 |
3.4 | 医生可以进行电话咨询(预约前或预约后) | 4.23 |
3.86 |
2.906一个 | 204 |
4.6 | 医生和他的团队正确地执行治疗步骤 | 4.82 |
4.11 |
2.533一个 | 199.250 |
5.5 | 医生激励病人积极参与治疗过程 | 4.52 |
4.22 |
2.831一个 | 202.718 |
5.7 | 医生以同理心对待病人 | 4.66 |
4.38 |
2.938一个 | 203.110 |
6.2 | 病人对治疗很满意。 | 4.74 |
4.49 |
2.863一个 | 197.191 |
6.3 | 患者回到同一位医生那里进行检查等(患者忠诚度)。 | 4.62 |
4.49 |
3.266b | 203.841 |
一个
b
评估能力方面的教育差异(独立样本)
指示器 | 教育水平 |
|
|
||
|
|
低 | 高 |
|
|
4.9 | 医生及时做出正确诊断,迅速启动治疗 | 3.58 |
3.22 |
2.485一个 | 204 |
5.6 | 病人的担忧得到保密处理 | 3.22 |
2.81 |
2.183一个 | 204 |
5.8 | 关于行动方案的决定是与病人一起做出的 | 4.14 |
4.43 |
−2.261一个 | 161.254 |
一个
b
好医生的判断指标重要性与年龄的Pearson相关系数(N=211)。
指示器 | 年龄 | |
2.3 | 执业助理的工作经验丰富 | .241b |
2.4 | 医生已经有了较长时间的工作经验和实践 | .214b |
3.1 | 等待下一次预约的时间很短 | .238b |
3.2 | 如果预约延误或取消,会通知病人 | .151一个 |
3.3 | 与医生预约是很容易的 | .154一个 |
5.5 | 医生激励病人积极参与治疗过程 | .150一个 |
5.8 | 关于行动方案的决定是与病人一起做出的。 | .148一个 |
一个
b
进一步分析医疗保健消费者数据,以检查年龄与医疗保健消费者对某些方面的医疗保健的重要性属性以及他们对医疗保健提供者的自我感知能力之间是否存在关系。相关分析的结果显示,随着年龄的增长,医疗保健消费者认为组织和共享决策方面更重要(
医疗保健消费者对医疗保健方面的感知能力与年龄的相关系数(N=211)。
指示器 | 年龄 | |
1.1 | 医生的诊所很容易到达,可以乘坐公共交通工具和汽车 | −.149一个 |
2.3 | 执业助理的工作经验丰富 | .257b |
2.4 | 医生已经有了较长时间的工作经验和实践 | .179b |
2.5 | 这位医生与他的团队合作得很好 | .223b |
4.1 | 病人的诊断是正确的 | .202b |
4.2 | 医生询问相关问题,并要求进行正确的检查,以得出正确的诊断 | .189b |
4.3 | 医生系统而能干地进行诊断,以达到正确的诊断 | .168一个 |
4.7 | 医生和他的团队正确地执行治疗步骤 | .224b |
4.9 | 医生及时做出正确诊断,迅速启动治疗 | .173一个 |
5.8 | 关于行动方案的决定是与病人一起做出的 | .171一个 |
6.4 | 治疗有效(即成本效益比准确) | .142一个 |
一个
b
我们的结果显示,大多数医疗保健消费者和医生对35个指标中的26个进行了相似的分类,这两个指标都是在确定一个好医生的重要性和患者在第一次就诊后评估他们的感知能力方面。数据显示,大多数指标被评估为既重要又可由医疗保健消费者进行评估,因此产生有限的方差。出现这种情况的原因是,医生认为在第一轮德尔菲研究中不重要的指标在第二轮研究中被排除在外。此外,这些项目没有呈现给医疗保健消费者,这可能解释了这种缺乏差异的一些原因。然而,数据提供了一个初步的迹象,医疗保健消费者有一个中等自我感知能力,以评估医生的素质和技能。
更仔细地观察被认为是可评估的护理方面,我们发现,医疗保健消费者和医生认为,前者评估基础设施、组织和医生人际行为的能力较高。保健质量的这些方面适合保健消费者进行评估,因为它们不需要医疗专业知识进行评估。在医疗保健消费者无法评估的方面,我们的结果表明,医疗保健消费者和医生对患者评估医生技术技能或护理结果的能力持保留态度。具体来说,医生的教育质量、达到正确诊断的过程、治疗的执行(能力、卫生和效率)以及治疗方案的提出是相互认可的关键,但医疗保健消费者不能评估。
这些结果表明,医疗保健消费者承认并意识到医生和患者之间的专业知识差距,这种差距是由医生的医学教育引起的[
医生选择研究表明,当医疗保健消费者不得不选择医生时,技术方面往往被认为是最重要的标准[
结果进一步表明,在这26个指标中,有6个主要涉及医生达到和执行诊断的能力,不应该被医疗保健消费者审查,因为他们缺乏这样做的能力。Verhoef和他的同事已经建议混合信息来源来报告护理质量的不同方面,结合患者回顾作为习惯质量报告的补充。
在基于性别和教育水平的感知重要性和评估能力差异的分析中,出现了两种模式:女性和受教育程度较低的人认为指标更高或更重要,并且认为护理方面的可评估性优于男性和受教育程度较高的人。鉴于女性更关注健康问题,更积极地搜索健康信息[
此外,我们的结果表明,没有受过高等教育的人比有大学学位的人具有更高的评估医疗保健方面的能力。这一发现令人震惊,因为较低的教育水平与较低的卫生素养有关[
除了教育程度和性别,年龄在个人判断什么是鉴别好医生的重要因素中起着重要作用,并且可以在看完医生后进行判断。总的来说,随着年龄的增长,个人认为与医生做决定的各个方面和便利性(可达性,日程安排等)更重要。此外,年龄较大的人认为自己对医生技术技能的评估能力更高。最有可能的是,老年人在他们的一生中收集了实际的医疗保健经验,使他们对自己评估医生的技能更满意。然而,对这些结果的解释需要谨慎,因为潜在的混杂因素没有包括在分析中。
这项研究有一些局限性。首先,两个样本的招募和组成存在局限性。德尔菲研究从第一轮到最后一轮的参与者退出率从n=29到n=19。本研究中招募的医疗保健消费者样本提出了另一个限制。数据通过网络滚雪球抽样收集。因此,该结果不能声称具有代表性。由于样本中有大量年轻的、受过高等教育的女性填写了问卷,建议在不同的背景或国家复制这项研究,以获得更均衡的样本。
此外,医生和医疗保健消费者之间的比较结果是有限的,因为由于设计原因,德尔菲研究样本远远小于医疗保健消费者样本(德尔菲vs横断面调查)。因此,由于样本的多样性,不可能进行参数测试来确定医疗保健消费者和医生的评估是否具有统计学意义。为了调整这一限制,如方法一节所述,采用了严格的分组标准和阈值,将指标分为上述4类。此外,横断面调查仅包括第一轮德尔菲研究后保留的项目,以缩短对医疗保健消费者的调查。因此,只有医生在第一轮德尔菲研究中确定为“重要”的项目才会呈现给医疗保健消费者,从而潜在地限制了研究结果的差异。
此外,我们评估个体自我感知能力来评估医生技能的方式,并不能确定个体在现实中能够如何评估他们的医疗保健质量。此外,如果个人有机会判断医生的技术能力,即使他们以前表示他们不认为自己能够评估医疗保健的这一方面,他们是否会克制自己不去这样做,这是有争议的。与其询问个人评估医疗保健某些方面的感知能力,不如向他们展示治疗经历的案例或视频样本,并让他们评估和回顾这些案例或视频样本,从而提供更多关于个人评估医生绩效的感知能力的答案。
四个具有不同技能要求、客户群体、手术参与和支付方案的专业(儿科医生、骨科医生、全科医生、牙医)被邀请参加。在未来的研究中,应该邀请其他医学专家单独制定指标,仅针对特定的医学专业知识来识别一个好医生。如何确定一个好医生的指标可能会因所研究的医生的专业化而有所不同。
医生和医疗保健消费者对医疗保健质量的重要和可评估方面的适度认同表明,prw可能受益于以选定的方式提供关于医生质量的信息和口碑。患者和医生一致认为,医疗保健消费者对其提供者的评估应限于基础设施、组织、员工和他或她的人际交往能力。技术专长和护理结果也被认为很重要,但医生和卫生保健提供者都没有将准确评估它们的能力赋予患者。此外,我们的研究结果表明,社会人口统计学特征(年龄、性别、教育水平)在医疗保健消费者评估什么是确定好医生的重要因素以及第一次就诊后可以评估什么方面发挥作用。
我们的研究结果表明,医疗保健消费者可能会同意一种混合模式,在这种模式中,医疗保健消费者可以评估医疗保健的搜索和体验方面,而技术护理信息可以由有能力评估医生医疗技能的来源或委员会提供(例如,外部专家委员会)。这可能会产生一种混合模式,在这种模式中,医疗保健消费者和专家都可以提供根据他们的专业水平调整的信息。医疗保健消费者对医生的评价和专家信息的混合格式如何才能最好地实现,以及PRW用户将在多大程度上支持和使用这种混合格式,这应该是未来研究的主题。
由医疗保健消费者和医生评估的指标重要性方面的指标比较。
保健消费者与医生健康消费者评价能力指标比较
医生评级网站
电子口碑
Qualitäts-Basis模块(Verdag)
作者要感谢医生和横断面研究参与者的宝贵时间和参与这项研究。特别感谢瑞士中部医师协会的Ueli Zihlmann在招募医生参与德尔菲研究方面的帮助,以及Kilian Schaudig在问卷设置和预测试方面的技术支持。
没有宣布。