卡塔尔世界杯8强波胆分析|卡塔尔世界杯4强波胆分析

JMIR

J医疗互联网服务

医学互联网研究杂志

1438 - 8871

冈瑟Eysenbach

卡塔尔世界杯8强波胆分析JMIR出版公司，多伦多，加拿大

v14i2e50

22491423

10.2196 / jmir.2005

原始论文

在线医生评论:他们跟踪外科医生的数量，一个代理的护理质量?

Eysenbach

冈瑟

受拉

丹尼尔

高

国栋

Goeuriot

洛林

西格尔

杰弗里

医学博士、法学博士 1

医疗司法服务公司

邮政信箱49669

格林斯博罗，北卡罗来纳州，27419

美国 1 336 691 1286 1 208 988 5897 jsegal@medicaljustice.com

Sacopulos

迈克尔

JD 2 表

维吉尔

博士学位 3. 瑟斯顿

爱尔兰

4 布鲁克斯

坎德拉

4 Puccia

瑞安

¹ 医疗司法服务公司

格林斯博罗、数控

美国 ² Sacopulos，约翰逊，Sacopulos

Terre Haute, IN

美国 ^3. 印第安纳州立大学心理学系

Terre Haute, IN

美国 ⁴ 努斯鲍姆创业中心

格林斯博罗、数控

美国 ⁵ 凯斯西储大学

克利夫兰,哦

美国

3 - 2012

10 04 2012

14 2

e50

19 11 2011 07 12 2011 05 02 2012 09 03 2012

©Jeffrey Segal, Michael Sacopulos, Virgil Sheets, Irish Thurston, Kendra Brooks, Ryan Puccia。最初发表于《医疗互联网研究杂志》(//www.mybigtv.com)， 2012年4月10日。

2012

这是一篇开放获取的文章，根据创作共用署名许可(http://creativecommons.org/licenses/by/2.0/)的条款发布，允许在任何媒介上无限制地使用、分发和复制，前提是正确引用最初发表在《医学互联网研究杂志》上的原创作品。必须包括完整的书目信息，//www.mybigtv.com/上的原始出版物的链接，以及此版权和许可信息。

背景

越来越多的消费者通过互联网寻求健康信息。消费者还使用在线医生评论网站来帮助他们选择医生。这类网站记录了过去患者的数字评分和评论。据我们所知，之前没有研究分析过在医生评论网站上拥有积极在线声誉的医生是否真的提供了更高质量的护理，通常与更好的临床结果和更好的安全记录相关。

客观的

对于许多手术，手术次数多的外科医生比手术次数少的外科医生有更好的临床结果和安全记录。我们的目标是确定作为临床结果和患者安全代理的外科医生数量是否与在线声誉相关。

方法

我们在9个在线评论网站上调查了高容量和低容量外科医生对三种手术的数值评分和评论:腰椎手术、全膝关节置换术和减肥手术。使用相关的现行程序术语(CPT)代码，从索赔要求最高的四分之一组中随机选择高容量外科医生。低容量的外科医生从提交的程序相关CPT代码的索赔中最低的四分之一中随机选择。在规范健康信息数据库中对索赔进行了整理，涵盖2500多万投保患者的多个支付人。

结果

在我们的样本中，对大多数医生(547/600,91.2%)进行了数值评分，对385/600(64.2%)的医生进行了评论。我们发现，通过分析:(1)每个网站的数字评分总数(HV: mean = 5.85;LV: mean = 4.87， P<措施);(2)每个网站的文字评论总数(HV: mean = 2.74;LV: mean = 2.30， P= . 05);(3)对护理质量的溢美之词/总评价的比例(HV: mean = 0.64;LV: mean = 0.51， P= .002);(4)对护理质量的尖锐批评/总评论的比例(HV: mean = 0.14;LV: mean = 0.23， P= .005)。即使将这些特征结合在一起，效应量虽然显著，但仍然很弱。结果表明，通过判别分析和分类分析，可以准确识别医生的病人数量，准确率为61.6%。我们还发现，通过分析(1)标准化z评分数值评分(HV: mean = 0.07;LV: mean = 0， P= 10);(2)对客户服务的热情好评/总评论的比例(HV: mean = 0.24;LV: mean = 0.22， P=点);(3)对客户服务的严厉批评占总评论的比例(HV: mean = 0.19;LV: mean = 0.21， P=的相关性)。

结论

在线评论网站提供了丰富的数据来源，可能能够跟踪护理质量，尽管效应大小很弱，并不是所有评论网站指标一致。

医生检查评级网站医生检查在线声誉临床结果医生的选择手术数量外科医生体积

简介

每天在某个地方都会有病人问:“X医生是个好医生吗?”

这种说法本身是没有意义的。病人实际上是在问X医生对某个特定的目的是否是一个好医生。例如，X医生是治疗特定症状或进行特定治疗的好医生吗?

打个比方，这个问题就像“这是一辆好车吗?”更好的问题是:“从油耗角度看，这辆车好吗?”或者“这辆车物有所值吗?”或者“这辆车适合快速加速吗?”每个问题都有不同的答案。

病人上网寻找“X医生是个好医生吗?”，但他们实际上是在问X医生是否适合某个特定的目的。X医生是一个好的诊断专家吗?还是他富有同情心，善于倾听?或者她是一位治疗过1000多名Chiari畸形患者的医生?一个典型的医生评论网站很少有足够明确的区分。

我们的假设是，孤立的医生评论网站可能不能很好地代表患者真正关心的东西，即临床结果和安全性。医生评论网站衡量病人是否喜欢他们的医生。这些网站也会衡量主观反应。医生沟通得好吗?医生会听吗?他们是如何经历手术的?这些措施很重要，因为临床结果取决于患者在决策和依从性方面发挥的合作作用。这些措施可以通过更客观的沟通措施加以补充，例如医生能够始终如一地向具有广泛医学素养的患者传递有关风险、益处和选择(例如各种治疗方法)的信息。其他补充的客观指标包括临床结果和安全性。在某种程度上，对于个别医生的结果或安全记录存在明确的在线衡量标准[ 1]，目前流行的医生评论网站并没有对这些数据进行整理。

医学文献支持这样一种观点，即对于某些外科手术，外科手术量与临床结果相关[ 2- 11］．换句话说，对于特定的手术，大容量(HV)外科医生比小容量(LV)外科医生有更好的结果。目前还不清楚为什么会出现这种情况:也许是熟能生巧——或者是越成功的医生就会得到更多的转诊。但是，网上关于外科医生量的信息也很难找到——如果有的话。

我们提出的问题是，在三种不同的手术中，在线医生评论网站上的帖子是否与外科医生数量(作为质量的代表)总体相关。我们的目标是先前已经提出这种相关性的外科手术:腰椎手术[ 12]、全膝关节置换术[ 13- 14]，以及减肥手术[ 15- 18］．换句话说，总的来说，高产量的外科医生比低产量的外科医生更有可能发布积极的帖子(而更少的负面帖子)吗?通过这样做，我们希望更好地了解大容量医生(总体上有更好的临床记录)是否有更好的在线声誉。

方法医生

选择进行腰椎手术、全膝关节置换术和减肥手术的外科医生进行研究，因为有数据支持这些手术的外科医生数量与临床结果/患者安全性之间的相关性。此外，与血管或肿瘤手术相比，这些手术更有可能被认为是“选择性的”，影响的人群更年轻(也有关于外科医生数量和临床结果/患者安全的数据)。我们认为，“年轻”的患者在考虑“选择性”手术时，更有可能访问在线评论网站，以帮助指导他们选择外科医生。

确定并选择了减肥手术、腰椎手术和全膝关节置换术的现行程序术语(CPT)代码( 表1)．虽然还有其他代码用于标记这三种手术，在表1确定绝大多数做过减肥手术、腰椎手术或全膝关节置换术的患者。

表1

减肥手术、腰椎手术和全膝关节置换术的程序规范和选择标准。

过程	代码	描述
减肥手术^一个	43644	Lp GSTR rstrciv prc;GSTR byps & roux-en y
	43644	胃旁路手术
	43645	Lp GSTR rstrciv prc;GSTR byps&sm intst r
	43645	胃绕道术包括小肠
	43770	Lap place gastr adj装置
	43770	未知的过程
	43770	环绕GSTR RSTCV px PLMT波段
	43842	v频带胃成形术
	43842	肥胖胃成形术
	43843	胃成形术不带v形带
	43843	肥胖胃成形术
	43846	胃分流术治疗肥胖
	43846	胃分流术治疗肥胖
	43846	Gast restricc w / byp;roux - en - y短
	43847	胃分流术包括小肠
	43847	胃分流术治疗肥胖
腰椎融合术^b	22558	腰椎融合术
	22612	腰椎融合术
	22630	腰椎融合术
	0309	对椎管进行开掘和减压
	0309	椎管探测仪
	63030	下背部椎间盘手术
	63035	椎间盘手术插件
	63035	增加椎间盘手术
	63042	椎板切开术，单腰椎
	63042	下背部椎间盘手术
	63044	半椎板切除术w神经rt dec
	63044	椎板切开术，腰椎移位
	63047	椎板切除
	63048	椎板切除
	63048	移除脊柱椎板附加件
	63056	脊髓减压
	63057	减压脊髓附加装置
	63057	脊髓减压
	8108	后路腰椎融合术
	8108	腰，腰囊，蚁丘技术

全膝关节置换术^c	27445	膝关节翻修术
	27447	全膝关节置换术
	27447	全膝关节置换术
	8154	全膝关节置换术

^一个CPT-4程序规范

^bCPT-4和国际疾病分类第九修订版(ICD-9)程序代码的混合

^cCPT-4和ICD-9程序代码混合

医生姓名来自OptumInsight的规范健康信息数据库(NHI)，这是一个由美国最大的综合保险公司之一维护的国家数据库。NHI包含超过2500万受保患者的多重支付人、健康保险可携带性和责任法案(HIPAA)合规交易级索赔。Lewin集团搜索了数据库，并创建了一份医生名单，这些医生在2009-2010年期间至少提交了一次CPT代码的账单，用于三个外科手术( 表2)．

表2

2009-2010年向规范健康保险(NHI)承运商提交至少一次有关CPT/ICD9程序代码账单的独立医生人数^一个．

手术类型	医生人数
减肥手术	1992
腰椎融合术	10195年
全膝关节置换术	13628年

^一个数据库为2010年1月1日- 2010年12月31日

我们的样本包括600名从事减肥手术(n = 200)、腰椎手术(n = 200)和全膝关节置换术(n = 200)的医生。从每个CPT/ICD9编码目标程序提交最多报销要求的四分位数医生中，随机选择100名医生代表“高容量”医生，从最低四分位数医生中随机选择100名“低容量”医生(2009-2010年提交最少CPT/ICD9编码目标程序报销要求的医生)。低量外科医生提交了至少一个相关手术的CPT/ICD9程序代码。报告了2009-2010年向NHI运营商提交账单的高容量和低容量外科医生进行的三种类型的相关手术的中位数表3．潜在的假设是，打算进行减肥手术、腰椎手术或全膝关节置换术的患者会在互联网上搜索有经验进行此类手术的医生的信息(并向保险公司提交报销账单)。

表3

高容量和低容量外科医生进行手术的中位数^一个．

手术类型	手术方法
	大容量的外科医生	少量的外科医生
减肥手术	16	3.
腰椎融合术	40	6
全膝关节置换术	13	3.

^一个根据2010年1月1日至2010年12月31日向NHI承运人数据库提交的账单确定。

数据收集

作者不知道哪些医生是高产量外科医生，哪些是低产量外科医生。

以数字评分和评论形式的医生评价收集自9个不同的访问量很大的网站:一个评论网站将其重点限制在医生和律师(Avvo);3个网站只关注医生(HealthGrades, RateMDs和Vitals);5个网站对包括医生在内的一系列商业和服务进行评论(Citysearch, InsiderPages, Yahoo!Local，谷歌Maps和Yelp)。Alexa (www.alexa.com)对美国网站流量的排名显示在表4．Alexa是全球网络指标(如流量)的领先提供商。

表4

Alexa在美国选定评论网站的流量排名[ 19］．

网站类型	网站的名字	URL	Alexa美国流量排名
Doctor-specific
	Avvo^一个	www.avvo.com	1613
	HealthGrades	www.healthgrades.com	570
	RateMDs	www.ratemds.com	6320
	重要器官	www.vitals.com	2029
全面审查
	Citysearch	www.citysearch.com	341
	InsiderPages	www.insiderpages.com	1430
	雅虎当地的	www.local.yahoo.com	4
	谷歌地图	www.maps.google.com	1
	Yelp	www.yelp.com	43

^一个也审查律师

评分是由患者的主观印象定义的数值度量。例如，在1-5分的范围内，患者如何评价医生的整体素质、及时性、沟通能力等。每个网站都有不同的衡量标准，但大多数网站至少问了一个类似于“总的来说，你给医生打多少分?”

我们使用样本中每个医生的名字和位置搜索每个网站。我们记录了每个医生的评分数量和“整体”评分。在允许对多个维度(如沟通、信任、守时和与病人相处的时间)进行评分的网站上，所有数字评分的平均值也被记录下来。

评论是对病人主观体验的自由文本描述。例如，“X医生很有同情心，倾听了我的每一个担忧。”

我们记录了每个医生的评论数量。三名独立评委中的一名同样对医生的执业量视而不见，他审查了每一篇帖子，并将其分类为包含溢美之词或严厉批评，以及溢美之词或严厉批评是否涉及护理/安全或客户服务质量。一篇文章可以包括对护理质量和客户服务的评论。如果是的话，这两项都包括在内。那些既不火热也不火热的评论被记录在了帖子总数中，但没有被记录在火热/火热的统计中。一个典型的关于高质量护理/安全的评论是“X医生让我重获新生。”相比之下，一个严厉的护理质量/安全评论是“X医生是一个屠夫。”热情洋溢的客服评论的一个典型例子是“X医生深夜回了我的电话，给了我所有需要的时间。”相比之下，一个严厉的客服评论是“X博士不屑一顾，傲慢，从不倾听。”其中一个名为HealthGrades的网站不允许发表评论。

由于许多消费者可能不会对医生信息进行详尽的搜索，我们记录了在谷歌搜索腰椎和全膝关节置换术样本中每个医生的前20个检索中是否有任何研究网站的链接。对每个医生进行谷歌搜索，搜索格式为以下三种:

1.“Dr. First_Name Last_Name”+“城市，州”

2.“First_Name Last_Name, D.O.”+“城市，州”

3." Dr. First_Name Last_Name, M.D. " + " City, State "

单独的分析只使用在这个简短的搜索中检索到的数据。前20个链接与典型搜索中检索到的前2个网页相关，因为谷歌搜索的默认设置是每页10个结果。［ 20.］

一旦从在线评论网站获取数据，电子表格就会被发送给卢因集团。他们增加了一个字段，表明医生是高音量还是低音量。随后，所有其他医生识别信息都被剥离，并被打乱了排列。然后将数据库返回给作者进行分析。

分析方法

医生评论网站上的评分和评论是否提供了关于手术量(临床结果/安全性的代表)的有效信息?我们通过比较高容量和低容量医生的可用信息来回答这个问题，并在2 × 3方差分析中控制手术实践。我们的分析还考虑了高容量和低容量医生之间的差异是否在减肥、腰椎和全膝关节置换术手术实践中一致。

使用每个网站的平均评分次数进行分析(每个医生至少被评分一次)。对每个医生的总体评分进行了额外的分析，在各个网站上平均。使用医生总体评分的分析跟踪了包括特定医生特征评分的平均值(多维数值评分的平均值) r> .85)，因此只提供使用整体评级的分析。Vitals网站使用了与其他网站(1-5)不同的评分量表(1-4);因此，从每个网站的评级是标准化使用 z测试(将每个医生的分数转换为每个网站上的平均值的标准差数)。的 z分数，或标准分数，允许在网站上平均评级。

使用每个医生在网站上至少发表一条评论的平均评论数进行分析。研究人员还进行了额外的分析，根据他们是否关注医生的护理质量或客户服务，来确定热情和严厉的评论的比例。

结果

首先，我们使用每位医生的所有可用数据报告这些分析结果。其次，我们报告的分析仅限于腰椎手术和全膝关节置换术样本中每个医生谷歌搜索的前20个链接中可用的数据。最后，我们提出了一项分析的结果，该分析探讨了使用来自评级和发布评论的数据来区分高容量和低容量医生的增量有效性。

表5展示了我们样本中医生的数量，并在每个研究网站上发布了评级和评论。

表5

研究网站上公布的外科医生评分和评论的数量。

	有评分的外科医生(N = 547)				外科医生评论(N = 385)
网站	减肥(n = 170)	腰椎(n = 182)	膝盖(n = 195)	总计	减肥(n = 101)	腰椎(n = 147)	膝盖(n = 137)	总计
重要器官	101	134	137	372	68	107	98	273
HealthGrades	129	161	165	455
RateMDs	44	91	77	212	40	87	74	201
InsiderPages	One hundred.	141	151	392	7	9	13	29
Avvo	1	2	3.	6	1	2	3.	6
雅虎当地的	11	17	20.	48	10	17	19	46
谷歌地图	9	16	6	31	1	14	5	20.
Citysearch	2	5	3.	10	2	2	1	5
Yelp	3.	1	4	8	3.	1	4	8
总计	400	568	566	1534	132	239	217	588

所有可用数据

在我们的样本中，大多数医生(547/600,91.2%)都有数值评分;385名(64.2%)医生发表了评论。平均每位医生在9个网站中的3个网站上有评分(范围:1-7)，在1个网站上有评论(范围:1-5)。初步分析表明，医生在所有网站上的总评分数与每个网站的总评分数之间的相关性为 r= .86， ( P<措施)。额外的初步分析显示，流量大的医生在所有网站上的总评分更高，在更多网站上的评分也比流量小的医生高。我们的分析集中于每个网站对医生的平均评分，基于这样一个假设:一个典型的消费者可能不会对许多网站上所有可用的评分进行详尽的审查，但只要找到一个网站上有他或她的医生的信息就会满意。

表6介绍所有可用医师资料的分析结果。在每种类型的实践中，大容量医生在每个网站上的评分明显高于小容量医生( P< .001)，并且没有证据表明这种效果在医生组之间存在差异( P=酒精含量)。然而，分配给大容量医生的标准化数值评分与分配给小容量医生的标准化数值评分没有显著差异( P= .27)，这一无效发现在不同医生组之间也没有差异( P=的相关性)。表6此外，对于每种类型的实践，高流量医生在每个网站上的评论都比低流量医生多( P= . 05)。同样，没有证据表明这在不同的医生组之间存在差异( P= .74点)。

表7表明只有与护理质量相关的评论似乎才能区分高容量和低容量的医生;高容量的医生有更大比例的溢美之词( P= .002)，对护理质量的严厉评论比例明显低于低量医生( P= .005)。同样，我们在每个手术实践中观察到这些模式，我们的分析没有提供任何依据来推断这对一个组比另一个组更真实( P发光= .70; P= .41严厉)。我们还观察到，总体上，即使是对小众医生来说，热情的评论也远远多于严厉的评论。总的来说，我们观察到，大容量的医生对医疗质量有近64%的好评(而小容量的医生有51%)。总体而言，与客户服务相关的热情/严厉评论的比例在高数量医生和低数量医生之间没有区别( P发光= .52; P= 0.48的严厉)，也没有证据表明这一无效发现在不同医生组之间存在差异( P发光= .92; P= .20严厉)。

表6

分析高容量和低容量外科医生的评分和评论。

		外科医生卷									方差分析
		所有		减肥		腰椎		膝盖		体积^一个		过程^b		交互^c
		高压	LV	高压	LV	高压	LV	高压	LV	F	P	F	P	F	P
有评级的外科医生
	N =	547		170		182		195		F 1541年		F 2541年		F 2541年
	意味着评级/网站^d(SD)	5.85 (3.92)	4.57 (3.29)	4.40 (3.22)	3.70 (2.53)	7.49 (4.29)	5.39 (3.97)	5.60 (3.58)	4.63 (3.02)	18.33	<措施	20.73	<措施	1.88	酒精含量
	综合评分^e	0.07 (0.74)	-0.00 (0.84)	0.35 (0.68)	0.19 (0.90)	-0.14 (0.75)	-0.10 (0.85)	0.03 (0.69)	-0.07 (0.77)	1.21	低位	11.98	<措施	0.74	的相关性

外科医生的评论
	N =	385		101		147		137		F 1379年		F 2379年		F 2379年
	意思是评论/网站^d(SD)	2.74 (1.95)	2.30 (2.05)	2.03 (1.30)	1.78 (1.36)	3.07 (2.00)	2.74 (2.44)	2.87 (2.15)	2.25 (2.01)	3.82	0。	7.72	措施	0.30	.74点

^一个比较高容量和低容量的外科医生

^b比较减肥、腰椎和膝关节外科医生

^c比较不同外科医生类别的高容量外科医生和低容量外科医生

^d只包括医生至少有一个评价/评论的个人网站

^e z分数

表7

分析高容量和低容量外科医生的尖锐和热情洋溢的评论。

		外科医生类型										方差分析
		所有(n = 385)			减肥(n = 101)			腰椎(n = 147)		膝盖(n = 137)		体积^一个		过程^b		交互^c
		高压		LV	高压	LV		高压	LV	高压	LV	F 1379	P	F 2379	P	F 2379	P
护理质量评论
	发光的意思是(SD)		1.76 (1.56)	1.25 (1.46)	1.09 (0.98)	0.73 (0.64)	2.06 (1.50)		1.55 (1.50)	1.89 (1.81)	1.35 (1.76)	9.43	.002	11.59	<措施	0.11	.89
	发光的% (SD)		0.64 (0.35)	0.51 (0.38)	0.53 (0.38)	0.44 (0.41)	0.70 (0.30)		0.55 (0.34)	0.64 (0.36)	0.53 (0.40)	9.87	.002	4.57	. 01	0.36	2
	严厉的意思是(SD)		0.35 (0.65)	0.44 (0.57)	0.26 (0.49)	0.34 (0.57)	0.40 (0.79)		0.57 (0.61)	0.35 (0.59)	0.38 (0.53)	1.98	16	2.80	06	0.42	点
	严厉的% (SD)		0.14 (0.26)	0.23 (0.34)	0.15 (0.30)	0.19 (0.35)	0.12 (0.22)		0.27 (0.33)	0.15 (0.27)	0.23 (0.35)	8.01	.005	0.28	.76	0.90	.41点

客服意见
	发光的意思是(SD)		0.65 (0.90)	0.52 (0.89)	0.23 (0.41)	0.17 (0.42)		0.60 (0.72)	0.57 (1.02)	1.00 (1.16)	0.74 (0.93)	1.65	.20	17.83	<措施	0.74	的相关性
	发光的% (SD)		0.24 (0.30)	0.22 (0.32)	0.11 (0.23)	0.09 (0.26)		0.22 (0.27)	0.22 (0.31)	0.36 (0.33)	0.32 (0.35)	0.41	点	18.93	<措施	0.09	.92
	严厉的意思是(SD)		0.58 (0.87)	0.49 (0.79)	0.32 (0.60)	0.18 (0.42)		0.73 (0.93)	0.67 (0.93)	0.60 (0.92)	0.56 (0.80)	0.97	收	9.29	<措施	0.12	.89
	严厉的% (SD)		0.19 (0.27)	0.21 (0.32)	0.14 (0.28)	0.08 (0.21)		0.22 (0.27)	0.26 (0.32)	0.19 (0.26)	0.26 (0.36)	0.49	的相关性	6.78	措施	1.60	.20

^一个比较高容量和低容量的外科医生

^b比较减肥、腰椎和膝关节外科医生

^c比较不同外科医生类别的高容量外科医生和低容量外科医生

前20个链接

我们对医生数据进行了重新分析，这些数据仅限于通过谷歌搜索医生姓名返回的前20个链接的评论网站( 表8)．这些搜索返回部分或全部样本医生评论网站的链接，可以访问大多数(896/ 1134,79%)医生至少有一个评分的网页和医生至少有一个评论的网页(347/456,76%)。该分析仅限于腰椎和全膝关节置换术样本。我们从这个亚分析中排除了减肥手术，因为通过前20个链接可以获得的评论和评论的数量不足以得出有意义的结论。的分析表9与在表7使用全部可用数据。

我们再次发现，流量大的医生比流量小的医生在每个链接网站上有更多的评级和评论。对高量和低量医生的数值评分没有差异。对护理质量评价高的医生比评价低的医生有更高比例的溢美之词(而批评的比例更低)。关于客户服务的评论比例没有差异。

表8

分析前20个网站(不包括减肥手术)对高容量和低容量外科医生的评分和评论。

		外科医生卷						方差分析
		全部(N = 374)		腰椎(n = 181)		膝盖(n = 193)		体积^一个		过程^b		交互^c
		高压	LV	高压	LV	高压	LV	F 1370年	P	F 1370年	P	F 1370年	P
评级
	意味着评级/网站^d(SD)	6.76 (4.18)	5.47 (4.55)	7.70 (4.39)	6.08 (5.24)	5.85 (3.76)	4.93 (3.78)	8.21	04	11.30	措施	0.62	点
	综合评分^e(SD)	-0.01 (0.78)	0.02 (0.83)	-0.08 (0.80)	0.01 (0.85)	0.05 (0.76)	0.04 (0.81)	0.22	.64点	0.96	.33	0.38	54
评论
		外科医生卷						方差分析
		全部(N = 266)^一个		腰椎(n = 138)		膝关节(n = 128)		体积^一个		过程^b		交互^c
		高压	LV	高压	LV	高压	LV	F 1262年	P	F 1262年	P	F 1262年	P
	意思是评论/网站^d(SD)	3.16 (2.36)	2.51 (2.32)	3.24 (2.24)	2.71 (2.60)	3.06 (2.51)	2.32 (2.03)	4.78	03	0.98	收	0.13	开市

^一个比较高容量和低容量的外科医生

^b比较腰椎和膝关节手术

^c比较不同外科医生类别的高容量外科医生和低容量外科医生

^d只包括医生至少有一个评价/评论的个人网站

^e z分数

表9

分析前20个网站(不包括减肥外科医生)上对高容量和低容量外科医生的严厉和热烈的评论。

		外科医生卷						方差分析
		所有(n = 266)		腰椎(n = 138)		膝盖(n = 126)		体积^一个		过程^b		交互^c
		高压	LV	高压	LV	高压	LV	F 1262年	P	F 1262年	P	F 1262年	P
护理质量评论
	发光的意思是(SD)	2.06 (1.74)	1.44 (1.72)	2.13 (1.59)	1.52 (1.67)	1.98 (1.92)	1.36 (1.77)	8.11	.005	0.51	的相关性	0．00	获得
	发光的% (SD)	0.68 (0.33)	0.53 (0.40)	0.71 (0.30)	0.55 (0.38)	0.65 (0.36)	0.52 (0.42)	10.76	措施	0.78	38	0.12	收
	严厉的意思是(SD)	0.43 (0.88)	0.44 (0.60)	0.45 (0.87)	0.52 (0.62)	0.39 (0.89)	0.37 (0.57)	0.04	点	1.24	低位	0.22	.64点
	严厉的% (SD)	0.12 (0.23)	0.22 (0.34)	0.12 (0.22)	0.25 (0.35)	0.12 (0.24)	0.19 (0.33)	7.34	.007	0.76	点	0.74	点

客服意见
	发光的意思是(SD)	0.80 (0.99)	0.73 (1.05)	0.60 (0.81)	0.59 (1.09)	1.03 (1.13)	0.87 (1.00)	0.48	报	8.13	.005	0.397	53
	发光的% (SD)	0.29 (0.32)	0.31 (0.36)	0.22 (0.29)	0.23 (0.32)	0.38 (0.34)	0.38 (0.39)	0.01	总收入	13.93	<措施	0.04	.85
	严厉的意思是(SD)	0.71 (1.07)	0.61 (0.90)	0.81 (1.04)	0.69 (0.98)	0.60 (1.10)	0.53 (0.82)	0.61	无误	2.24	.14点	0.03	.86
	严厉的% (SD)	0.19 (0.26)	0.24 (0.33)	0.22 (0.27)	0.26 (0.32)	0.16 (0.24)	0.23 (0.35)	2.13	酒精含量	1.38	。	0.16	i =

^一个比较高容量和低容量的外科医生

^b比较腰椎和膝关节手术

^c比较不同外科医生类别的高容量外科医生和低容量外科医生

额外的分析

前面的分析表明，高容量和低容量外科医生可以根据(1)评分数量来识别;(2)意见数量;(3)对护理质量的溢美之词的比例;(4)对护理质量的尖锐评论的比例。接下来，我们试图建立这些不同的信息的实际用途，以区分高容量和低容量的医生。(判别)分析开发了一种功能，最大限度地区分各个研究小组。函数系数(见表10)是支持这种区分的权重;更高的绝对权重表明变量对区分不同组的贡献更大。如表中所示，判别分析表明，每个网站的评分和对护理质量的热情评论的比例是两个最具差异化的信息(最高绝对权重)，其次是对护理质量的严厉评论的比例。每个网站的评论数量，虽然单独检查时提供了一些信息，但提供的附加信息很少(除了其他测量)。

作为随访，我们还进行了分类分析，其中医生的手术量(高或低)是由他们收到的评分和评论数量以及对护理质量的热烈和严厉评论的比例“预测”的(使用判别函数)。结果显示，在61.6%的时间里，人们可以准确地识别医生的手术量。对由此产生的歧视函数进行检查后发现，每个网站的评分数量和热帖的比例似乎是歧视的最主要因素，其次是尖锐评论的比例。评论的数量对这些其他措施来说基本上是多余的。

表10

判别函数分析结果。

	标准化函数系数
每个网站的评分	0.57
每个网站的评论	0.08
发光比例(护理质量)	0.46
比例严厉(护理质量)	-0.35

判别函数显著(= 21.4， P<措施)

讨论

我们的研究发现，有证据表明，在线医生评论网站可以用来识别大量外科医生执行有针对性的手术，这与更高质量的护理相关。病人自然希望找到最好的医生，并接受最好的医生的治疗。他们在网上寻找这些信息。在美国，因特网在决定病人的医疗保健选择方面的重要性不应被低估。皮尤互联网和美国生活项目最近的一项研究指出，59%的成年人在网上搜索过15种健康主题的信息，如特定疾病或治疗方法[ 21］．他们也在寻找医疗保健提供者的信息;12%的成年人咨询过医生或其他提供者的在线排名或评论。

在线评论网站追踪患者的情绪。最近的进展甚至允许根据情绪自动分类患者的评论。夏等[ 22]描述了一种用于患者意见挖掘的多步情感分类器，原则上，它可以分析在线或其他方式的大量数据，并为患者评论分配情感评分。虽然患者的情绪是有帮助的，但据我们所知，我们的研究是第一个解决患者评论、患者情绪和临床结果代理之间联系的研究。

定义医疗保健的质量是困难的。从病人的角度来看，软措施(如沟通技巧和倾听能力)对于决策和依从性等问题很重要，这些问题会影响结果。更客观地说，质量往往反映患者安全和临床结果。这些指标包括发病率和死亡率、住院时间、失血量、重返工作岗位的时间等。这种详细的个体从业人员信息追踪在网上无法方便地提供给患者进行分析。

医学文献表明，对于一些外科手术，每年由个别外科医生进行的病例量与患者安全和临床结果指标相关。换句话说，对于特定的手术，大容量的外科医生比小容量的外科医生有更好的结果。

我们针对三种之前已经显示出这种相关性的外科手术:腰椎手术[ 12]、全膝关节置换术[ 13- 14]，以及减肥手术[ 15- 18］．据我们所知，我们的分析是第一个解决在线评论是否可以通过临床结果和安全性的代理来识别更成功的外科医生的问题。我们提出了以下假设问题:在这三种不同的手术中，在线医生评论网站上的帖子的数量和特征总体上与外科医生的数量(作为质量的代表)相关吗?

我们的研究结果为以下数据提供了证据，这些数据来自9个医生评论网站，可以区分高容量和低容量的外科医生:数字评论的总数;文本注释总数;热情洋溢的正面评论比例;以及尖刻的负面评论的比例。对实际数值评分的分析并没有区分高容量和低容量外科医生。在谷歌搜索医生名字的前20个链接中，同样的结论也被注意到。

虽然我们的分析提供了证据，表明医生评论网站的数据可以帮助消费者识别更高质量的医生，但效应量很弱。从病人的角度来看，确定外科医生是否进行了大量手术的更好方法是询问医生。或者医生可以提前在各种评论网站上提供这些信息。

一个令人惊讶的结果是，虽然评论总数与外科医生的数量相关，但实际评分值却没有。此外，目前还不清楚为什么评论和评论的总数与外科医生的数量有关。也许大容量的外科医生对他们的技术/结果更满意，更有可能向他们的病人寻求内部或互联网上的反馈。无论如何，这样的观察值得进一步研究。

我们的分析也支持了其他人之前报道的一个发现[ 23];也就是说，在在线评论网站上，单一指标(总体评分)与更细粒度、多维度的数值评分高度相关。在我们的分析中，这种相关性是在总体评分和所有多维评分(所有 r> .85)。因此，分析患者对“总的来说，你给这位医生打多少分?”从更详细的问题中预测出积极和消极的情绪。

即使有了这些发现，消费者是否应该严重依赖这些网站仍然是一个悬而未决的问题，部分原因是网站的数据有限。在600名医生中，在对医生进行评分的网站上，平均每个医生有4到6个评分，2到3条评论。随着网站积累的数据越来越多，我们的结论可能会改变。

我们的研究发现，样本中91%的医生至少有一项评分。这与Lagu等人的研究形成了对比。 24在他们调查的33个网站中，70%的医生在任何一个网站上都没有发表过评论。这项研究在2009年春季收集了仅限于波士顿通才和未定义的亚专家的数据。我们的研究收集了2011年夏天全国各地特定类别外科医生的数据。病人从外科医生那里得到的经验，可以说与从通才或许多类型的专科医生那里得到的经验是不同的。手术经验通常是“一次性的”。通才和许多类型的专科医生的经验通常是长期的。患者可能更倾向于根据与外科医生的单一(更情绪化的)经历，而不是与多面手的常规长期经历，来发布评分和评论。但是，医生从在任何网站上没有评论转变为在网站上至少有一个评论的门槛很低。每个医生平均每年要看1000多个病人。如果只有一个病人发了评论，那就越过了这个门槛。 As our data was gathered two years after that of Lagu et al, this suggests that although the number of online reviews per doctor is still limited, the trend is for more reviews for more doctors.

我们的研究仅限于有针对性的外科手术的样本。在该数据集中，可能有大量临床结果/患者安全记录较差的外科医生。可能会有少量的外科医生具有出色的临床结果/患者安全记录。我们的研究只是试图追踪临床质量-手术量-而不是临床质量本身。此外，我们的样本没有对实施分析之外的手术的外科医生做出任何结论，也没有对非手术从业人员做出任何结论。

另一个限制是，NHI数据库用于识别低量和高量外科医生，虽然广泛，但只覆盖提交给私人保险公司的CPT/ICD9程序代码。国家健康保险数据库不反映提交给医疗保险的数据。在调查有关外科医生数量与护理质量的文献时，我们有意选择了三种更有可能在年轻人群中进行的手术，希望最大限度地减少医疗保险数据的缺失对我们分析的影响。

进一步的限制是，我们将评论分类为护理质量和客户服务的类别，因为热烈的赞扬或严厉的批评需要人类的判断，这使得它容易受到潜在的审稿人之间的差异。尽管不同的评论家对“屠夫”和“救星”这样的词不太可能有不同的分类，但新技术[ 22可能有助于自动化审查过程，以获得更大的一致性。

在线医生评论网站为消费者提供了越来越多的数据。这些网站为未来的研究提供了肥沃的土壤，这些研究的数据是否可以帮助患者可靠地区分提供更好临床结果和患者安全的医生。

总之，在线评论网站提供了丰富的数据来源，可能能够跟踪护理质量，尽管效应大小很弱，并不是所有评论网站指标一致。

缩写

CPT

现行程序术语

高压

高容量

ICD9

《国际疾病分类》第九版

低容量

简介:

规范的健康信息

HIPAA

《健康保险携带和责任法案》

这篇文章的作者希望承认和感谢医疗司法服务公司为这项研究提供财政支持。

Jeffery Segal，医学博士，JD，是医疗正义服务公司的所有者和创始人，该公司帮助医疗保健提供商解决在线声誉等问题。

Michael J. Sacopulos，法学博士，执业律师，担任医疗司法服务公司的法律顾问。

宾夕法尼亚州医疗保健成本控制委员会 2012-03-27 2008-2009年宾夕法尼亚州的心脏外科手术 http://www.phc4.org/reports/cabg/09/download.htm

66年tljgazn

博克梅厄

Stukel

助教

Siewers

Goodney

页

Wennberg

德

卢卡斯

美国外科手术量和手术死亡率

N英语J医学 2003 11 27 349 22 2117 27

10.1056 / NEJMsa035205

14645640

349/22/2117

罗杰斯

米

Jobe

英航

O’rourke

谢泼德

digg

猎人

詹

病例量是食管癌切除术后住院病人死亡率的预测因子

拱杂志 2007 09 142 9 829 39

10.1001 / archsurg.142.9.829

17875837

142/9/829

莱特

列文

多伊奇

我

伯克

太阳

赫尔佐格

手术量对子宫内膜癌腹式子宫切除术发病率和死亡率的影响

比较。Gynecol 2011 05 117 5 1051 9

10.1097 / AOG.0b013e31821647a0

21508742

00006250-201105000-00005

布朗

晶澳

Pietrobon

奥尔森

髋部骨折的结局:外科医生或医院容量真的重要吗?

J创伤 2009 03 66 3. 809 14

10.1097 / TA.0b013e31816166bb

19276758

00005373-200903000-00033

基林

安德鲁斯

雷德蒙

惠普

富尔顿

腹主动脉瘤修复术、颈动脉内膜切除术和下肢血运重建术的容量和结果

血管外科 2007 03 45 3. 615 26

10.1016 / j.jvs.2006.11.019

17321352

s0741 - 5214 (06) 02063 - 5

Karanicolas

杜波依斯

Colquhoun

PH值

吞下

沃尔特

Guyatt

“大酒店”

越多越好?:外科医生和医院容量对结直肠切除术后住院死亡率的影响

安杂志 2009 06 249 6 954 9

10.1097 / SLA.0b013e3181a77bcd

19474684

o艾普斯坦

Csikesz

McPhee

曾

摩根富林明

沙阿

外科医生量影响胰腺切除术的医院死亡率

安杂志 2009 04 249 4 635 40

10.1097 / SLA.0b013e31819ed958

19300225

Nazarian

Yenokyan

汤普森

再保险

格里斯沃尔德

我

常

直流

perl

英航

全州数据库中颈动脉内膜切除术10年容量-结局效应的统计建模

血管外科 2008 08 48 2 343 50

10.1016 / j.jvs.2008.03.033

18644481

s0741 - 5214 (08) 00446 - 1

林

外科医生和医院容量对口腔癌切除术后5年生存率的影响:一个亚洲国家的经验

手术 2008 03 143 3. 343 51

10.1016 / j.surg.2007.09.033

18291255

s0039 - 6060 (07) 00634 - 4

McPhee

罗宾逊

伊斯拉米

引起

墨西拿

Schanzer

一个

外科医生的病例量，而不是机构的病例量，是选择性腹主动脉瘤开腹修补术后住院死亡率的主要决定因素

血管外科 2011 03 53 3. 591 599

10.1016 / j.jvs.2010.09.063

21144692

s0741 - 5214 (10) 02317 - 7

Farjoodi

Skolasky

莱利

韩

医院和外科手术量对腰椎手术后并发症的影响

脊柱(Phila Pa 1976) 2011 11 15 36 24 2069 75

10.1097 / BRS.0b013e318202ac56

21343869

Hervey

Purves

人力资源

居尔

托斯

美联社

维尔

Pietrobon

在hcup -全国住院患者样本中，全膝关节置换术的提供者数量和患者结果

美国骨关节外科杂志 2003 09 85年 9 1775 83

12954837

卡茨

约

巴雷特

Mahomed

神经网络

男爵

晶澳

莱特

Losina

医院和外科手术量与全膝关节置换术结果的关系

美国骨关节外科杂志 2004 09 86年 9 1909 16

15342752

86/9/1909

史密斯

医学博士

帕特森

哇

作为

美女

上海

贝斯勒

米

Courcoulas

美联社

Flum

哈尔平

米切尔

我

盛况

一个

Pories

乌尔夫

在减肥手术纵向评估(实验室)研究中，手术体积与RYGB后不良结果的关系

外科医生 2010 03 4 6 2 118 25

10.1016 / j.soard.2009.09.009

19969507

s1550 - 7289 (09) 00684 - 4

PMC2848920

凯尔

Barreto

Guerra

霍奇金淋巴瘤

2167例患者减肥手术后的死亡率和住院时间:外科医生专业知识的影响

ob杂志 2009 09 19 9 1228 35

10.1007 / s11695 - 009 - 9894 - 7

19562422

韦勒

我们

汉纳

埃尔

纽约州减肥手术中提供者数量和术后并发症之间的关系

J Am Coll外科医生 2006 05 202 5 753 61

10.1016 / j.jamcollsurg.2006.02.002

16648015

s1072 - 7515 (06) 00120 - 7

Nallamothu

汉堡王

Gurm

海关

停

Goodney

页

罗杰斯

妈

柯蒂斯

摩根大通

Dimick

简森-巴顿

贝茨

呃

Krumholz

嗯

博克梅厄

医疗保险受益人的手术经验和颈动脉支架置入术结果

《美国医学会杂志》 2011 09 28 306 12 1338 43

10.1001 / jama.2011.1357

21954477

306/12/1338

PMC3208144

Alexa网络信息公司 2012-03-27

http://www.alexa.com/

66年tkytim9

20.

谷歌指南 2012-03-27 自定义结果:首选项 http://www.googleguide.com/preferences.html

66年tlglpwz

福克斯年代

“我不知道，但我可以试着找出”是有健康问题的人的默认设置

卫生信息的社会生活，2011年 2011 05 12

华盛顿特区

皮尤互联网和美国生活项目

夏

外邦人

艾尔

芒罗

Iria

通过多步分类改进患者意见挖掘

文本，演讲和对话 2009

柏林

施普林格-

70 76

Kadry

楚

Macario

一个

对4999名在线医生评分的分析表明，大多数患者对医生的评分都很好

J医疗互联网服务 2011 13 4 e95

10.2196 / jmir.1960

22088924

v13i4e95

拉古

Hannon

Rothberg

Lindenauer

社交网络时代患者对医疗服务提供者的评价:对医生评级网站的分析

J Gen实习生 2010 09 25 9 942 6

10.1007 / s11606 - 010 - 1383 - 0

20464523

PMC2917672