医学互联网研究杂志-识别在线健康社区的关键医院服务质量因素

原始论文

¹韩国科学技术信息研究所，大韩民国大田

²电子和电信研究所，大田，韩国

^3.韩国科学技术高级研究院，大韩民国大田商业与技术管理系

⁴韩国高等科学技术学院，商学院，韩国首尔

通讯作者:

Minki Kim博士

韩国科学技术高级研究院

商学院

S304, KAIST商学院

东大门区Hoegiro 85号

首尔,130 - 722

大韩民国

电话:82 29583512

传真:82 29583620

电子邮件:minki.kim@kaist.ac.kr

背景:与健康相关的用户创建内容的数量，特别是在线健康社区中与医院相关的问题和答案，迅速增加。患者和护理人员参与在线社区活动，分享他们的经验，交换信息，并询问被推荐或不可信的医院。然而，如何从网络社区自动识别医院服务质量的研究很少。过去，对医院的深入分析采用随机抽样调查。然而，由于在线数据量的快速增长和相关利益相关者的不同分析需求，这种调查正在变得不切实际。

摘要目的:作为一种利用大规模健康相关信息的解决方案，我们提出了一种从在线健康社区中自动识别医院服务质量因素和加班趋势的新方法，特别是与医院相关的问题和答案。

方法:我们定义了医院基于社交媒体的关键质量因素。此外，我们开发了文本挖掘技术来检测在线健康社区中经常出现的这些因素。在检测到这些代表医院定性方面的因素后，我们应用情感分析来识别在线健康社区中发布的消息中的建议类型。韩国两个最大的在线门户网站被用来测试基于社交媒体的医院关键质量因素检测的有效性。

结果:为了评估所提议的文本挖掘技术，我们使用消息的随机样本(即占总消息的5.44%(9450/173,748)，对提取和分类结果(如医院名称、服务质量因素和推荐类型)进行了手动评估。服务质量因子检测和医院名称提取的F1平均得分分别为91%和78%。在推荐分类方面，性能(即精度)平均为78%。提取和分类性能仍有提高的空间，但提取结果适用于更详细的分析。对所提取信息的进一步分析表明，韩国不同地区的医院在基于社交媒体的关键质量因素细节上存在差异，变化模式似乎准确地反映了社会事件(如流感流行)。

结论:这些发现可以用来为护理人员、医院官员和医疗官员提供及时的信息，以制定卫生保健政策。

中国医学网络学报2015;17(4):e90

doi: 10.2196 / jmir.3646

关键字

医院服务因素；在线健康社区；基于社会媒体的医院质量关键因素；推荐类型分类；质量因素分析；医疗保健政策

患者及其护理人员越来越多地使用互联网进行医疗保健信息共享和支持[1］．他们尤其倾向于通过维基百科、脸书、网上论坛和留言板等社交媒体服务获取健康信息和分享健康经验[2］．总体而言，社交媒体应用程序具有增强卫生公平的潜力:通过社交媒体进行互动可以增加社会支持和联系感，并导致患者的赋权感。这样的互动也增加了信息共享，从而带来更以患者为中心的体验。出于这个原因，研究患者之间健康交流的研究人员也关注在线用户生成的健康数据，例如医生评级网站[3.]、以健康相关关键词撰写的博客[4]、网站上关于医院的自由文字评论[5]，以及在线健康社区的留言板[6］．

医院质量是患者最感兴趣的健康信息之一，许多进行医院质量分析的研究在很大程度上依赖于随机抽样调查[7，8］．然而，随机抽样方法的实用性是有限的，因为它们需要大量的人力，因此是劳动密集型和耗时的。基于互联网的调查是一种选择，但专门设计的问卷通常仅限于付费用户。此外，由于每天产生的大量与健康有关的信息，将传统的统计方法应用于与健康有关的信息变得更加困难。关于医院的调查反映了用户对医院服务质量和患者满意度的看法，但社交媒体更容易提供相同的结果。

在决定选择哪家医院时，社交媒体是一个宝贵的资源。例如，像推特和脸书这样的信息系统允许使用算法搜索单词和短语，以发现积极或消极的情绪。9］．最近，一项研究[10表明医院的Facebook页面可以作为质量指标。他们发现，医院页面上的“赞”数量不仅是患者满意度的重要指标，也是患者护理质量的重要指标。特别是，根据对纽约40家医院的观察，Facebook上的“赞”与患者推荐以及30天死亡率的下降之间存在相关性(即，30天道德率每下降一个百分点，Facebook上的“赞”就会增加近100个百分点)。虽然很难从相关性中得出结论，但更重要的一点是，广泛使用的社交媒体可以成为医院质量的一个有意义的指标。

为了从在线社区获得有用的信息，最近已经报道了几种自动方法。对各种社交媒体(如博客、书签、社区和论坛)的调查应用了主题建模[11］．根据社交媒体的类型考虑了不同的主题建模策略，因为每个社交媒体都有不同的文档类型和元数据。例如，要找到一个在线社区专家，不仅是作者，还有社会反馈的数量，如评论、点赞和分享，都是评估专业知识的关键因素。最近的研究[12-14]使用用户生成内容的定量摘要，如用户评论评分的总体价值和数量来代表用户意见。相比之下，最近很少有研究正式纳入和测试用户生成评论的文本内容的影响[15，16］．研究人员(11分析了酒店行业(如TripAdvisor)的在线用户评论，以更好地衡量酒店服务质量和表现。他们试图通过应用文本分类和情感分析技术，从多维角度考虑定量方面和文本上下文，从而创建一个更全面的在线用户创建内容的视图。此外，还有一种使用Twitter数据的医院服务质量情绪分析版本。例如，Chou等[17发现“梅奥诊所”被评为负面，但对提到该诊所的推文进行检查后发现，人们的看法不一。一些被评为负面的(78%)与担心手术中的人或疾病有关，而不是护理或质量。

虽然各种类型的社交媒体可以用来获取健康相关的信息，但在线健康社区是最相关的，原因如下:

我们可以关注提问者和回答者之间的社会互动。在在线健康社区中，患者和他们的护理人员可以分享他们的经验，交换医院和医疗信息。特别是社区成员对医院的情感印象和定性评价是患者和护理人员选择医院的关键。
方便和匿名是母亲使用互联网的重要原因[18］．他们希望轻松快速地找到与健康相关的和医院相关的信息，他们通常不会尴尬地向在线健康专业人员提问或与在线会员交流他们的个人状况和经历[19］．
通过使用社会支持，在线健康社区使患者在选择合适的医院时发挥更积极的作用。他们可以考虑“服务”、“专业”、“流程”、“环境”、“印象”、“知名度”等多个方面。

因此，我们从在线健康社区中选择用户生成的消息作为我们的实验数据。

我们不仅通过情感分析，还通过分析用户文字信息中多维度的服务质量因素来揭示医院声誉的细节。我们提出的方法不仅依赖于“点赞”或“推荐”的数量，还能找出哪些医院服务质量因素与在线健康社区的推荐真正相关。总之，我们的贡献有三个方面:

我们通过对在线健康社区内容的观察，定义了由“服务”、“专业”、“过程”、“环境”、“印象”、“知名度”六个服务质量因素组成的基于社交媒体的医院服务质量因素模型。
我们提出了一种利用文本挖掘技术检测基于社交媒体的医院服务质量因素的新方法。我们在这项任务中的主要目标是在在线健康社区中有效地自动识别这些因素。为此，我们实现了一组文本挖掘模块来提取这些服务质量因素的潜在线索，并将其分为两种推荐类型。具体步骤包括集中爬行、预处理、基于字典的医院名称提取、过滤、检测医院质量因子、推荐分类。
我们通过对国内6个主要城市的分析，提供了可以可视化为主要行为改变因素模式的分析结果(对于被大众评价为负面的医院)。分析显示了我们所提出的方法在揭示基于社交媒体的医院服务质量因素的集体智慧潜力方面的有效性。

数据

为了调查人们对韩国医院质量因素的看法，特别是儿科医院的质量，我们从韩国门户网站托管的在线社区收集了用户生成的内容。初步调查显示，儿科专业网络社区为家长提供了积极讨论(通过问答)儿科医院质量的场所，分享他们的想法、想法和经验。考虑到Naver [20.]和Daum [21为父母和护理人员运营主要的本地在线社区，我们决定分析这两个门户网站的内容。

我们的目标是收集用户生成的内容，这些内容可能包含用户对在线健康社区儿科医院的经验和意见。内容的结构可以分为三个层次:线程、消息和句子。线程通常包含几个消息，而消息很短，通常只包含几句话或句子片段。图1是在线社区医院推荐内容的快照，其中(2)为线程标题，(4)表示线程的详细信息，(5)包含线程的消息。

表1。数据统计(来自Naver和Daum网站)。

区	线程,n	消息,n	每个线程的消息，n	包含质量因子的消息，n
首尔	10832年	54392年	5.02	12421年
大邱	8072	47419年	5.87	4240
釜山	5965	28910年	4.85	9509
大田市	3952	22475年	5.69	2358
仁川	775	5184	6.69	1525
光州	2826	15368年	5.44	2012
总计	32422年	173748年		32065例(18.45%)
平均	5403.66	28958年	5.59

表1显示了2007年4月至2013年5月期间Naver和Daum上选定的父母/照顾者在线社区的内容统计数据。我们获得了32,422个线程和173,748条消息。在选定地区的社区成员中，平均每个线程有5.59个与儿科医院相关的讨论。具体而言，18.45%的信息包含医院质量因素的线索表达。

值得注意的是，在样本期间，韩国的互联网使用率和两个门户网站的在线健康社区内容都有所增加。截至2013年，韩国互联网用户数量为40,080,000人(即占总人口的82.09%)[22］．大约50%的互联网用户访问社交媒体是出于个人用途，2010年至2012年期间，超过70%的用户使用过在线社区。以在线健康社区的用户相关内容为例，自2003年推出以来，线程数量迅速增长，但自2010年以来，该数字似乎趋于稳定。在图2，我们呈现这两种趋势;我们提出的方法将适当地处理数量上的这种变化(2013年的线程数是根据2013年5月的可用数据推断出来的)。

基于社会媒体的医院质量关键因素的推导

为了在医院服务质量度量方面有效地管理社交媒体数据，我们参考了以往的质量模型，定义了基于社交媒体的医院服务质量因子。然而，也值得注意的是，有几个重要的研究[23-29医院服务质量模式。在衡量患者满意度方面，SERVQUAL模型[23]，由五个维度组成:(1)响应性，(2)可靠性，(3)保证，(4)有形，(5)共情，是最广泛使用的工具[24］．SERVQUAL模型有助于获得顾客对感知和期望的有序评分。由于其固有的不完整性，有几种方法采用了改进的SERVQUAL方法。例如，[25]在SERVQUAL中增加了“关怀”和“患者结果”两个质量维度，以及[26]增加了“核心医疗结果”和“专业/技能/能力”。

从消费者的角度来看，可以定义医疗保健提供者的五个质量因素:(1)温暖、关怀和关心，(2)医务人员，(3)技术和设备，(4)可用服务的专业化和范围，以及(5)结果[27］．

为供医院评审程序使用，联合委员会[28]定义了九个医院质量维度:(1)有效性，(2)适宜性，(3)效率，(4)尊重和关怀，(5)安全性，(6)连续性，(7)有效性，(8)及时性和(9)可用性。联合委员会模式更为全面，因为它包含了SERVQUAL和卫生保健提供者的五个质量因素。

为发展一套有效及可靠的工具，供医院管理层在策略及运作上作出决策，“医院主要品质特征评估”模式得以发展[29]，由八个因素组成:(1)尊重和关怀，(2)有效性和连续性，(3)适当性，(4)信息，(5)效率，(6)餐食，(7)第一印象，和(8)员工多样性。该模型使用了来自卫生保健提供者和消费者的输入。然而，现有的服务质量测量模型并不适合用医院的服务质量来解释社交媒体数据，因为用户没有预先定义的格式或原则来记录他们的体验。

为此，我们手动列出了在语料库中出现超过五次的所有关键字。然后，我们只选择了与服务质量相关的术语，例如与医院的地位、印象和治疗有关的术语。我们最终将基于社会化媒体的医院服务质量因子模型解析为六个质量因子(即“服务”、“专业”、“流程”、“环境”、“印象”和“知名度”)，如图所示图3．每个服务质量因素平均有1000个关键字作为特征，可用于分析用户编写的消息的内容。六个服务质量因素有各自的子类别和从属项目，如表2．每个质量因子都有一个以上的子类别，分别从f1-f29和e1-e10编号，根据它们的功能或情感特征。

表2。基于社会化媒体的医院服务质量影响因素的详细分类及分项。

品质因数	详细质量因素	描述
服务	善良(f1、f2)	善良，礼貌与医生/护士/医院员工的礼貌有关
	善良(f1、f2)	用简单的语言/粗略的细节进行诊断和解释
	诚实(f3或f4)	忠实地/仔细地响应请求
专业	专业(f5、f6 / f7)	技术知识、技能
		专门的医学课程，专业的
		教授、主任(职级)
	技能(f8 / f9 / f10)	医疗程序/技能，经验
		副作用，并发症，医疗事故，安全
		治疗效果、速度
	治疗(季/ f12 / f13 / f14)	住院，门诊，住院
		精度
		抗生素、注射剂、处方药(药粉、药液、感冒药)
		诊断、治疗、处方、治愈、适当(或过度)治疗
过程	速度(f15 / f16)	(短/长)等待时间，剂量待机，接受相关治疗
	速度(f15 / f16)	能迅速对变化做出反应，能够应对突发事件
	成本(f17)	低(或合理)/昂贵的医疗费用
	系统(f18 / f19)	高效的业务流程(接待和快递服务)、调查问卷、(基本/可选)医疗保健
环境	方便(f20 f23 / f21 /——f22 /)	交通，距离(住所)，停车设施
		预订
		候车室，设施方便
		办公时间，日期，晚上的时间(周末，周日和晚些时候)，下班时间
	卫生(f24 / f25)	清洁、管理
	卫生(f24 / f25)	一次性用品，卫生洁具
	设施/设备(f26/f27/f28/f29)	住院治疗
		CT, MRI，设备，工具，手术室，医生办公室
		手术，物理治疗，各种测试，治疗，健康检查，医院查房
		医院的规模
		医院类型(公共卫生中心、大学医院、医院、诊所和私立医院)
印象(e1、e2、e3 / e4 / e5)		医院的形象，氛围
		可靠，最喜欢的医院，医生
		标牌，新医生，还是第一次遇到的医院
		厌倦了现有的医院
		对医生的印象，医生的信息(即情绪，性格，性别，年龄)
受欢迎程度(e6 / e7 / e8 / e9 / e10)		谣言，传统，名声
		医院的名字
		媒体,广告
		知名医生(医生名)
		知道医院的人

医院质量因子提取与推荐分类的文本挖掘

概述

我们实现了一套文本挖掘模块，用于我们基于社交媒体的医院服务质量因子模型的提取和分类。该过程包括六个步骤，如图所示图4:通过爬行、数据预处理、医院名称提取、消息过滤、质量因子检测、推荐类型分类进行数据准备。在通过集中爬行进行数据聚合之后，HTML元素将被删除。对于每条消息，应用接下来的四个自然语言处理步骤来检测消息中的质量因素，并基于这些因素计算医院的推荐类型。虽然我们的方法可以应用于在线健康社区的各种类型的领域，但我们针对明确提到儿科医院/诊所的消息进行分析，并讨论了与这些医院/诊所相关的质量因素。

步骤1。聚焦爬行

Naver和Daum这两个门户网站按地区和主题，运营着各种各样的在线社区。例如，Naver门户网站拥有大约200万个区域社区。我们注意到，每个地区至少有一个家长社区，成员活跃，知名度高，在线活动活跃。我们选择这些本地在线社区作为我们的文本挖掘信息源。每个在线社区都提供了搜索功能，允许我们用“儿科”和“推荐”关键字识别特定的网页。从选定的在线父社区的网页被抓取并以HTML格式存储。

步骤2。预处理

HTML标签和非文本信息(如图像、JavaScript代码和广告)从提取的文件中删除。为了有效地处理超文本标记语言(HTML)内容，我们使用了用Python编程语言设计的Beautiful Soup库[30.］．

步骤3。基于字典的医院名称抽取

在韩国，人们在社会语境中提到医院时，通常会使用一系列医院名称，主要是通过首字母缩写或缩写来表达。为了解决这个问题，我们建立了一个医院名称字典，涵盖了韩国六大城市(即首尔、大邱、釜山、大田、光州和仁川)的儿科医院。医院名称取自健康保险检讨及评估服务网站[31］．该字典是一个值(表达式)映射表，为在线社区中用户编写的句子中观察到的每个医院名称添加首字母缩写或缩写。使用这个字典，我们的文本挖掘模块执行一个特别设计的分步表达式规范化过程，基于文本编辑距离相似性[32字典中的同义词和句子中的表达之间的区别。这用于查找在原始医院表示中使用的规范医院名称。

步骤4。过滤消息

一旦从消息中提取出正规的医院名称，我们就会过滤掉没有提到医院名称或有歧义的消息，从而只考虑清楚提到医院名称的消息。此外，我们选择了推荐或以其他方式提到医院的候选消息。

第5步。检测质量因素

这是识别医院质量因素文本表示的主要步骤。通过利用关键字列表(即质量因素字典)，我们从每条消息中检测并提取服务质量因素。这项任务中使用的技术源自基于字典的命名实体识别[33］．如果确定了服务质量因素，我们会计算发生的次数，以便进一步分析。此外，为了处理韩语处理的已知困难，我们使用了从数据收集中观察到的高频术语派生的等效术语列表。

步骤6。推荐类型分类

该步骤根据识别出的质量因子的表达式，对每条消息的推荐类型进行分类，即是否推荐医院。作为基于关键字的情感分析的简单实现，它计算支持和反对推荐的情感关键字的数量[9］．为了考虑单个信息中句子类型的可能变化，我们使用了情绪流分析的修改版本[34］．结果，分类类型为阳性(即推荐)、中性、双侧和阴性(即不推荐)。如果简单总结分类结果，35.86%(47,046/131,191)为医院推荐，其中131,191为被认为是四个分类类型之一的质量因子的总数，47,046为显示阳性的质量因子的数量。需要注意的是，单个消息可以有多个限定因子。然而，我们将其视为二元分类问题，将分类类别减少为两种类型(即积极或消极);结果类型的错误分类是一个严重的问题，特别是当同一消息中存在两种不同的极性时。

手动评估

在以各种方式深入分析步骤5和6的结果之前，我们对医院名称、质量因子和推荐类型等内容的提取和分类结果进行了手动评估。为了评估医院名称提取，我们对9450条消息的随机样本进行了人工标记，占消息总数的5.4%。此外，为了对质量因子检测和推荐类型分类进行评估，我们从六个地区中选取了5家发生频率最高的医院/诊所，手动检查其下属质量因子和推荐类型进行检查

如果他们的提取/分类是正确的。评价结果总结在表3．

表3。评估结果(以百分比报告)。

地区	评价分类
	医院名称提取			质量因子检测			推荐类型分类
	精度	回忆	F1	精度	回忆	F1	精度
首尔	68	83	75	93	95	94	76
大田市	91	72	80	96	91	93	82
大邱	86	65	74	97	80	88	70
光州	91	66	77	96	83	89	64
仁川	79	77	78	88	93	90	61
釜山	87	73	79	98	82	89	67
平均	84	73	78	95	87	91	78

医院名称提取

我们实现了召回率(原文中医院名称正确提取的比例)为73%，准确率(提取的医院名称正确比例)为84%，即F1 = 2 ×(精度)×(召回率)/(精度+召回率)= 77.7%。测量F1是精密度和召回率的调和平均值。虽然在英语命名实体提取中，准确率通常达到80%-90%，但在韩语非正式文本中，由于各种类型的首字母缩写、拼写错误和单词之间的间距经常不正确，很少有如此高的准确率。这些因素加上韩国语是一种粘合性语言，成为了目前的性能瓶颈。

检测质量因素

质量因子检测是一种关键字匹配，检查给定的单词是否存在于六个质量因子中的一个类别中。由于韩国语的字间距错误和谐音问题，其表现略高于90%。目前取得的F1成绩相当令人满意。然而，通过考虑复合名词和更复杂地处理错误书写的句子以获得更清晰的单词间隔，可以进一步提高检测性能。

使用情感分析的推荐分类

我们的推荐分类是一种情感分析，是一项具有挑战性的任务，因为它应该跟踪消息中的极性转换。尽管通过引用[来处理消息中的极性转换34]，验证分类性能平均为77.8%。这表明，韩国语的情绪分析还有进一步提高的空间。尽管如此，我们的质量因素检测和情感分析提供了按地区对消息进行深入分析的选项。

概述

通过将之前介绍的文本挖掘技术应用于在线健康社区消息，我们获得了由基于社交媒体的医院服务质量因素模型驱动的集体智能。作为研究这一知识潜力的第一步，我们分析了韩国不同大城市中首选质量因素的发生模式。

基于社会化媒体的医院服务质量因素的区域和时间分布

以往医院服务质量评价多采用劳动密集型调查。与这种昂贵的手工调查相比，我们可以很容易地从六个质量因素类别之一的关键字的出现率中获得多维分析结果。各质量因子的发生比例表示护理人员在选择儿科医院/诊所时的偏好。

面板(a)的图5提供了韩国六个最大城市(即首尔、大邱、釜山、大田、仁川和光州)的六个关键质量因子分布的高级视图。的(a)图图5说明各质量因子在各区域的占比。虽然不同的六个素质因素之间有细微的差异，但有两个显著的因素(知名度和专业性)最常出现。

每月都保持这种趋势，如(b)组所示图5，其中质量因子的原始频率为所有区域的平均值。相反，当我们观察区域数据时，其构成因子的平均相对频率比因地区和季节而有所不同。的(c)和(d)板图5显示大田和光州两个选定城市在2006-2013年期间每月的平均相对频率比。面板(b)-(d)中的数字图5以发生的百分比表示。

我们假设基于社交媒体的医院服务质量因素驱动的分析结果形成了一种集体智慧，代表了护理人员对当地医院质量的信念，并可以有效地用于在线健康社区中发现医院推荐。我们的分析提供了对质量因素的区域和季节性趋势的洞察，这些趋势可以通过观察相关的关键词/术语获得。

消极态度的个案研究

概述

基于坚信基于社交媒体的医院服务质量因子在不同推荐类型下的分布存在明显差异，我们将之前结果中的负向部分进行了分解，揭示了各因子之间隐藏的区域关系。为此，我们使用了情感分析，将用户编写的消息分解为两种类型(即推荐和不推荐)。

大量用户可能对其医院体验持积极或中立态度，即使有个别用户持消极态度。根据我们的观察，如果我们将冲突的情况(在一条信息中积极和消极情绪共存)作为消极案例，平均有8%的样本被确定为消极案例。图6显示了2006-2013年韩国六大城市每年对基于社交媒体的医院服务质量因素的负面评论的百分比。可以说，这体现了国内对儿科医院的消极态度的特点。

2009年流感大流行

我们从2009年的流感大流行中得出这一结论。2009年，不仅韩国，全世界都遭遇了新型甲型流感[35］．韩国最严重的时间大约是当年的10月至11月;大流行的影响在2009年12月之后逐渐减弱。我们验证了2009年从在线卫生社区收集的78%的流感相关帖子。帖子的细节大多由问答组成，比如哪家医院有多余的疫苗，或者看医生和拿药需要多长时间。事实上，流感疫苗的供应严重不足，很明显，大多数患者很难找到医院为他们的孩子接种疫苗。当人们涌入当地医院时，他们在网上抱怨等待时间过长。换句话说，这一时期的医疗质量很差。

图6显示了2009年看护者强烈的负面反应。因为在2009年，用户生成内容的数量也有所增加图2，我们使用了质量因子的百分比，而不仅仅是频率。事实上，尽管6个素质因素负面内容的出现都有所增加，但我们观察到排在前两位的“知名度”和“专业性”的相对比例在2009年明显下降。有趣的是，我们观察到“过程”和“环境”在2009年的相对份额有所增加，它们的总和也占了频率的很大比例。这意味着父母和护理人员在儿科医院的经验往往很差，他们的不满增加，特别是在低效率的治疗过程中，如等待时间长或保留经验差。为了更密切地观察基于社交媒体的医院服务质量因素，我们研究了与医院长等候时间相关的质量因素，如流程和环境，如图所示表4．

对于“过程”因素，出现频率最高的前三名分别是“长期”、“现在”和“住院”，分别占73%、11%和10%。在“环境”因素方面，各对应因素的关键词类型不同，反映了公众对医院服务的不满和投诉程度。

表4。深入分析2009年的消极态度。

过程		环境
项目	份额,%	项目	份额,%
长期	73	预订	48
现在	11	拍摄	13
住院	10	检查	9
基本	5	保健中心	7
其他	1	其他	23

地方城市应急管理

病人和护理人员偶尔会到综合医院接受紧急护理。从…中可以看出图7，我们观察到，在2010年之前的几年里，大邱地区的“紧急事件”相关线索稳步持续增加。假设它们代表在线社区发布的紧急事件，我们注意到大约5%的帖子讨论特定医院是否提供迅速和令人满意的紧急医疗服务。

在许多情况下，人们期望综合医院有足够的能力处理紧急情况。例如，一个人的孩子受伤了，他拼命地寻找午夜开门的医院。这些人可能认为，能够提供医疗服务的第一所综合医院拥有合格的医务人员和必要的急救设备。然而，地方城市的实际情况往往不尽人意。表5显示与紧急相关的术语经常与五家当地综合医院的名称同时出现在许多负面意见的线程中(并被归类为不推荐)。对此，我们通过分析基于social media的医院服务质量因素，了解哪些质量因素需要提高。例如，在与紧急情况相关的线程中经常检测到“进程”和“环境”因素。

表5所示。消极己见线程的共现比率(大邱地区)。

同现两	百分比
急诊和医院D1	22
急诊和医院D2	16
急诊和医院D3	7
急诊和医院D4	31
急诊和医院D5	8

造成这种现象的一个重要原因是地方综合医院儿科挂号员数量较少。大邱地区综合医院的儿科住院医师申请人数不足，这是普遍存在的问题。2011年，只有排名前两名的综合医院达到了入学人数要求。这一问题可能导致医疗服务质量低下，包括急救和紧急治疗。一些记者指出，需要改善医院的能力和应急准备。另一个原因是当地的医院信息没有很好地传播。人们经常在紧急情况下找不到足够的医院，所以他们发布了关于哪些医院可用的问题。

如果能够自动定期地检测和分析医院的关键质量因素，我们就可以确定控制高传染性流行病所需的医疗服务类型。卫生当局可以根据即时和切实的定性观察实施一项可能帮助患者的政策。从患者的角度，他们可以发现附近医院普遍存在哪些负面的质量因素，从而发现其他地区更好的医疗服务。此外，分析的模式对政府决策者来说是有意义的咨询信息，因为它们解释了去儿科医院的护理人员的要求。这些信息对国家和地方卫生政策制定者都有帮助。

主要研究结果

随着Web 2.0的日益普及，许多有孩子的护理人员正在参与对儿科医院的审查、推荐和交换意见。在这方面，全面了解医院的定性措施对于选择合适的儿科医院/诊所很重要。因此，我们的贡献有三个方面:(1)我们定义了六种可用于基于社交媒体的医院服务质量分析的质量因素类型，(2)我们提出了一种文本挖掘方法来提取几个医院质量因素，并将消息分为推荐类型(推荐或不推荐)，(3)我们提供了一种深入的分析，可以用于许多股东，包括护理人员，医院员工和医疗保健政策的政府官员。

限制

尽管这项工作产生的新分析具有价值，但这项研究在数据覆盖方面有几个局限性。社交媒体，就像其他评估公众舆论的工具一样，容易产生选择偏差，而且很难评估这个研究人群是否代表了普通人群的公平样本[36］．此外，由于资料有限(考虑区域趋势)，需要更深入地分析为什么会出现不同的波动模式。然而，这超出了本研究的范围，因为原因与人口特征高度相关。

用户固有的匿名性和无法验证内容等问题可以稍微缓解，因为与Twitter相比，来自在线健康社区的消息包含来自医院真实个人经历的更详细信息。由于社交媒体对儿科医院/诊所推荐的报道并非没有缺陷，研究结果强调了社交媒体延续甚至可能促进未知质量信息来源的潜力。

这项研究基于我们的坚定信念，即社交媒体可以用来衡量患者和护理人员对特定医院的反应。然而，之前已经发现社交媒体也有风险。更广泛的范围和易于访问的平台可能导致错误信息的广泛传播。由于对其他社会科学研究结果的误解或过度简化，我们可能高估了质量因子度量的效果。尽管如此，我们的实验分析显示了基于社交媒体的医院关键质量因素分析的巨大潜力。

下一个步骤

下一步自然是通过比较通过互联网用户相关数据测量的医院服务质量与传统质量测量方法以及患者满意度调查来验证我们的分析结果。在之前的文献中，Greaves等人[5对关于医院的在线自由文本评论进行了情绪分析，并将结果与英国所有161家设有成人服务的急症医院的全国住院病人纸质调查结果进行了比较。他们发现在线评论与调查有一定的相关性，因此在线评论可以用来评估患者对医院表现的看法。虽然他们比较了医院的排名，但他们没有深入研究我们在本研究中尝试的医院服务质量因素的详细类别。事实上，据我们所知，从未在国家层面上对医院服务质量因素进行过患者调查。目前在韩国，有几个政府运营的网站提供医院信息，例如卫生和福利部[37]、卫生福利统计资料处[38]，以及健康保险检讨及评估服务[31］．然而，这些认证机构都没有提供患者满意度方面的医院评价信息，特别是在本研究中使用的六个服务质量因素方面。我们搜索并找到了详细描述社交网络服务情感分析的学术研究，其中提到了韩国医院，使用servicqual模型[39，40］．然而，宋[39]仅对三家医院的社交媒体评论进行了3个月的分析。虽然康与宋[40]将他们的情绪分析结果与调查数据进行了比较，并验证了社交媒体结果与调查结果相一致，他们的分析仅限于韩国排名前五的医院。事实上，到目前为止，很少有研究验证社交媒体上关于医院质量的内容，这主要是因为缺乏在国家层面进行的医院质量调查。如果医院服务质量的调查将在国家层面进行，验证我们基于社会媒体的分析如何反映医院的实际质量将是重要和有趣的。

虽然我们把这样的验证工作留到未来的研究中进行，但通过我们提出的方法从在线网站提取的实时信息仍然可以帮助政府当局以及地方和国家层面的寻求信息的患者。最近，来自社交媒体的信息在英国的国家层面上被分析和使用。特别是，英国政府建议使用社交媒体和情感分析来快速衡量医院的表现和糟糕的护理[41]他还经营着“国民健康服务选择”网站[42]，在那里人们可以评价他们的家庭诊所所接受的护理质量。

结论

这项工作和未来在这一领域的研究是至关重要的，以告知研究和医疗保健社区关于医院服务质量的现状，并强调需要仔细的，基于证据的分析用户更喜欢的质量因素和基于它们的建议。为了进一步解释医院选择模式的可能原因，我们计划结合人口统计数据分析结果。

利益冲突

没有宣布。

陆勇，张鹏，刘娟，李娟，邓松。基于文本聚类的健康相关话题在线社区检测。PLoS One 2013;8(2):e56221 [免费全文] [CrossRef] [Medline］
Kinnane NA, Milne DJ。互联网在支持和告知癌症患者护理人员方面的作用:文献综述。癌症2010年9月18日(9):1123-1136。［CrossRef] [Medline］
Emmert M, Meier F, Heider AK, Dürr C, Sander U.患者如何评价他们的医生?这是对德国医生评级网站上3000条叙事性评论的分析。卫生政策2014年10月;118(1):66-73。［CrossRef] [Medline］
Marcus MA, Westra HA, Eastwood JD, Barnes KL，动员思想研究小组。年轻人对心理健康有什么看法?网络博客分析。中国医学杂志，2012;14(1):e17 [免费全文] [CrossRef] [Medline］
Greaves F, Ramirez-Cano D, Millett C, Darzi A, Donaldson L.使用情感分析从在线发布的自由文本评论中捕捉患者体验。中国医学杂志，2013;15(11):e239 [免费全文] [CrossRef] [Medline］
Kim M, Jung Y, Jung D, Hur C.调查众包信息与官方政府数据的一致性:以儿科诊所为例。中国医学杂志，2014;16(2):e29 [免费全文] [CrossRef] [Medline］
Goldstein E, Farquhar M, Crofton C, Darby C, Garfinkel S.从患者角度衡量医院护理:CAHPS医院调查发展过程概述。卫生服务决议2005年12月;40(6页2):1977-1995 [免费全文] [CrossRef] [Medline］
希登霍维H，诺约宁K，莱帕拉P.测量门诊病人对芬兰大学医院服务质量的看法。中华儿科杂志2004,38(1):59-67。［Medline］
观点挖掘与情感分析。信息检索2008;2(1-2):1-135。［CrossRef］
Timian A, Rupcic S, Kachnowski S, Luisi P.病人“喜欢”好的护理吗?通过Facebook衡量医院质量。中华医学杂志2013;28(5):374-382。［CrossRef] [Medline］
Guy I, Avraham U, Carmel D, Ur S, Jacovi M, Ronen I.挖掘社交媒体的专业知识和兴趣。见:第22届国际万维网会议论文集。:国际万维网会议指导委员会;2013年发表于:WWW '13 -第22届国际万维网大会;2013年5月13-17日;里约热内卢巴西里约热内卢，第515-526页。
阿克·N, Ghose A, Ipeirotis PG.基于消费者评价的产品特征定价权。管理科学2011年8月;57(8):1485-1509。［CrossRef］
谢瓦利埃·贾，梅兹林·D.口碑对销售的影响:在线书评。市场研究杂志2006年8月;43(3):345-354。［CrossRef］
段W，顾B，温斯顿AB。在线评论重要吗?-面板数据的实证调查。决策支持系统2008年11月;45(4):1007-1016。［CrossRef］
Ghose A, Ipeirotis PG.评估产品评论的帮助性和经济影响:挖掘文本和评论者特征。IEEE反式。"。数据工程2011年10月;23(10):1498-1512。［CrossRef］
聂泽，费尔德曼R，戈登伯格J，弗雷斯科M.挖掘你自己的业务:通过文本挖掘的市场结构监视。市场营销，2012年5月;31(3):521-543。［CrossRef］
周wys，亨特Y, Folkers A, Augustson E.在YouTube和社交媒体时代的癌症幸存者:叙事分析。中国医学杂志，2011;13(1):e7 [免费全文] [CrossRef] [Medline］
Umefjord G, Petersson G, Hamberg K.在互联网上咨询医生的原因:“问医生”服务用户的网络调查。J Med Internet Res 2003 10月22日;5(4):e26 [免费全文] [CrossRef] [Medline］
安德森JG，雷尼MR, Eysenbach G.网络医疗对医患关系的影响。中华医学杂志2003 Feb;27(1):67-84。［Medline］
NAVER。URL:http://www.naver.com/[访问2013-10-28][WebCite缓存］
多姆。URL:http://www.daum.net/[访问2013-10-28][WebCite缓存］
韩国互联网和安全局(KISA)。2013年互联网使用情况调查执行摘要。URL:http://isis.kisa.or.kr/eng/board/?pageId=040100&bbsId=10&itemId=325[访问时间:2014-10-26][WebCite缓存］
帕拉苏拉曼A，泽瑟尔VA，贝里LL。服务质量的概念模型及其对未来研究的启示。市场营销杂志1985;49(4):41。［CrossRef］
Sadiq Sohail M.医院的服务质量:比你想象的要好。管理服务质量2003 Jun;13(3):197-206。［CrossRef］
鲍尔斯先生，斯旺杰，克勒夫。哪些因素决定了医疗保健服务的质量和满意度?卫生保健管理，1994;19(4):49-55。［Medline］
Ramsaran-Fowdar RR。确定卫生保健质量属性。中华卫生杂志2005;27(4):428-443。［Medline］
科丁顿DC，摩尔KD。将护理质量作为企业战略。卫生论坛1987;30(2):29-32。［Medline］
卫生保健组织认证联合委员会。医院综合认证手册:官方手册。伊利诺伊州奥克布鲁克露台:医疗保健组织认证联合委员会;1996.
Sower V, Duffy J, Kilbourne W, Kohers G, Jones P.医院服务质量的维度:KQCAH量表的开发和使用。卫生保健管理Rev 2001;26(2):47-59。［Medline］
莱纳德·r·美汤。URL:http://www.crummy.com/software/BeautifulSoup/[访问2013-10-28][WebCite缓存］
健康保险审查和评估处。URL:http://www.hira.or.kr/[访问2013-10-28][WebCite缓存］
Vilares M, Ribadas FJ, Vilares J.通过编辑距离的短语相似度。在:数据库和专家系统应用:第15届国际会议。柏林:施普林格;2004年发表于:DEXA 2004;2004年8月30日至9月3日;西班牙萨拉戈萨，页306-317。
科恩WW, Sarawagi S.利用字典在命名实体提取:结合半马尔可夫提取过程和数据集成方法。第十届ACM Sigkdd知识发现和数据挖掘国际会议论文集。:美国计算机协会;2004年8月发表于:第十届ACM Sigkdd知识发现与数据挖掘国际会议;2004年8月22日至25日;西雅图，华盛顿州，89-98页。
郑勇，朴海华，宋明盛。一种混合情绪分类方法。见:PRICAI 2006:人工智能趋势:第九届环太平洋人工智能国际会议(计算机科学课堂讲稿)。:施普林格;2006年8月第九届环太平洋人工智能国际会议;2006年8月7日至11日;中国桂林，页1099-1103。
疾病控制和预防中心。流感网址:http://www.cdc.gov/flu/pastseasons/0910season.htm[访问2014-06-23][WebCite缓存］
Janssens ACJW, Kraft P.使用从在线社区获得的数据进行的研究:方法局限性的伦理影响。公共科学图书馆，2012;9(10):e1001328 [免费全文] [CrossRef] [Medline］
卫生和福利部。URL:http://www.mw.go.kr/front_new/index.jsp[访问时间:2014-10-26][WebCite缓存］
卫生福利统计信息服务处。URL:http://stat.mw.go.kr/[访问时间:2014-10-26][WebCite缓存］
宋娥。基于大数据的客户声誉案例分析研究。韩国信息与通信工程研究所学报2013年10月31日;17(10):2439-2446。［CrossRef］
姜敏，宋仁杰。基于社会网络服务情感分析的医院顾客满意度评价模型研究。theebusinessstudies 2012 11月13日(4):339-352。［CrossRef］
李志强，李志强，李志强，等。关于医院质量的推文:一项混合方法研究。BMJ Qual Saf 2014 10月;23(10):838-846 [免费全文] [CrossRef] [Medline］
国民健康保险制度的选择。URL:http://www.nhs.uk/Pages/HomePage.aspx[访问时间:2014-10-26][WebCite缓存］

G·艾森巴赫(G Eysenbach)编辑;提交26.06.14;L Ning, E Zimlichman同行评议;对作者09.10.14的评论;修订版本收到02.11.14;接受22.01.15;发表07.04.15

这是一篇开放获取的文章，根据创作共用署名许可(http://creativecommons.org/licenses/by/2.0/)的条款发布，允许在任何媒介上无限制地使用、分发和复制，前提是正确引用最初发表在《医学互联网研究杂志》上的原创作品。必须包括完整的书目信息，//www.mybigtv.com/上的原始出版物的链接，以及此版权和许可信息。

本文内容如下e-collection /主题问题:

在线健康社区医院服务质量关键因素识别