这是一篇开放获取的文章,根据创作共用署名许可(http://creativecommons.org/licenses/by/2.0/)的条款发布,允许在任何媒介上无限制地使用、分发和复制,前提是正确引用最初发表在《医学互联网研究杂志》上的原创作品。必须包括完整的书目信息,//www.mybigtv.com/上的原始出版物的链接,以及此版权和许可信息。
为消费者提供医疗保健信息的基于web的问答(Q&A)服务的普及程度显著增加。这些在线社区中存档了大量的问答,为寻求医疗保健问题答案的消费者形成了有价值的知识库。然而,由于消费者可能缺乏专业知识,要找到与自身健康问题密切相关的问答仍然很有挑战性。消费者经常反复问类似的问题,而这些问题之前已经被其他用户回答过了。
在这项研究中,我们的目标是开发有效的信息学方法,可以检索类似的基于web的消费者健康问题使用句法和语义分析。
我们提出“SimQ”来实现这一目标。SimQ是一个信息学框架,它比较存档健康问题的相似性并检索答案以满足消费者的信息需求。采用统计句法分析的方法分析每个问题的句法结构。采用标准化统一医学语言系统(UMLS)对语义类型进行标注,提取医学概念。最后,利用语义特征和句法特征计算句子之间的相似度。
我们使用了2000个随机选择的消费者问题来评估系统的性能。结果表明,在使用成分特征表示时,SimQ达到了最高的精密度(72.2%)、召回率(78.0%)和F-score(75.0%)。
我们演示了SimQ对Netwellness现有的问答服务的补充,Netwellness是一个非营利性的基于社区的消费者健康信息服务,由近70,000个问答组成,每年为超过300万用户提供服务。SimQ不仅通过即时提供密切相关的问题和答案来减少响应延迟,而且还帮助消费者提高对其健康问题的理解。
基于网络的健康相关问答服务越来越受欢迎。一些消费者健康网站每年获得数百万的页面浏览量,如NetWellness、WebMed和EverydayHealth。成千上万的用户访问这些网站,寻找与他们的健康问题有关的答案[
基于社区的问答平台的服务模式有几个独特的优势。首先,用户保持他们的身份匿名,这保护了用户的隐私,鼓励信息共享。例如,许多人在面对面的医生咨询中感到压力太大或不好意思问某些类型的问题(例如,与性有关的问题,与体重有关的问题,或情感问题),可以从网络社区寻求帮助。其次,问答平台可以作为获取新知识的信息源。它增强了用户对许多不同主题的医疗保健的理解,如营养、病人护理或疾病管理。第三,与面对面的医生咨询相比,基于社区的服务通常能提供更快的反应和更广泛的视角。例如,用户问了一个关于“儿童营养”的问题,可能会得到儿童护理专家和营养学家的回答。最后,在线社区为消费者提供了一个分享他们的健康问题和健康兴趣的平台。这不仅创造了一个分享新知识的环境,还为医疗保健消费者提供了情感支持。因此,基于社区的问答是向广泛的公共用户传递医疗保健信息的极好方式。 It could help reduce the time and cost of information delivery, such as those services provided by MIMIR [
尽管基于社区的在线卫生信息服务有许多优点,但仍有许多具有挑战性的问题需要解决,以提高服务质量和可获得性[
许多基于社区的服务平台现在已经存档了数千个问答,这创建了一个有价值的知识库。Berland等人发表了一项研究[
NetWellness是一家非营利性的健康信息网站,自1995年以来一直为消费者提供始终如一的高质量服务。该服务平台由来自凯斯西储大学、俄亥俄州立大学、辛辛那提大学等三所大学的专业医疗专家运营。NetWellness网站提供的健康信息已由专家按照高质量标准进行评估和维护,专家定期审查内容,以确保信息是最新的。包括医生、护士、药剂师、营养师、牙医、遗传学顾问、验光师、运动教练和社会工作者在内的500多名健康专家为公众问答做出了贡献,更重要的是,他们提供了专业的健康保健信息,直接解决了消费者的健康问题。已回答超过70,000个消费者问题,其中约1,400,000个[
问答的相似性分析仍然是一项具有挑战性的任务[
这些方法为不同领域的问答检索提供了不同的解决方案,如问题分类和排名。然而,医疗保健Q&As通常包含具有挑战性的医疗信息,这些信息难以封装,无法有效地进行标准语言处理和信息检索[
提交到NetWellness网站的问题以自由文本形式撰写,其中包含复杂的语法结构和语义元素。分析消费者问题的相似性并不是一项简单的任务,因此我们提出了一种结合语义注释技术和句法自然语言处理方法来分析问题相似性的方法。
消费者健康问题相似度分析的SimQ框架概述。
语义标注是问答相似度分析的基础步骤。注释过程旨在从自由文本消费者问题中识别与健康相关的实体,并为所识别的实体分配语义类型。我们使用从UMLS开发的语义注释工具来执行命名实体识别[
为了分析消费者问题的语言结构和成分,我们将问题句解析为句法树。AQUA解析器[
解析的语法树和语义依赖关系。
我们构建了依赖语法[
本文采用的相似度计算算法是骰子系数和余弦相似度。骰子系数(DC)和余弦相似度(CS)(见
我们对语法和语义特征都使用二进制表示。如果一个特征在一个问题中出现在消费者面前,那么它的值为1;否则,值为0。从二进制表示中,我们可以生成包含句法和语义特征的向量来比较这两个问题之间的相似性,如式1和式2所示
骰子系数(1)和余弦相似度(2)公式。
我们将我们的方法(SimQ)应用于Netwellness网站上发布的消费者问题,该网站已经存档了超过70,000个问题和由领域专家撰写的600多篇健康信息文章。所有的问答和文章被分为121个健康主题。然后通过使用2000个随机选择的NetWellness问题来评估所提出的SimQ方法的性能。精确度,召回率,以及
“饮食与营养”主题的语义依赖网络概述。
SimQ计算类似问题的例子。
排名 | 类似的问题 | 相似性得分 | |
|
|
||
1 |
|
喉腺肿痛吗? | 0.7368 |
2 |
|
喉咙痛、腺体肿大? | 0.6718 |
3. |
|
喉咙肿,不能很好地吞咽? | 0.6545 |
4 |
|
我的喉咙一直痛,腺体也痛。 | 0.5901 |
5 |
|
小舌肿痛,请帮忙? | 0.5611 |
|
|
||
1 |
|
血小板计数减少? | 0.8235 |
2 |
|
血小板计数低的原因是什么? | 0.7906 |
3. |
|
血小板计数极低? | 0.7726 |
4 |
|
血小板计数下降? | 0.7003 |
5 |
|
食物增加血小板计数? | 0.5957 |
为了评估SimQ方法的性能,从Yahoo Answers中选择了12个种子消费者问题作为输入问题。这些问题是从妇女健康、疾病和状况以及心理健康等不同类别中挑选出来的。两名独立于该项目的生物医学信息学家被招募来生成一个金标准,以评估SimQ问题检索引擎的结果。他们被要求手动选择与种子问题非常相似的网络问题。共有2000个随机选择的网络问题被用作候选库。评估者共选取246个消费者问题作为SimQ检索性能的正金标准。两个评估者之间的初始一致性为83%。然而,他们被允许讨论并就所有类似的消费者问题达成最终一致的协议,然后将其用作黄金标准。
我们还比较了使用不同特征表示的相似性分析的性能。
在
句法分析用于方便识别命名实体,并支持语义特征的构建[
评估消费者问答相似度分析的不同特征表征(使用12个种子问题的平均12个实验)。
功能 | 真正的 |
假 |
真正的 |
假 |
精密% | 记得% |
|
|
|
||||||||
|
基线(B) | 12.83 | 7.67 | 1969.33 | 7.67 | 62.6% | 62.6% | 62.6% |
|
归一化(N) | 12.67 | 6.67 | 1970.33 | 7.83 | 65.5% | 61.8% | 63.6% |
|
概念(C) | 14.00 | 8.33 | 1968.67 | 6.50 | 62.7% | 68.3% | 65.4% |
|
N + POS (P) | 11.67 | 7.67 | 1969.33 | 8.83 | 60.3% | 56.9% | 58.6% |
|
N+概念(NC) | 15.00 | 7.50 | 1969.50 | 5.50 | 66.7% | 73.2% | 69.8% |
|
N + C +类型(NCT) | 15.33 | 6.67 | 1970.33 | 5.17 | 69.7% | 74.8% | 72.1% |
|
||||||||
|
基线(B) | 11.33 | 3.17 | 1973.83 | 9.17 | 78.1% | 55.3% | 64.7% |
|
归一化(N) | 15.50 | 10.33 | 1966.67 | 5.00 | 60.0% | 75.6% | 66.9% |
|
概念(C) | 15.33 | 8.00 | 1969.00 | 5.17 | 65.7% | 74.8% | 70.0% |
|
N + POS (P) | 11.67 | 5.67 | 1971.33 | 8.83 | 67.3% | 56.9% | 61.7% |
|
N+概念(NC) | 14.33 | 3.83 | 1973.17 | 6.17 | 78.9% | 69.9% | 74.1% |
|
N + C +类型(NCT) | 16.00 | 6.17 | 1970.83 | 4.50 | 72.2% | 78.0% | 75.0% |
为了演示SimQ的使用,我们开发了一个应用程序来补充NetWellness网站上现有的问答服务。
这个新的应用程序通过语义相似性分析增强了工作流(参见
SimQ在网络健康中的应用。
目前,在网上查找健康信息最常见的方式之一是通过搜索引擎。搜索引擎使用基于关键字的信息检索技术[
SimQ方法与问答机(QAMs)有关,但本质上不同[
我们从SimQ检索结果中观察到两种类型的错误:假阳性结果和假阴性结果。假阳性结果(错误地包含问题)通常是由具有微小但重要差异的问题产生的。例如,SimQ检索查询,“我如何在一个月内减肥?”,因为“lose weight”和“gain weight”都有相同的语义类型,即发现。这两个问题包含相同的语义类型,患者群体和时间概念。唯一的主要区别是“减肥(CUI:C0043096)”和“增重(CUI:C0043094)”的概念。对于这种类型的错误,一个潜在的解决方案是将概念重要性排名纳入相似度分析。在生成特征向量时,重要概念具有较高的权重,用于计算相似度得分,从而提高检索结果。假阴性结果(错误排除的问题)通常是由复杂的问题引起的。例如,“我乳房有个肿块,是淋巴结还是肿瘤?”在语义上与“乳房肿胀是乳腺癌的征兆吗?”以人类的标准。 However, the SimQ similarity score is not very high. To address this problem, we need to add concept reasoning ability to the similarity analysis. In this example, the concept “breast lump (CUI:C0424849)” is a descendent of the concept “swelling (CUI:C0038999)”, and “breast cancer (CUI:C0006142)” is a descendent of “tumor (CUI:C0027651)”.
简短含糊的问题也会导致假阴性和假阳性错误。例如,在分析问题“Vitamin B6 deficiency”时,SimQ检索到假阳性结果“Vitamin B12 deficiency?”以及假阴性结果“维生素B6缺乏的症状是什么?”我们认为,解决由简短的模糊问题造成的错误的潜在方法包括根据重要性对问题元素进行加权和/或应用查询扩展技术。例如,扩展网络性问题的一种直观的方法是包括之前相似度分析的答案。然而,答案通常比问题复杂和长得多,因此要获得良好的结果仍然具有挑战性,特别是需要实时检索响应。整合问题和答案以改善检索结果将在我们计划进行的后续研究中进行检查。
SimQ使用UMLS作为标准化的语义知识库。未来,我们计划利用其他医学知识资源进行语义标注,可以提供更细粒度的语义赋值,提高语义分析能力。此外,一些研究者指出,消费者健康词汇(CHV) [
对消费者健康问题进行相似性分析,可以显著提高在线社区问答服务的质量和可及性。在本研究中,我们提出了一个新的应用程序SimQ,它结合自然语言处理和语义模式技术,分析消费者健康问题的语义相似性。评估结果表明,我们的方法有效地检索了NetWellness上的类似问题。结果表明,SimQ法的精密度最高,为72.2%,查全率为78.0%
相似度分析的源代码。
临床和转化科学合作克利夫兰
国家推进转化科学中心
自然语言处理
名词短语
词性
问答
简单的问题
统一医学语言系统
动词词组
第三人称动词
这项工作得到了临床和转化科学合作(CTSC)的支持,授权号为UL1TR000439。CTSC得到了国家促进转化科学中心(NCATS)的支持,该中心是美国国立卫生研究院和NIH医学研究路线图的组成部分。
没有宣布。