卡塔尔世界杯8强波胆分析|卡塔尔世界杯4强波胆分析

JMIR

J医疗互联网服务

医学互联网研究杂志

1438 - 8871

冈瑟Eysenbach

卡塔尔世界杯8强波胆分析JMIR出版公司，多伦多，加拿大

v13i4e82

22011384

10.2196 / jmir.1826

原始论文

用于从Medline检索临床检查研究的过滤器的开发和验证

Eysenbach

冈瑟

张

李

勒克莱尔

伊迪丝

谢赫

纳德

MD英里每小时 1

匹兹堡大学医学院一般学术儿科匹兹堡儿童医院

佩恩大道4401号

匹兹堡，宾夕法尼亚州，15224

美国 1 412 692 8111 1 412 692 8516 nader.shaikh@chp.edu

Badgett

罗伯特·G

医学博士 2 π

米娜

废话 3. Wilczynski

南希·L

博士学位 4 McKibbon

k .安

博士学位 4 凯彻姆

安德里亚米

信息学硕士学历 5 海恩斯

r·布莱恩

医学博士学位 4

¹ 匹兹堡大学医学院一般学术儿科匹兹堡儿童医院

宾夕法尼亚州匹兹堡

美国 ² 内科堪萨斯大学威奇托医学院

威奇托,KS

美国 ^3. 生物学系卡内基梅隆大学

宾夕法尼亚州匹兹堡

美国 ⁴ 临床流行病学与生物统计学系“，麦克马斯特大学

汉密尔顿,在

加拿大 ⁵ 健康科学图书馆系统匹兹堡大学

宾夕法尼亚州匹兹堡

美国

Oct-Dec 2011

19 10 2011

13 4

e82

13 04 2011 09 05 2011 03 06 2011 06 06 2011

©Nader Shaikh, Robert G. Badgett, Mina Pi, Nancy L. Wilczynski, K. Ann McKibbon, Andrea M. Ketchum, R. Brian Haynes。最初发表于《医疗互联网研究杂志》(//www.mybigtv.com)， 2011年10月19日。

2011

这是一篇开放获取的文章，根据创作共用署名许可(http://creativecommons.org/licenses/by/2.0/)的条款发布，允许在任何媒介上无限制地使用、分发和复制，前提是正确引用最初发表在《医学互联网研究杂志》上的原创作品。必须包括完整的书目信息，//www.mybigtv.com/上的原始出版物的链接，以及此版权和许可信息。

背景

有效地找到临床检查研究(量化症状和体征在疾病诊断中的价值的研究)正变得越来越困难。用于从Medline检索诊断研究的过滤器缺乏特异性，因为它们还检索了大量关于影像学和实验室检测诊断价值的研究。

客观的

目的是开发从Medline检索临床检查研究的过滤器。

方法

我们在训练数据集中开发了过滤器，并在测试数据库中验证了它们。我们通过手工搜索161种期刊(n = 52,636项研究)创建了训练数据库。我们评估了65个候选单术语过滤器在识别训练数据库中报告症状或体征敏感性和特异性的研究时的召回率和准确性。为了确定这些搜索词的最佳组合，我们使用了递归分区。训练数据库中表现最好的过滤器以及13个先前开发的过滤器在测试数据库中进行了评估(n = 431,120项研究)。我们还研究了检查收录文章的参考文献列表对回忆的影响。

结果

在训练数据库中，查全率最高(95%)的单项过滤器为诊断(subheading)，查准率最高(8.4%)的单项过滤器为“病史采集”(MeSH)。使用递归分区开发的多项过滤器(RP过滤器)在训练数据库中的召回率为100%，精度为89%。在测试数据库中，Haynes-2004-Sensitive滤波器(召回率98%，精密度0.13%)和RP滤波器(召回率89%，精密度0.52%)表现最佳。回顾纳入文章的参考文献列表，这两个过滤器的召回率分别提高到99%和94%。

结论

递归分区似乎是开发搜索过滤器的一种有用方法。本文提出的实证检索过滤器可以帮助从Medline检索临床检查研究;然而，由于检索策略的精度较低，检索相关研究仍然具有挑战性。提高精确度可能需要国家医学图书馆系统地改变文章的标签。

Medline 过滤器对冲临床检查递归分区

简介

在作出诊断时，临床医生往往依赖临床检查结果(即病人的病史和/或体格检查的资料)[ 1- 3.］．因此，临床检查研究结果的易得性可以极大地影响医疗保健。自1980年以来，每年发表的专注于临床检查的研究数量增加了两倍多。随着这类文献的增多，可靠而简单地识别可靠研究的任务变得越来越具有挑战性。

在医学的许多领域，已经开发了过滤器以方便搜索相关文章。过滤器是预先测试的搜索策略，有助于从Medline的所有其他研究中识别某种类型的研究。可供检索诊断、治疗和临床预测规则研究的优化搜索过滤器[ 4- 6］．这些过滤器通常被临床医生使用(例如，PubMed临床查询[ 4])和系统审稿人(例如，Cochrane治疗文章高敏感搜索策略[ 7])。然而，尚未开发出任何已发表的筛选器，以方便检索临床检查研究[ 8］．临床检查过滤器可能对临床医生和系统评价的作者有用。临床医生需要及时识别良好的临床检查文章，以便有效地护理患者。随着Cochrane诊断测试准确性评价的开始[ 9]，其中将包括临床检查的评论，因此对用于临床检查研究检索的优化过滤器的需求越来越大。

本研究的目的是开发和评估Medline过滤器，以促进临床检查研究的检索。

方法概述

过滤器的训练和测试包括8个步骤:(1)开发训练数据库，(2)识别候选单项滤波器，(3)识别训练数据库中性能最佳的单项滤波器，(4)采用递归分区法识别训练数据库中性能最佳的多项滤波器，(5)开发测试数据库，(6)评估本研究开发的滤波器在测试数据库中的性能，(7)评估先前在测试数据库中开发的过滤器的性能，以及(8)检查审查收录文章的参考文献列表对召回的影响。我们使用PubMed进行研究，PubMed是美国国家医学图书馆的公共搜索引擎，用于访问Medline。

开发培训数据库

我们使用了临床对冲数据库，其方法已在前面描述过[ 10]，作为本研究的起点。简单地说，赫奇斯团队对2000年发表在161家高质量期刊上的文章进行了手工搜索;共审查52,636篇文章。该团队根据先验标准将文章分类为与诊断、治疗或预后有关的(在其他类别中)。对于本文报道的项目，我们回顾了临床对冲数据库中确定的与诊断或预后相关的研究，以确定那些专门与临床检查相关的研究(n = 1347)。

一名研究者(作者NS)最初审查了1347项研究的标题和摘要(如果有摘要)以及全文(如果有必要)，并将每篇文章分类为a 临床检查(金本位文章)或a 非 - - - - - - 临床检查文章( 图1)．金标准文章是那些符合我们量化临床检查价值的先验标准的文章。我们只考虑了通常可用的道具如听诊器或检眼镜可以引出的体检结果。我们纳入了报告至少一种症状、体征或症状和体征组合的敏感性和特异性的文章( 图1)．我们纳入了仅由体征或症状组成的多变量诊断规则;描述包括影像学或实验室发现的多变量规则的研究未被考虑，因为这些研究可以很容易地使用现有的、更通用的用于检测诊断测试的过滤器找到。例如，布里斯评分(一种用于诊断儿童链球菌咽炎的有效评分系统)不被认为是一项临床检查研究，因为除了体征和症状外，还需要白细胞计数来计算总分[ 11］．我们排除了预后因素的研究，即那些专注于预测未来疾病的研究(例如，基于重症监护病房入院时的发现预测死亡率)。少于10例患者的文章被排除在外，因为这些研究样本量非常小，无法提供准确的敏感性或特异性估计。不容易分类的研究由第二审稿人(作者RGB)独立审查，差异通过讨论解决。在52,636篇文章中，有60篇符合金本位标准( 图1)．

然后，我们通过输入Medline上的161种期刊，并将出版年份限制在2000年，重新创建了临床对冲数据集( 图1)．我们把这些文章分为两组存放在PubMed的一个账户中。一个集合包含符合金本位标准的文章，另一个集合包含其余的文章。

图1

描述培训数据库开发的流程图。

候选单项过滤器的识别

在两名临床医生、三名参考图书管理员的帮助下，我们用PubMed语法生成了65个候选搜索词的列表，并对文献进行了彻底的回顾。专家搜索独立审查了我们的候选术语列表，并建议了额外的术语。我们使用了与临床检查和诊断相关的术语以及否定的术语(例如，非MRI)。(见多媒体附件1以查阅所使用的搜寻词清单。)使用了以下PubMed语法:[tw] = text word;[MeSH] =国家医学图书馆的医学学科标题;[sh] = MeSH子标题;[TIAB] =标题或摘要;[pt] =出版类型;[ti] =标题;du[sh] =诊断使用MeSH子标题;noexp =不会爆炸(即，不要在MeSH层次结构中自动将更具体的术语包含在MeSH术语之下)。

使用训练数据库识别性能最好的单术语过滤器

我们根据训练数据库对每个单独的过滤器进行评估，以确定其召回率(过滤器检测到的临床检查文章的比例)、精密度(检索到的相关文章的比例)、F-measure(结合召回率和精密度的整体测量)、“影响”(检索到的不相关文章的比例)和需要阅读的文章数(搜索者为了找到每篇相关文章需要查看的平均文章数)[ 12］．在临床检查术语中，7个术语的召回率大于25%，沉降率小于50%。我们评估了这7个术语的所有可能的组合(2项组合、3项组合、4项组合、5项组合、6项组合和一个7项组合)，以确定具有最高查全率、精密度和F-measure的组合。我们对8个诊断术语的所有可能组合重复了这一过程，召回率大于25%，沉降率小于50%。

基于训练数据库的递归分区多项滤波器的开发

因为测试所有单项过滤器的组合是不可能的，所以我们使用递归分区来开发最佳的多项过滤器(以下简称递归分区过滤器)[ 13］．递归划分是非参数判别分析的一种形式，它根据一组预测变量反复将组分层为更小的互斥子组。除了它的效率之外，递归分区的另一个优点是它能够创建包含布尔术语OR和and的过滤器。递归划分还增加了改变错误分类代价(假阳性的代价vs假阴性的代价)的能力，以确定最能解决分析目标的术语。召回率超过25%的41个词语或当辐射小于75%时，我们根据训练数据库计算召回率、精度、F-measure和辐射。为了确定树中的第一个分支点，我们选择了加权错误率最低的术语(基于数据库中所有研究中临床检查研究的患病率的权重)[ 13］．一旦发现错误率最低的术语(即诊断[tw])，我们就在PubMed中创建了4个新的数据集(“临床检查”和诊断[tw];“临床检查”不是诊断[tw];“非临床检查”和诊断[tw];“非临床检查”不是诊断[tw])。然后，我们针对这4个新数据集测试了所有剩余的过滤器，并再次确定了错误率最低的术语。这使得我们可以扩展递归分区树。我们重复这个过程，直到拆分所创建的两个2x2表彼此之间不再有显著差异( P> . 05)。由于这种方法可能导致过拟合，我们还要求每个新分支的召回率至少为99%。

建立测试数据库

为了开发测试数据库，我们使用了文献中最大的临床检查系统综述集合:《美国医学会杂志》(JAMA)的《理性临床检查》系列[ 14］．一个作者(NS)使用类似于建立训练数据库的先验纳入和排除标准来开发测试数据库。我们纳入了系统综述，这些综述回顾了至少10项原始研究，报告了体征或症状的敏感性和特异性，并于1996年至2006年发表( 图2)．与临床检查无关的回顾、问卷回顾、包括实验室或影像学变量的多变量诊断规则的回顾以及预后或筛查试验的回顾被排除。共有15篇系统评价符合所有纳入标准。

纳入这15篇综述的文章被视为有关过滤器应该能够回忆起的文章(黄金标准)。识别 nonrelevant文章:我们使用每个系统综述的方法部分中报告的搜索策略重新创建了主题特异性搜索(例如，颞动脉炎或巨细胞动脉炎);通过特定主题电子检索检索到但未包括在审查中的文章被视为不相关。这使我们能够计算出每次评论中相关和不相关文章的数量。15篇系统综述共纳入224篇原创临床检查文献。我们排除了7篇不在Medline上的文章。一项研究被排除在外，因为它没有通过特定主题搜索找到。总之，28项没有摘要的较老的研究被排除在外，因为过滤器很难检索这些研究，而且因为当代临床检查的研究可能有摘要。最终的测试数据库包括188篇相关文章和430,932篇不相关文章。

图2

描述测试数据库开发的流程图。

本研究中开发的过滤器的评估

对于训练数据库中召回率最高的3个过滤器，我们在测试数据库中计算召回率、精度、F-measure和读取所需的数量。计算是基于的单元格和公式表1．

表1

为每个系统回顾和所用公式创建一个2x2表^一个

	纳入系统综述的文章	未纳入系统综述的文章
过滤器检测	一个	B
被过滤器漏掉	C	D

^一个召回率= A/(A+C);精度= A/(A+B);F-measure = 2*精度*召回率/(精度+召回率);读取所需的数= 1/精度;放射性尘埃= B/(B+D) [ 15， 16］

评估先前开发的过滤器

先前开发的12个过滤器的性能验证了检索诊断文章的有效性[ 10， 17- 21]和1个由《理性临床检查》系列编辑专门为临床检查开发的过滤器[ 22在测试数据库中进行了评估。中列出了测试的过滤器多媒体附件2并且使用描述过滤器的出版物的第一作者的名称命名，后面跟着出版年份。如果出版物中描述了多个过滤器，我们将标记作者用来描述各种过滤器的名称。例如，“Haynes-2004- sensitive”标签指的是Haynes等人在2004年的出版物中描述的具有最高灵敏度的过滤器(即具有最高召回率的过滤器)。最后，我们测试了最佳滤波器的组合是否会提高性能。

回顾参考书目对召回的影响

系统评论的作者经常检查参考文献列表，希望增加回忆。我们研究了这种策略如何在临床检查领域补充过滤器的使用。具体来说，我们检查了检查所收录文章的参考文献列表是否允许使用具有较低召回率的过滤器。因此，我们确定了被召回率最高的2个过滤器遗漏的文章，并检查这些文章是否包含在没有被这些过滤器遗漏的文章的参考文献列表中。

结果培训结果

训练数据库中性能最好的滤波器如图所示表2．“诊断”一词[副标题]确定了95%的临床检查研究。MeSH术语体检仅发现了25%的研究，因此未列入表中。一般来说，只使用与诊断相关的术语的多词搜索过滤器优于只使用临床检查术语的过滤器。此外，3个滤波器的召回率为100% (ce -高召回率，dx -高召回率，RP)，其中两个(dx -高召回率，RP)由于精度较高而显得特别有希望。

表2

训练数据库中具有最佳召回率(保持放射性沉降小于50%)、精度(保持召回率大于50%)和F-measure的过滤器

过滤器		性能测量	回忆(%)	精度(%)	F-measure	NNR^一个
最佳单项滤波器
	诊断(副标题)	最好的回忆	95	0.35	0.71	279
	病史采集[MeSH]	最好的精度和f测量	12	8.44	9.79	11.86
仅使用诊断术语的最佳多术语过滤器
	诊断[tw]或“敏感性和特异性”[MeSH]	最佳召回(以下简称dx -高召回)	One hundred.	0.52	1.04	191
	试验的预测价值[网格]或特异性[TIAB]	最佳精度和F-measure(以下简称Dx-precise)	67	1.95	3.78	51
仅使用临床检查术语的最佳多术语过滤器
	临床[tw]或症状[tw]或检查*[tw]或标准[tw]或试验[tw]或试验[tw]	最佳召回(以下简称CE-high召回)	One hundred.	0.27	0.53	377
	测试[tw]或物理[tw]	最佳精度和F-measure(以下简称CE-precise)	62	0.72	1.43	138
使用所有术语的最佳多术语过滤器
	(诊断[tw]和(特异性[tw]或临床[tw]或检查*[tw]))或“敏感性和特异性”[MeSH]	递归划分的最佳整体滤波器(以下简称RP-filter)^b	One hundred.	0.89	1.76	113

^一个需要读取的数字

^b使用递归分区开发的过滤器(请参阅“方法”部分)

递归分区树显示在图3．当转换为布尔语言时，RP过滤器在PubMed语法中如下:(诊断[tw] AND(特异性*[tw] OR临床*[tw] OR检查*[tw]))或“敏感性和特异性”[MeSH]。

图3

使用递归分区开发的用于临床检查(CE)文章检索的最佳多术语过滤器。

测试结果

在本研究中开发的滤波器以及之前开发的13个滤波器和滤波器组合的召回率、精度、F-measure和读取所需的数都显示在表3．Haynes-2004-Sensitive滤镜[ 10的记忆力最高(98%)。当只考虑召回率为80%的滤波器时，RP滤波器具有最高的精度(0.26%)。Haynes-2004-Sensitive过滤器和CE-high recall过滤器结合使用布尔术语OR时，召回率为100%，精度为0.06%。与单独使用相比，其他过滤器组合并没有提供太多的回忆改善。

表3

测试数据库中根据召回率排序的搜索过滤器的性能

过滤器或过滤器组合		回忆(%)	精度(%)	F-measure	NNR^一个
过滤器
	海恩斯- 2004敏感( 10］	98	0.13	0.26	778
	文森特- 2003 ( 21］	98	0.09	0.17	1154
	巴赫曼- 2002 ( 15］	96	0.11	0.22	906
	海恩斯- 1994敏感( 19］	95	0.16	0.31	641
	Dx-high回忆^b	95	0.12	０．２５	804
	范德伟登-1997 [ 20.］	95	0.07	0.13	1490
	CE-high回忆^b	91	0.08	0.15	1330
	海恩斯- 1994准确( 19］	91	0.07	0.14	1431
	RP-filter^b	89	0.26	0.52	380
	临床检查[ 22］	73	0.30	0.61	328
	帝威- 2002 ( 18］	71	0.40	0.80	249
	海恩斯- 2004准确( 10］	69	0.45	0.89	224
	帝威- 2000准确( 17］	64	0.64	1.26	157
	帝威- 2000敏感( 17］	64	0.60	1.19	167
	海恩斯- 1994具体( 19］	51	0.72	1.42	139
	海恩斯- 2004具体( 10］	36	1.01	1.97	99
滤光片组合
	海恩斯- 2004敏感( 10或ce -高回忆	One hundred.	0.06	0.12	1613
	CE-high recall OR RP	99	0.06	0.13	1572
	海恩斯- 2004敏感( 10]或rp	98	0.11	0.22	890
	海恩斯- 2004敏感( 10]和rp	95	0.13	０．２５	790
	海恩斯- 2004敏感( 10以及ce -高回忆率	88	0.19	0.39	515

^一个NNR =需要读取的数字

^b训练数据库中召回率最高的三个过滤器

审查参考书目的影响

总的来说，Haynes-2004-Sensitive搜索策略漏掉了188篇相关文章中的4篇，其中2篇是通过查看该策略没有漏掉的文章的参考文献列表而检索到的(召回率从98%提高到99%)。在递归分区策略遗漏的19篇文章中，通过回顾该策略没有遗漏的文章的参考文献列表检索到8篇文章(召回率从89%提高到94%)。

讨论

我们量化了可能用于在MEDLINE中查找临床检查文章的过滤器的召回率和精度。虽然使用递归分区可能会提高搜索的精度，但我们测试的所有策略的精度都非常低，不到2%。

过滤器的应用

对于医疗保健提供者寻找有关临床检查结果诊断准确性的信息，RP过滤器似乎是最合理的选择。例如，让我们假设一位临床医生正在检查第三个心音检测心力衰竭的能力。为了确定第三次心音患者的充血性心力衰竭的测试后概率，使用PubMed中的RP过滤器进行搜索将是(心跳加速或S3或第三次心音)和心力衰竭[MeSH] AND(诊断[tw] AND(特异性*[tw]或临床*[tw]或检查*[tw]))或“敏感性和特异性”[MeSH])。截至2011年3月，这项搜索产生了68篇文章，其中有几篇与临床医生的问题直接相关。虽然没有被研究过，但医生可以通过添加术语“systematic[sb]”来限制搜索系统综述。该策略产生了1个相关的系统评价。虽然本研究中报告的过滤器的NNRs非常高( 表3)，在临床实践中，NNR会大大降低。NNR与诊断测试的阳性预测值一样，取决于有关体检的文章的流行程度。尽管体检研究在MEDLINE中的比例相对较低(例如，在Hedges数据库中< 0.1%)，但当临床医生输入疾病和体检结果的搜索词时，体检文章的流行度会增加。因此，读取所需的数量将大大降低(参见上面的例子)。因此，至关重要的是，临床医生使用最具描述性和最具体的术语来使用一个精心构建的临床问题[ 23］．

对于想要进行系统评价的研究者，Haynes-2004-Sensitive过滤器[ 10，其回收率为98%，似乎是最合理的选择。然而，如果仅依赖此过滤器，可能会错过一些文章。提出了两种提高回忆率的策略。一是检查符合纳入标准的文章的参考书目。这将灵敏度提高到99%。另一种策略是使用OR将haynes -1994和CE高召回过滤器结合起来。虽然该策略的召回率为100%，但其精度非常低(0.06%)。尽管仅仅依赖过滤器可能会导致一些研究被遗漏[ 24]，我们认为使用过滤器是适当的，特别是在没有过滤器很难进行审查的情况下。这里提供的过滤器旨在用作更大的搜索策略的一部分，其中包括参考列表的审查，以及与该领域专家的交流。

临床检查研究中滤光片精度差

我们测试的所有过滤器在识别临床检查研究方面的精度都非常低。我们的发现与Haynes及其同事发表的研究结果一致[ 19]，表明为检索诊断文章而开发的过滤器的准确度较为检索治疗文章而开发的过滤器差( 表4)．这些观察结果表明，国家医学图书馆应该为量化诊断敏感性和特异性的研究创建一种出版物类型。其他替代或补充的解决方案可能包括手动识别和标记量化临床检查的研究(目前Cochrane协作组织正在使用该方法创建健全的随机对照治疗试验数据库CENTRAL)、协同过滤或基于内容的过滤[ 25］．

表4

用于临床检查、诊断和治疗的过滤器性能比较

过滤器		回忆(%)	精度(%)	F-measure	NNR^一个
临床检查
	海恩斯- 2004敏感( 10］	98	0.13	0.26	778
	递归分区	89	0.26	0.52	380
一般诊断
	海恩斯- 2004敏感( 10］	99	1．1	2.17	91
治疗
	海恩斯2005 [ 26］^b	99	9.9	18.0	10
	Haynes 1994 [ 19］^b	99	22	36.0	4．5

^一个NNR =需要读取的数字

^b值用于最敏感的多项过滤器

限制

我们的研究有几个局限性。Hedges数据库[ 10]收录了161种被认为具有最高科学价值和临床相关性的期刊。虽然我们相信这些是最能帮助临床医生的期刊，但当搜索整个Medline时，结果可能会有所不同。此外，以外文出版的期刊没有被包括在Hedges数据库中。由于我们的一些过滤器使用了文本单词，这些过滤器在搜索未被翻译成英语的文章或没有摘要的文章时性能可能会下降。另一个限制是我们对候选搜索词的识别。与过滤器开发的先前研究一致，专家搜索人员独立审查了我们的候选术语列表，并建议了额外的术语。然而，我们没有定量地回顾金标准研究中最频繁的搜索词和文本词，以确定候选术语。然而，当我们回顾性检查用于在训练数据库中索引金标准研究的MeSH术语时，未经过我们测试的术语的查全率和准确度远远低于我们选择的术语。尽管如此，我们认为未来的研究应该采用这种识别术语的方法。另一个限制是在训练数据库中识别黄金标准文章。 Only one investigator initially reviewed the articles for eligibility. Future studies should utilize two investigators who independently assess each article. Finally, because of the low prevalence of clinical examination studies, the number of gold standard studies in both the training and testing databases were relatively small. Further testing of these filters in larger databases is necessary.

令人惊讶的结果是，训练数据库中只有25%和20%的临床检查研究分别使用MeSH术语“体检”和“体征和症状”进行编码。当前这些MeSH术语分配的不一致性限制了搜索过滤器在这个主题上的能力。

对未来滤波器发展的启示

提出了一种开发多项滤波器的新方法。在过滤器的开发中使用递归分区是一种新颖的方法，似乎特别适合有许多候选项的情况。当候选词的数量很少时，可以根据数据集测试所有可能的词的组合。当候选项的数量很大时，这就变得令人望而却步。相比之下，使用递归分区，搜索过滤器是逐步构造的。这种方法还允许开发使用AND和OR术语的过滤器，并允许开发具有召回率和精度的最佳组合的过滤器。

结论

递归分区提供了另一种开发过滤器的方法:它不仅允许开发具有召回率和精度的最佳组合的过滤器，而且还允许开发同时使用and和OR布尔连接器的过滤器。尽管递归分割具有优势，但我们开发的用于临床检查研究检索的过滤器精度相对较低。我们认为国家医学图书馆应该为量化临床检查的敏感性和特异性的文章创建一种出版类型。这种新标签可以提高临床诊断文献的检索。

我们感谢陈品王博士，圣安东尼奥德克萨斯大学健康科学中心流行病学和生物统计系，他帮助我们开发了统计策略来解决递归分区模型中的过拟合问题。

没有宣布

多媒体附件1

单项过滤器列表。

多媒体附件2

测试语料库中评估的过滤器列表。

汉普顿

小

哈里森

乔丹

米切尔

小

普里查德

西摩

病历记录、体格检查、实验室调查对门诊病人诊断和管理的相对贡献

Br医学J 1975 05 31 2 5969 486 9

1148666

PMC1673456

彼得森

霍尔布鲁克

•冯•黑尔斯

史密斯

问

股份

病史、体格检查、实验室检查对医学诊断的贡献

西J医院 1992 02 156 2 163 5

1536065

PMC1003190

桑德勒

不必要的测试成本

Br医学J 1979 07 7 2 6181 21 4

466256

PMC1595755

海恩斯

Wilczynski

在MEDLINE中寻找黄金:临床查询

ACP J俱乐部 2005 142 1 A8 9

15656539

acpjc - 2005 - 142 - 1 - a08

Wilczynski

问

海恩斯

树篱的团队

EMBASE搜索策略在检索方法学上合理的系统综述时具有较高的敏感性和特异性

临床流行病学 2007 01 60 1 29 33

10.1016 / j.jclinepi.2006.04.001

17161751

s0895 - 4356 (06) 00127 - 2

黄

党卫军

Wilczynski

问

海恩斯

Ramkissoonsingh

树篱的团队

在MEDLINE中开发最佳搜索策略来检测可靠的临床预测研究

AMIA年度诉讼程序 2003 728 32

14728269

D030003013

PMC1479983

Lefebvre

Manheimer

一个被

科克伦干预系统评价手册 2011

2011-10-04

英国牛津郡,

Cochrane协作网

搜索研究 http://www.mrc-bsu.cam.ac.uk/cochrane/handbook/index.htm

62年buu8fca

Simel

戴斯。莱纳姆:

兰尼

Bossuyt

点

报告诊断准确性研究的标准声明:应用于病史和体格检查

J Gen实习生 2008 06 23 6 768 74

10.1007 / s11606 - 008 - 0583 - 3

18347878

PMC2517891

Leeflang

毫米

Deeks

Gatsonis

Bossuyt

点

Cochrane诊断测试准确性工作组

诊断测试准确性的系统回顾

实习医生 2008 12 16 149 12 889 97

19075208

149/12/889

PMC2956514

海恩斯

Wilczynski

问

从Medline检索科学强诊断研究的最佳搜索策略:分析调查

BMJ 2004 05 1 328 7447 1040

10.1136 / bmj.38068.557998.EE

15073027

bmj.38068.557998.EE

PMC403841

Breese

链球菌性咽炎初步诊断的简易记分卡

Am J Dis Child 1977 05 131 5 514 7

855837

赫斯

或者说是

信息检索:卫生保健的视角 1995

纽约

施普林格

烹饪

英孚

高盛

多元分析技术的经验比较:递归分区分析的优缺点

J慢性疾病 1984 37 9 - 10 721 31

6501544

Simel

戴斯。莱纳姆:

兰尼

临床检查。一个让它更理性的议程

《美国医学会杂志》 1997 02 19 277 7 572 4

9032165

巴赫曼

Coray

Estermann

怪兽Riet

识别MEDLINE中的诊断研究:减少所需阅读的数量

美国医学信息协会 2002 9 6 653 8

12386115

PMC349381

托斯

灰色的

晶澳

布莱斯•

一个

读取所需的数字—一种新的日志价值度量方法

健康信息(图书馆 2005 06 22 2 81 2

10.1111 / j.1471-1842.2005.00568.x

15910578

HIR568

德维尔

王

Bezemer

布特

家庭医学期刊中诊断试验评价的发表:最优搜索策略

临床流行病学 2000 01 53 1 65 9

10693905

s0895 - 4356 (99) 00144 - 4

德维尔

王

Buntinx

布特

Montori

虚拟机

de Vet

范德温特

达

Bezemer

进行诊断研究的系统回顾:教学指南

BMC医学Res Methodol 2002 07 3. 2 9

12097142

PMC117243

海恩斯

Wilczynski

McKibbon

卡

沃克

辛克莱

开发MEDLINE中检测临床可靠研究的最佳搜索策略

美国医学信息协会 1994 1 6 447 58

7850570

PMC116228

20.

van der Weijden

IJzermans

的诞生之地迪南市

范名女警

de Vet

Buntinx

确定MEDLINE中的相关诊断研究。以血沉仪为例，探讨血沉仪的诊断价值

Fam Pract 1997 06 14 3. 204 8

9201493

文森特

年代

Greenley

年代

Beaven

临床证据诊断:开发一种敏感的搜索策略来检索深静脉血栓的诊断研究:一种实用的方法

健康信息(图书馆 2003 09 20. 3. 150 9

12919278

427

普通内科学会

理性临床检查系列 2008

2011-04-12

弗吉尼亚州亚历山德里亚

普通内科学会

作者合理临床检查须知 http://sgim.org/index.cfm?pageId=666

5 xtmo85ou

专家

亚当斯

欧文斯

Keitz

年代

Fontelo

利用PICO框架改进PubMed对临床问题的搜索

BMC Med通知Decis Mak 2007 7 16

10.1186 / 1472-6947-7-16

17573961

1472-6947-7-16

PMC1904193

Leeflang

毫米

Scholten

Rutjes

亚历山大-伍尔兹

Reitsma

简森-巴顿

Bossuyt

点

使用方法学搜索过滤器来识别诊断准确性研究可能导致相关研究的遗漏

临床流行病学 2006 03 59 3. 234 40

10.1016 / j.jclinepi.2005.07.014

16488353

s0895 - 4356 (05) 00327 - 6

Yoneya

Mamitsuka

PURE: PubMed基于内容过滤的文章推荐系统

基因组的通知 2007 18 267 76

18546494

9781860949920 _0026

海恩斯

McKibbon

卡

Wilczynski

问

沃尔特

Werre

老

树篱的团队

从Medline检索科学强研究的最佳搜索策略:分析性调查

BMJ 2005 05 21 330 7501 1179

10.1136 / bmj.38446.498542.8F

15894554

bmj.38446.498542.8F

PMC558012