许多临床医生和研究人员对特定年龄的患者(儿童、老年患者等)感兴趣。在大型书目数据库(如Medline)中搜索特定年龄的出版物是有问题的,因为索引不一致,年龄类别重叠,以及相关文献在许多期刊上的传播。据我们所知,目前还没有针对Medline的年龄搜索策略。
我们试图确定Medline中年龄相关术语的检索特征,以确定与五个临床专业相关的研究:成人医学、老年医学、儿科医学、新生儿医学和产科。
我们比较了在Medline中检索引用的特定年龄搜索词和短语与对161种核心医疗保健期刊文献的手动搜索。六名经验丰富的研究助理接受了培训并进行了严格的校准,阅读了2000年出版年度161种期刊的所有问题。除了根据目的和质量对所有物品进行分类外,研究人员还记录了研究参与者的年龄。结果测量包括敏感性、特异性、精密度和单检索词和组合检索词的准确性。
在敏感性最大化的情况下,儿童医学、老年医学、新生儿医学、成人医学、产科、82%、97.1%分别达到最佳敏感性和特异性,分别为98%和81.2%、96.4%和55.9%、95.3%和83.6%。当特异性最大化时,所有学科的敏感性都有预期的下降,而精确度则有所提高。在新生儿医学中,最佳敏感性和特异性的优化值分别为92.5%和92.6%。
选择单个术语和MeSH术语和文本词的组合可以可靠地检索Medline中引用的特定年龄的研究。
临床医生和研究人员寻求特定年龄类别的研究报告,包括通才和那些从事临床专业的人,如成人医学、老年医学、儿科医学、新生儿医学或产科,需要针对他们的文献搜索,以便他们检索的信息与他们的患者群体相关。由于难以找到相关证据,卫生专业人员在保持最新的循证医学和实践循证医学方面面临挑战[
在Medline中寻找特定年龄的证据是一项艰巨的任务,原因有几个。在像Medline这样的大型书目数据库中,对单个主题的最佳搜索检索受到大量与问题无关的可用信息的阻碍。当用户在Medline中搜索时,他们有可能从数据库中目前编入索引的大约4800种期刊中检索文章。这个通用生物医学数据库的规模,加上索引的不完善[
在Medline上通过选择“特定年龄”的期刊来搜索特定的患者群体是没有帮助的,因为与任何年龄组相关的研究都分散在广泛的期刊中,包括不迎合特定年龄组的一般期刊。此外,在Medline中,用于识别研究参与者年龄的索引实践是如此自由,以至于他们创建了一个非常不精确的研究参与者年龄类别的表示。Medline索引器将所有与年龄相关的索引术语应用于一篇文章,而不管有多少参与者属于该类别。因此,如果研究中只有一名患者或参与者属于特定的年龄类别,则将应用该年龄特定的医学主题标题(MeSH)术语。例如,如果一名研究人员对围绕新生儿护理问题的家庭医学跨文化交流感兴趣,那么哈尔森和同事的研究[
为了帮助临床医生搜索特定年龄患者群体的研究,我们开发并测试了Medline搜索策略,用于检测特定年龄类别的研究,并测试了与五个年龄相关的临床专业相关的特定年龄搜索词。在本文中,我们报告了Medline中年龄特定搜索策略的检索性能与2000年161种期刊每期每篇文章的人工回顾(“金标准”搜索)的比较。
在大型电子数据库中进行搜索时,搜索策略是非常有用的工具。我们之前开发了用于Medline的搜索策略,以检测因果关系、预后、治疗和诊断领域的临床相关科学合理的文章[
这项研究比较了Medline(使用Ovid访问)中针对特定年龄的搜索词和短语的检索性能,以及对2000年每期161个期刊标题中的每篇文章的人工检索。这161种期刊是在对400多种期刊进行手工检索的基础上,经过几年的迭代过程选出的。这些期刊由临床医生、图书管理员、编辑和出版商推荐,并根据科学引文索引影响因子和对其研究成果的持续评估以及科学价值和临床相关性的评论来选择[
六名研究助理手工检索了2000年的161种期刊,并根据我们手工检索的类别收集了研究参与者的年龄数据
手检索与Medline MeSH年龄分类的比较
|
|
|
|
胎儿 | 胎儿 | - | - |
新生儿 | 出生至1个月 | 婴儿,新生 | 出生至1个月 |
婴儿 | > 1个月至< 24个月 | 婴儿 | 1至23个月 |
学前教育 | 2年至6年以下 | 孩子,幼儿园 | 2至5年 |
孩子 | 6年到13年 | 孩子 | 6至12年 |
青少年 | 13年到19年 | 青少年 | 13至18岁 |
成人 | 19年到小于45年 | 成人 | 19至44岁 |
中年 | 45岁到< 65岁 | 中年 | 45至64岁 |
岁的 | 65岁到80岁以下 | 岁的 | 65至79岁 |
享年80岁 | ≥80岁 | 80岁以上 | 80年以上 |
ND | Nondiscernible | - | - |
MeSH术语和与年龄相关的文本词(如婴儿、儿童、成人)从Medline下载,并被视为“诊断测试”,用于检测年龄特定人群的研究,这是通过手动搜索161种期刊的文献(金标准)确定的。手工检索数据是通过完整阅读每期刊物获得的。从161种期刊下载的Medline数据包括每个单独术语的检索集。在获得这两个数据源之后(即Medline下载和手动搜索审查),将创建一个数据库,其中包含来自这两个数据源的匹配合并内容。然后,这些奥维德检索集由我们自己的程序集进行操作,以计算我们的结果测量-每个年龄特定的搜索词的操作特征(例如,敏感性,特异性和准确性)对于单个词和词的组合。当我们合并两个数据集(Medline和手动搜索)时,我们确定了匹配。如果Medline包含了一个没有被编入索引的项目,我们就会返回该期刊并对其进行评分。如果我们对一个不在Medline中的项目进行了评分,我们将其从合并的数据库中删除。因此,最终合并的数据库只包括有手动搜索分数和Medline索引的项目。这个合并的数据库被用来开发针对特定年龄的搜索策略[
借用诊断测试评估和图书馆学的概念,我们确定了单项和多项Medline搜索的敏感性、特异性、精密度和准确性。我们将这些操作特征作为搜索词性能的指标。对特定年龄主题的敏感度被定义为检索到的相关文章(即具有所需特定年龄内容的文章)的比例;专一性是指不相关的文章(即在期望的特定年龄内容之外的文章)未被检索到的比例;精确度是检索到的相关文章的比例(这是一个图书馆学术语,相当于诊断测试评估中的“阳性预测值”);准确率是所有文章被正确分类的比例(即检索到的相关文章和未检索到的不相关文章的总比例)。我们手工检索了Medline收录的161种期刊,得出了这些期刊中所有文章的年龄相关内容分类。然后对搜索词进行测试,以确定它们在检索与年龄相关的文章时的表现,同时删除那些不相关的文章。一个自动化的过程(我们使用计算机程序开发和实现)被用来计算Medline中每个单独和组合术语的操作特征(性能)。计算搜索的操作特性(即灵敏度、特异性、精密度和准确度)的公式显示在
用于计算检测年龄特定文章的搜索的灵敏度、特异性、精密度和准确性的公式*
|
||
|
|
|
检测到 | 一个 | b |
没有检测到 | c | d |
a + c | b + d |
*灵敏度= a/(a + c);精度= a/(a + b);特异性= d/(b + d);accuracy = (a + d)/(a +b + c + d).手工查阅文献时分类的所有文章,n = (a +b + c + d)。
对于特定年龄类别,敏感度为> 25%,特异性为> 75%的单个搜索词被纳入包含两个或多个搜索词的搜索策略的开发中。所有术语的组合都使用布尔“或”。为了开发多词搜索策略以优化敏感性或特异性,我们测试了所有敏感性至少为75%和特异性至少为50%的两词搜索策略。
为了构建一个全面的搜索词集,最初生成了MeSH术语和文本词列表,并通过与已知搜索者的访谈、会议和会议上的请求以及向国家医学图书馆的请求,从美国和加拿大的临床医生和图书馆员那里寻求输入。这些专家被问及他们在搜索特定年龄的研究时使用了哪些术语或短语,以及在搜索特定目的类别的研究时使用了哪些术语或短语。搜索词可以是MeSH词,包括出版类型和副标题,或者标题和文章摘要中特定于年龄的文本词。还对文本词、短语和MeSH术语应用了各种截断。我们列出了543个与年龄相关的词汇(多媒体附录)。所有词汇都在Medline中使用Ovid Technologies搜索系统进行测试。
手工搜索的年龄类别是根据用于索引年龄内容的MeSH术语建模的。手动搜索类别和MeSH术语定义的比较显示在
我们定义了五个年龄特定的专业领域通过折叠我们的手搜索年龄类别(见
表3至表7显示了2000年Medline上关于老年医学、成人医学、儿科医学、新生儿医学和产科的研究中,灵敏度最佳、特异性最佳、灵敏度和特异性最佳优化且两者差异最小的表现最佳的词汇组合的操作特征。使用Ovid的Medline搜索引擎语法报告搜索策略(mp =多个发布术语出现在标题、摘要或主题标题中;sh =主题标题[MeSH术语];单词或短语出现在标题或摘要中;: =截断;Pt =出版类型;exp = explosion -自动包含密切相关MeSH术语的搜索词;Tu =治疗用途,作为副标题;Xs =爆炸的小标题)。
单一术语“exp adult”在检索老年医学文章时产生了最好的敏感性(96.4%)和特异性(55.9%)。但是,通过使用次佳的灵敏度组合“age .sh”。OR年龄:.tw.”,与最敏感的术语相比,敏感性的小牺牲(绝对下降1%)导致了更好的特异性(绝对增加14.4%),提高了精密度(绝对增加5.2%)和准确性(绝对增加13.3%)。正如预期的那样,当特异性最大化时,精密度略有提高(绝对增加8.6%)。产生最佳的敏感性和特异性优化的术语“age .sh.”的敏感性为93.6%,特异性为82.7%。
结合2000年Medline上关于老年医学(≥65岁)研究的最佳敏感性、最佳特异性和最佳敏感性和特异性优化术语
|
|
|||
|
|
|
|
|
最好的灵敏度 |
96.4 |
55.9 |
13.7 |
58.7 |
次佳灵敏度 |
95.4 |
70.3 |
18.9 |
72.0 |
最好的特异性 |
63.3 |
84.0 |
22.3 |
82.6 |
下一个最佳特异性 |
93.6 |
82.7 |
28.2 |
83.5 |
灵敏度和特异性最佳优化 |
93.6 |
82.7 |
28.2 |
83.5 |
*使用Ovid的Medline搜索引擎语法报告搜索策略(如果显示单个搜索词,则该词优于两个和三个词的组合)。保持特异性≥50%的最佳灵敏度;最佳特异性,同时保持灵敏度≥50%;灵敏度和特异性的最佳优化是基于灵敏度和特异性之间尽可能小的绝对差;Exp =爆炸,自动包含密切相关的索引术语的搜索词;Sh =主题标题;: =截断;Tw = textword(单词或短语出现在标题或摘要中)。
__数据库共有49028篇文章,其中与老年医学相关的文章3309篇,与老年医学无关的文章45719篇。
‡N随行变化。
三任期策略“adult.mp.”或者中年。sh。OR年龄:.tw.”对检索成人医学相关文章的敏感性最高(94.9%),特异性为64.5%。当特异性最大化时(85.2%),敏感性降低至72.3%,但精密度提高至62.1%(绝对增加14.8%),准确度也提高(绝对增加9.8%)。敏感性和特异性的最佳优化出现在组合术语“middle age .sh”。年龄。tw.”的OR值接近79%。
结合2000年Medline上关于成人医学(19岁至< 65岁)的最佳敏感性、最佳特异性和最佳敏感性和特异性优化的术语
|
|
|||
|
|
|
|
|
最好的灵敏度 |
94.9 |
64.5 |
47.3 |
72.1 |
最好的特异性 |
72.3 |
85.2 |
62.1 |
81.9 |
灵敏度和特异性最佳优化 |
78.7 |
77.9 |
54.4 |
78.1 |
*使用Ovid的Medline搜索引擎语法报告搜索策略(如果显示单个搜索词,则该词优于两个和三个词的组合)。保持特异性≥50%的最佳灵敏度;最佳特异性,同时保持灵敏度≥50%;灵敏度和特异性的最佳优化是基于灵敏度和特异性之间尽可能小的绝对差;Mp =标题、摘要或主题标题中出现多个张贴术语;Sh =主题标题;: =截断;Tw = textword(单词或短语出现在标题或摘要中)。
__数据库共有49028篇文章,其中成人医学相关文章12307篇,成人医学无关文章39721篇。
‡N随行变化。
三词策略“child:.mp.”或adolescent.mp。OR infan:.mp.的敏感性为98.0%,特异度为81.2%。当“children.tw.”一词的特异性最大化(97.1%)时,敏感性发生了显著的权衡,降低到58.2%(绝对下降39.8%)。然而,正如预期的那样,精确度提高了(绝对增加了30.9%)。三学期策略“青少年。tw。或children.tw。OR child, preschool.sh.”获得了最佳的敏感性和特异性优化(分别为89.3%和87.3%)。
将2000年Medline中用于检测儿科医学(> 1个月至< 19岁)研究的最佳敏感性、最佳特异性、最佳敏感性和特异性优化术语组合
|
|
|||
|
|
|
|
|
最好的灵敏度 |
98.0 |
81.2 |
24.6 |
82.4 |
最好的特异性 |
58.2 |
97.1 |
55.5 |
94.9 |
灵敏度和特异性最佳优化 |
89.3 |
87.3 |
30.3 |
87.4 |
*使用Ovid的Medline搜索引擎语法报告搜索策略(如果显示单个搜索词,则该词优于两个和三个词的组合)。保持特异性≥50%的最佳灵敏度;最佳特异性,同时保持灵敏度≥50%;灵敏度和特异性的最佳优化是基于灵敏度和特异性之间尽可能小的绝对差;Mp =标题、摘要或主题标题中出现多个张贴术语;: =截断;Tw = textword(单词或短语出现在标题或摘要中);Sh =主题标题。
__数据库共有49028篇文章,其中儿科医学相关文章2845篇,儿科无关文章46183篇。
‡N随行变化。
三项策略“infan:.mp”的敏感性最高(95.3%)。或孩子:.mp。OR妊娠:.tw.”,检索新生儿医学文章特异性为83.6%。预期的权衡发生在敏感性(绝对下降41.7%)与最具体的术语,“婴儿。tw。”(98.7%)。但精密度增加到38.2%(绝对增加30.8%),准确度达到98.2%。三任期策略“infan:.mp.”或妊娠:.tw。OR neontal .tw.”产生了最佳的灵敏度和特异性优化,达到93%的值(这是所有五个专业中最高的)。
结合2000年Medline上关于新生儿医学(出生到1个月)检测的最佳敏感性、最佳特异性、最佳敏感性和特异性优化的术语
|
|
|||
|
|
|
|
|
最好的灵敏度 |
95.3 |
83.6 |
7.4 |
83.8 |
最好的特异性 |
53.6 |
98.7 |
38.2 |
98.2 |
灵敏度和特异性最佳优化 |
92.5 |
92.6 |
14.7 |
92.6 |
*使用Ovid的Medline搜索引擎语法报告搜索策略(如果显示单个搜索词,则该词优于两个和三个词的组合)。保持特异性≥50%的最佳灵敏度;最佳特异性,同时保持灵敏度≥50%;灵敏度和特异性的最佳优化是基于灵敏度和特异性之间尽可能小的绝对差;Mp =标题、摘要或主题标题中出现多个张贴术语;: =截断;Tw = textword(单词或短语出现在标题或摘要中)。
__数据库共有49028篇文章,其中新生儿医学相关文章663篇,新生儿医学无关文章48365篇。
‡N随行变化。
妊娠:.tw。或fetal.tw。OR pregnancy.tw.”的敏感性最高,为82.0%,在检索有关产科的文章时特异性非常高,为97.1%。“妊娠期:.tw.”一词的特异性最大化(几乎达到99%)产生了1.8%的特异性增加,但敏感性显著降低,下降至52.0%(绝对下降30%)。
结合2000年Medline上关于产科(胎儿)检测研究的最佳敏感性、最佳特异性、最佳敏感性和特异性优化的术语
|
|
|||
|
|
|
|
|
最好的灵敏度 |
82.0 |
97.1 |
23.4 |
97.0 |
最好的特异性 |
52.0 |
98.9 |
33.6 |
98.4 |
灵敏度和特异性最佳优化 |
80.7 |
79.3 |
4.0 |
79.3 |
*使用Ovid的Medline搜索引擎语法报告搜索策略(如果显示单个搜索词,则该词优于两个和三个词的组合)。保持特异性≥50%的最佳灵敏度;最佳特异性,同时保持灵敏度≥50%;灵敏度和特异性的最佳优化是基于灵敏度和特异性之间尽可能小的绝对差;: =截断;Tw = textword(单词或短语出现在标题或摘要中)。
__数据库共有49028篇文章,其中与产科相关的文章516篇,与产科无关的文章48512篇。
‡N随行变化。
我们的研究表明,选择特定年龄的搜索策略可以实现针对特定年龄人群的高检索。我们针对年龄的搜索策略在我们调查的五个专业中表现不同。儿科医学(分别为98%和81.2%)和新生儿医学(分别为95.3%和83.6%)的敏感性和特异性最高。这一发现可能是因为这些年龄组的定义更精确,研究往往只局限于他们。产科搜索策略的特异性(97.1%)高于敏感性(82%),这表明该策略在过滤不相关的年龄特异性文章方面比检索它们更好。优化敏感性和特异性的最佳执行策略在新生儿医学中实现(分别为92.5%和92.6%)。在所有情况下,精度都很低,这是在大型多用途数据库中搜索的结果。未来的研究将集中于在不影响灵敏度的情况下提高精度的潜在方法,例如通过在期刊子集中搜索。
由于我们的数据是在2000年收集的,因此我们的研究结果对其他出版年份的普遍性可能是我们研究的一个局限性。然而,我们相信我们的搜索策略是稳健的,因为自2000年以来,针对特定年龄的MeSH术语没有发生过重大变化。此外,我们之前已经证明,1990年开发的搜索策略在2000年搜索时是稳健的[
年龄特定过滤器的效用将根据临床医生和研究人员的需要而有所不同,他们必须权衡使用敏感或特定搜索的后果。尽管一个敏感的搜索不会漏掉很多相关的文章,但这样的搜索不那么精确,并且需要在不相关的文章中进行耗时的排序。特定搜索的较窄收益将捕获许多相关文章并减少筛选,但它更有可能丢失关键文章。
为了说明特定年龄搜索策略的使用,如果一名老年医学专家正在寻找有关亨廷顿病当前治疗策略的信息,她可能通过在Medline中输入内容术语“亨廷顿病”开始搜索,这将产生5907篇文章(
例如:Medline(1996年至2005年7月第3周)老年医学(≥65岁患者)中检测治疗研究的最佳敏感性(保持特异性≥50%)搜索策略
|
|||||
|
|
|
|
|
|
亨廷顿病 | - | - | - | - | 5907 |
亨廷顿病 | 和 | 临床trial.mp。或临床试验。或随机:.mp。或tu.xs。 | - | - | 901 |
亨廷顿病 | 和 | 临床trial.mp。或临床试验。或随机:.mp。或tu.xs。 | 和 | exp成人__ | 483 |
*使用Ovid的Medline搜索引擎语法报告搜索策略。Mp =标题、摘要或主题标题中出现多个张贴术语;: =截断;Pt =出版类型;Tu =治疗用途,作为副标题;Xs =爆炸小标题;Exp = explosion -自动包含密切相关索引项的搜索项。
__表现优于两届和三届组合。
然而,筛选如此大量的文章将是耗时的,其中许多文章将与老年医学的治疗研究无关。通过将内容术语“亨廷顿病”与最敏感的治疗研究术语组合(临床试验.mp。或临床试验。或随机:.mp。或tu.xs.),搜索范围可以缩小到901篇文章。此外,通过使用布尔运算符AND将最敏感的老年医学(exp adult)策略添加到这个搜索字符串中,搜索被细化到483篇文章,这比仅通过搜索内容项检索到的原始5907篇文章更易于管理。对于有兴趣进行系统评论的研究人员来说,这样一个敏感的搜索将是一个有效的开始。
一个更具体的方法可能是特别有用的医生谁没有时间处理详尽的搜索。在上述例子中,通过将内容词“亨廷顿病”与最具体的治疗研究搜索策略相结合[
例如:Medline(1996年至2005年7月第3周)老年医学(患者年龄≥65岁)中检测治疗研究的最佳特异性(保持敏感性≥50%)搜索策略
|
|||||
|
|
|
|
|
|
亨廷顿病 | - | - | - | - | 5907 |
亨廷顿病 | 和 | 随机对照试验。或随机对照试验。 | - | - | 46 |
亨廷顿病 | 和 | 随机对照试验。或随机对照试验。 | 和 | 年龄80岁及以上。或者年龄。 | 5 |
*使用Ovid的Medline搜索引擎语法报告搜索策略。Mp =标题、摘要或主题标题中出现多个张贴术语;Pt =出版类型;Sh =主题标题;Tw = textword(单词或短语出现在标题或摘要中)。
针对特定年龄的搜索策略可以增强临床医生和研究人员对研究的检索,他们需要与定义明确的年龄类别患者人群相关的信息。敏感性和特异性之间的最佳权衡应该根据搜索者的需要来确定。
没有宣布。
年龄术语用于开发针对特定年龄的搜索策略
本研究由美国国家医学图书馆资助(批准号:no。5 r01 lm06866-02)。赫奇斯团队包括安吉拉·伊迪、布莱恩·海恩斯、苏珊·马克斯、安·麦基本、道格·摩根、辛迪·沃克-迪尔克斯、斯蒂芬·沃尔特、南希·威尔琴斯基和莎伦·王。
医学学科标题