发表在5卷第四名(2003)

在互联网上搜索癌症信息:分析自然语言搜索查询

在互联网上搜索癌症信息:分析自然语言搜索查询

在互联网上搜索癌症信息:分析自然语言搜索查询

原始论文

国家癌症研究所,通信办公室,癌症信息产品和服务,通信技术分部,贝塞斯达MD,美国

通讯作者:

Judith L Bader医学博士

通讯科技科

国家癌症研究所

行政大道6116号,3048A室

贝塞斯达MD 20852

美国

电话:+1 301 594 3382

传真:+1 301 435 6069

电子邮件:jbader@mail.nih.gov


背景:搜索健康信息是互联网用户最常执行的任务之一。许多用户开始在流行的搜索引擎上搜索,而不是著名的健康信息网站。我们知道,许多访问我们(国家癌症研究所)网站Cancer .gov的人是通过搜索引擎结果中的链接到达的。

摘要目的:为了更多地了解普通用户的具体需求,我们想了解外行用户对癌症真正想知道的是什么,他们如何表达他们的问题,以及他们使用了多少细节。

方法:美国国家癌症研究所与AskJeeves公司合作开发了一种方法,可以在Ask.com网站上捕获、采样和分析3个月来与癌症相关的查询,Ask.com是美国著名的消费者搜索引擎,每周收到超过3500万个查询。使用由国家癌症研究所提供的500个术语和词根的基准集,AskJeeves在2001年8月确定了一个为期一周的癌症查询测试样本。在这500个词汇中,在17208个查询中,只有37个在试用测试周内出现次数≥5次/天。使用这37个术语,在Ask.com 2001年6月至8月的实际测试期间的查询日志中发现了204165个癌症查询实例。其中,7500个用户问题被随机选择进行详细分析,并被分配到适当的类别。给出了示例查询的确切语言。

结果:考虑到多个相同的问题,7500个用户查询的样本代表76077个查询(占3个月总池的37%)。总体而言,78.37%的癌症样本询问了14种特定的癌症类型。在每种癌症类型中,查询被分类为适当的子类别,至少包括以下内容:一般信息、症状、诊断和测试、治疗、统计数据、定义和原因/风险/联系。查询中最常见的特定癌症类型是消化/胃肠/肠道(15.0%),乳房(11.7%),皮肤(11.3%)和泌尿生殖系统(10.5%)。关于特定癌症类型的查询的其他子类别各不相同,这取决于用户的输入。不特定于癌症类型的查询也被跟踪和分类。

结论:自然语言搜索为用户提供了充分表达其信息需求的机会,可以帮助用户naïve对内容和词汇进行搜索。本研究分析的具体查询反映了研究期间报道的新闻和研究研究,并且肯定会随着不同的研究日期而变化。分析来自搜索引擎的查询是了解向给定Web站点的用户提供何种内容的一种方法。用户用完整的句子和关键词提问,经常会拼错单词。提供自然语言搜索的选项并不排除为了优化用户体验而需要好的信息架构、可用性工程和用户测试。

中国医学杂志,2003;5(4):e31

doi: 10.2196 / jmir.5.4.e31

关键字



对于使用互联网的公众人士来说,许多人会寻求医疗资料[1-6].根据最近对24份描述发达国家不同癌症患者人群中互联网用户比例的同行评审出版物的系统回顾,约39%的癌症患者直接使用互联网,此外,15%至20%的癌症患者通过家人和朋友“间接”使用互联网[7].研究一般评估癌症患者在互联网上的信息寻求行为[8-10],他们的同伴[11,12],以及患有以下常见癌症诊断的患者:乳癌[13-16],前列腺[17,18], lung [19],以及胃肠道癌症[20.].研究亦评估了接受放射治疗的癌症患者所收集的资料[21]和化疗[22],以及来自北美以外的中心[23,24].某些弱势群体的个人在网上寻求医疗信息的频率较低,难度较大[7,25,26].

Eysenbach和Kohler发现,普通消费者使用搜索引擎搜索医疗内容,而不是使用医疗门户网站或医学学会或图书馆的网站[27].新诊断出的癌症患者及其家属在开始搜索时往往对网络和医学术语不太熟悉。他们通常开始在流行的搜索引擎上搜索,而不是在著名的癌症信息网站上。我们知道,许多访问我们网站的人[28通过搜索引擎结果链接到达。

为了更好地了解用户的需求,本研究旨在确定外行用户在网上搜索癌症信息时真正想知道的是什么。为此,我们评估了来自Ask.com的数据。29,一个流行的自然语言处理(NLP)搜索引擎。自然语言处理搜索引擎允许用户使用任何长度的短语和句子来创建查询,而不仅仅是关键字。

该项目的早期报告仅以摘要形式发表。摘要报告了一个简短的项目摘要[30.],以及乳腺癌的特定数据[31]和胃肠道癌[20.].这是整个项目的第一份综合报告。


美国国家癌症研究所(NCI)与AskJeeves, Inc合作开发了一种方法来捕获、采样和分析Ask.com网站上3个月的癌症相关查询,Ask.com是美国著名的自然语言处理消费者搜索引擎。在这个项目的时候,Ask.com每月收到超过3500万的查询。

搜索条件

一位NCI肿瘤学家(JLB)开发了一套包含500个术语和词根的基准测试,与实际的AskJeeves用户查询相匹配。大多数术语和词根来自NCI网站上的NCI词典[32].NCI还建议了字典中没有包含的其他术语。这些术语涉及解剖学、器官系统、治疗、药物、治疗和诊断程序、遗传学、流行病学和病理学。

表1。在测试周,每周查询次数≥5次的前37个搜索词和根
术语 测试周期间的实际查询 查询总数的百分比
*癌症* 9765 56.75
*肿瘤* 1396 8.11
* carcino * 656 3.81
*白血病* 635 3.69
lymphom * 419 2.43
化疗 378 2.20
活检/活组织检查 375 2.18
* melano * 348 2.02
*肉瘤* 294 1.71
*发育不良* 255 1.48
何杰金氏病* 245 1.42
核磁共振成像 214 1.24
临床试验 187 1.09
mammogr 175 1.02
maligna * 170 0.99
* metasta * 155 0.90

“*”是一个占位符,用于搜索词根之前或之后的部分。

2001年8月,这500个单词和词根的测试样本被用来过滤来自Ask.com网站的癌症查询。在这500个词汇中,只有37个在试验周内每天出现≥5次。37个词汇(加上常见拼写错误)的列表在测试周产生了17208个查询。每个术语的频率显示在表1.收集并分析常见拼写错误的查询(例如,前列腺和前列腺,活检和活检,白血病和白血病,化疗和化疗)。人们认为,每天5次(每周≥35次)的截断值将捕获关键查询并包括任何常见查询主题,因为即使每周查询频率为35次,这些术语中的大多数也只占总人口的不到1%。在NCI提供的原始500个术语中,只有7%(35/500)在日志中出现频率很高,但在研究期间,这7%占Ask.com上被识别为癌症相关的用户查询的37%以上。

收集查询和抽样

中概述了用于收集和抽样查询的过程图1.使用这37个术语搜索Ask.com的查询日志,在2001年6月、7月和8月发现了204165个与癌症相关的查询实例。在这些问题中,AskJeeves随机选择了7500个用户问题进行详细分析附录1).

图1。处理Ask.com上的癌症查询
查看此图

通常会有很多相同的问题。因此,这7500个查询实际上代表了在Ask.com上输入的76077个查询,大约37%(76077/204164)的查询在3个月的日志分析期间被确定为与癌症相关。例如,用户的问题可能是“我在哪里可以找到关于乳腺癌的信息?”这个单独的例子代表1个用户问题,但在任何一天都可能有超过100人查询。每个查询只计算一次。

抽样问题

7500个独立查询的随机样本在95%的置信水平下提供了1.11%的置信区间。这意味着即使从204165个查询中提取了更多的样本,这些样本中的95%的偏差不应超过1.1%。虽然这意味着样本本身在95%的样本中变化不会超过1.1%,但随着数据的分类和分类,实际上采样的样本越来越小。因此,为了消除这个问题,我们检查了额外的查询,尽管较小的样本仍然可以提供对结果的高度信任。

换句话说,虽然可以很容易地概括出诸如“乳腺癌占所有癌症查询的25%”这样的问题,但需要大量的样本量来分解数据,以得出这样的结论:当用户询问乳腺癌时,他们最常询问的是特定类型的治疗方法。

查询的最高级别类别

用户查询被分配到一组6个最高级别的类别(如表2):

  • 癌症(即特别提及一种癌症类型)
  • 一般的研究
  • 治疗
  • 诊断与测试
  • 原因/风险/链接
  • 应对
表2。查询的最高级别类别
最高级别的类别 查询个数 所有抽样查询的百分比
癌症__ 59619 78.37
一般的研究 7808 10.26
治疗 3832 5.04
诊断与测试 3315 4.36
原因/风险/链接 1249 1.64
应对 254 0.33
总计 76077

由于四舍五入,百分比总和不等于100%。

__即,特别提到一种癌症类型。

在研究开始之前,AskJeeves数据分析团队和NCI工作人员合作创建了最高级别的类别,但随着对实际查询的分析,最终的类别标题进行了修改。最初的分类是基于用户在Ask.com和各种在线资源上的查询,比如NCI的在线词典[32]和NCI的医生数据查询(PDQ) [33].

最高级别的类别是使用专利AskJeeves过滤器和自动分析工具填充的,这些工具根据特定类型的癌症对查询进行排序,或者在没有提及特定癌症类型的情况下,查询是否询问了其他领域,如治疗或应对。(AskJeeves没有与作者共享过滤器和自动化分析工具。)无法通过过滤器和自动分析工具进行排序的查询被放置在暂时未分类的类别中;在下一步(阅读和分析)中对它们进行了分类。

阅读和分析每个单独的查询不仅验证了自动化流程,而且还有助于改进现有类别,并根据需要创建新的类别和子类别。例如,如果没有这种类型的分析,查询“我在哪里可以找到一个网站,上面有使用高蛋白食物来对抗乳腺癌的信息?”可能被留在乳腺癌>媒体和组织>网站下(其中“>”表示类别级别的变化)。这是不正确的,因为真正的用户意图是询问替代疗法。因此,在乳腺癌>治疗类别下,“Alternative”作为子主题添加到乳腺癌>治疗类别分析中。(治疗-没有指定特定的癌症部位-是乳腺癌和大多数癌症类型下的最高级别类别和子类别。)

样本中大约78%的分类查询引用了特定类型的巨蟹座,并被放在最高级别的巨蟹座类别中。这类查询的一个例子是“我在哪里可以找到关于乳腺癌的信息?”(此查询将被分类为癌症>乳腺癌>一般信息。)任何没有提到特定类型的癌症的问题,即使是关于癌症的问题,也会被放在其他5个最高级别类别中的1个。这类查询的一个例子是“我在哪里可以找到关于癌症放射治疗的信息?”该查询被分配到最高级别类别治疗中的辐射子类别(即,它被分类为治疗>辐射)。

与特定癌症类型无关的查询被放在其他5个最高级别类别中的1个:一般研究、治疗、诊断和测试、原因/风险/链接或应对。例如,查询“吸烟如何导致癌症?”将被放置在原因/风险/链接类别中,因为它不涉及任何特定类型的癌症。

“癌症”查询(与特定癌症类型有关)

表3,有14种癌症类型(N = 59619个查询)被选为癌症最高级别类别的子类别。对于查询最频繁的癌症类型,如消化/胃肠/肠道(D/G/B)、乳房和泌尿生殖系统,有足够的查询来构成标准的子类别,如一般信息、治疗、症状、诊断和测试以及原因/风险/链接。这些常见的癌症类型通常需要创建定制的子类别,如乳腺癌>媒体和组织>网站。对于不常见的癌症类型查询,如D/G/B中的胆汁(胆管),很少收到查询,只显示了一般信息中的查询。

表3。癌症
类型在顶级癌症类别 查询个数 癌症类别查询__ %报表中的查询
消化/胃肠道肠(D / G / B) 8959 15.0 11.8
乳房 6953 11.7 9.1
皮肤 6709 11.3 8.8
泌尿生殖器的 6250 10.5 8.2
血液和血液 5448 9.2 7.2
妇科 5344 9.0 7.0
4630 7.8 6.1
软组织/肌肉 3954 6.6 5.2
淋巴瘤 3333 5.6 4.4
头颈部 2522 4.2 3.3
大脑和神经系统 1852 3.1 2.4
各种各样的癌症 1633 2.7 2.1
1429 2.4 1.9
儿科 603 1.0 0.8

由于四舍五入,百分比总和不等于100%。

__分母(N = 59619)是关于癌症类别中特定类型的查询总数。

分母(N = 76077)是本报告中分析的查询总数。

隐私问题

尽管NCI帮助创建了搜索词和被分析数据放入的类别,但NCI没有访问:AskJeeves的原始查询日志,有关AskJeeves用户使用在AskJeeves网站上生成的搜索所做的任何信息(即,他们选择了什么链接),或Ask.com网站的任何用户的身份。NCI不需要机构审查委员会的许可。


顶级类别的频率

表2,按查询频率递减顺序排列的6个最高级别类别为:

  • 癌症(N = 59619, 78.37%)
  • 一般研究(N = 7808, 10.26%)
  • 治疗组(N = 3832, 5.04%)
  • 诊断与测试(N = 3315, 4.36%)
  • 原因/风险/联系(N = 1249, 1.64%)
  • 顶部(N = 254,0.33%)

数据表2表明绝大多数用户询问有关特定类型癌症的信息,但很少询问治疗方案或诊断和测试程序,而不具体说明他们所关心的特定癌症。同样,用户很少询问与特定类型癌症无关的一般癌症症状(见诊断和测试>症状,N = 473, 14.27%)。例如,“癌症有哪些症状?”

细分癌症查询

表3将最高级别的癌症查询(N= 59619)分解为更具体的癌症类型。按照巨蟹座类别中出现频率递减的顺序,14个子类别分别为:

  • 消化/胃肠/肠道(D/G/B) (N = 8959, 15.0%)
  • 乳房(N = 6953, 11.7%)
  • 皮肤(N = 6709, 11.3%)
  • 泌尿生殖科(N = 6250, 10.5%)
  • 血液学/血液(N = 5448, 9.2%)
  • 妇科(N = 5344, 9.0%)
  • 肺(N = 4630, 7.8%)
  • 软组织/肌肉(N = 3954,6.6%)
  • 淋巴瘤(N = 3333, 5.6%)
  • 头颈部(N = 2522, 4.2%)
  • 脑和神经系统(N = 1852, 3.1%)
  • 杂项(N = 1633, 2.7%)
  • 骨骼(N = 1429, 2.4%)
  • 儿科(N = 603, 1.0%)

任何通过名称特别提到癌症类型的查询都被分配到该子类别中。例如,关于乳腺癌的特定治疗、诊断和检测、原因和应对的问题可以在Cancer >乳腺癌类别中找到,在显示乳腺癌信息的10个子类别中的1个子类别中找到。所有关于白血病或骨髓瘤的问题将在血液学/血液中找到,霍奇金氏病的问题在淋巴瘤中找到,食管癌的问题在D/G/B中找到。

分配给14种不同癌症类型的子类别的数量略有不同,并由这些癌症类型的特定查询的性质和数量驱动。

查询明细分析

中显示了抽样查询示例的详细分类和逐字显示附录1.在最高级别类别癌症中有所有14种癌症类型的细分,以及在其他5个最高级别类别中不引用任何特定癌症类型的查询的细分。这19个在附录中按字母顺序排列。

关于这19个类别和子类别的主要意见如下,按它们在附录中出现的顺序列出。我们的评论更多地强调与要求的癌症内容相关的问题,而不是与自然语言处理相关的技术问题。

1.0骨癌

附录1,有1429条关于骨癌的查询。绝大多数骨癌患者询问的是一般信息(N = 110778%)。这个类别的一个例子是:“骨癌的信息在哪里?”用户提出的有关骨癌的问题与不同的解剖学网站以及某些组织学有关。有一些与青少年骨癌相关的问题被分配到这个类别,而不是儿科类别。“诊断与检测”(64例,4.48%)和“症状”(135例,9.45%)多于“治疗”(26例,1.82%)。

2.0脑癌和神经癌

在1852例脑神经肿瘤查询中,一般信息占绝大多数(N = 1323,71.44%)。该类别中涉及特定癌症类型的问题有427个(23.1%)。一些癌症类型询问了髓母细胞瘤,这是典型的但不总是儿科肿瘤。就像上面提到的骨癌一样,一些问题可以有意义地分配到不止一个顶级癌症部位类别。在这一类别中,关于症状的查询(N = 259, 13.98%)多于关于治疗的查询(N = 112, 6.05%)。

3.0乳腺癌

附录1从数据显示的角度来看,乳腺癌是一种比较简单的癌症类型。只有一种解剖学上的癌症类型,所有关于该癌症类型的个人查询都被分配到10个子类中的1个。

10个顶级乳腺癌子类别是:

  • 基本信息(N = 3423, 49.23%)
  • 症状(N = 889, 12.79%)
  • 治疗(N = 570, 8.20%)
  • 媒体/机构(N = 428, 6.16%)
  • 原因/风险/联系(N = 393, 5.65%)
  • 诊断与测试(N = 376, 5.41%)
  • 统计数据(N = 274, 3.94%)
  • 图片(N = 225, 3.24%)
  • 类型(N = 217, 3.12%)
  • 定义(N = 158, 2.27%)

详细分析了10个乳腺癌亚类中的9个附录1.第十篇“图片”不需要进一步分析。大多数查询要求一般信息。

关于乳腺癌(N = 6953)的咨询比其他任何癌症类型的咨询都要多。这可能不明显表3这似乎表明D/G/B癌更多(N = 8959)。然而,D/G/B总体上实际上由10种癌症类型组成。D/G/B中查询次数最多的癌症类型为结直肠癌(N = 4801),查询次数少于乳腺癌。

尽管其他癌症类型可能被分配了比乳腺癌更多的子类别,但乳腺癌查询的细节、医学特异性和技术词汇似乎比其他癌症网站更复杂,这可能反映了关于这一主题的基础研究和临床数据的复杂性,以及乳腺癌信息搜索者的相对复杂性。

4.0原因和风险

在这个最高级别类别中有1249个查询。在没有提及特定癌症名称的情况下,有N = 1115(89.27%)个关于原因和联系的查询,但只有N = 134(10.73%)个关于预防的查询。在“原因和链接”子类别中的1115个查询中,注意到以下主题:

  • 药物(N = 287, 25.74%)
  • 未知(N = 247,22.15%)(例如,“什么导致癌症?”(原文如此))
  • 辐射(N = 247, 22.15%)
  • 个人(N = 116, 10.40)(例如,“抗持久性除臭剂会导致癌症吗?”)
  • 化学/塑料(N = 74,6.64%)
  • 环境(N = 70, 6.28%)
  • 食物补充(N = 64,5.74%)
  • 基因突变/病毒(N = 10,0.90%)

吸烟不在这个列表中,可能是因为大多数关于吸烟的查询都包含在关于特定类型癌症的查询中,如肺癌或头颈癌。

5.0应对

关于应对的问题只有254条。查询参考了支持组(N= 127, 50%),疼痛(N= 98, 38.58%)和抑郁(N= 29, 11.42%)。尽管在这个最高级别类别中几乎没有问题,但NCI对这个问题特别感兴趣,因此要求单独创建和分析这个类别。

6.0诊断与测试

在这个最高级别的类别中,有3315个查询,其中没有提到特定的癌症名称。大多数是关于特定测试的查询(N = 2842, 85.73%)。其他(N = 473, 14.27%)是关于症状的查询。在测试查询中,CAT/CT扫描(计算机轴向断层扫描/计算机断层扫描)(N = 1509, 53.10%)和MRI (N = 587, 20.65%)是最常见的测试主题,其次是活检(N = 502, 17.66%)。

7.0消化/胃肠/肠道(D/G/B)

D/G/B中的数据查询的表示附录1是复杂的,因为,有7个顶级子类别,包括一般信息和10种癌症类型确定在一般信息子类别

附录1,有关D/G/B类网站的查询共8959项,分为7个小类别:

  • 基本信息(N = 5568, 62.15%)
  • 症状(N = 1506, 16.81%)
  • 诊断与检测(N = 1125, 12.56%)
  • 治疗组(N = 294, 3.28%)
  • 统计数据(N = 184, 2.05%)
  • 定义(N = 163, 1.82%)
  • 原因/风险/联系(N = 119, 1.33%)

大多数查询要求一般信息。一般信息查询的例子是“我在哪里可以了解食管癌?”?以及“我在哪里可以找到胃癌的信息”?

按癌症类型划分的所有D/G/B查询的细目如下表所示。下面列表中的绝对数字和百分比(所有D/G/B查询)与饼图不同附录1因为下面的列表包括一般信息中的器官类型查询,以及D/G/B中的其他6个子类别。

  • 结直肠(N = 4801, 53.59)
  • 肝脏(N = 1413, 15.77%)
  • 胃肠(胃)(N = 1094, 12.21%)
  • 胰腺(N = 965, 10.77%)
  • 肠道(N = 273,3.05%)
  • 食管(N = 260, 2.90%)
  • 其他(N = 153, 1.7%)

其他部位包括胆囊、胆管、肛门和腹部。

如在附录1对于D/G/B,关于症状的问题(N = 1506, 16.81%)远远多于关于治疗的问题(N = 294, 3.28%),这可能反映了以下事实:(1)Ask.com的用户刚刚开始他们的D/G/B信息搜索;(2)与其他一些癌症类型(如乳腺癌)相比,D/G/B公布的治疗数据的复杂性较低。

术语肠,胃肠,胃,和腹部可能已被用户互换使用。他们似乎没有意识到,查询乙状结肠、直肠、盲肠、阑尾、横结肠、小肠和胃癌会提供更有用的信息。

对于D/G/B,一些关于肝转移的查询与关于原发性肝癌的查询一起包含。

8.0总体研究

有7808个查询被分配到最高级别的一般性研究类别,这是一个与特定癌症类型无关的主题。在这个类别中,最常见的5个子类别是:

  • 研究(N = 2819, 36.10%)
  • 组织机构(N = 1656, 21.21%)
  • 临床试验(N = 1272, 16.29%)
  • 担忧(N = 1201, 15.38%)
  • 图片(N = 559, 7.16%)

在关于组织的查询中,关于美国癌症协会(ACS)的查询有1065个,关于国家癌症研究所(NCI)的查询有223个。

在1272个关于临床试验的查询中,最常见的3个问题/主题是:

  • 什么是…(N = 634, 49.84%)如:“什么是临床试验?”
  • 最新的…(N = 260, 20.44%)如:“最新癌症临床试验研究”
  • 类型…(N = 111, 8.73%)例如,“癌症试验类型”
泌尿生殖系统癌症

在包括一般资料在内的所有12个泌尿生殖分类子类别中泌尿生殖器官类型查询的频率(N = 6250)依次为:

  • 前列腺(N = 3141, 50.26%)
  • 睾丸(N = 1772, 28.35%)
  • 膀胱(N = 708, 11.33%)
  • 肾(N = 496, 7.94%)
  • 其他(N = 133, 2.12%)

尽管据估计,2001年美国有198100例前列腺癌确诊病例,而只有7200例睾丸癌[34],“睾丸癌”查询的相对频率相当高。一个可能的原因可能是,被诊断患有睾丸癌的男性通常比被诊断患有前列腺癌的男性年轻得多,而这些年轻人可能更频繁地在互联网上寻求信息。这也可能反映了一个事实,即睾丸癌幸存者兰斯·阿姆斯特朗赢得的2001年环法自行车赛是在7月举行的,与本项目的研究期间一致。

与大多数网站一样,最常见的前列腺癌问题是一般信息(N = 1715, 54.6%)。对于前列腺癌,关于治疗的问题(N = 460, 14.65%)多于症状(N = 364, 11.59%)。这可能反映了关于治疗方案和疾病典型无症状表现的主要医学争议。

泌尿生殖科作为一个整体,症状问题(N = 854, 13.66%)多于治疗问题(N = 604, 9.66%)。

注意到前列腺(prostrate)的预期拼写错误。

10.0妇科癌症

总共有5344个查询。按频次递减的分类如下:

  • 基本信息(N = 3409, 63.79%)
  • 症状(N = 939, 17.57%)
  • 诊断与测试(N = 452, 8.46%)
  • 治疗组(N = 247, 4.62%)
  • 定义(N = 158, 2.96%)
  • 原因/危险(N = 83,1.55%)
  • 统计学(N = 42, 0.79%)
  • 预防(N = 14, 0.26%)

按频率由高到低排列,所有8个妇科分类中查询的癌症类型包括:

  • 卵巢(N = 2031, 38.00%)
  • 宫颈(N = 1924, 36.00%)
  • 子宫(N = 606, 11.34%)
  • 子宫内膜(N = 225, 4.21%)
  • 外阴(N = 166, 3.11%)
  • 阴道(N = 219, 4.09%)
  • 其他或未指明(N = 173, 3.24%)

关于子宫颈癌的问题几乎和卵巢癌一样多,尽管美国在2001年新发卵巢癌的估计发病率约为侵袭性子宫颈癌的两倍[34].

有关于子宫内膜癌和子宫癌的问题。这些数据表明,Web站点信息需要使用这两个标签来提供。

11.0头颈

总共有2522个查询。查询最多的是一般信息(N = 1485, 58.88%)。一般资料中用于询问特定癌症类型的词汇是:

  • 喉咙
  • 口服
  • 舌头
  • 脖子

词汇表证实了提供健康信息的必要性,这些词汇不是技术性的,如喉、声门、咽部或鼻咽部。有59个问题涉及头颈癌的定义。与其他网站相比,公众对这种癌症类型的癌症解剖学细节可能不太熟悉。

有422条询问头颈癌的照片。尽管人们对头颈癌的病因和预防有很多了解,但只有47个问题(1.86%)涉及病因/风险/联系问题。“症状”问题有418个(16.57%),“治疗”问题仅有52个(2.06%)。

12.0血液学和血癌

在该类别5448个查询中,12个子类别中最常见的5个查询为:一般信息(N = 3781, 69.40%)、定义(N = 701, 12.96%)、症状(N = 539, 9.89%)、治疗(N = 175, 3.21%)和组织(N = 102, 187%)。在一般信息中,用户询问了白血病(N = 2895, 76.57%)、骨髓瘤(N = 592, 15.66%)、骨髓(N = 148, 3.91%)和血癌(N = 146, 3.86%)。白血病的各种拼写错误被注意到,非技术术语如血癌和骨髓癌是常见的。

13.0肺癌

在最高级别癌症类别中,肺癌(N = 4630)占器官类型特定查询的8%。考虑到2001年美国肺癌的相对发病率,这是一个不成比例的低百分比[32].有更多关于妇科和血液/血液癌症的问题,尽管美国的发病率要低得多。

在肺癌的查询中,查询的分类如下:

  • 基本信息(N = 3223, 69.61%)
  • 症状(N = 530, 11.45%)
  • 原因/风险/联系(N = 305,6.59%)
  • 治疗组(N = 219, 4.73%)
  • 定义(N = 150, 3.24%)
  • 统计学(N = 113, 2.44%)
  • 诊断与检测(N = 90, 1.94%)

在肺癌的原因/风险/联系类别中,只有N = 180项查询(59.02%)是一般地询问肺癌的原因,而N = 102项查询(33.44%)是专门地询问吸烟。有N = 23个(7.54%)询问大麻是否导致肺癌。

在一般信息中,只有N = 255(7.91%)的查询是按(组织学细胞)类型询问肺癌的,尽管这是治疗分诊的主要决定因素。

对于肺癌>治疗,有219个查询(4.73%)。大多数治疗问题是未指明(N = 118, 53.88%),例如,“肺癌的治疗方法是什么?”关于Cure的治疗题26个(11.87%)。关于药物治疗(化疗)(N = 21, 9.59%)、放疗(N = 19, 8.68%)和手术(N = 10, 4.57%)的具体问题较少。虽然人数较少,但关于替代治疗的问题(N = 13, 5.94%)多于手术(N = 10, 4.57%)。尽管大多数肺癌预后严重,但关于姑息治疗的治疗问题只有4个(1.83%)。显然,关于最常见的致命癌症肺癌的问题远没有关于乳腺癌或前列腺癌的问题复杂。

14.0淋巴瘤

在3333个关于淋巴瘤(包括霍奇金淋巴瘤和非霍奇金淋巴瘤)的问题中,一般信息(N = 2391,71.74%)是最常见的。与许多癌症类型不同,考虑到该亚类别中临床不同的预后和治疗方法,经常提到组织学类型是适当的。何杰金氏病有很多种不同的拼法。

15.0其他癌症

有1633个查询被分配到这个癌症子类别。其他巨蟹座是:

  • 内分泌(N = 901, 55.17%)
  • 肿瘤(N = 272, 16.66%)
  • 卡波病(N = 262,16.04%)
  • 眼(N = 179, 10.96%)
  • 生殖细胞(N = 19, 1.16%)

一些眼部问题,如眼部黑色素瘤和视网膜母细胞瘤,可以分别考虑用于其他亚类别,如皮肤和儿科。生殖细胞肿瘤也可以被归入泌尿生殖或妇科亚类。这些歧义说明,尽管使用了自然语言处理,但仍难以对精确的用户信息需求进行分类。

16.0儿童

只有603个儿科问题,大多数询问了特定的癌症类型(N= 403, 66.83%)。一般信息查询相对较少(N = 81, 13.43%),例如,“我在哪里可以找到关于儿童癌症的信息?”由于美国儿科癌症患者通常由主要地区医疗中心的儿科肿瘤学专家管理,那些寻求儿科癌症信息的人可能会被引导到专门的网站,而不是像Ask.com这样的普通网站。

在403例癌症类型查询中,最常见的是血液学/血液学(N = 137, 34%)、成神经细胞瘤(N = 133, 33%)和横纹肌肉瘤(N = 68, 16.87%)。只有4个问题涉及儿童脑癌和神经癌。由于这是一种如此常见的儿科肿瘤类型,一些儿科神经肿瘤问题可能被分配到脑肿瘤和神经肿瘤类别,尽管这些问题实际上是针对儿科问题的。

17.0皮肤癌

在这个癌症子类别的6709个查询中,3596个(53.60%)要求一般信息。与淋巴瘤一样,经常提到特定的皮肤癌类型(N = 2157, 32.15%),可能是因为临床预后和治疗方法显著不同。

只有169个查询(2.52%)询问了原因/风险/联系,60个查询(0.89%)询问了预防,尽管人们对这些主题和皮肤癌已经了解得很多。

在按组织学癌症类型查询的皮肤癌中(N = 2157, 32.15%),黑色素瘤是最常见的(N = 1707, 79.14%),尽管它远低于基底细胞皮肤癌(N = 322, 14.93%) [10].频繁提及黑素瘤可能反映了其更严重的预后和更复杂的临床分诊。

18.0软组织癌

在这个癌症子类别中有3954个查询。虽然大多数恰当地指的是各种类型的肉瘤,但也有少数错误的查询。一些查询似乎参考了可能是良性的情况(神经节,纤维瘤,发育不良和脂肪瘤),而其他的应该被放在不同的癌症亚类别中,如脑癌和神经癌(少突胶质细胞瘤和胶质瘤)。这些将在以后的分析中更正。

19.0治疗

在3832个关于治疗的最高级别类别查询中,大多数问题是关于特定的治疗类型(N = 3223)。84.11%),尽管没有提到具体的癌症。在治疗>治疗类型中,有许多关于化疗的一般性疑问(N = 2275, 70.59%)。有关于一般放射治疗的问题(N = 534, 16.57%),而关于伽玛刀、激光和质子等特殊放射治疗的问题很少。关于替代疗法的一般性问题(N = 239, 7.42%)比外科(N = 127, 3.94%)更多。许多替代疗法的问题也出现在特定器官类型的亚类别中,特别是乳房。

查询频率相对于美国癌症类型的发病率

表4比较2001年美国选定癌症的发病率与本报告中选定特定部位癌症查询的频率。据估计,2001年美国有1268000例新癌症病例[34].网站在表4被特别挑选是因为它们最容易直接比较。

特定器官类型查询的相对百分比仅超过罕见癌症的年发病率百分比。在著名的癌症门户网站或标准搜索引擎上很难找到有用的信息可能是一种解释,尽管还有其他解释。这种比较并不意味着是确定的,因为这种比较的有效性显然存在问题:

  • 癌症发病率可能是一个比发病率更好的基准
  • 美国的发病率数据不包括原位乳腺癌和宫颈癌,以及非常常见的基底细胞癌和鳞状细胞皮肤癌
  • 查询可能来自世界任何地方,而不仅仅是美国
  • 查询总数可能包括那些访问网站超过一次的人
  • 询问可能来自非新诊断患者的个人
表4。比较美国所选癌症的相对年发病率和查询频率
癌症的网站 2001年美国新诊断癌症的估计数字 占2001年美国新发癌症的%__ 本报告中癌症特定部位查询的数量 癌症类别查询__
消化(D / G / B) 235700 18.6 8959 15.0
前列腺癌 198000 15.6 3141 5.3
乳房 193700 15.3 6953 11.7
169000 13.3 4630 7.8
淋巴瘤 63600 5.0 3333 5.6
膀胱 54300 4.3 708 1.2
子宫、子宫内膜 38300 3.0 931 1.6
头颈部 30100 2.3 2522 4.2
卵巢 23400 1.9 2031 3.4
脑与神经学 17200 1.4 1852 3.1
子宫颈 12900 1.0 1924 3.2
软组织 700年8 0.69 3954 6.6
睾丸 7200 0.57 1772 3.0

数据来自2001年美国癌症发病率估计年度数字(N = 1268000) [10].

__第3栏和第5栏的百分比加起来不等于100%,因为该表只包括选定的癌症。

这张图表中只包括了部分巨蟹座。分母(N = 59619)是关于癌症类别中特定子站点的查询总数。

其他观察结果

查询分析显示,在线用户通常会寻找特定癌症的症状和治疗方面的信息,而不是关于癌症的一般信息。此外,对于大多数癌症,症状查询的频率是治疗查询的2到5倍。

在这项研究中,我们没有专门针对有关成人免疫缺陷综合征(艾滋病)的查询,尽管艾滋病通常与癌症有关。在杂项癌症类别中,有262个关于卡波西肉瘤的问题。


一般信息是几乎所有癌症的最大类别,这可能反映了Ask.com消费者搜索引擎的性质。它是一个面向消费者的全网络搜索引擎,用户倾向于在其中查找一般性信息,这些信息可以帮助他们了解如何或在哪里进一步进行查询。用户很可能刚刚开始在Ask.com上进行网络搜索,他们还不感兴趣,或者他们还不知道足够的信息来提出更复杂的问题。这种行为可能并不能反映那些直接访问已知癌症信息门户网站并预先确定需要详细信息的用户的行为。

我们试图捕获并分析所有与癌症相关的查询,包括拼写正确和不正确的查询。拼写错误相对频繁,但我们没有关于拼写错误数量的数据,因为我们没有提前将其作为一个端点,并且我们没有直接访问原始数据日志。附录1使用拼写错误的示例逐字查询。自动帮助输入错误单词的用户是搜索引擎优化查询结果的一个主要问题。其他研究人员注意到,癌症搜索词的正确拼写与搜索困难有关[35].

尽管Ask.com是一个自然语言处理搜索引擎,但用户可以输入关键字搜索和句子式查询。我们认识到,即使用户输入一个很长的查询,有时仍然很难确定用户需要什么具体的信息,特别是因为我们无法访问用户选择的链接。

Ask.com用户使用的词汇从简单到非常复杂不等。这表明,允许用户在癌症网站上使用不太专业的语言将极大地帮助他们找到他们想要的信息。

本研究所收集的查询无疑反映了2001年6月至8月期间在公共领域进行的新闻和研究。不同的时间段肯定会反映不同的分布情况。可能影响结果的事件包括癌症名人的诊断或死亡,关于乳腺癌骨髓移植的重大试验的发表,或美国食品和药物管理局(Food and Drug Administration)批准一种重要新药。

在网站上使用自然语言处理的搜索引擎,虽然对用户可能有价值,但并不排除对以用户为中心的良好网站设计和信息架构的需求[36].事实证明,如果信息架构和链接标题遵循适当的指导方针,通过搜索引擎进行搜索可以最小化,用户满意度最大化[37].然而,对于不那么复杂的用户,自然语言处理搜索引擎可以帮助找到用户想要的信息,并提高搜索的成功率。

2003年10月30日PubMed网站搜索[38]国家医学图书馆[39]从“自然语言处理”的查询中得到了458个搜索结果。大多数引用都来自于过去3年的出版物,这证明了自然语言处理作为一个重要的研究课题,跨越了各种各样的研究学科。该工具在医学中的潜在数据挖掘应用远远超出了本文所描述的用途。

Eysenbach和Kohler最近开发了一种新的方法,类似于本研究中使用的方法,用于估计与互联网上每天进行的搜索总数相关的与健康相关的网络搜索的实际数量和流行程度[40].他们收集了来自两个搜索引擎的查询,Metacrawler(搜索引擎中的搜索引擎)[41]及Ask.com [29)(与本报告使用的自然语言处理搜索引擎相同)。之所以选择这两个搜索引擎,是因为它们允许“窥探”实际用户的搜索查询主题。他们得出的结论是,4.5%的网络搜索可能与健康有关。这些查询是2001年2月至2002年4月间从Metacrawler和2001年2月至2001年4月间从Ask.com收集的。第一个日期范围与我们的研究日期重叠,第二个发生在我们研究的数据收集之前。

总之,自然语言处理工具(如本研究中使用的工具)能够过滤原始查询数据,并将其划分为有用的分析类别。这些数据的检索和分析可以用来更好地理解用户想要的实际内容,以及他们访问Web站点时的理解和复杂程度。在持续的基础上使用这些信息可以根据最新的用户需求来更新Web站点上的内容。例如,如果在健康信息门户网站上提供自然语言搜索引擎,它可以改善客户对所需信息的访问,特别是对那些对内容或语言不太熟悉的用户。未来计划对查询结果进行更多的分析。已经考虑在我们的Web门户的子网站上试用自然语言处理。

致谢

自然语言处理项目是由科学政策办公室的切丽·尼科尔斯和伯纳德·格拉斯曼发起并资助的。该项目得到了Janice Nall、William Trefzger和Su Hubbard的编程支持。在AskJeeves, Inc,几位工作人员提供了重要的技术和方案支持,包括向NCI提交最终报告,这篇论文就是基于这份报告。这些人是Jeff Hjelt, Rob Thomson和Kent Schmitt。

利益冲突

没有宣布。

数据补充附录:数据分类、计数和图表

点击这里查看完整的数据补充附录:ZIP文件,2.9米

概述

附录1包含7,500个用户问题样本中所有分类问题的计数和准确措辞。每个类别(如乳房或头颈部)将在第一页有最高级别的分解,随后的分解(如果可能)在该页和以下页面。

饼图四舍五入

在看饼状图的时候附录1有些类别显示为0%。这是由于微软Excel中的数字四舍五入。实际百分比以表格形式显示。

饼图中的附加信息

在附录中嵌入的图表可以双击显示额外的信息。

大多数类别被分成4列的表。在显示实际数据表之前,下面显示了一个摘录的示例。它显示了脑癌和神经癌>基本信息>癌症类型。各列包含以下信息:

  • 第一列以黄色单元格中的类别名称开始。在这个例子中,这就是巨蟹座类型。癌症类型下面是该类别中发现的癌症类型。对于其他类别,这些将是该类别的代表性术语,即,对于诸如治疗的类别,可能会有替代、化疗、手术和放射的列表。
  • 说明表的第二列包含该字段的用户查询的原始计数。如例所示,星形细胞瘤被查询了144次,占癌症类型子类别中所有查询的33.72%。
  • 第三列显示了该子类别的百分比。这些是特定于类别的,这意味着它们仅是该类别或子类别中这些术语的百分比。因此,良性癌症占所有癌症类型查询的2.81%,而不是所有脑癌和神经癌查询的2.81%。虽然在此分析中不打算包含良性查询,但捕获并分析了一小部分查询,因此出现在表中。
  • 第四列标题说明子类别相对于主类别的位置。在这种情况下,癌症类型是在癌症网站脑神经癌症的一般信息类别中创建的。还包括计数,以说明在脑癌和神经系统癌症的总数中(N = 1852个查询),一般信息查询占1323个查询,占所有脑癌和神经系统癌症查询的72%。在一般信息的子类别中,还有另一个癌症类型的子类别,占所有一般信息查询的32.28%,占427个查询。在这个关系映射下面的第四列中包括了左边术语的实际用户查询示例。拼写、标点和大写都没有更正。这些查询和所有查询都直接来自日志,目的是阐明用户所询问的查询类型。有时用户输入完整的,甚至是过长的查询,而其他时候,他们选择使用关键字。

严格地比较一种癌症类型和另一种癌症类型的类别可能是不可能的,因为每个分析都是由用户查询本身驱动的。如果所有询问乳腺癌的用户中有50%询问了治疗,但询问肺癌的用户中没有人询问治疗,那么肺癌下就不会有治疗子类。

说明表格内容的节选示例(见上文表格中的解释)

表A1。一般信息
脑和神经1852 -基本信息1323 72%癌症类型427 32.28%
我怎样才能得到关于胶质母细胞瘤的信息
星形细胞瘤脑瘤研究在线
查找有关成神经管细胞瘤的信息
良性脑瘤
骨癌
图A1。骨癌
查看此图
表A2。骨癌
骨癌总数为1429
一般信息 关于骨癌的信息在哪里?
青少年骨癌有哪些症状?
诊断与检测 骨髓活检是什么?
被诊断患有骨癌的人的预期寿命是多少?
骨癌的治疗方法在哪里?
骨癌疼痛如何应对?
橙剂会导致骨癌吗?
骨癌和美国癌症协会
哪位美国总统左下巴有癌症?
查找骨癌的好网站有哪些?
预防骨癌?

  1. 克莱因,王志强,王志强。在互联网上寻求消费者健康信息:最先进的状态。卫生教育决议2001年12月;16(6):671-692。[Medline] [CrossRef
  2. 泰勒·h·疑病症更新。2001年4月18日URL:http://www.harrisinteractive.com/harris_poll/index.asp?PID=229[进入2003年11月16日]
  3. 福克斯S,法洛斯D.互联网健康资源:健康搜索和电子邮件已经变得越来越普遍,但在搜索和整体互联网接入方面还有改进的空间。华盛顿特区:皮尤互联网和美国生活项目;2003年7月16日。URL:http://www.pewtrusts.com/pdf/pew_internet_health_resources_0703.pdf
  4. Lebo H.加州大学洛杉矶分校互联网报道。展望数字化未来:第三年。2003年2月http://www.ccp.ucla.edu/pdf/UCLA-Internet-Report-Year-Three.pdf[进入2003年11月16日]
  5. Baker L, Wagner TH, Singer S, Bundorf MK.使用互联网和电子邮件获取医疗保健信息:来自一项全国调查的结果。中国医学杂志2003年5月14日;289(18):2400-2406。[CrossRef] [Medline
  6. .在:克兰西RE,编辑;国家电信和信息化局。一个在线的国家:美国人如何扩大他们对互联网的使用。华盛顿特区:新星科学酒吧公司;2002年5月1日。URL:http://www.ntia.doc.gov/ntiahome/dn/index.html
  7. Eysenbach G.互联网对癌症结果的影响。中华癌症杂志,2003;29 (6):356-371 [免费全文] [Medline
  8. 陈旭,萧丽玲。媒体和互联网对肿瘤学的影响:加拿大癌症患者和肿瘤学家的调查。中华临床医学杂志2001年12月1日;19(23):4291-4297。[Medline
  9. Helft PR, Hlubocky F, Daugherty CK。美国肿瘤学家对癌症患者使用互联网的看法:美国临床肿瘤学会成员的邮件调查。中华临床医学杂志2003 3月1日;21(5):942-947。[Medline] [CrossRef
  10. 挪威癌症医院网站的评价和癌症患者使用互联网的探索性调查。J medical Internet Res 2001 12月26日;3(4):e30 [免费全文] [Medline] [CrossRef
  11. 莫尼耶,李丽娟,李志强。患者和护理人员对基于互联网的癌症服务感兴趣。中华癌症杂志2002;10(6):305-310。[Medline] [CrossRef
  12. 王志强,王志强,王志强,等。成人癌症患者及其同伴对互联网等信息资源的使用[摘要]。Proc Am Soc clinaloncol 2001;20:298a [免费全文
  13. Pereira JL, Koski S, Hanson J, Bruera ED, Mackey JR.乳腺癌女性的互联网使用:一项探索性研究。临床乳腺癌2000七月;1(2):148-153[Medline
  14. Satterlund MJ, Mccaul KD, Sandgren AK。乳腺癌患者长期收集的信息。J Med Internet Res 2003 Aug 27;5(3):e15 [免费全文] [Medline] [CrossRef
  15. Meric F, Bernstam EV, Mirza NQ, Hunt KK, Ames FC, Ross MI等。万维网上的乳腺癌:关于网站信息质量和受欢迎程度的横断面调查。BMJ 2002 3月9日;324(7337):577-581 [免费全文] [PMC] [Medline] [CrossRef
  16. 傅志刚,李志刚,李志刚,李志刚。乳腺癌患者使用互联网的情况。J medical Internet Res 2002 11月22日;4(2):e9 [免费全文] [Medline] [CrossRef
  17. 史密斯RP,迪瓦恩P,琼斯H,丹尼提斯A,惠廷顿R,梅茨JM。接受放射治疗的前列腺癌患者使用互联网的情况。泌尿外科杂志2003年8月;62(2):273-277。[Medline] [CrossRef
  18. 陈志强,陈志强,陈志强,等。前列腺癌患者利用互联网进行自我教育。泌尿外科2001年2月;57(2):230-233。[Medline] [CrossRef
  19. Peterson MW, Fretz PC。肺癌诊所患者使用互联网获取信息。Chest 2003 Feb;123(2):452-457 [免费全文] [Medline] [CrossRef
  20. Bader J, Nall J.胃肠道癌在互联网上:人们真正想知道的[摘要]http://www.asco.org/ac/1,1003,_12-002489-00_18-002003-00_19-00101280-00_28-00RESULTPAGE,00.asp。Proc Am Soc clinc Oncol 2003;22:284。
  21. 梅兹,迪瓦恩,邓尼提斯,琼斯,M,高德温,等。放射肿瘤患者使用互联网的多机构研究。中华放射医学杂志2003年7月15日;56(4):1201-1205。[Medline] [CrossRef
  22. Nair MG, Hickok JT, Roscoe JA, Morrow GR.患者用于了解化疗副作用的信息来源。中华癌症杂志2000;15(1):19-22。[Medline
  23. Mills ME, Davidson R.癌症患者的信息来源:使用和质量问题。Psychooncology 2002; 11(5): 371 - 378。[CrossRef] [Medline
  24. Carlsson M.癌症患者寻求医疗保健系统之外的信息来源。癌症2000年11月;8(6):453-457。[Medline
  25. 在种族/民族人口和低识字率群体中使用互联网获取癌症信息。癌症控制2003;10(5增刊):45-51 [免费全文] [Medline
  26. Lazarus W, Lipper L, Roberts K, Fireman R, Rose M.为低收入和服务不足的社区寻找高质量的在线内容:评估和生产所需的内容。URL:http://www.contentbank.org/research/Qualitycontent.pdf[进入2003年11月16日]
  27. Eysenbach G, Köhler C.消费者如何在万维网上搜索和评估健康信息?使用焦点小组、可用性测试和深度访谈进行定性研究。BMJ 2002 3月9日;324(7337):573-577 [免费全文] [PMC] [Medline] [CrossRef
  28. ;国家癌症研究所。主页。URL:http://cancer.gov/[进入2003年11月16日]
  29. ;AskJeeves Inc .)主页。URL:http://www.ask.com/[进入2003年11月16日]
  30. 王志强,王志强,王志强,等。基于自然语言处理的网络癌症查询评估[摘要]。2002.Proc Am Soc clinconcol 2002;21(2):196b [免费全文
  31. Bader J, Trefzger W, Glassman B, Nichols C.乳腺癌在互联网上:人们真正想知道的。乳腺癌研究与治疗2002年12月;76(Supp1):S86。
  32. ;国家癌症研究所。Cancer.gov字典。URL:http://cancer.gov/dictionary/[进入2003年10月31日]
  33. ;国家癌症研究所。PDQ: NCI的综合癌症数据库。URL:http://www.cancer.gov/cancerinfo/pdq[进入2003年10月31日]
  34. Greenlee RT, Hill-harmon MB, Murray T, Thun M.癌症统计,2001。中华癌症杂志2001;21 (1):15-36 [免费全文] [Medline
  35. Biermann JS, Golladay GJ, Greenfield ML, Baker LH。互联网上癌症信息的评估。癌症杂志1999年8月1日;86(3):381-390。[Medline] [CrossRef
  36. Koyani SJ, Bailey RW, Nall JR.基于研究的网页设计和可用性指南。贝塞斯达,医学博士:计算机心理学;2004年8月。URL:http://usability.gov/pdfs/guidelines_book.pdf
  37. Koyani SJ, Bailey RW。搜索vs.网络链接:研究总结。URL:http://www.usability.gov/searchlinkfinalal1.pdf[进入2003年10月31日]
  38. ;国家医学图书馆。PubMed。URL:http://www.ncbi.nlm.nih.gov/PubMed/[进入2003年10月31日]
  39. ;国家医学图书馆。主页。URL:http://www.nlm.nih.gov/[进入2003年10月31日]
  40. Eysenbach G, Kohler C.在万维网上与健康相关的搜索的流行程度是多少?互联网上搜索引擎查询的定性和定量分析。美国医学会年度分会2003:225-229。[Medline
  41. ;Infospace公司。Metacrawler。URL:http://www.metacrawler.com/[进入2003年11月16日]


艾滋病:成人免疫缺陷综合症
ACS:美国癌症协会
D / G / B:消化,胃肠和肠道
NCI:国家癌症研究所
我们:美国


G·艾森巴赫(G Eysenbach)编辑;提交03.11.03;R Kiley, Q Zeng, K McCaul同行评议;对作者13.11.03的评论;修订本收到19.11.03;接受22.11.03;发表11.12.03

版权

©Judith L Bader, Mary Frances Theofanos。最初发表于《医疗互联网研究杂志》(//www.mybigtv.com), 2003年12月11日。除非另有说明,发表在《医学互联网研究杂志》上的文章都是根据创作共用署名许可协议(http://www.creativecommons.org/licenses/by/2.0/)发布的,该协议允许在任何媒体上不受限制地使用、分发和复制,前提是正确引用原创作品,包括完整的书目细节和URL(参见上面的“请引用”),并包括本声明。

Baidu
map