向主要以互联网和基于网络的环境传播卫生信息的过渡改变了卫生信息的格局和评估此类活动的框架。需要一种多维评估方法。
本文讨论了Web评估的一个重要维度——使用数据。特别地,我们讨论了网站使用外部数据的收集和分析,以便更好地了解健康信息(以及相关的美国政府信息)市场空间,并估计国家医学图书馆(NLM)和国家卫生研究院(NIH)网站与其他健康信息提供商相比的市场份额或相对使用水平。
本文提出的主要方法是根据外部用户小组的网络使用情况,并由私人供应商(在本例中是comScore)组装而成的互联网受众测量。讨论的第二种方法是基于Web日志软件数据的Web使用。这两种方法的主要指标是独立访问者和每月下载的总页面。
NLM网站(主要是MedlinePlus和PubMed)占NIH网站总使用量的55%至80%,具体取决于所使用的指标。而NIH.gov的顶级域名使用率(包括NLM)在美国国内家庭健康信息市场中仅次于WebMD排名第二,在全球排名第一。根据全球网络使用率,NIH.gov一直排在美国政府顶级域名的前三四名。在特定站点的基础上,全球使用率最高的健康信息网站似乎是WebMD, MSN health, PubMed, Yahoo!健康、AOL健康和MedlinePlus。根据MedlinePlus网站日志数据和外部互联网受众测量数据,使用最多的三个以癌症为中心的网站似乎是
互联网受众测量已被证明对NLM有用,与仅依赖Web日志软件的使用数据相比,它具有显著的优势。互联网受众数据帮助NLM更好地了解NLM和NIH网站在卫生信息和美国政府信息市场部门交叉领域的相对使用情况,这是NLM和NIH的主要市场交叉部门。无论多么重要,Web使用情况只是完整的Web评估框架的一个维度,其他主要的研究方法,如在线用户调查、可用性测试和焦点小组,对于包括用户满意度和用户友好性等定性元素以及网站使用情况的定量指标的综合评估也很重要。
因特网和万维网的出现从根本上改变了各种卫生信息服务的竞争环境。在过去的十年中,国家医学图书馆(NLM),像许多其他图书馆一样,已经向互联网和基于网络的健康信息传播做出了重大转变。到目前为止,通过各种网站传播信息是NLM和美国国立卫生研究院(NIH)的大多数其他单位所使用的主要渠道,用于向消费者、卫生专业人员、图书馆员和研究人员提供健康信息。
向互联网的转变也要求对信息传播评价方法进行反思和转变。在互联网之前的日子里,NLM严重依赖于针对可识别用户的用户调查,这些用户是NLM已知的,因为需要注册。现在,在Web环境中,大多数NLM(和其他NIH)基于Web的信息服务不需要注册;事实上,NLM特别强调保护用户隐私,并且不收集关于其用户的任何可识别信息。唯一的例外是专门的服务,如电子邮件更新或存储搜索,用户可以根据自己的意愿提供联系信息来接收这些服务。
这种情况不仅极大地增加了从用户那里获得反馈的困难,而且也大大增加了了解和跟踪卫生信息提供者相对市场地位的困难。在很大程度上,所有卫生信息提供者都面临着类似的挑战。然而,联邦政府提供商,如NLM和其他NIH单位,由于禁止使用持久性cookie、行为跟踪和个人标识符——这些限制不适用于许多私营部门健康信息提供商。
为了应对评估基于Web的信息传播的挑战,NLM开发了一种多维的Web评估方法[
这种方法部分是为了更好地理解NLM在卫生信息领域的地位。本文的重点是NLM使用互联网受众测量服务作为估计NLM和NIH的卫生信息市场份额的主要方法。在很大程度上,互联网受众测量服务提供了获得市场范围内使用数据的唯一可行方法,因为来自其他信息提供商的Web日志数据通常是不可用的。公共部门和私营部门都是如此。
此外,Web日志数据定义因站点而异,并且依赖于特定于站点和软件的详细信息。这可能会限制日志数据用于比较的有效性(和实用性)。互联网受众测量服务提供了应用相同的方法和定义的可能性,对所有网站和子网站进行测量和比较。
在本文中,我们应用互联网受众测量方法来估计NLM和NIH在卫生信息(以及联邦政府)市场部门的地位。作为案例研究,我们还检查了MedlinePlus网站日志数据和使用最频繁的癌症特定健康信息网站的外部互联网受众测量数据。
NLM在向互联网和基于网络的信息传播过渡的早期就意识到,需要新的受众测量方法。NLM拥有多年的互联网观众评估服务经验,目前订阅两项商业服务:comscore [
这两种服务都使用了类似的整体方法,即根据用户小组的实际网络使用情况来估算整体网站使用情况。这两个事务处在征聘专家小组、专家小组的规模和范围、估计算法、预测方法以及地域和部门范围方面各不相同。然而,这两种方法的核心都使用了一组Web用户,这些用户自愿每周7天、每天24小时监控他们的Web使用情况。然后,使用美国人口普查数据和其他调查数据对原始Web使用数据进行调整,以产生对定义的市场部门的估计。每家公司使用的具体估计算法被认为是专有的,差异很大。
尼尔森/NetRatings在美国使用了约60000人的小组,并为美国家庭和办公室市场以及整个美国市场准备了估计的使用水平。尼尔森/NetRatings在其他一些国家设有分支机构,但尚未编制全球使用量的综合估计。comScore在美国使用了约120万人的小组,在其他国家则增加了约30万人。comScore提供美国家庭、办公室和学校市场的使用估计,以及美国总市场加上非美国的使用,这些共同提供了全球使用估计。
两种服务都使用类似的指标。NLM用于互联网受众测量的主要指标(无论是基于外部面板还是内部Web日志软件)如下:唯一访问者(不同用户的数量);总访问量(包括回头客在内的用户总数);总浏览次数(在指定期间内,新图书馆网站的浏览次数);下载的网页数(所有用户下载的网页总数)。
在这篇论文中,我们只使用了来自comScore的互联网受众测量数据,因为它是两家供应商中唯一一家提供全球网站使用估计的公司。这在NLM的情况下尤其重要,因为NLM的一半或更多的Web使用来自美国以外的国家。此外,全球使用数据是唯一可以与Web日志数据进行合理比较的数据。此外,在本文中,我们仅使用comScore数据,该数据基于来自参与小组成员计算机的流量测量。这些数据被称为基于机器的面板数据,与Web日志软件收集的数据更具可比性。由于多人使用同一台计算机,基于机器的面板数据可能会低估用户总数。本文中的所有数据都是基于机器的——要么来自comScore面板,要么来自NLM的Web日志软件——以帮助尽可能地确保可比性。
NLM已经努力交叉验证来自外部面板和内部Web日志数据的互联网受众测量数据。只有comScore数据可以用于这种类型的相互关联,因为Web日志数据测量的是全球使用情况。如前所述,comScore的方法衡量了小组成员的网络使用情况,然后根据人口因素和假设推断出美国和全球的估计。相比之下,Web日志软件测量访问者正在使用的IP地址的数量,而不是直接测量用户,并且包括来自世界各地的任何地区的IP地址。假设在一段时间内测量到的不同IP地址的数量与实际用户的数量大致相关。但是,具有动态IP地址的单个用户和具有相同IP地址的多个用户是IP数据可能具有误导性的两个例子。因此,这两种方法都有不同的误差来源,Web日志数据和外部互联网受众数据之间的精确关联是不可能实现的。
PubMed和MedlinePlus的comScore和Web日志数据比较,2003年9月
|
|
|
||
PubMed | ||||
Web日志
|
4.2 | 7.6
|
193 | |
comScore | 3.8 | 10.2 | 62 | |
医疗在线 | ||||
Web日志
|
2.7 | 5.6 | 23 | |
comScore | 3.4 | 5.2 | 20. |
*数据来自安装在PubMed服务器上的自定义Web日志软件。
__估计
‡数据来自MedlinePlus服务器上安装的WebTrends Web日志软件。
PubMed和MedlinePlus的comScore和Web日志数据的比较,2004年10月
|
|
|
||
PubMed | ||||
Web日志
|
10 | 21
|
235 | |
comScore | 5.7 | 12.8 | 117 | |
医疗在线 | ||||
Web日志
|
6.2 | 10.5 | 59 | |
comScore | 5.6 | 8.7 | 30. |
*数据来自安装在PubMed服务器上的自定义Web日志软件。
__估计
‡数据来自MedlinePlus服务器上安装的WebTrends Web日志软件。
MedlinePlus在第一个样本月(2003年9月)和第二个样本月(2004年10月)的所有指标(独立访问者、总访问量和总访问量)的使用数据都很好地进行了比较,但下载的总页面却不是这样。comScore的数据似乎低估了2004年10月下载的MedlinePlus页面的数量,这可能反映了comScore小组成员对所捕获数据的定义和使用模式的差异。例如,教程是MedlinePlus最受欢迎的功能之一,Web日志软件将每个教程等同于许多已下载的页面(教程的每个连续视图都被算作一个单独的页面)。目前还不清楚comScore的方法在多大程度上捕捉了教程使用情况和其他MedlinePlus的特殊功能,比如链接,其基础直接与Web日志软件相当。
对于PubMed来说,2003年9月的数据在独立访问者和总访问量方面比较不错,但在总下载页面方面比较不太好;2004年10月的数据显示,comScore在这三个指标上都低估了PubMed的使用率50%到75%。PubMed的差异可能部分是由于comScore小组中研究人员和科学家的代表性不足,以及使用Web日志数据和comScore数据被视为“页面浏览”的定义不同。研究人员和科学家是PubMed的核心用户群体,他们可能是非常密集的用户。这将转化为大量的访问量和页面下载;因此,如果他们在小组中代表不足,这将导致低于预期的使用数据。虽然comScore小组特别关注大学部门,但重点主要是学生,而不是可能是PubMed更密集用户的教师和研究科学家。总的来说,comScore和Web日志数据之间的明显相关性在2003年9月被认为是良好的,但在2004年10月由于PubMed的低估而被认为是混合的。后者可能会在最近几个月加剧,因为谷歌索引了PubMed,这似乎大大增加了网站访问者的数量。
NLM使用互联网受众测量数据的目标之一是更好地理解NLM在更广泛的NIH互联网和Web使用环境中的位置。了解这一点很重要,因为互联网受众测量服务通常通过顶级域名(如NIH.gov)收集数据。这使得跟踪子域使用变得困难,除非子域(或子域组)代表了顶级域使用的很大一部分。
因此,NLM要求两家供应商提供特殊的下钻数据,以便能够将NLM网站的使用与其他NIH网站的使用分开。
NLM网站使用率占NIH使用率的百分比,2004年10月,基于comScore数据
|
|
|
NCBI(含PubMed) | 45 | 64 + |
医疗在线 | 39 | 14 |
其他NLM网站 | 4 | 1 |
总数 | 55 - 75 |
80 + |
独立访问者并不是严格意义上的加法,因为用户可以在一个月内访问多个NIH网站。然而,使用数据表明,估计每个月访问所有NIH网站的总独立访问者的55%到70%是由NLM网站的使用所占的。每月下载的总页面是附加的,这些数据突出显示了NLM网站用户下载的页面的很大比例——大约80%(如果comScore的数据没有计算PubMed的下载页面,则更多)。
总的来说,这些结果表明,至少作为一个粗略的近似,NIH顶级域名的使用数据可以被用作NLM网站使用的合理替代品,因为NLM网站的使用占了NIH网站使用总量的很大一部分。
分析的下一步是查看美国家庭健康信息空间,以及领先的通用健康信息网站。(专门的网站如ediets.com被排除在外。)根据comScore的美国家庭数据,2004年9月每月独立访问量排名前五的网站如下:
WebMD: 250万
NIH.gov: 240万(包括NLM的顶级域名)
AOL Health(由WebMD提供支持):170万
雅虎健康:120万
MSN健康(当时由WebMD提供支持):950000
因此,在美国国内市场,WebMD和NIH.gov在使用上几乎是捆绑在一起的,尽管如果在AOL Health和MSN Health上使用WebMD作为他们的消费者健康信息门户,WebMD将是明显的领导者。
美国本土市场的第二级健康信息网站包括以下内容(以每月独立访问者为单位):
CDC.gov(美国卫生与公众服务部疾病控制中心):74万
MayoClinic.com: 427000
KidsHealth.org(内摩尔基金会):448000
Medscape.com(面向医生和其他卫生专业人员;现在是WebMD的一部分):263000
FamilyDoctor.org(美国家庭医生学会):243000
HHS.gov (DHHS主网站):384000
美国医学协会:174000
Intelihealth.com(与哈佛医学院合作):120000
从整体来看,WebMD和NIH.gov是美国家庭健康信息市场的领导者,根据每月的独立访问者。
在过去的几年中,NLM发现非美国人使用NLM网站的情况有所增加。这一趋势得到了互联网受众测量数据的证实。在全球范围内的增长已经足够显著,使NIH.gov网站的总体使用量在全球卫生信息领域保持第一的位置,WebMD.com紧随其后,位居第二。
NIH.gov与WebMD在全球卫生信息空间的使用情况对比,基于comScore数据
|
|
|
||
|
||||
NIH.gov | 6.6 | 9.8 | 12.3 | |
中央社报道 | 5.3 | 5.9 | 11.1 | |
|
||||
NIH.gov | 87.7 | 114.8 | 184.0 | |
中央社报道 | 64.6 | 81 | 107.8 |
全球领先的健康信息网站,2004年4月和2005年4月,基于comScore数据
|
|
|
NIH.gov(所有网站) | 11.3 | 17.2 |
NLM网站(NIH.gov的子集) | 7.6 | 12.1 |
WebMD(公司主要网站) | 7.5 | 15.5 |
美国在线健康
|
4.9 | 6.1 |
PubMed (NLM的子集) | 3.8 | 7.4 |
雅虎健康 | 5.0 | 6.5 |
MedlinePlus (NLM的子集) | 4.1 | 5.4 |
MSN健康
|
3.7 | 10.1 |
iVillage健康 | 2.1 | 1.5 |
KidsHealth.org | 1.5 | 2.9 |
Medscape.com | 1.7 | 1.8 |
MayoClinic.com | 1.1 | 2.0 |
FamilyDoctor.org | .465 | 1.4 |
AMA-assn.org | .928 | 1.3 |
Cancer.org | .690 | 1.1 |
Cancer.gov | .652 | .704 |
Intelihealth网站 | .545 | .597 |
Breastcancer.org | .168 | .327 |
*美国在线健康由WebMD提供支持。
__MSN健康在2004年由WebMD提供支持,而不是在2005年。
如
针对特定疾病的健康信息有两种主要类型的网站,一种是包括广泛疾病和状况信息的通用健康网站,另一种是专注于单一疾病或状况的专业网站。
MedlinePlus是一个通用健康信息门户网站的例子。在本文中,我们主要关注癌症信息。通过MedlinePlus可获得的癌症信息有三种主要类型:(1)包含癌症相关内容的个人可下载网页,(2)涉及癌症相关主题的交互式教程,以及(3)从MedlinePlus链接到其他网站的链接(称为“重定向”),这些网站反过来也有癌症相关内容。
MedlinePlus网站2004年10月的日志数据显示,下载最多的360个网页中有4%是与癌症相关的网页。涉及的主题包括以下类型的癌症:乳腺癌、前列腺癌、皮肤癌、宫颈癌、肺癌、卵巢癌、胃癌、淋巴瘤、结肠、骨癌、霍奇金淋巴瘤、结肠直肠癌和喉癌。2004年10月的数据显示,大约16%的教程使用与癌症有关,并以这样或那样的方式涵盖了以下主题:前列腺癌、化疗、结肠癌、乳房x光检查、脑癌、乳腺肿块活检、乳腺癌、卵巢癌、放射治疗、皮肤癌、早期筛查和癌症预防、肺癌和黑色素瘤。
2004年10月的网络日志数据还显示,大约4%的MedlinePlus链接(用户从MedlinePlus链接或点击到外部网站)显然是指向癌症相关网站的。三个网站占了这些链接的大部分:
另一种看待数据的方式是由国家卫生研究院的研究所和中心。在所有拥有网站的NIH单位中,网络日志数据显示,2004年10月,MedlinePlus链接到国家癌症研究所的比例第二高(约占所有链接的4%)。
2004年8月comScore全球数据显示,关于癌症特定网站,排名前三的是
NLM和NIH负责在健康信息空间和美国政府信息空间运行的网站。
根据comScore数据,全球排名前八的美国政府网站或顶级域名的相对排名
|
|
|
||||||
|
|
|
|
|
|
|
|
|
NIH.gov | 3. | 1 | 4 | 1 | 3 - | 2↓ | 4 - | 3↓ |
NOAA.gov | 2 | 2 | 2 | 3. | 1↑ | 1↑ | 1↑ | 1↑ |
USPS.com | 1 | 3. | 1 | 2 | 2↓ | 3 - | 2↓ | 2 - |
NASA.gov | 6 | 4 | 6 | 5 | 6 - | 4 - | 5↑ | 5 - |
LOC.gov | 8 | 5 | 8 | 7 | 8 - | 8↓ | 8 - | 8↓ |
ED.gov | 4 | 6 | 3. | 4 | 4 - | 5↑ | 3 - | 4 - |
CDC.gov | 7 | 7 | 7 | 8 | 7 - | 6↑ | 7 - | 7↑ |
国税局 | 5 | 8 | 5 | 6 | 5 - | 7↑ | 6↓ | 6 - |
注:箭头表示相对排名的变化方向(增加或减少)(-表示排名没有变化)。
根据comScore的数据,2005年4月,与其他美国政府顶级域名相比,全球使用情况有所不同
|
|
|
NIH.gov | 16.8 | 287.3 |
Army.mil | 4.2 | 162.6 |
Navy.mil | 3.0 | 43.1 |
中情局后 | 2.9 | 12.2 |
AF.mil(空军) | 2.0 | 47.2 |
whitehouse . gov | 2.3 | 24.8 |
House.gov | 1.5 | 7.5 |
Senate.gov | .978 | 6.2 |
基于外部Web用户面板的互联网受众测量服务的使用已被证明对NLM是无价的。这种方法是NLM了解NLM(和NIH)网站在卫生信息和政府信息部门中适用的唯一已知手段。
comScore的互联网受众数据表明,NLM网站总体上占据了NIH网站使用的大部分,反过来,NIH网站总体上是所有美国政府卫生机构中使用最多的网站。总的来说,在全球健康信息领域,根据2005年4月的数据,在单个网站的基础上,使用最多的六个网站似乎是WebMD, MSN health, PubMed, Yahoo!健康、AOL健康和MedlinePlus。考虑到外推使用数据的不确定性,可以说这些网站的总体使用情况大致相同。在企业基础上,NIH.gov(所有网站,但大部分由PubMed和MedlinePlus提供)似乎比WebMD有更多的使用。然而,如果将其战略合作伙伴AOL Health的流量包括在内,WebMD将拥有更大的使用量。
没有完美的方法来评估网站的使用情况。这种使用数据的解释和使用应考虑到数据收集和推断方法的固有局限性,无论是使用外部互联网受众面板还是Web日志软件。
许多网站和大多数主要网站(如NLM)都在Web服务器上安装了Web日志软件。Web日志软件捕获网站使用情况的数据,包括总访问次数和访问者、唯一访问者、下载的页面以及各种其他使用指标。Web日志数据提供了安装软件的网站使用情况的合理估计。Web日志数据受到一些错误因素的影响,因为数据是基于使用网站的IP地址,这些IP地址被用作实际人类用户的代理。对于具有动态IP地址的用户来说,会出现一些问题,因为单个用户(尤其是拨号用户)可能在每次登录时都分配了一个新的IP地址。这可能会人为地增加特定月份的独立用户数量。另一方面,大学或公司的用户可能被低估,因为这些机构经常使用代理服务器,Web日志记录为单个IP地址。因此,多个用户将被视为一个用户,因为每个用户的IP地址保持相同。代理服务器还可以缓存下载的页面,因此也会低估下载的页面数量。
基于外部面板的网络使用情况的互联网受众测量数据为估计使用情况提供了一种补充方法,甚至是自己网站的使用情况。当然,外部小组方法本身也受到一些错误因素的影响,例如小组招募方法的变化,小组成员的选择偏差,以及从小组使用情况外推到部门、国家甚至全球使用估计的不确定性。另一方面,Web机器人、代理程序和爬虫程序可能会影响并扭曲Web日志数据,但不会影响面板数据。NLM发现,与MedlinePlus同期的Web日志使用数据相比,全球Web使用估计的相关性相当好(通常为+/- 10%至15%)。然而,现在看来comScore的数据将PubMed的使用率少算了50%到75%甚至更多。这种差异是由于谷歌指数、一些主要PubMed用户群体(如生物医学科学家)在comScore上的代表性不足,还是由于其他一些尚未确定的因素,这在未来几个月仍有待观察。由于很难分析出特定地理区域或用户部门的基于ip的使用数据,因此只能比较全球使用估计数。
除了增加Web日志数据外,基于外部面板的互联网受众测量数据还有一个明显的优势,即能够为其他网站提供使用估计。此外,数据可以聚合成细分市场,并为估计特定感兴趣的网站的市场份额提供基础。理论上,这样的市场份额估计可以从Web日志数据中构建出来。但实际上,Web日志数据被许多组织认为是专有的,网站自身组织以外的任何人都很难访问这些数据。
根据NLM自己使用外部互联网受众测量数据的经验,这些数据似乎可以用来描绘相关市场部门的合理准确的图景——在NLM的案例中,是健康信息部门和美国政府信息部门。NLM的网站位于这两个市场领域或空间的交汇处。
NLM还发现,互联网受众测量数据对于更好地理解顶级域名(在本例中为NIH.gov)内的使用分布很有用。NIH是一个非常大的组织,有超过125个网站,由几十个独立的组织单位管理。事实证明,在这么多网站上收集Web日志数据是很困难的。因此,互联网受众测量数据是一种更可行的方法,至少可以估计NIH.gov顶级域名内网站的相对使用情况。在早些年,NLM从供应商请求所谓的子域钻取数据作为自定义服务。然而,今天,子域数据是可用的,至少对于有足够流量的网站,作为常规在线数据报告的一部分。
NLM了解和跟踪网络使用情况的努力比较容易,因为NLM的两个网站,MedlinePlus和PubMed,似乎是使用最多的两个美国政府健康相关网站。根据使用的度量标准,它们加在一起占了NIH所有网络使用量的一半到五分之四。
然而,MedlinePlus和PubMed在公共部门的使用数据占主导地位,WebMD在私营部门的使用数据占主导地位,不应掩盖许多使用水平较低的健康相关网站的重要性。在NLM和NIH,有许多所谓的利基市场网站,专注于与特定疾病、病症或研究或应用领域相关的健康信息。这些网站的使用情况也可以通过互联网受众测量数据来跟踪,至少对于每月拥有5万至10万独立访问者的网站来说是这样。在这个水平以下,面板使用数据通常过于有限,无法分配统计显著性。
癌症信息案例研究说明了Web日志数据和互联网受众数据如何提高对特定疾病健康信息网站使用情况的理解。
总之,总体而言,基于外部面板的网络使用情况的互联网受众测量数据已被证明对NLM非常有用。这些数据使NLM能够更好地了解整个健康信息市场空间以及NLM网站在该市场中的定位。互联网受众数据还适用于各种类型的人口统计和地理分析,NLM打算将其与其他类型的使用数据(如Web日志数据)以及用户调查结果进行比较。
外部测量方法是NLM Web评估方法库中的一个重要工具。然而,必须记住的是,Web使用统计数据,如独立访问者和每月下载页面,虽然很重要,但并不能解决所引用网站的感知质量、有用性或用户友好性。对于网站性能的这些关键维度,还需要其他的Web评估方法。其中特别包括对网络用户的调查。NLM广泛利用NLM网站用户的在线调查,而这些用户都在网站上。作为补充,外部小组的成员,包括互联网观众测量小组,也可以被调查。我们在开始的地方结束,强调对Web评估的多维方法的需要,其中互联网受众测量是几个重要的方法之一。
这篇论文部分基于第一作者在2004年4月2-3日于佛罗里达州清水市举行的在线癌症服务跨学科探索会议上的演讲,该会议由密歇根州立大学和国家癌症研究所联合主办。作者感谢NLM主任唐纳德·AB·林德伯格博士对NLM使用互联网受众测量服务和其他网络评估方法的支持。作者感谢comScore的Lara Fisher女士和Carolina Petrini女士提供的互联网受众测量数据,这些数据是大部分分析的基础。作者还感谢NLM的Paula Kitendaugh女士和Simon Vann先生协助分析MedlinePlus的网络日志数据。
没有宣布。
互联网协议
国家生物技术信息中心
美国国立卫生研究院
国家医学图书馆