发表在17卷第三名(2015): 3月

互联网健康信息检索行为的出版趋势映射与研究热点:定量和共词聚类分析

互联网健康信息检索行为的出版趋势映射与研究热点:定量和共词聚类分析

互联网健康信息检索行为的出版趋势映射与研究热点:定量和共词聚类分析

本文作者:

李风扇1 作者Orcid图片 李敏2 作者Orcid图片 彭关3. 作者Orcid图片 双马4 作者Orcid图片 Lei崔1 作者Orcid图片

原始论文

1中国医科大学医学信息系,沈阳,中国

2中国齐齐哈尔和平医院

3.中国医科大学公共卫生学院流行病学教研室,沈阳

4中国医科大学附属盛京医院神经内科,中国沈阳

通讯作者:

崔蕾女士

医学信息学系

中国医科大学

沈阳市北新区浦和路77号

沈阳110122

中国

电话:86 24 31939518

传真:86 24 31939517

电子邮件:cmuinfo@163.com


背景:互联网已经成为人们寻求健康信息的一个既定的健康信息来源。近年来,对互联网用户健康信息搜索行为的研究日益成为一个重要的学术热点。然而,迄今为止还没有关于网络健康信息搜索行为的长期文献计量学研究。

摘要目的:本研究旨在绘制网络健康信息检索行为的发表趋势,探索网络健康信息检索行为的研究热点。

方法:基于PubMed进行文献计量学分析,探讨网络健康信息检索行为研究的发表趋势。对于纳入的出版物,确定了年度出版物数量、国家分布、作者、语言、期刊和高频次的主要MeSH(医学主题词)术语的年度分布。此外,利用高频次MeSH主要术语的共词聚类分析,发现了该领域的研究热点。

结果:共收录533种出版物。研究成果逐步增加。有5位作者分别发表了4篇或以上的文章。共纳入271篇文章(50.8%)由美国作者撰写,533篇文章中有516篇(96.8%)是英文发表。最活跃的8种期刊发表了34.1%(182/533)的论文。发现了十个研究热点:(1)艾滋病毒感染或性传播疾病互联网健康信息查询行为,(2)学生互联网健康信息查询行为,(3)手机及其应用程序互联网健康信息查询行为,(4)医生对互联网医疗资源的利用,(5)家长对社交媒体的利用,(6)癌症患者(主要是乳腺癌患者)互联网健康信息查询行为,(7)消费者对网络健康信息的信任或满意程度;(8)互联网使用与医患沟通或关系之间的相互作用;(9)人们使用搜索引擎或其他网络系统的偏好和计算机素养;(10)人们(特别是青少年)通过互联网寻求健康信息时的态度。

结论:这10大研究热点可以为研究人员在启动新项目时提供一些提示。网络健康信息检索行为研究的产出逐渐增加。与美国相比,PubMed收录的其他发达国家和发展中国家的出版物数量相对较少,这在一定程度上表明该领域在许多国家可能仍然不发达。进一步研究网络健康信息搜索行为,可为健康信息提供者提供参考。

中国医学网络杂志2015;17(3):e81

doi: 10.2196 / jmir.3326

关键字



近几十年来,互联网技术发展迅速,已成为世界各地许多人日常生活的重要组成部分。与此同时,人们对媒体作为健康相关信息的传播工具的兴趣正在迅速增长[1-4].

互联网具有资源丰富、访问方便、成本低廉、互动性强、不断发展等特点,在满足人们健康信息需求、提高人们健康素养方面具有巨大潜力。可以说,传播媒介的泛滥改变了人们利用信息保护健康的方式。5].为开展全球健康促进运动,满足每个人日益迫切的健康信息需求,越来越多的政府、学术组织、医疗教育部门、商业公司等机构建立了健康信息门户,网络健康信息越来越丰富。因此,人们越来越多地通过互联网来获取健康信息,互联网是世界上增长最快的健康信息载体和最大的医学图书馆。早在2004年,就确定全球约4.5%的互联网搜索与健康有关[6].然而,随着互联网的发展,数据比以前多得多。皮尤互联网与美国生活项目(Pew Internet & American Life Project) 2013年的最新全国调查显示,在美国,临床医生仍然是健康信息的主要来源,但由同行策划的基于网络的信息是一个重要的补充。在美国成年人中,81%的人使用互联网,59%的人说他们在过去的一年里在网上查找过健康信息,35%的人说他们专门上网试图弄清楚自己或他人可能患有什么疾病。7].统计结果表明,越来越多的互联网用户不满足于医疗专业人员提供的健康信息,在互联网上搜索健康信息,同时也享受互联网的高效和便利。

在学术界,健康信息寻求行为被学者定义为“公众或消费者在获取健康信息时所表现出的行为”[8].近年来,随着人们越来越多地使用互联网搜索健康信息,研究人员对互联网健康信息搜索行为进行了理论和实证研究。这些研究成果对于(1)建设各类健康或医疗信息网站,(2)优化基于网络的健康信息搜索语言,(3)开发工具,提高用户阅读专业健康内容的能力,(4)制定针对特定人群的健康信息传播策略,(5)提高基于网络的健康信息服务效率和质量[9].

尽管世界范围内已有学者发表了关于网络健康信息搜索行为的论文,但对该领域研究进展的综述却寥寥无几。例如,在Younger的一篇简短的文献综述中,收集了1995年至2009年间的一些现有证据,以确定医生和护士在寻找基于网络的信息的方式和原因上是否存在任何显著差异,并确定护士和医生如何在网上查找信息[10].欧洲疾病预防和控制中心的一项文献综述集中于2006年至2010年发表的关于成年人在互联网上寻求健康信息行为的英文研究文章。它主要记录了互联网的可访问性和使用模式,概述了互联网卫生信息消费者概况,确定了卫生信息的互联网来源,概述了卫生专业人员的互联网使用情况,并确定了互联网使用对卫生专业人员构成的挑战[11].

上述综述虽然在一定程度上反映了网络健康信息检索行为的研究现状,但不同学者的研究内容和观点存在较大差异,缺乏跨时间跨度的文献计量学研究。文献计量学方法是一种定量分析方法,近年来被广泛应用于科学研究进展的判断。衡量科学出版物在特定主题或研究领域内贡献的统计指标,可以代表研究趋势和热点[12].研究热点是指研究人员开展了大量研究并发表了大量相关论文的研究焦点。通过计算一个领域中反映文章内容的词语出现的频率和关系,通常可以识别出该领域的热点[1314].共词分析是一种在学术文献中识别热点和发现知识的文献计量方法,早在20世纪70年代末就由法国文献计量学家提出[15].其原理是:如果表达某一研究主题的两个专业术语同时出现在同一篇文章中,这两个术语可能存在一定的内在联系。这两个术语在同一篇文章中出现的频率越高,它们之间的关系就越密切。根据这一“距离”,通过现代统计技术,如聚类分析、因子分析、多维尺度分析或多元分析等,对学科的重要关键词进行进一步分类,总结出学科的研究重点和结构。众所周知,聚类分析被广泛用于提取一个领域的研究主题。例如,通过聚类算法,Raghupathi等人确定了卫生信息系统研究的子领域[16], Schuemie等人描述了医学信息学领域[17].与传统聚类不同,双聚类可以同时对矩阵的行和列进行聚类,不仅可以聚类全局信息,还可以高效地在高维数据中查找局部信息[18].1972年,Hartigan首次提出了同时对矩阵的行和列进行聚类的想法[19].直到2000年,Cheng和Church才正式提出了聚类算法和模型[18].此后,越来越多优秀的聚类算法和模型被开发出来。近年来,聚类分析被引入文献计量领域。Cui等运用聚类方法从机构和主题两个方面分析了我国医学信息学教育现状[20.].Yu等人通过聚类分析揭示了生物医学信息学的研究领域和热点[21].Fang等采用双聚类方法探索中国图书馆学与信息学的高产作者和研究特点[22].他们的研究结果表明,利用聚类方法可以捕捉到一个学科领域的主要研究热点和代表性的出版物或研究。

据笔者所知,目前关于网络健康信息检索行为的文献计量学文章较少。本研究通过对相关出版物的外部特征和内容模式的综合分析,揭示该领域的研究历史和现状。具体而言,利用共词聚类分析,识别了互联网健康信息搜索行为的研究热点。希望本文能够为今后网络健康信息搜索行为的研究提供一定的参考。


数据收集

通过搜索PubMed确定相关文章,不受语言和出版年份的限制。选择PubMed作为数据来源有两个原因:(1)PubMed是美国国家医学图书馆在网上的一个免费的权威医学文献数据库,其中有关于健康和医学信息搜索行为的文章;(2)Medline (PubMed的一个子集)的文章使用MeSH (medical Subject heading)术语进行索引,MeSH是一组规范化的词语,可以反映文章的内容;基于这些词,可以进行共词聚类分析。搜索在2014年9月30日进行,以确保搜索结果尽可能是最新的。搜索策略的详细信息如下(关于PubMed如何翻译此搜索策略的详细信息,请参见多媒体附件1): #1互联网信息搜索行为;#2网络信息搜索行为;#3 ((search*[ti] OR seek*[ti]) OR (behavior[ti] OR behavior[ti])) AND (Internet[ti] OR net*[ti] OR online[ti] OR web*[ti]);#4 #1或#2或#3。

根据上述搜索策略,PubMed共找到2741篇出版物。根据相关性和选择标准筛选出版物的标题和摘要。纳入标准为(1)论文内容以网络健康信息搜索行为为主,(2)所有研究设计。排除标准为(1)研究关注信息资源的准确性或有效性,而不是互联网健康信息搜索行为(例如,题为“万维网上的婴儿出牙信息:从搜索中抽取一个字节”的文章已被排除,因为本研究的目的是描述和评估选定的流行育儿网站上的婴儿出牙信息的质量[23]),(2)其他行为的研究,如自杀行为[24]、基于互联网的问题购物行为[25]、网络成瘾行为[26]、常规游戏行为[27],等等,(3)寻找与健康无关的其他信息的研究,(4)贝叶斯网络等其他网络的研究[28]和代谢网络[29而不是互联网。两名研究人员独立审查和评估了这些研究,并就纳入分析达成共识。两者的符合率为0.90,表明两者高度一致[30.].任何差异都参照研究目标进行讨论,直到达成共识。最初,确定了494篇相关文章。然后,我们统计了每期期刊上相关文章的数量。研究发现,排名前三的期刊依次是《医学互联网研究杂志》、《健康传播杂志》和《医学图书馆协会杂志:JMLA》,对这些期刊也进行了人工搜索,并确定了另外39篇相关论文。最后,本研究共纳入533篇论文。从PubMed下载的每个出版物都包含以下关键资格项:标题、作者、机构、国家、来源、出版年份和MeSH术语。这些数据分别以XML和MEDLINE格式保存为两个文件。

数据提取与分析

文献项目共现矩阵构建器(BICOMB)(由中国医科大学崔教授开发,网上免费提供)[31], GoPubMed [32],并使用Microsoft Excel确定收录出版物的出版年份、国家、作者、语言、期刊分布以及主要MeSH术语的频次排名。在本研究中,最活跃的期刊是根据布拉德福德定律(Bradford’s Law of Scattering由Bradford在1934年首次提出)确定的。该定律表明,一个特定学科领域的期刊可以按照文章数量分为三个部分,每个部分约占所有文章的三分之一:(1)由少数期刊组成的核心部分,(2)由更多期刊组成的第二区域,以及(3)由大量期刊组成的第三区域。每组的期刊数量将按1:n: n成比例2.尽管Bradford定律在统计上并不准确,但图书馆员通常将其作为核心期刊研究的指导原则[33].

考虑到本研究纳入的论文必须与网络健康信息搜索行为相关,在内容分析中,“互联网”和“信息搜索行为”这两个MeSH中使用频率较高的术语将被删除。其余高频率主要MeSH术语随时间的变化趋势被直观地说明。为了探索互联网健康信息搜索行为的热点,对高频次的主要MeSH词条和收录论文进行了聚类。在本研究中,通过聚类,可以得到高频词之间的关系,以及高频词与源文章之间的关系。随后,由BICOMB构建了一个二进制矩阵,以高频率的主要MeSH术语为行,以源文章为列,使用“gCLUTO”软件进行进一步的聚类,版本1.0(图形聚类工具包,CLUTO数据聚类库的图形前端,由明尼苏达大学的Rasmussen、Newman和Karypis开发)[34].gCLUTO中的聚类参数根据文献中适合聚类分析的参数进行设置[35].聚类方法采用重复等分,相似函数采用余弦2为聚类的准则函数。为了能够区分最优的聚类数量,我们使用不同数量的聚类重新运行了双聚类。采用山地可视化和矩阵可视化两种方法,对高频次主要MeSH词源文章的矩阵进行了聚类。借助MeSH术语之间的语义关系和各聚类中代表性论文的内容,绘制并分析了互联网健康信息搜索行为研究热点的基本框架。


文学的成长

根据检索策略和收录标准,共收录533篇文献(见多媒体附件2)均纳入本研究。每年这些出版物的平均数量约为18份。第一篇文章于1985年发表[36].在图1,给出了互联网健康信息搜索行为相关文章的出版年份分布,同时也给出了在PubMed中被索引的所有出版物的出版年份分布,以便进行比较。

图1。PubMed中关于互联网健康信息搜索行为的论文和PubMed中所有索引论文的时间分布。
查看此图

国家、作者和语言的分布

在PubMed所有关于互联网健康信息搜索行为的文章中,93.4%(498/533)提供了作者地址。因此,据粗略统计,PubMed收录的关于互联网健康信息搜索行为的文章至少来自42个不同的国家或地区。图2说明了不同国家关于互联网健康信息搜索行为的研究产出数量。地图上的数字是每个国家或地区相关出版物的数量。美国以271篇(50.8%)排名第一。

在涉及该主题的1758位作者中,有5位作者单独发表了4篇或4篇以上的文章。他以第一作者的身份发表了1篇文章,共发表了5篇文章,排名第一。迪克森发表了四篇文章获得第二名,但他有三篇文章是第一作者。第一份关于互联网健康信息搜索行为的出版物的作者是来自美国的Tolle和Hah。

这些文章以英语发表最多(96.8%,516/533),其余分别以西班牙语(1.1%,6/533)、德语(0.8%,4/533)、法语(0.6%,3/533)、波兰语(0.4%,2/533)、希伯来语(0.2%,1/533)、瑞典语(0.2%,1/533)和日语(0.2%,1/533)发表。(注:有一篇文章同时以英文和法文发表[37].)

图2。互联网健康信息搜索行为研究成果的地理分布。
查看此图

最活跃的期刊

总共有253家期刊参与了该领域的研究。1985 - 2014年,最活跃的8种期刊发表了182篇关于互联网健康信息搜索行为的文章,占533篇文章的34.1%。表1展示了在Bradford定律下,被认为是互联网健康信息搜索行为研究领域的核心期刊的8种最高产的期刊。

表1。大多数关于互联网健康信息搜索行为主题的活跃期刊(PubMed的来源截止2014年9月)(n=533)。
不。 顶级期刊上 出版物
n (%)
1 医学互联网研究杂志 67 (12.6)
2 健康传播杂志 41 (7.7)
3. 医学图书馆协会杂志:JMLA 16 (3.0)
4 美国医学信息协会(AMIA):年度研讨会论文集/ AMIA研讨会。AMIA研讨会 14 (2.6)
5 网络心理学与行为:互联网、多媒体和虚拟现实对行为和社会的影响 13 (2.4)
6 国际医学信息学杂志 13 (2.4)
7 《公共科学图书馆•综合》 9 (1.7)
8 健康传播 9 (1.7)
总计
182 (34.1)

互联网健康信息搜索行为研究热点

1985年至2014年9月的出版物中,除去“互联网”和“信息寻求行为”两个词,MeSH主要词汇共495个,累计出现频次为1577次。经过讨论,将出现频率在10次及以上的MeSH主要术语定义为高频次术语。然后从收录的文献中提取30个高频次的MeSH主要术语,累计比例为45.34% (715/1577)(表2).这些MeSH术语的年分布显示在图3,其中圆圈表示该年度至少有一份出版物。圆圈越大,对应年份的出版物就越多。根据这些高频次的MeSH术语在同一篇文章中同时出现的情况,以高频次的主MeSH术语为行名,以源文章为列名,建立矩阵。矩阵(局部化视图)表3)介绍了源文章中主要MeSH术语的可用性。单元格中的“1”表示文章中存在主要MeSH术语,而“0”表示不存在。

采用不同数量的聚类进行双聚类;高频次主要MeSH词源文章矩阵的聚类结果表现为山型可视化和矩阵可视化。图4说明了当MeSH术语被划分为6个聚类时,每个聚类中的山地可视化和高频度MeSH术语。山地可视化的目的是直观地帮助用户理解高维数据集的内容和聚类的效果。在图4,每个聚类表示为三维地形中的一个峰值,用聚类编号标记(0到5,本研究共6个聚类)。峰值在平面上的位置、体积、高度和颜色用于描绘有关关联集群的信息。一个峰最有信息量的属性是它在平面上相对于其他峰的位置。平面上一对峰之间的距离表示它们的簇的相对相似度。每个峰的高度与簇的内部相似度成正比。峰值的体积与集群中包含的MeSH术语的数量成正比。最后,峰值的颜色表示集群对象的内部标准偏差。红色代表低偏差,蓝色代表高偏差。根据作者的知识,每个独立的聚类应涵盖至少30篇出版物,并且在山地可视化中不存在三重峰,因此将这些高频率的MeSH术语分为6个聚类。图5显示了矩阵可视化,其中行标签代表频繁出现的主要MeSH术语,列标签是源文章的PubMed Unique identifier (PMIDs),分别位于矩阵的右侧和底部。颜色用于图形化地表示矩阵中呈现的值。每个网格的颜色表示文章中MeSH术语的相对出现频率。越来越深的红色表示较大的值,白色表示接近零的值。主矩阵的行(表3)通过biclu群集重新排序,以便同一群集的行被聚合;黑色水平线将这些簇分开。矩阵可视化显示了30个高频率的主要MeSH术语被聚为6个簇。左边的层次结构树描述了频繁使用的主要MeSH术语之间的关系,顶部的层次结构树显示了文章之间的关系。此外,它还显示了每个集群中出现的每个高频次MeSH项的对应文章。仔细阅读每一组的代表性文章有助于确定和总结每一组的主题。

此外,一些聚类可以根据研究小组讨论的以下标准划分为更小的主题:(1)一个大聚类内MeSH术语之间的语义关系,(2)MeSH术语被引入MeSH词汇的年份,以及(3)MeSH术语所在的类别。MeSH中的术语,如“学生”、“父母”和“医生”都位于“人”或“人类学”的类别下。“手机”和“社交媒体”是两个新引入的MeSH术语。因此,这些较小的主题中的每一个都被总结为一个单独的热点。因此,在互联网健康信息搜索行为领域共发现了10个热点话题,具体如下:(1)艾滋病毒感染或性传播疾病互联网健康信息查询行为(聚类0),(2)学生互联网健康信息查询行为(聚类0),(3)手机及其应用程序互联网健康信息查询行为(聚类0),(4)医生对互联网医疗资源的利用情况(聚类1),(5)家长对社交媒体的利用情况(聚类1),(6)癌症患者(主要是乳腺癌患者)的互联网健康信息搜索行为(聚类2),(7)消费者对基于网络的健康信息的信任或满意度(聚类3),(8)互联网使用与医患沟通或关系之间的交互作用(聚类3),(9)人们使用搜索引擎或其他基于网络系统的偏好和计算机素养(聚类4),(10)人们(尤其是青少年)在通过互联网寻求健康信息时的态度(聚类5)。

表2。高频率的主要MeSH一个术语来自所收录的关于互联网健康信息搜索行为的出版物(n=1577)。
不。 网格计算 频率n (%b) 累计百分比,%
1 消费者健康资讯 77 (4.88) 4.88
2 信息服务 67 (4.25) 9.13
3. 以病人教育为主题 55 (3.49) 12.62
4 信息存储与检索 50 (3.17) 15.79
5 健康知识、态度、实践 50 (3.17) 18.96
6 健康教育 44 (2.79) 21.75
7 患者接受医疗保健 35 (2.22) 23.97
8 肿瘤 33 (2.09) 26.06
9 信息传播 23日(1.46) 27.52
10 父母 21日(1.33) 28.85
11 对电脑的态度 18 (1.14) 29.99
12 医学信息学 17 (1.08) 31.07
13 医患关系 16 (1.01) 32.09
14 健康行为 16 (1.01) 33.10
15 社会支持 16 (1.01) 34.12
16 消费者满意度 15 (0.95) 35.07
17 搜索引擎 15 (0.95) 36.02
18 乳腺肿瘤 14 (0.89) 36.91
19 健康态度 14 (0.89) 37.79
20. 在线系统 13 (0.82) 38.62
21 计算机知识 12 (0.76) 39.38
22 消费者参与 11 (0.70) 40.08
23 社交媒体 11 (0.70) 40.77
24 青少年的行为 11 (0.70) 41.47
25 信任 11 (0.70) 42.17
26 医生 10 (0.63) 42.80
27 病人满意度 10 (0.63) 43.44
28 艾滋病毒感染 10 (0.63) 44.07
29 学生 10 (0.63) 44.71
30. 手机 10 (0.63) 45.34

一个医学主题标题

b1577次出现频率占比。

表3。高频率的主要MeSH一个术语源文章矩阵(本地化)。
不。 MeSH主要术语 PubMed源文章的唯一标识符
10052399 10402805 10590585 ... 9934530
1 消费者健康资讯 0 0 0 ... 0
2 信息服务 0 0 0 ... 0
3. 以病人教育为主题 1 1 1 ... 0
4 信息存储与检索 0 0 0 ... 1
... ... ... ... ... ... ...
29 学生 0 0 0
0
30. 手机 0 0 0 ... 0

一个医学主题标题

图3。从所收录的关于互联网健康信息搜索行为的出版物中,高频度主要MeSH术语的年度分布。
查看此图
图4。高频次主要MeSH词条和文章在互联网健康信息搜索行为中的聚类山地可视化。
查看此图
图5。互联网健康信息搜索行为的高频度主要MeSH术语和PubMed唯一标识符(PMIDs)聚类的可视化矩阵。
查看此图

主要研究结果

在互联网发展及其在健康领域应用的背景下,人们在互联网上的健康信息搜索行为越来越受到学术界的关注。在此基础上,本研究从数量和内容两方面揭示了网络健康信息搜索行为的出版物数量和10个研究热点。与PubMed中所有出版物的趋势相比,增长更为显著,说明互联网健康信息搜索行为子领域的研究产出增长与整个医学领域对应的研究产出增长不成正比。正如预期的那样,在2000年之前,论文数量较少,在2001年至2010年期间开始增加。2013年发表论文最多(21.4%,114/533)。在收录的出版物中,第一篇关于互联网健康信息搜索行为的文章可以追溯到1985年;作者是美国人,这表明这一领域的研究可能起源于美国。本文作者研究了CATLINE数据库上的用户搜索模式[36].目前,美国仍然是该领域最大的论文生产国。就所有生产国而言,主要贡献来自北美、欧洲和澳大利亚的少数发达国家。这可能是由于这些国家对互联网健康信息搜索行为的研究意识更高、水平更高,研究人员在英语方面也具有相对优势。由于作者的母语为中文,作者还在中国学术期刊全文数据库、中国博士论文全文数据库、中国硕士论文全文数据库和中国知网全文数据库(CNKI)中搜索了目标主题的相关文章,该数据库提供了全球范围内全面的、最新的中文信息,包括论文、论文集、学术论文、以及来自中国各种出版商、研究机构和信息来源的书籍。截至2014年9月,共发现21篇文章(17篇期刊文章,1篇会议文章,3篇研究生论文);第一批出版于2008年。此外,与美国相比,其他以英语为官方语言或母语的发达国家或发展中国家/地区(如英国、澳大利亚、新西兰、印度)的作者发表的相关文章数量并不相当,因此可以在一定程度上推断,该领域在许多国家仍然不发达。鉴于PubMed的免费优势,本研究的结果可以反映出高度依赖PubMed获取专业信息的相关科学界的一些相对偏好。

本研究发现,最活跃的8种期刊共发表相关论文182篇(占所有相关论文的34.1%),可视为网络健康信息搜索行为研究领域的核心期刊。在最活跃的期刊名单中,《医学互联网研究杂志》是最多产的期刊。此外,关于互联网健康信息搜索行为的论文主要发表在医学互联网研究、健康传播学、行为学、心理学、医学信息学等期刊上,说明该领域跨越多个学科,需要包含传播学、医学、健康促进学、社会营销、心理学、信息技术等知识。

在方法上,采用聚类方法和gCLUTO软件的可视化方法,发现了本研究中互联网健康信息搜索行为的热点问题。在网络健康信息搜索行为研究中,共发现10个研究热点,具体如下:

1.互联网健康信息查询艾滋病毒感染或性传播疾病的行为。例如,在南加州,195名使用Grindr(一款手机应用程序)的男男性行为者的概率样本进行了一项基于网络的调查,以评估使用Grindr的模式和动机,以便为开发和定制针对男男性行为者的基于手机的艾滋病毒预防提供信息。结果显示,70%的YMSM表示愿意参与基于手机应用程序的艾滋病预防项目。开发和测试提供艾滋病毒预防服务的手机应用程序有可能使青年青年参与艾滋病毒预防规划,可以根据使用模式和使用动机量身定制[38].

2.学生网络健康信息查询行为。例如,一项横断面研究考察了寻求刺激和冲动决策等个性特征如何影响台湾大学生寻求网络信息的意愿[39].

3.通过手机及其应用程序搜索互联网健康信息的行为。这方面的一个例子是人们使用手机应用程序进行减肥手术的研究[40].

4.医生对互联网医疗资源的利用。例如,Shabi等人确定了医生使用互联网医疗数据库的程度、目的、决定因素和影响[41].

5.父母使用社交媒体。例如,在Gabbert等人的研究中,他们研究了早产儿父母使用社交网站的经历,以及此类网站在收集信息和促进个人交流方面的潜力[42].

6.癌症(主要是乳腺癌)患者网络健康信息查询行为例如,一项随机对照实验检查了哪种基于网络的故事搜索工具会导致乳腺癌患者的满意度和搜索成功。研究发现,能够使用故事主题搜索工具显然对患者满意度和搜索成功有最积极的影响[43].为了更好地理解癌症患者在网络上的信息和寻求支持的行为,另一项研究探讨了各种社会和心理特征如何预测在线乳腺癌支持小组的不同参与水平:海报、潜伏者和不用户。结果显示,参与癌症支持小组的模式因患者的特点而异[44].

7.消费者对基于网络的健康信息的信任或满意。例如,一项建立在基于个人资本、基于社会资本和基于转让等信任理论视角上的研究,考察了消费者对基于网络的健康信息的信任的各种相关因素[45].另一项研究调查了消费者的动机、感知质量、满意度和重复搜索电子健康信息的意图之间的关系[46].

8.互联网使用与医患沟通或关系的互动。医患沟通是影响患者满意度和健康结果的重要因素。传统的医患关系正受到人们互联网健康信息搜索行为的挑战。Hou等人利用使用和满足理论来研究个人对与医疗保健提供者沟通的感知如何与他们在与健康相关的活动中使用互联网有关。研究人员发现,当个人认为他们与提供者的交流不那么以病人为中心时,他们更有可能参与各种基于网络的健康活动,例如使用健康生活方式的网站,搜索医疗保健提供者,以及寻求健康信息[47].另一项研究调查了使用互联网获取健康信息如何影响与卫生专业人员接触的频率[48].

9.人们使用搜索引擎或其他基于网络的系统的偏好和计算机素养。一项研究调查了信息偏好对一般消费者寻求健康信息的搜索行为、他们对搜索任务的看法以及搜索系统的用户体验的影响。研究发现,那些有高偏好的人在搜索特定的事实信息时,更有可能使用更笼统的查询,并对探索性健康问题产生更复杂的心理表征,并尝试不同的概念组合来探索这些问题。高偏好用户对系统的要求也更高。卫生信息搜索系统应根据个人的信息偏好进行调整[49].

10.人们(尤其是青少年)在通过互联网寻求健康信息时的态度。例如,一篇论文探讨了英国和美国青少年使用互联网查找健康和药物信息的看法和经历[50].

从MeSH高频次术语的年度分布来看,癌症患者的网络健康信息查询行为等话题一直是研究热点。我们还发现,2011年以来,通过手机及其应用程序搜索互联网健康信息的行为这一话题非常流行。这可能是近年来移动互联网快速发展的结果。

限制

此外,我们认识到有几个潜在的限制可能会鼓励进一步的研究工作。首先,图1说明1990 - 1997年没有相关文章。虽然这可能是客观的,但也可能是由于我们目标领域的研究产出仅由单个数据库PubMed中的出版物表示,并且无法分析关于该主题的外部出版物。但这些问题将在未来的研究中得到解决,这取决于文本数据挖掘技术的进展和更多的开放存取文献数据库,如PsycINFO。我们希望未来能有更多的文献数据库,这样我们就可以利用这些文献做更多有质量的研究。其次,6.6%(35/533)的文章没有提供完整的隶属关系数据,因此这些文章没有被分配到一个国家。这可能会给一些国家带来低估的偏见。此外,在确定原产国时,所使用的方法是根据通讯作者地址,虽然经常使用,但也不允许承认跨国研究。最后,虽然共词双聚类是一种非常有用的方法,用于识别一个领域的热点,但在本研究中,结果也可能受到一些因素的影响,如用MeSH术语索引文档的准确性和MeSH术语引入MeSH词汇表的时间。

结论

本研究采用共词聚类的内容分析方法,将互联网健康信息搜索行为领域的研究热点可视化。发现了10个研究热点,可以为研究人员启动新项目提供一些提示。

其他文献计量指标也反映了该领域的研究现状;研究发现,网络健康信息检索行为的研究成果逐渐增多。最多产的期刊是《医疗互联网研究杂志》,它是发表关于互联网健康信息搜索行为文章的主要期刊。此外,与美国相比,PubMed收录的其他发达国家和发展中国家的出版物数量相对较少,这在一定程度上表明,该领域在许多国家可能仍然不发达。进一步研究网络健康信息搜索行为,可为健康信息提供者提供参考。

致谢

感谢国家自然科学基金项目(No.81301930)对本研究的支持。作者也要感谢所有审稿人的宝贵意见。

利益冲突

没有宣布。

多媒体附件1

研究PubMed的搜索策略和相应的搜索细节。

PDF档案(adobepdf档案),41KB

多媒体附件2

本研究中涉及互联网健康资讯搜寻行为的出版物清单。

PDF档案(adobepdf档案),166KB

  1. Andreassen HK, Bujnowska-Fedak MM, Chronaki CE, Dumitru RC, Pudule I, Santana S,等。欧洲公民使用电子医疗服务:7个国家的研究BMC Public Health 2007 april 10;7:53 [免费全文] [CrossRef] [Medline
  2. 医学2.0:社交网络、协作、参与、调解和开放。J medical Internet Res 2008 Aug 25;10(3):e22 [免费全文] [CrossRef] [Medline
  3. 互联网上的健康:对健康促进的影响。卫生教育决议2006年2月;21(1):78-86 [免费全文] [CrossRef] [Medline
  4. 劳伦斯D, Park H.群体差异和健康信息:对服务不足人群在线访问的研究。卫生信息学杂志2008年3月14日(1):29-38。[CrossRef] [Medline
  5. Costa-Font J, Mossialos E, Rudisill C.互联网什么时候成为欧洲有价值的健康信息通信设备?《创新与新技术经济学》2009年7月;18(5):429-445。[CrossRef
  6. Morahan-Martin JM。互联网用户如何查找、评估和使用在线健康信息:跨文化回顾。Cyberpsychol Behav 2004十月;7(5):497-510。[Medline
  7. Fox S, Duggan M.皮尤研究中心。:皮尤网络与美国生活项目;2013.健康在线2013网址:http://www.pewinternet.org/~/media//Files/Reports/PIP_HealthOnline.pdf[访问时间:2014-02-13][WebCite缓存
  8. 刘XL。Doc88.com。2012年5月。互联网环境下患者健康信息查询行为研究http://www.doc88.com/p-7512993858536.html[访问时间:2015-03-14][WebCite缓存
  9. 刘玉杰,兰晓宇。国外网络健康信息用户研究进展及启示。中华医学图书与信息科学2011;20(7):38-41。[CrossRef
  10. 医生和护士之间基于互联网的信息寻求行为:一个简短的文献回顾。卫生信息杂志2010 3月27日(1):2-10。[CrossRef] [Medline
  11. 希金斯O, Sixsmith J, Barry M, Domegan C.欧洲疾病预防与控制中心。在网络上寻求健康信息行为的文献综述:健康消费者和健康专业人士的视角http://www.ecdc.europa.eu/en/publications/Publications/Literature%20review%20on%20health%20information-seeking%20behaviour%20on%20the%20web.pdf[访问时间:2014-02-13][WebCite缓存
  12. 苏华,李平。基于关键词共现的知识结构映射——以科技展望期刊论文为例。科学计量学2010 6月22日;85(1):65-79。[CrossRef
  13. 陈海林,赵gq,徐妮。基于CiteSpace II的知识可视化研究热点前沿分析。入:编辑方杰。混合学习:第五届国际会议,ICHL 2012,广州,中国,2012年8月13-15日,会议记录(计算机科学/理论计算机科学和一般问题)。柏林:施普林格;2012:57 - 68。
  14. 张强。本文通过对词频分析的回顾来揭示中国科学研究的发展。知识学习与管理2011(2):95-98,128。
  15. 刘志刚,刘志刚,刘志刚。环境酸化研究的共词分析。科学计量学报1988 9月14日(3-4):251-264。[CrossRef
  16. 卫生信息系统的研究主题和趋势。方法国际医学杂志,2008;47(5):435-442。[CrossRef] [Medline
  17. Schuemie MJ, Talmon JL, Moorman PW, Kors JA。绘制医学信息学领域。方法中华医学杂志2009;48(1):76-83。[Medline
  18. 程毅,教会总经理。表情数据的聚类。Proc Int Conf Intell system Mol Biol 2000;8:93-103。[Medline
  19. Hartigan农协。数据矩阵的直接聚类。美国统计协会杂志1972年3月;67(337):123-129。[CrossRef
  20. 崔玲,李霞。中国医学信息学部门身份研究重点的新方法。武汉大学学报(信息科学版)2010;35(增刊):49-54。
  21. 于勇,徐志军,王凯,王伟。基于聚类方法的生物医学信息学文本数据挖掘。图书情报工作2012;56(18):133-136。
  22. 方玲,崔玲。用聚类方法探讨中国图书馆情报界部分高产作者及其研究特点。载于:第十七届中国医学信息学学术会议论文集。2011年中华医学会第十七届中国医学信息学学术会议;2011;长沙,中国p. 1-6。
  23. 高祖M,孔雀E, D'Auria JP。万维网上的婴儿出牙信息:从搜索中抽取一个字节。中华儿科卫生杂志2015;29(1):38-45。[CrossRef] [Medline
  24. 哈特EE,威廉姆斯CL,戴维森JA。自杀行为,社会网络和精神病诊断。社会精神病学精神病学流行病学1988年10月;23(4):222-228。[Medline
  25. 罗斯S, Dhandayudham A.为了理解基于网络的问题购物行为:网上购物成瘾的概念及其提出的预测因素。J行为成瘾2014年6月;3(2):83-89 [免费全文] [CrossRef] [Medline
  26. Critselis E, Janikian M, Paleomilitou N, Oikonomou D, Kassinopoulos M, Kormas G,等。网络赌博是网络成瘾行为的预测因素。《行为成瘾》杂志2013年12月;2(4):224-230 [免费全文] [CrossRef] [Medline
  27. Müller KW, Janikian M, Dreier M, Wölfling K, Beutel ME, Tzavara C,等。欧洲青少年的常规游戏行为和网络游戏障碍:来自一项关于患病率、预测因素和精神病理相关性的跨国代表性调查的结果。欧洲儿童青少年精神病学2014年9月5日:e。[CrossRef] [Medline
  28. Adabor ES, Acquaah-Mensah GK, Oduro FT. SAGA:转录调控网络贝叶斯网络结构学习的混合搜索算法。J Biomed Inform 2015 Feb;53:27-35。[CrossRef] [Medline
  29. 权鸥,金世杰,金德伟,金建民,金海林,安勇,等。vanbaalenii分支杆菌PYR-1多环芳烃代谢网络中环羟基化加氧酶系统的多效和上位性行为。中华细菌杂志2014 10月;196(19):3503-3515。[CrossRef] [Medline
  30. 兰迪丝,柯氏。分类数据中观察者一致性的测量。生物计量学1977 Mar;33(1):159-174。[Medline
  31. 崔玲,刘伟,闫玲,张慧,侯艳芳,黄燕云,等。基于文献中书目项共现的文本挖掘系统的开发。图书情报工作新技术2008(8):70-75。
  32. GoPubMed。URL:http://www.gopubmed.com/web/gopubmed/[访问时间:2014-02-13][WebCite缓存
  33. 纳什-斯图尔特CE,克鲁西LM,德尔马CB。Bradford's Law of Scattering能预测Cochrane Reviews的文献规模吗?中华医学杂志2012 04;100(2):135-138 [J]免费全文] [CrossRef] [Medline
  34. Karypis实验室。图形化集群工具包URL:http://glaros.dtc.umn.edu/gkhome/cluto/gcluto/download[访问时间:2014-02-13][WebCite缓存
  35. 王琳。Doc88.com。沈阳:中国医科大学;2012.基于文献剖析的聚类在科研人员分类中的应用http://www.doc88.com/p-9713775461927.html[访问时间:2015-03-14][WebCite缓存
  36. 周永杰,夏林。在线搜索模式:NLM CATLINE数据库。科学通报1985年3月;36(2):82-93。[Medline
  37. Richardson CG, Hamadani LG, Gotay C.量化加拿大人使用互联网作为与癌症预防相关的行为风险因素改变的信息来源。慢性疾病注射能2013 Jun;33(3):123-128 [免费全文] [Medline
  38. Holloway IW, Rice E, Gibbs J, Winetrobe H, Dunlap S, Rhoades H.基于智能手机应用程序的艾滋病毒预防在男男性行为中的接受度。艾滋病行为研究2014 Feb;18(2):285-296。[CrossRef] [Medline
  39. 陆海,Palmgreen PC, Zimmerman RS, Lane DR, Alexander LJ。人格特质对台湾大三和大四大学生网上寻求性传播疾病和爱滋病资讯意愿的预测。网络心理行为杂志2006 10月9(5):577-583。[CrossRef] [Medline
  40. Connor K, Brady RRW, Tulloh B, de Beaux A.减肥手术的智能手机应用程序(应用程序)。Obes外科2013年10月;23(10):1669-1672。[CrossRef] [Medline
  41. IN Shabi, OM Shabi, MA Akewukereke, EP Udofia。尼日利亚西南部奥逊州三级卫生机构的医生使用互联网医疗数据库。卫生信息杂志2011年12月;28(4):313-320。[CrossRef] [Medline
  42. Gabbert TI, Metze B, Bührer C, Garten L.极低出生体重婴儿父母使用社交网站:经验和专用网站的潜力。中华儿科杂志2013年12月;172(12):1671-1677。[CrossRef] [Medline
  43. Overberg R, Otten W, de Man A, Toussaint P, Westenbrink J, Zwetsloot-Schonk B.乳腺癌患者如何希望从互联网上其他患者的故事中搜索和检索信息:一项在线随机对照实验。中国医学杂志,2010;12(1):e7 [免费全文] [CrossRef] [Medline
  44. 韩志勇,金志华,尹海杰,沈敏,McTavish FM, Gustafson DH。参与在线乳腺癌支持小组的社会和心理决定因素:海报、潜伏者和非用户。卫生通报2012;17(3):356-371 [免费全文] [CrossRef] [Medline
  45. 叶艳。消费者对在线健康信息信任的相关因素:来自健康信息全国趋势调查的发现。中华卫生杂志2011年1月;16(1):34-49。[CrossRef] [Medline
  46. 李玉杰,朴杰。消费者满意度与电子健康信息重复搜索行为的影响因素研究。中华卫生杂志2009 3月14日(2):160-173。[CrossRef] [Medline
  47. 侯娟,沈敏。医患沟通与信任在互联网健康相关活动使用中的作用。J卫生公共2010;15增刊3:186-199。[CrossRef] [Medline
  48. 李CJ。互联网是否取代了医疗专业人员?中华卫生杂志2008;13(5):450-464。[CrossRef] [Medline
  49. 张艳。信息偏好对消费者在线健康信息搜索行为的影响。中国医学杂志,2013;15(11):e234 [免费全文] [CrossRef] [Medline
  50. 格雷NJ,克莱因JD,诺伊斯PR,瑟塞尔伯格TS,坎特里尔JA。青少年健康信息寻求行为:互联网的位置。社会科学杂志2005年4月;60(7):1467-1478。[CrossRef] [Medline


BICOMB:书目项目共现矩阵生成器
网:医学学科标题
YMSM:和男人发生性关系的年轻人


G·艾森巴赫(G Eysenbach)编辑;提交15.02.14;M Schuemie, B St. Jean, S Kim, J Moreland, Q Li同行评审;对作者29.08.14的评论;修订版本收到06.12.14;接受04.02.15;发表25.03.15

版权

©范蠡,李敏,关鹏,马爽,崔磊。最初发表于《医疗互联网研究杂志》(//www.mybigtv.com), 2015年3月25日。

这是一篇开放获取的文章,根据创作共用署名许可(http://creativecommons.org/licenses/by/2.0/)的条款发布,允许在任何媒介上无限制地使用、分发和复制,前提是正确引用最初发表在《医学互联网研究杂志》上的原创作品。必须包括完整的书目信息,//www.mybigtv.com/上的原始出版物的链接,以及此版权和许可信息。


Baidu
map