发表在5卷, 4号(2003)

青少年在互联网上搜索健康信息:一项观察性研究

青少年在互联网上搜索健康信息:一项观察性研究

青少年在互联网上搜索健康信息:一项观察性研究

原始论文

1美国密歇根州安娜堡市密歇根大学信息学院

2美国密歇根州安娜堡市密歇根大学综合癌症中心健康媒体研究实验室

3.美国密歇根州安娜堡市VA医疗中心卫生服务研究与发展,密歇根大学医学院家庭医学系

通讯作者:

德里克·汉森,理学学士

石道2389号

安娜堡mi48105

美国

电话:+1 734 764 1008

传真:+1 734 647 8045

电子邮件:shakmatt@umich.edu


背景:青少年能够在互联网上获取健康信息,部分是因为他们有能力搜索和找到与健康有关的问题的答案。青少年可能有独特的健康和计算机知识需求。虽然许多调查、访谈和焦点小组已经被用来了解青少年在网上寻找健康信息的信息寻求和信息检索行为,但我们无法找到在这种情况下对青少年个体进行的观察。

摘要目的:本研究旨在了解青少年如何使用互联网搜索健康信息,以及这可能对获取健康信息产生什么影响。

方法:从密歇根州东南部的1所初中和2所高中选取12名学生(12-17岁)作为方便样本,向他们提供6个与健康相关的问题,并要求他们使用互联网寻找答案。研究人员使用捕捉屏幕图像和同步录音的软件记录了68个特定的搜索。后来对录音进行了审查,并对具体的搜索技术和策略进行了编码。对口头交流也进行了定性评价。

结果:在观察到的68次搜索中,47次(69%)成功,因为青少年找到了健康问题的正确和有用的答案。学生尝试访问的大多数网站是直接从搜索引擎结果(77%)或搜索引擎推荐链接(10%)中检索到的;只有一小部分是直接访问(5%)或从其他网站链接(7%)。大多数(83%)来自搜索引擎结果的链接来自前9个结果。拼写错误(132个搜索词中的30个)、网站内访问的页面数量(范围从1-15个)和整体搜索策略(例如,使用搜索引擎还是直接访问网站)都是成功的重要决定因素。定性分析显示,参与者使用试错法来制定搜索字符串,随机而不是系统地扫描页面,并且在搜索健康信息时不考虑内容的来源。

结论:这项研究为当前青少年的搜索模式提供了一个有用的快照。研究结果对构建青少年搜索行为的真实模拟、改善与青少年相关的健康信息网站的分布和有用性、提高教育者对学生可能遇到的具体陷阱的认识具有重要意义。

中国医学信息学报,2003;5(4):925

doi: 10.2196 / jmir.5.4.e25

关键字



互联网已成为许多关注健康人士的重要工具[12],尤其是青少年[3.4]。对保密性的担忧,再加上许多青少年发现很难通过传统提供者获得护理[5],使得通过互联网获取信息尤为重要。鉴于互联网在年轻人中迅速扩大,因此,超过70%的15至17岁的人说他们使用互联网查找健康信息也就不足为奇了(书面交流,2001年12月;Generation RX.com调查打印件;V. Rideout, Henry J. Kaiser Foundation, Menlo Park, CA)。如果近年来在家上网的人数继续增加,这一比例可能还会增加。6]。

由于大量的非结构化在线内容,了解青少年如何浏览网络以查找健康信息是至关重要的。先前的研究,主要来自图书馆和信息科学文献和教育文献,强调了青少年中独特或更明显的几个搜索特征。例如,青少年比大学生花更多的时间来完成在线任务[7],不那么系统地搜索[7-10],由于拼写错误和具体程度的问题,难以制定搜索查询[8-11],使用不太高级的搜索语法[7],很少考虑网页的来源[89]。虽然信息丰富,但这些文献主要是基于青少年寻找家庭作业问题的答案,而不是健康信息。

搜索在线健康信息涉及不同的挑战,包括不熟悉的术语[12];与色情屏蔽软件的接触(书面交流,2001年12月;Generation RX.com调查打印件;V. Rideout, Henry J. Kaiser Foundation, Menlo Park, CA), [13];确定卫生信息质量的重要性和难度[14]。然而,尽管需要详细研究健康消费者的在线搜索行为,但作者只能找到几篇健康科学研究人员实际观察、记录和分析任何年龄的消费者搜索健康信息的文章[14-16]。相反,调查(例如,书面沟通,2001年12月;Generation RX.com调查打印件;V. Rideout, Henry J. Kaiser Foundation, Menlo Park, CA;和[124])一直是用来了解健康消费者在线搜索行为的主要方法,尽管存在参与者回忆和调查无法捕捉具体搜索策略的问题。此外,作者在医学信息学文献中发现了一些研究,这些研究也查看了来自特定医疗网站的日志数据,但这些研究的范围也很有限,因为它们没有观察到实际的搜索者,也没有看到搜索者行为的更广泛的背景。17]参见[18]对搜索引擎数据进行的类似研究)。直接观察用户的价值在Eysenbach的研究中得到了证明,该研究显示,成年人在采访中表示他们会注意健康网站的来源,尽管在实际观察中没有发现这种行为[15]。

针对青少年年龄组和在线健康信息搜索行为的观察性研究也很少。有一些很好的调查回答了许多有用的问题,如青少年为什么上网,他们搜索什么,如果他们找到了,他们用它做什么(书面交流,2001年12月;Generation RX.com调查打印件;V. Rideout, Henry J. Kaiser Foundation, Menlo Park, CA;和[419])。我们能找到的唯一一项观察性研究进行了27个焦点小组,其中青少年小组在讨论自己的经历时在网上搜索健康信息[14]。在图书馆和信息科学文献中发现的关于青少年搜索行为的许多发现得到了证实,并提出了其他问题,包括对健康素养低和难以判断信息质量的担忧,这些问题在青少年中可能比成年人更明显。然而,这项研究只是开始描绘青少年在线健康信息搜索行为的一幅图景,因为搜索是在一个群体环境中进行的,成功、失败和使用的特定搜索策略没有被编码或分析。

这里报告的研究对青少年如何使用互联网搜索健康信息以及这可能对获取健康信息产生的影响提供了更深入的了解。为了捕捉足够的细节,该研究记录了青少年采取的具体行动,随后对这些行动进行编码和分析。研究人员鼓励参与者在寻找一系列预先确定的健康问题的答案时,大声分享他们的思考过程。结果是一组丰富的定量和定性数据,对共同主题和事件进行了彻底的分析。感兴趣的具体问题包括但不限于:所使用的各种搜索策略是什么?什么因素有助于找到正确和有用的答案?当使用搜索引擎时,有多少结果页面被浏览和利用?搜索引擎会输入哪些类型的搜索字符串?这些问题和相关问题的答案应该引起许多方面的兴趣,包括教育工作者(如卫生教育工作者、图书管理员、教师)、网站和搜索引擎设计者、卫生保健从业人员和研究人员(如通过模拟在线搜索行为创建url示例)。20.])。


样本

本研究共招募了密歇根东南部1所中学(N= 4)和2所高中(N= 4和N= 4)的12名学生。每所学校的工作人员被要求选择4名学生,他们(a)熟练使用电脑,(b)熟练在互联网上搜索信息,(c)能力强,可以翘一节课。作为参与的回报,学生们将获得一件价值约8美元的密歇根大学t恤。

每位学生的家长或监护人签署了一份描述研究目的和程序的知情同意书。学生们还签署了包含类似信息的单独同意书。密歇根大学行为科学机构审查委员会批准了本研究以及同意和同意文件。

数据收集

采用了三种数据收集方法。首先,在每次观察期间,研究小组的两名成员中的一名在实时编码搜索行为,而研究小组的另一名成员与学生互动。二、TechSmith Camtasia 3.0.1商业跟踪软件[21安装在计算机上。该软件捕捉学生的声音,并在整个过程中每秒拍摄两次屏幕照片(屏幕截图)。最后,一个摄像机被放置来捕捉屏幕和学生的声音,但不是学生的图像。实时编码的观察结果用于开发更详细和系统的编码系统,以便在审查跟踪软件记录时使用。这里报告的是跟踪软件编码的数据。

所有对青少年的观察都在2002年1月进行。每个学校都提供了一个房间来进行观察。学生们被逐一带到观察室。每次观察都有两名研究人员在场。对于每个学生,首先有一名研究人员审查同意书,介绍该项目并获得学生的参与许可。然后,学生们被问及14个关于人口统计(年龄、种族/民族和性别)和他们之前的电脑使用情况(例如,他们使用电脑或互联网的频率,他们搜索过什么健康主题,他们使用过哪种搜索引擎,以及他们是否有电脑并在家中访问互联网)的问题。

一旦简短的面谈结束,观察到的搜查就开始了。为了帮助学生理解搜索程序,并强调在搜索时大声思考的重要性,每个学生首先被要求做一个简单的非健康相关搜索,寻找第二天的当地天气预报。与随后与健康相关的搜索一样,当地天气问题首先由研究人员念给学生听,然后在电脑旁边放一张写有问题的卡片,以备学生需要时阅读。作为大声思考方案的一部分,实验者要求学生大声说出他们正在做的事情,这样研究人员就能更好地理解搜索行为背后的原因。如果一个学生在搜索过程中停止说话,观察者会提醒他或她“继续说话”,但实验者并没有要求学生详细说明他们说过的任何具体事情。同时进行的口头报告比回顾性反思更准确地反映了受试者在观察行为时的精神状态,这种最小的“大声思考”协议已被证明会减慢受试者的速度,但不会从本质上改变他们解决问题的行为。22]。

在学生们完成当地天气搜索练习后,他们被给予多达6个预先确定的健康信息问题的序列(见表1),一次一个。提出问题的方式考虑到问题试图解决的更广泛的信息问题。为了消除搜索之间的学习效应造成的混淆,我们使用了一个6 x 6的拉丁方格来确定向参与者呈现问题的顺序。学生们使用的电脑是由研究人员提供的,但与学校的网络相连,这样学生们就可以通过学校使用的相同的屏蔽或过滤软件来保护他们免受有争议或色情内容的侵害。这三所不同的学校使用三种不同的过滤系统。每次观察持续一个课时。每个问题都没有时间限制,但是当课程结束时,任何正在进行的搜索将被终止,任何剩余的问题将被跳过。

表1。与健康有关的问题
你阿姨刚被告知她有糖尿病。她不确定她能吃或不能吃什么样的食物。利用互联网,为你的阿姨找到一些关于她应该或不应该吃什么食物的信息。
我的一个朋友最近开始服用一种叫做帕罗西汀的药物来治疗抑郁症。他似乎总是很累,甚至在课堂上睡着了。上网查查这种药是否会让他犯困。
你哥哥有酗酒的毛病。他想参加当地的戒酒互助会。利用互联网帮助他找到一个当地的会议。
你想做艾滋病毒检测,但你不想让任何人知道。你也没钱买它。利用互联网找到一个地方获得免费和保密的艾滋病毒检测。
在课堂上,你需要学习可以帮助人们戒烟的药物。使用互联网,找到这些药物的名称。
你正准备去纹身,但一个朋友警告你,有些地方会传播艾滋病毒和肝炎等传染病。上网看看这是不是真的。

健康相关问题的主题是根据对凯撒家庭基金会对青少年进行的一项调查的答复选定的(书面来文,2001年12月;Generation RX.com调查打印件;V. Rideout, Henry J. Kaiser Foundation, Menlo Park, CA)。包括同性恋、少女怀孕和堕胎在内的某些话题被有意避免,以免让参与者接触到过于有争议的信息。

数据分析

在所有观察完成后,包括医生、健康教育工作者和人机界面专家在内的3名研究人员组成一个小组,审查实时编码结果,并在对跟踪软件记录进行最终编码之前澄清或补充编码方案。最后的编码方案被设计用来记录搜索的人、被问到的问题、找到答案所需的时间、使用的搜索策略(例如,利用搜索引擎或直接输入URL)的数据;使用的搜索字符串;被审查的搜索引擎结果页面的数量;在特定网站内浏览的网页数目;以及菜单、广告和目录的使用。三个编码员中的一个被指定为每个观察会议的主要审稿人。指定的主要审稿人负责观察会议的详细编码,任何编码问题在第二次小组讨论中解决。

审稿人将学生找到的每个答案分类为正确的不正确的完整的不完整的,至于地点问题,有用的有用的。为了避免我们的分类过于狭隘正确的对于更开放的问题,例如关于糖尿病患者健康食品的问题,我们使用以下一般规则进行分类:要被认为是正确的,答案的内容必须是可能在医学院或公共卫生学院讨论的信息。该分类系统在研究小组先前发表的工作中得到了验证,并产生了很高的评分间信度(κ = 0.84) [13]。更具体的问题,比如询问匿名戒酒会会议地点的问题,如果学生找到了一个列出会议地点和时间或联系电话号码的网页,就被认为是正确的。如果学生能够回答问题的所有部分,那么答案就是完整的。例如,如果学生找到了关于纹身店传播艾滋病毒的讨论,但没有找到关于肝炎的答案,则将其归类为不完整。有用的答案与位置问题有关。另一个州的戒酒互助会也没用。将每个搜索分类为成功、部分成功或不成功的汇总度量使用正确、完整和有用的评级来计算。要获得成功的评级,答案必须是完整、正确和有用的。如果学生在找到答案之前就放弃了,那么搜索将被归类为不成功。


密歇根州东南部的12名中学生和高中生参与了这项研究。学生年龄从12岁到17岁不等,平均年龄为14岁。一半的学生是女性。在12名学生中,7名是白人,2名是非裔美国人,1名印第安人,1名西班牙裔美国人,1名亚裔美国人。在这12名学生中,只有6名年龄最大的学生以前在互联网上搜索过健康信息。年龄的差异与其他调查结果一致,即15至17岁的青少年(32%)比12至14岁的青少年(18%)更有可能查找健康信息[23]。然而,所有的学生在家里都有电脑和互联网。学生们报告使用电脑的时间从每周1小时到每天3小时不等,平均每周12.3小时。

11名学生尝试了所有6次搜索,而剩下的学生尝试了3次,总共搜索了69次。由于互联网连接不正常,没有包括一次搜索,总共分析了68次搜索。搜索平均耗时5分41秒,从不到1分钟到近24分钟不等。这个时间框架基本上与艾森巴赫记录的成人相同[15]。虽然直接比较是不合适的,因为不同的问题被提出,相似的数量级是暗示性的。

整体搜索策略

当学生们大声思考时,研究人员就能知道学生们在每页上看什么。学生们似乎跳过了很多,没有以任何系统或彻底的方式浏览结果页面或特定的网站,有时会遗漏包含问题答案的链接或文本。这也与Hsieh-Yee [24]。

表2。每个站点浏览页面的分布
每个网站浏览的网页 网站
n 累积%
1 143 70.4 70.4
2 27 13.3 83.7
3. 11 5.4 89.2
4 8 3.9 93.1
5 8 3.9 97.0
6 2 1.0 98.0
8 1 0.5 98.5
9 1 0.5 99.0
15 2 1.0 100.0
总计 203 One hundred.

学生们使用多种方法找到他们认为包含68个问题答案的网站。在60个案例中,学生通过访问搜索引擎并输入搜索词或短语开始寻找答案。在2个案例中,学生开始从目录菜单中选择(例如,选择主题)健康)。在6个案例中,学生通过直接在浏览器地址栏中输入URL(而不是搜索引擎)开始。总共有215次尝试访问非搜索引擎或目录网站。几乎所有这些尝试都是通过在搜索后或通过使用目录跟踪搜索引擎的链接进行的。在215次尝试的网站访问中,有4次是断开的链接,3次被某些学校使用的过滤器阻止,5次是PDF文件(由Acrobat Reader读取),学生无法下载或因为下载速度太慢而选择不下载。剩下的203个网站被浏览,平均每个网站有1.8个页面被浏览。每个站点访问的页面分布显示在表2.请注意,该分布与先前研究中观察到的幂律大致一致[25]。应审稿人的要求,这些数据是在个别学生的水平上进行的。学生们在参观地点的总数上差异很大。12名学生中有11名在大多数访问的网站上只深入了1页。虽然个人层面的数据不够大,无法进行更严格的分析,但幂律似乎在个人层面和总体层面上都起作用。

即使学生找到了一个包含问题答案的网站,他们也不一定能找到答案。一个例子是匿名戒酒会网站[26在那里,11名学生中有8名在寻找当地的会议时结束了。虽然有一个包含当地信息的网站链接,但8名学生中只有3人能够找到这个链接,其中1人在第二次访问匿名戒酒会网站时才找到它,在网站内浏览了16页。同样,在11名查询帕罗西汀是否会导致嗜睡的学生中,有6名访问了帕罗西汀的官方网站[27]。6名学生中只有3名能够根据他们在网站上找到的信息成功回答问题。其中两人没能找到副作用清单,其中一人找到了清单,但没有足够理解(或读得不够仔细),无法正确回答问题。

搜索引擎策略

使用了7个搜索引擎,包括2个元搜索引擎(Dogpile和Locate.com)。元搜索引擎Locate.com为用户提供了许多搜索引擎可供选择。使用其他搜索引擎(如Yahoo!)从Locate.com网站执行的搜索会被报告为在目标搜索引擎(如Yahoo!)上进行的搜索。表3总结特定搜索引擎的使用次数。如果在搜索同一问题的答案时多次使用搜索引擎,则只计算一次。因为学生在尝试回答同一个问题时偶尔会切换搜索引擎,所以使用搜索引擎的搜索次数(79)多于尝试回答问题的次数(68)。总的来说,12名学生中有6名只使用b谷歌,1名只使用Yahoo!剩下的5家在某个时候改变了搜索引擎。

表3。搜索引擎使用情况
搜索引擎 次使用
n
谷歌 38 48.1
雅虎 13 16.5
12 15.2
MSN 7 8.9
Hotbot 6 7.6
Dogpile 2 2.5
AltaVista 1 1.3

在各种搜索引擎中总共输入了132个搜索短语。其中只有104个搜索词是唯一的。使用频率最高的两个短语是“糖尿病”和“帕罗西汀”,每个短语出现5次。每个搜索短语平均输入3.6个单词,80%的情况下,每个搜索短语的单词数不超过4个。

表4。查看的搜索结果链接的分布
查看的搜索结果链接频带 选择链接
n 累积%
结果1 - 10 137 82.5 82.5
结果11日至20日 8 4.8 87.3
结果21 - 30 11 6.6 94.0
结果31-40 4 2.4 96.4
结果每周 4 2.4 98.8
结果51-60 1 0.6 99.4
结果61或以上 1 0.6 100.0

在132个搜索短语中,30个包含至少一个拼写错误的单词(例如,“纹身”,“酗酒者”或“吸烟”),尽管事实上学生可以阅读包含问题的索引卡上拼写正确的单词。一些搜索引擎(例如b谷歌)提供了一个功能,推荐一个具有正确拼写单词的替代搜索字符串。例如,如果一个学生输入“匿名酗酒者”,第一页的结果是“你是说‘匿名酗酒者’吗?”’”学生们在15个不同的场合得到了拼写正确的新搜索字符串,但只注意到并使用了6次。剩下的时间他们使用错误拼写提供的结果。在得到拼写纠正建议的7名学生中,只有2名使用了这些建议。

一旦在搜索引擎中输入一个搜索字符串,学生们浏览的结果页面数量就会有所不同。78%的学生只浏览第一页结果,93%的学生只浏览4页或更少的结果。因为搜索引擎报告的每个搜索结果页面的链接数量不同,表4报告从前10个结果、后10个结果中选择链接的频率,依此类推。在所有的搜索中,只有3个被屏蔽的链接,这表明屏蔽软件对这些结果没有显著的影响。

成功搜索特征

在学生试图回答的68个问题中,有7个是在学生放弃后放弃的,有2个是在课程结束后放弃的。在其余61次搜索中,47次成功地找到了健康问题的完整、正确和有用的答案,其余14次没有成功。不成功的答案中有6个是完全错误的,没有用处,4个是有用的,但只是部分正确,4个是完全正确的,但没有用处。

有几个因素有助于成功地找到正确、完整和有用的答案。一个重要的因素是进行搜索的个人。虽然每个学生至少回答了一个问题,但正确答案的数量差异很大。2名同学成功回答了6道题,3名同学成功回答了5道题,4名同学成功回答了4道题,剩下的3名同学只成功回答了1或2道题。虽然我们的学生样本太小,无法得出结论,但没有观察到明显的模式表明种族、性别、互联网经验或健康搜索经验是成功的重要决定因素。然而,年龄较大的青少年(16-17岁)成功率为87%(30人中有26人),而年龄较小的青少年成功率为68%(31人中有21人)。

另一个重要因素是问题本身的难度。表5显示每个问题的不合格率。4个部分正确的答案被平均分配给了匿名戒酒会和纹身的问题。所有4个正确但无用的答案都来自艾滋病毒测试问题。

表5所示。按搜索主题进行的不成功搜索
搜索主题 不成功的搜索
n
艾滋病毒检测 8 38.1
帕罗西汀 4 19.0
匿名戒酒互助社 3. 14.3
纹身 3. 14.3
吸烟 2 9.5
糖尿病 1 4.8
总计 21 100.0

某些搜索行为会导致包含答案的网站比其他网站更频繁。总的来说,学生们在22%的网站上找到了答案(215个网站中有47个)。他们通过5种方式访问网站。虽然不经常采取,但成功率最高的行动(47%;15个站点中有7个是跟随从一个非搜索引擎站点(如www.aa-intergroup.org)到另一个站点(如www.alcoholics-anonymous.org)的链接。在大多数情况下,学生直接从搜索引擎访问第一个站点。点击搜索引擎结果后,学生能在21%的情况下找到答案(166个问题中有35个)。从搜索引擎提供的列表或菜单中点击推荐链接的成功率相似(18%;22中的4个)。直接输入URL,完全绕过搜索引擎,成功率只有9%(1 / 11)。 A sponsored link from a search engine was followed only once, and the student found an incorrect answer on that site.

另一个与成功相关的因素是搜索词的拼写错误。在14个完成但不成功的搜索中,29%(4次搜索)至少有1个拼写错误,而在47次成功搜索中,只有15%(7次搜索)拼写错误。也许更能说明问题的是,有拼写错误的成功和不成功的搜索比没有拼写错误的搜索平均要多花1.5分钟。观察证实,一些学生在发现并纠正拼写错误之前无法找到答案,从而获得更高质量和更相关的结果。

其他搜索特征对搜索是否成功没有统计学上的显著影响,尽管这可能是由于样本量小。例如,搜索引擎在成功搜索的百分比上没有显著差异。同样,每个搜索字符串的平均单词数与搜索成功率没有显著相关。(数据未显示。)

定性分析

青少年搜索者的某些共同行为在定量分析中并不明显。

首先,学生们在网上搜索健康信息时非常舒适和自信。大多数学生知道他们想从哪里开始搜索,并使用快速点击鼠标和快捷键进行导航。然而,这一特征在我们的人群中可能被过度代表,因为他们的学习成绩和互联网熟练程度都很高。

其次,一些搜索者没有花太多时间来制定搜索策略或(当适用时)选择搜索词。相反,这些搜索者似乎会输入脑海中浮现的第一个搜索字符串。如果结果与预期不符,则键入另一个搜索字符串,有时甚至不单击第一个搜索字符串的任何结果。总体方法是一种反复试验的方法,经常回溯。搜索字符串最常见的问题是它们不够具体。例如,两名不同的学生在寻找提供免费和保密的艾滋病毒检测的地方时输入了搜索字符串“hiv”。

第三,大多数学生快速浏览页面,在一页中从一个地方跳到另一个地方,很少阅读整个段落。在某些情况下,一个问题的答案包含在一页纸上,但学生在找到它之前就离开了。在其他情况下,可能导致答案的链接被遗漏了。这一发现支持了先前关于青少年搜索行为与非健康话题相关的研究[7-10]。

第四,学生们提到他们会故意避开赞助链接和广告,尽管事实上许多搜索引擎会先显示这些结果。定性数据证实了这一做法,因为只有一个赞助链接被选中。

最后,几乎没有人注意到答案的来源。在绝大多数情况下,一旦找到答案,就会简单地认为它是正确的。


与先前的研究相比,本研究的结果显示青少年和成年人在搜索健康信息时的行为有许多相似之处,也有一些关键的区别。这项研究发现,青少年在搜索健康信息时几乎每次都使用搜索引擎。这一发现与艾森巴赫研究中对成年人的描述相似[15]。这些观察性研究还表明,关于搜索引擎使用的事后调查问题可能低估了这种行为。例如,两项具有全国代表性的调查显示,58%的年轻人(书面交流,2001年12月;Generation RX.com调查打印件;V. Rideout, Henry J. Kaiser Foundation, Menlo Park, CA)和81%的成年人[12开始在搜索引擎上寻找健康信息。我们的研究发现,青少年只依赖于前几个结果页面的链接,很少在任何网站上深入探索。这些结果也与成人的搜索行为相似[15],尽管年轻人似乎更有可能搜索前10个搜索结果之外的内容。青少年经常选择过于笼统和/或包含拼写错误的搜索字符串,因此他们并不总能找到可用的有用网站。Eysenbach还报告了成年人的搜索字符串过于笼统[15],然而,拼写似乎更多的是年轻人的问题。青少年在浏览网站时没有系统,有些网站组织得很差,以至于他们并不总是能找到他们想要的信息,即使这些信息已经出现在他们浏览的网站上。未来的研究需要更好地了解青少年是否不理解这些网站上提供的信息,是否他们只是缺乏耐心,或者其他原因。总之,对于成年人和青少年来说,许多特定的搜索策略是相似的,但是与拼写、网站浏览和对内容的理解有关的一些问题明显不同。

模拟搜索

这项研究的结果对任何模拟青少年健康搜索的人、健康信息的提供者和教育工作者都有意义。模拟青少年健康搜索有很多原因。例如,准备课程计划的教育工作者可能想要非正式地模拟搜索,以便在给定特定的搜索任务时预测学生可能会找到什么。研究人员可能希望更系统地模拟青少年的搜索,以评估特定主题信息的可用性和可获得性,评估应该向青少年推荐哪种搜索引擎,或评估过滤软件的安装是否会对健康信息的可获得性产生不利影响[13]。由于这些模拟模拟的许多搜索行为在青少年和成年人中都是相似的,因此模拟其中一组的研究结果可能适用于两组。

这项研究的结果表明,这样的模拟可以集中在搜索引擎的使用上,但也应该考虑到非常广泛的搜索词,尤其是对青少年来说,常见的拼写错误。广告和其他无结果链接可以忽略。由于超过80%的被关注的链接出现在前10个结果中,超过95%的链接出现在前40个结果中,因此搜索模拟不需要考虑这些结果之外的链接。

互联网健康内容提供商

鉴于本研究中发现的青少年搜索行为模式,健康内容提供者可以做几件事来增加青少年找到他们网站的可能性。由于青少年主要依赖搜索引擎的前几个结果,而不倾向于看广告,因此重要的是要确保在搜索健康术语时,健康网站出现在结果的顶部附近。域名中的关键字、页面标题、元标签和前几句话,以及来自其他网站的链接,都会影响在搜索结果中的位置。在元标记关键字和文本正文中包含一些常见的拼写错误可能也很有用,以便使站点出现在使用这些拼写错误的相关搜索词的搜索结果页面中。因为大多数主要的英语搜索引擎不再使用元标签的关键字功能,所以网站设计师面临着一项艰巨的任务,即在文本中输入拼写错误的单词(例如,拼写错误),同时又不会给人留下拼写不佳的印象。同样重要的是,在搜索引擎中显示的网站描述对青少年搜索者有吸引力:虽然我们的研究没有分析青少年选择跟随一个链接而不是另一个链接的各种原因,但我们确实观察到他们根据链接描述做出选择,而不是简单地选择提供的第一个链接。书籍和文章、软件和咨询服务都可以广泛使用,以改善搜索引擎的位置,并影响搜索引擎提取的简短摘要文本,以便在搜索结果中显示[2829]。投资大量资金开发复杂健康信息网站的组织最好多花一点钱,以确保这些网站很容易被找到。

互联网内容提供商应该关注的另一个领域是站点内导航。因为学生们倾向于在一个页面中从一个地方跳到另一个地方,并且按顺序阅读很少,所以重要的是,有大量青少年受众的网站组织良好,简洁易懂。冗长的段落、过多的链接和困难的词汇都会降低青少年找到他们正在寻找的健康信息的可能性,即使这些信息包含在一个网站中。互联网内容生产者应该尝试了解网站访问者的需求,并建立反映这些需求的层次结构。例如,如果个人访问匿名戒酒会网站的主要需求之一是寻找当地的聚会,那么网站的第一页应该包含一个明显的链接(例如,“寻找你附近的AA聚会”),在输入邮政编码或城市名称后,该链接会引导到另一个页面,返回最近的聚会。虽然站点内导航的便利性对健康信息网站的所有访问者都很重要,但一些信息提供者可能希望开发专门针对青少年的网站。虽然一旦他们找到了目标信息,他们可能会喜欢它,但我们观察到青少年倾向于依赖通用搜索引擎。因此,开发专门针对青少年的信息网站可能效用有限,除非同时进行广告或教育活动,使青少年更有可能找到这类网站。

与其改变网站或其在搜索引擎中的呈现方式,不如开展教育运动,改进青少年在寻找健康信息时使用的搜索策略和战术。引导他们使用面向青年的目录或搜索引擎,而不是通用的搜索引擎,可能会有所帮助。例如,Yahoo!和谷歌提供目录与网站的子类别为青少年设计,涵盖各种健康主题。通过在学校和图书馆的Web浏览器的起始页上包含指向这些资源的链接,可以促进这种方法。或者,青少年可以学习如何在通用搜索引擎中形成和精炼搜索词,根据返回的结果类型添加或删除更具体的词。他们可能还会被教导根据令人惊讶的搜索结果注意到潜在的搜索词拼写错误。最后,还可以教青少年如何系统地浏览网站,以找到他们正在寻找的那种信息。

局限性与未来研究

对这些结果的解释有几个重要的限制。

首先,这不是青少年的代表性或随机样本。这是一个小的便利样本,选择偏向于具有较强网络搜索能力的青少年。虽然结果不能推广到所有的青少年,也没有捕捉到青少年搜索经历的全部范围,但我们可以假设,在互联网上寻找健康信息时,普通青少年比我们的研究参与者遇到更多的麻烦。

其次,与健康相关的搜索问题被刻意构建,以避免有争议的话题,如安全性行为、堕胎和同性恋。鉴于青少年经常面临与性有关的健康问题,他们的实际搜索行为和在寻找与性有关的健康信息方面的成功可能不会反映在我们的结果中。另一个担忧是,参与者可能因为观察者的存在而改变了他们的搜索行为,因为他们意识到他们的搜索行为正在被记录。例如,找不到答案的学生可能比在非研究环境中坚持搜索的时间更长。另外,因为学生们知道他们在一节课上有几个搜索问题要回答,他们可能不会像搜索与个人更相关的问题和更少限制的搜索时间那样坚持不懈。因此,这里的数据反映了青少年寻找健康相关信息的持久性的粗略估计。此外,搜索是单独进行的,而实际上,在家里和学校的许多搜索都是与朋友、老师或附近的家人一起进行的。虽然在没有进一步研究的情况下很难知道这将如何影响搜索行为,但有可能学生的行为会有所不同(例如,在拼写方面得到帮助)。

最后,虽然之前已经验证了成功搜索和不成功搜索分类方案的组件,但是修改了整个方案,以便更准确地将搜索结果编码为正确、完整和有用的。对健康信息搜索结果的编码方案进行更系统的验证是未来研究的一个重要领域。

需要更多的研究来验证本文中提出的结果,并确定结果是否因不同的人群(例如,年龄、种族和健康搜索经验)和不同的健康问题(例如,寻找医生与寻找问题的答案)而有所不同。此外,未来的研究可能还需要探索旨在改善青少年搜索健康信息的干预措施,而不是关注青少年目前如何搜索健康信息。例如,是否应该使用为青少年设计的健康门户网站或在线目录?或者目前使用普通搜索引擎的做法,但随着青少年学习改进的搜索策略会更有效吗?同样,什么样的搜索策略能找到最准确、最能影响青少年改变行为的网站呢?

结论

这项研究为当前青少年的搜索模式提供了一个有用的快照。研究结果对构建搜索行为的真实模拟,以及对信息提供者和教育者都有启示。通过实际观察分析搜索行为应该成为任何改善青少年获取健康信息的努力的基石。

致谢

这项研究是由密歇根大学健康媒体研究实验室进行的。除了作者,Ed Saunders和Mike Nowak协助观察和编码这项研究。Suresh Bhavnani对我们的研究设计提供了宝贵的反馈。

这项研究的资金是根据凯撒家庭基金会的合同提供的。

利益冲突

没有宣布。

  1. 在线医疗革命:网络如何帮助美国人更好地照顾自己。华盛顿:皮尤互联网与美国生活项目;2000.URL:http://www.pewinternet.org/reports/pdfs/PIP_Health_Report.pdf
  2. Baker L, Wagner TH, Singer S, Bundorf MK.使用互联网和电子邮件获取医疗保健信息:一项全国性调查的结果。中国医学杂志2003年5月14日;289(18):2400-2406。[CrossRef] [Medline
  3. Rideout V. Generation RX.com:年轻人如何使用互联网获取健康信息。门洛帕克,加州:亨利·j·凯泽家族基金会;2001.URL:http://www.kff.org/content/2001/20011211a/GenerationRx.pdf
  4. 青少年上网获取健康信息:一种跨越障碍的新资源。中华儿科与青少年医学杂志;2001;31(7):813-817。[Medline
  5. Klein JD, Wilson KM, Mcnulty M, kapphhan C, Collins KS。青少年获得医疗保健的机会:1997年联邦基金少女健康调查的结果。青少年健康杂志1999;25(2):120-130。[Medline] [CrossRef
  6. .在:克兰西RE,编辑;商务部。一个在线的国家:美国人如何扩大他们对互联网的使用。: Nova Science Pub Inc;2002年5月1日。URL:http://www.ntia.doc.gov/ntiahome/dn/
  7. 张建军,张建军。网络用户信息搜索的相似性与差异性研究。Inf Process management 2002 Sep;38(5 Special Issue SI):649-670。[CrossRef
  8. 华莱士RM, Kupperman J, Krajcik J, Soloway E.网络科学:六年级课堂学生的在线学习。学习科学[J]; 2000;9(1):75-104。[CrossRef
  9. Lyons DJ, Hoffman JL, Krajcik JL, Soloway E.在科学课堂中使用万维网进行在线查询的调查。发表于:全国科学教学研究协会会议;1997年3月;伊利诺伊州奥克布鲁克
  10. Fidel R, Davies RK, Douglass MH, Holder JK, Hopkins CJ, Kushner EJ,等。访问信息中心:高中生的网络搜索行为。[J] .社会科学学报,1999,30(1):24-37。[CrossRef
  11. 儿童对雅虎流氓的使用!网络搜索引擎:2。研究任务中的认知和身体行为。[J] .光电工程学报,2001,25(2):1183 - 1183。[CrossRef
  12. 克莱恩RJ,海恩斯KM。消费者健康信息在互联网上的搜索:最先进的状态。健康教育,2001;16(6):671-692。[Medline] [CrossRef
  13. 李国强,李国强,李国强。色情屏蔽软件会阻止人们访问互联网上的健康信息吗?美国医学杂志2002年12月11日;288(22):2887-2894。[Medline] [CrossRef
  14. 葛雷NJ, Klein JD, Sesselberg TS, Cantrill JA, Noyce PR.青少年健康素养与互联网。青少年健康杂志2003;32(2):124。[CrossRef
  15. 消费者如何在万维网上搜索和评价健康信息?使用焦点小组、可用性测试和深度访谈进行定性研究。中国医学杂志2002年3月9日;324(3):573-577 [j]免费全文] [PMC] [Medline] [CrossRef
  16. Smith M, Gertz E, Alvarez S, Lurie P.互联网上性教育信息的内容和可及性。健康教育行为学2000;27(6):684-694。[Medline
  17. 刘建军,曾庆平,李建平,等。患者信息检索中的问题与挑战:一项描述性研究。程序AMIA Symp 2001:329-333。[Medline
  18. 网络搜索研究综述及未来研究框架。[J] .光电学报;2001;32(3):235-246。[CrossRef
  19. 伍兹AH,艾伦MJ,克莱因JD。青少年使用互联网作为健康信息资源的情况。青少年健康杂志2000年2月;26(2):124。
  20. 李建军,李建军,李建军,等。过滤软件的误差率计算。ACM通讯:计算机协会。(印刷中)。
  21. Camtasia[计算机程序],版本3.0.1 Okemos, MI: TechSmith;2002.
  22. Ericsson KA, Simon HA。方案分析:口头报告作为数据。马萨诸塞州剑桥:麻省理工学院出版社;1984.
  23. 青少年网络生活:即时通讯一代的崛起和互联网对友谊和家庭关系的影响。华盛顿特区:皮尤互联网与美国生活项目;2001.URL:http://www.pewinternet.org/reports/toc.asp?Report=36
  24. 谢义。网络搜寻行为研究。情报学报,2001;23(2):167-185。[CrossRef
  25. Huberman BA, Lada AA。互联网:全球网络的发展动态。自然1999年9月;401:131。
  26. ;世界戒酒互助会匿名戒酒会的主页。URL:http://www.alcoholics-anonymous.org/[2002年1月14日访问]
  27. ;葛兰素史克。帕罗西汀主页。URL:http://www.paxil.com/[2002年1月访问]
  28. 搜索引擎可见性。印第安纳州印第安纳波利斯:新骑手出版社;二二年十二月三十日。
  29. ;Jupitermedia公司搜索引擎观察网站主页。URL:http://www.searchenginewatch.com/[2003年10月14日访问]

G·艾森巴赫编辑;提交19.09.03;经N Gray、M Koo同行评审;对作者的评论28.09.03;修订版本收到14.10.03;接受14.10.03;发表17.10.03

版权

©Derek L Hansen, Holly A Derry, Paul J Resnick, Caroline R Richardson。原发表于医学互联网研究杂志(//www.mybigtv.com), 2003年10月17日。除非另有说明,发表在《医学互联网研究杂志》上的文章是在知识共享署名许可(http://www.creativecommons.org/licenses/by/2.0/)的条款下发布的,该许可允许在任何媒体上不受限制地使用、分发和复制,前提是正确引用原创作品,包括完整的参考书目细节和URL(见上面的“请引用”),并包括本声明。

Baidu
map