JMIR J医疗互联网服务 医学互联网研究杂志 14388871 卡塔尔世界杯8强波胆分析JMIR出版公司 加拿大多伦多 v15i9e192 23999327 10.2196 / jmir.2180 原始论文 博客提及的香港饮酒资讯流行病学:资讯监察研究 Eysenbach 冈瑟 忠实的否决权 Onicio 杜兰特 凯萨琳 Yunliang 井泉 Perez-Rey 大卫 西 约书亚 常ydF4y2Ba 吉隆坡 黑带大师 1 SY 博士学位 1
香港大学公共卫生学院 薄扶林沙宣道21号 香港 中国(香港) 852 28199883 852 28559528 syho@hku.hk
TH 医学博士 1
1 香港大学公共卫生学院 香港 中国(香港) 通讯作者:何思宇 syho@hku.hk 09 2013 02 09 2013 15 9 e192 23 05 2012 29 07 2012 29 08 2012 25 06 2013 ©陈家良,何诗诗,林舜天。最初发表于《医疗互联网研究杂志》(//www.mybigtv.com), 2013年2月9日。 2013

这是一篇开放获取的文章,根据创作共用署名许可(http://creativecommons.org/licenses/by/2.0/)的条款发布,允许在任何媒介上无限制地使用、分发和复制,前提是正确引用最初发表在《医学互联网研究杂志》上的原创作品。必须包括完整的书目信息,//www.mybigtv.com/上的原始出版物的链接,以及此版权和许可信息。

背景

在2007年和2008年,香港的啤酒和葡萄酒税减半,然后取消,导致酒精消费增加。互联网的普及和青少年和成年人的高博客率为通过信息流行病学研究饮酒模式提供了独特的机会。

客观的

评估及解释2005-2010年香港人(以香港中文博客网站的博客作者为代表)在网上使用与酒精相关的中文关键词的情况,并验证博客搜索可作为一种资讯监察方法,以调查香港人饮酒模式(如酒精种类)的变化。

方法

博客搜索是使用博客搜索引擎谷歌博客搜索完成的,在香港博客服务提供商MySinaBlog的档案中,从2005年到2010年。使用了三组中文关键词,每组代表一个与酒精相关的特定概念:(1)“酒精”(即控制概念),(2)“啤酒或葡萄酒”,以及(3)“烈酒”。使用信息流行病学指标和相关系数对产生的博客文章进行定量分析,并通过人工工作进行定性分析。信息流行病学指标为(1)表观流行率,(2)实际流行率,(3)流行率,(4)流行比。Pearson和Spearman相关性计算了患病率和与人均酒精消费量的比率。手工分析主要集中在(1)博客作者特征(如作者、性别、年龄)和(2)博客内容(如关键词出现频率、对某一段饮酒事件的描述、饮酒量和类型)。

结果

2008年和2008-2009年,“酒精”和“烈酒”等与酒精相关的概念在网上的使用率显著上升,但“啤酒或葡萄酒”等相关概念的使用率逐年下降。信息流行病学和流行病学数据之间的相关性仅对“酒精”患病率有显著意义。大多数博客都是由单个作者管理的。性别分布均匀,以18岁及以上为主。并不是所有的中文关键词都被找到了。许多博客文章并没有描述一个单独的饮酒事件,而是被归类为个人日记、观点或情感发泄。其余的缺乏饮酒量的信息,这阻碍了对酗酒的评估。

结论

与酒精相关的中文关键词在网上的流行归因于许多不同的因素,包括垃圾邮件,因此不能具体反映当地的饮酒模式。信息流行病学数据(以酒精相关概念的患病率和比例表示)与流行病学数据(以人均酒精消费量表示)之间的相关性较差。许多博客文章本质上是情感的,而不是信息的。如果有足够的专业知识和资源,建议对博客内容进行语义分析。

饮酒 写博客 博客搜索 中国人 香港 infodemiology infoveillance 互联网
简介 香港的饮酒及税收政策

酒精是一种人类致癌物,尽管经常被忽视。 1].它每年在全世界造成250万人死亡[ 2],联合国已将其有害使用确定为非传染性疾病的四个最重要风险因素之一[ 3.].在香港,虽然酒精消费量仍然很低,但并不罕见。由于缺乏对非营业场所销售最低年龄的规定(“营业场所”指的是获发售酒许可证的餐馆和酒吧),一般民众很容易获得酒精饮料。[ 4 5].本港研究显示,近三分之一的成年人及四分之一的中学生饮酒[ 6].对健康的不良影响令人生畏。根据卫生署在2006-10年度公布的数据,每年平均有超过2000宗因与酒精有关的疾病而住院病人出院及死亡的个案[ 6].

不过,香港特别行政区政府已于2007年将酒度不超过30%的啤酒及葡萄酒的关税减半[ 7],并于2008年全面废除[ 8].烈度超过30%的烈性酒的税率维持在100% [ 8].这些前所未有的反公共卫生政策,旨在帮助香港发展成为国际葡萄酒贸易中心,但代价是酒精对公众健康的危害增加。[ 9].卫生署酒精与健康工作小组注意到,2008年香港的人均酒精消费量大幅上升,原因是同年啤酒及葡萄酒价格下跌[ 4].这与112项研究的元分析相呼应,该分析发现酒精税或价格与消费量成反比[ 10].在芬兰,2004年将酒精饮料的消费税降低了三分之一,导致酒精消费量和相关危害明显上升[ 11],包括住院率[ 12]和突然死亡人数[ 13].香港啤酒和葡萄酒税收政策的急剧变化为使用信息流行病学研究饮酒提供了独特的机会。

信息流行病学和信息监视

信息流行病学是信息和流行病学的合成词,根据Eysenbach的说法,信息流行病学是"研究电子媒介,特别是因特网或人群中信息的分布和决定因素的科学,其最终目的是为公共卫生和公共政策提供信息" [ 14 15].它是基于人口健康状况/态度/行为与互联网上的信息模式之间的双向关系[ 15 16].最初用于识别互联网上不准确的健康信息[ 17],后来发现搜索引擎查询数据可以预测流感的流行[ 18].由于信息流行病学在公共卫生和政策方面的意义,它一直被用作传统流行病学研究的补充。[ 15 16],使用分析方法和指标,如关键词流行率和流行率[ 14].用于监测和趋势分析的信息流行病学指标的纵向跟踪被称为信息监测[ 14 15].

在过去的十年里,人们努力克服了从网上数据库中收集和分析大量非结构化信息的困难。[ 15 16].公共卫生部门内资讯流行病学的例子包括透过追踪搜寻查询,侦测疾病爆发或发病率[ 16 18- 20.],调查网上搜寻自杀相关资料的行为[ 21],监测公众对与健康有关的政策和运动的反应[ 22 23],以及从Twitter等社交网站的用户帖子中识别公众健康问题[ 24].一些计算机工具也已经开发出来,可以进行更有效的信息流行病学分析(例如,技术社会预测分析[ 25]、Infovigil [ 15]、全球公共卫生情报网及“健康地图”[ 26])。所有这些都以Web 2.0技术为基础,其特点是个性化、开放性、社会性和微内容[ 27].Web 2.0的一个成熟例子是在线社交网络。

在线社交网络,博客和博客搜索

在线社交网络在不断发展。利用适当的挖掘和分析技术[ 28],便有可能从这些网站撷取有用的资料作研究用途。博客(也叫weblogs)是一种社会网络网站,被认为是一种相对较新的主流个人交流形式[ 29 30.].它们的特点是个性化的、基于web的、社区支持的和自动化的[ 31].博客内容是万能的。它们可以是关于博主的生活、评论、想法和情感。他们也被用来建立和维护社区论坛[ 32].虽然有些博客被用于政治、教育和商业目的[ 33],大部分类似日记,被称为个人博客[ 34].使用博客服务的人被称为博主。

与其他社交网站一样,博客以其时间戳、消费者生成的内容和可扩展的数据库为特色,这使得它们在纵向数据检索和分析方面具有潜在的用处[ 35 36].事实上,博客分析在各个领域都越来越受欢迎。其应用实例包括评估一家公司的形象实力或客户产品,监测总统选举中的公众舆论,评估公众对灾难的反应,追踪网上仇恨团体或有自杀意图的人,研究青年文化,以及分析语言模式[ 34 37- 40].进行博客分析进行公共监督的前提是,有很大一部分人经常使用社交网络服务,使网络信息保持最新,真正反映当代社会的兴趣或关注。[ 25].

香港互联网使用与部落格:在本地公共卫生研究中应用部落格搜寻

在香港,互联网的使用无处不在。根据香港特别行政区政府的一项调查,本港人口的互联网普及率持续上升,由2005年的56.9%上升至2012年的72.8%。近70%的网民是10-44岁的青少年和成年人[ 41].他们也是参与博客和论坛等在线社交网络活动的最大群体[ 42].这与Blog-You.com和in - media在2005年的一项更早的研究相一致,该研究发现,超过90%的本地博主年龄在16-35岁之间[ 43].资讯流行病学利用部落格搜寻资料,有助研究本港青少年及成人的重要健康问题,例如饮酒问题。

博客分析有不同的方法。有些(如时间序列扫描,语义分析)需要特殊的软件和大量的时间和计算资源的投资[ 35].这大大降低了它在公共卫生研究中的实用性,这些临床医生可能不太了解计算机编程。另一方面,使用在线免费提供的博客搜索引擎进行博客搜索,在技术上提供了从博客中提取数据的简单、直接和用户友好的方法。与Web搜索引擎不同,博客搜索引擎主要是对博客文章进行索引,并且只致力于从博客文章中搜索信息,而忽略了数据库的其他部分[ 44].由于每篇博客文章都有时间戳,博客搜索引擎可以搜索特定日期的博客文章,允许纵向跟踪博客,甚至回溯。

目前,使用博客搜索和中文关键字进行的地方公共卫生研究很少。如果博客搜索数据与当地流行病学数据相关联,临床医生(和政策制定者)可以很容易地用实时、廉价、快速的博客搜索来取代传统的监测方法来跟踪公共健康。即使没有相关性,像这样的解释性研究通过展示中文博客搜索在英语主导的研究环境中的挑战,仍然有助于健康信息学的发展。由于零啤酒和葡萄酒税,香港的酒精消费量明显上升,这为博客搜索数据可以根据本地流行病学进行验证提供了一个合理的框架。

研究目标与假设

本研究利用现有的搜索工具及网络资源,旨在:(1)评估及解释与酒精相关的中文关键词在网上的使用情况;(2)验证博客搜索作为一种资讯监测方法,以调查2007- 08年啤酒及葡萄酒税变更后香港人(以香港中文博客服务供应商的博客作者为代表)饮酒模式(如酒精种类)的变化。

本研究假设如下:

(H1) 2007- 2008年之后,随着啤酒或葡萄酒税收政策的变化,中国博客中与酒精相关的概念,尤其是“啤酒或葡萄酒”的网络流行度有所上升。

(H2)信息流行病学数据(以酒精相关概念的患病率和比例表示)与当地流行病学数据(以人均酒精消费量表示)显著相关。

方法 研究设计

据我们所知,这是香港首次使用博客搜索来研究与公共健康有关的课题。选择饮酒问题是因为其公共健康利益和税收政策变化的明显影响。博客是数据提取的目标,因为选择本地排名和访问者最高的博客服务提供商可以最大限度地提高区域利益,而不像Twitter或Facebook等其他社交网站往往覆盖广泛的地理区域。

本研究主要有两组数据:(1)信息流行病学和(2)流行病学。信息流行病学数据来自特定搜索引擎索引的现有博客,而流行病学数据来自涉及公共卫生问题的政府文件。为了减少专业知识和技术投资,本研究使用免费的基于网络的博客搜索引擎谷歌博客搜索,从香港博客服务提供商MySinaBlog的档案中提取2005-2010年的数据。研究人员使用了三组中文关键词,每组代表一个特定的与酒精相关的概念。它们是(1)“酒精”(即控制概念),(2)“啤酒或葡萄酒”,以及(3)“烈酒”。使用信息流行病学指标和相关系数对产生的博客文章进行定量分析,并通过人工工作进行定性分析。信息流行病学指标为(1)表观流行率,(2)实际流行率,(3)流行率,(4)流行比。Pearson和Spearman相关性计算了患病率和与同期人均酒精消费量的比率。人工分析包括:(1)博客作者特征(如作者、性别、年龄),(2)博客内容(如关键词出现频率、对某段饮酒事件的描述、饮酒量、类型)。采用流行率和比例来评估酒精相关概念的网络流行程度,而通过相关分析和人工分析来验证博客搜索数据是否可以作为人口调查的信息监测方法。

收集资讯病学资料 博客服务商

博客服务提供商的在线数据库支持搜索任务和信息病学数据的收集。入选标准为(1)免费,(2)目前正在使用,(3)最近一次更新是在2010年或之后。因此,共有19家博客网站从852.com [ 45],这是一个以香港为基地的网页目录,而TopTenREVIEWS [ 46,一个媒体评论网站。他们的在线流量数据来自两家网络信息公司:Alexa Internet [ 47]及StatsCrop [ 48],显示在 表1.如果(1)唯一可用的数据来自他们的非博客域服务器,或者(2)数据不可用,他们就会被排除在外。其余的是根据本地受欢迎程度(由Alexa在香港的流量排名和来自香港的每日访客百分比衡量)和主要国家/服务器位置进行比较,以最大限度地提高地区利益。总部位于香港的博客服务提供商MySinaBlog最终入选,其本地排名为201,超过一半的访问者来自香港。

Alexa在香港的流量排名,来自香港的每日访客百分比,以及主要国家一个(截至2013年4月12日)。

URL 香港Alexa流量排名 每日从香港来港旅客的百分比 主要的国家
blogcity.me 1145 74.2 香港
blog.mingpao.com 94b 56.8b 香港
blog.yahoo.com/explorer/hk 4b 0.8b 美国
hk.xanga.com 571 5.4 美国
lifestream.aol.com 资料不可用 资料不可用 美国
mysinablog.com 201 50.8 香港
qooza.hk 417 35.7 香港
showhappy.net 资料不可用 资料不可用 美国
spaces.live.com 资料不可用 资料不可用 伊朗
space.gogo.la 1352b 67.0b 香港
space.uwants.com/html/blog.html 22b 57.4b 香港
wordpress.com 资料不可用 资料不可用 美国
www.blogger.com 资料不可用 资料不可用 印度
www.ezhk.net 资料不可用 资料不可用 香港
www.hkflash.com/diary 7012b 25.6b 韩国
www.livejournal.com 资料不可用 资料不可用 俄罗斯
www.mocasting.com 16435年 51.8 中国
www.myspace.com 资料不可用 资料不可用 美国
www6.mobichai.com/blog 资料不可用 资料不可用 香港

一个或者服务器位置,如果主要国家不知道。

b表示来自其非博客域服务器的唯一可用数据。

博客搜索引擎和搜索查询

Thelwall的一项研究比较了11个博客搜索引擎的能力和局限性。 44].其中,谷歌博客搜索是唯一一个具备以下所有功能:(1)全布尔搜索,(2)用户指定日期或日期范围搜索,(3)URL搜索,(4)语言选择,(5)单词位置。因此,本研究采用了这种方法。

在每个搜索查询中,包括:(1)与酒精相关的中文关键字,由布尔运算符“OR”连接,以及(2)博客服务提供商的URL,表示为“site:mysinablog.com”。为了获得博客文章的总数,将关键字替换为空格。日期指定为2005-2010年每年的1月1日至12月31日。时间框架是这样决定的,因为MySinaBlog在2005年开始运行他们的服务。 49],而有关香港人均饮酒量的流行病学数据仅截至2010年为止[ 4].搜索结果(即匹配的博客文章数量)用于信息流行病学分析。

与酒精相关的概念和关键词 概述

在这项研究中,与酒精相关的特定关键词组形成了博客搜索的基础。每个组对应一个概念,由多个由布尔运算符“OR”连接的关键字组成(这将返回包含任何搜索词的博客文章),以探索同一概念,正如Eysenbach在他的信息流行病学和信息监视框架中所建议的[ 14].这些概念是(1)"酒精",(2)"啤酒或葡萄酒",以及(3)"烈酒"。之所以选择这类酒,是因为啤酒和葡萄酒的酒精浓度不超过30%,香港特区政府正是在2007年将这类酒的关税减半,并于2008年取消。为了更好地比较“啤酒或葡萄酒”和“烈酒”的概念,我们选择“酒精”作为对照(即更广泛的)概念来计算流行率和流行率。

图1显示输入到搜索字段中的概念和关键字。所有关键词均为繁体中文,在香港,繁体中文比简体中文或英文更常用。与同时使用中文和英文关键词相比,可以(1)增强输出数据的同质性;(2)减少输出数据的大小,便于后续的人工分析。

关键字“酒精”

英文单词“alcohol”(酒精)用林语堂的《汉英现代用法词典》(网上版)翻译成中文[ 50].一般来说,两个或两个以上的汉字组成一个汉字。不同的中文单词可能有相同的意思,而有些中文单词可能有不止一个意思。为减少混淆和扩大搜索范围,只显示中文字符 图1用来表示酒,而不是其他具有相同意思的中文单词。然而,值得注意的是,一些中文翻译只是简单地从英语的自然发音中取了下来,而没有包括酒精的中文字符(如,champagne, whisky, brandy)。中所示的“酒精”一词,要保证所有啤酒、葡萄酒和烈性酒的搜索结果都能被完全覆盖是不可能的(也是不切实际的) 图1.尽管如此,作为本研究的对照概念,它已经提供了最大的纳入量。

关键词“啤酒还是葡萄酒”与“烈酒”

属于"啤酒或葡萄酒"及"烈酒"概念的关键词取自香港特别行政区政府海关发出的一份文件[ 51,这与有关改变啤酒和葡萄酒税的预算提案有关。他们对比了税收政策带来的影响。酒精浓度可变的通用术语被排除在外(如清酒、糖酒、再加工中国白酒)。其余的酒精浓度不超过30%的被归为“啤酒或葡萄酒”,否则被归为“烈酒”。

将与酒精相关的概念及其对应的中文关键词输入搜索栏。

收集流行病学数据

表2显示香港特区政府卫生署于2011年发表的报告所载的人均饮酒量[ 4].在我们的研究中采用它是因为(1)它是免费获取的,(2)以纵向形式呈现,(3)根据酒精类型分组。2011年的数据无法获得,迄今为止也没有看到数据的更新。

定量分析 信息流行病学指标:表观流行率、实际流行率、流行率和流行比

Eysenbach主张使用相对指标,例如比率,来代替绝对数字来代表信息普及,因为网站的数量是不断变化的[ 15].对他的建议稍加修改后,使用以下信息流行病学指标来表示博客文章中概念的在线流行程度:(1)表观流行度,(2)实际流行度,(3)流行率,(4)流行率。度量标准的定义/公式见 图2.表面上的流行程度指的是博客搜索引擎的估计,而实际的流行程度是由访问每个网站时进行计数的研究人员确认的。因为博客文章的总数也是由博客搜索引擎估计的,所以使用了表观流行率而不是实际流行率来计算流行率。同样,流行率的计算采用表观流行率而不是实际流行率,以避免相关分析中的混淆。

2005-2010年香港酒类总消费量及人均消费量(根据香港特别行政区政府卫生署资料改编)。

一年 纯酒精总消耗量(升) 年龄≥15岁的人口 人均酒精消费量(升)
啤酒和葡萄酒 精神 啤酒和葡萄酒 精神
2005 9382633年 5376813年 5844300年 1.61 0.92
2006 9442114年 5586247年 5918000年 1.60 0.94
2007 9878382年 5927246年 6004700年 1.65 0.99
2008 12309905年 5946634年 6075400年 2.03 0.98
2009 11973446年 4244254年 6130300年 1.95 0.69
2010 11252645年 5156867年 6209800年 1.81 0.83

信息流行病学指标的定义/公式。

皮尔森和斯皮尔曼相关性

通过相关分析来验证信息流行病学数据在调查当地人口饮酒模式时的使用,如图所示 表3.基本上,信息流行病学数据(即患病率和比率)是自变量,而流行病学数据(即人均酒精消费量)是因变量。皮尔逊和斯皮尔曼相关性使用社会科学统计软件包(SPSS)计算。

定性分析

博客搜索完成后,博客文章被保存在。html文件中,以供后续分析,以避免由于时间延迟造成的差异。手工分析主要集中在(1)博客作者特征(即作者、性别和年龄)和(2)博客内容(即关键词出现频率、对某一段饮酒事件的描述、饮酒量和类型)。他们将为流行病学调查中使用博客搜索数据的有效性提供进一步的信息。它们的子类别和标准列于 表4

以“酒精”为关键词的博客文章不包括在人工分析中,因为其中很大一部分预计会与包含“啤酒或葡萄酒”和“烈酒”关键词的博客文章重叠。它们在分析人群的饮酒模式(如酒精的选择)时可能没有特别的帮助。

值得注意的是,大多数免费文本分析工具不支持中文,也无法识别关键字在博客中的位置(例如,页眉、正文、边栏、页脚和评论)。目前可用的中文索引并不太方便使用,因为它们缺乏外部编码器/解码器、上下文关键字(KWIC)格式,或用于语义分析或意见挖掘的内置字典[ 52].这就是为什么在本研究中选择人工分析作为初步措施来探索博客作者特征和博客内容。

信息流行病学和流行病学数据的相关性。

Infodemiological数据 流行病学数据
“酒精”流行率 所有酒类的人均消费量
“啤酒或葡萄酒”的流行率 啤酒和葡萄酒的人均消费量
“精神”患病率 人均烈酒消费量
"啤酒或葡萄酒" / "酒精"流行率 啤酒和葡萄酒的人均消费量
"烈酒" / "酒精"流行率 人均烈酒消费量

2005-2010年myinablog中包含“啤酒或葡萄酒”和“烈酒”关键词的博客文章的类别、子类别和手动分析标准。

类别 子分类
作者 (1)单个作者,或(2)多个作者
(1)女性,(2)男性,或(3)未知
年龄 (1)未满18周岁,(2)年满18周岁,(3)不明
关键词出现频率 不适用
对一次饮酒事件的描述 (1)是,或(2)不是
饮用量 (1)酗酒,(2)非酗酒,(3)不确定
类型 (1)不属于酒精的地方/人物/实体名称,如歌词,(2)食谱/菜肴名称,(3)外部来源的新闻/复制文章,(4)故事叙述/电影简介,(5)健康/教育信息,(6)无主见的特色文章,(7)个人日记/观点/情感宣泄,或(8)以上一项以上
结果 概述

博客搜索是在2013年4月12日完成的,人工分析是由研究员KL Chan在随后的一周完成的。结果如下所述。

定量与相关分析 表观患病率和实际患病率

表5显示MySinaBlog的博客总数在5年内急剧增长,从2005年的不到500篇增加到2010年的2万多篇。除2010年“啤酒或葡萄酒”和“烈酒”的使用率较前一年有所下降外,“酒精”、“啤酒或葡萄酒”和“烈酒”的使用率也呈上升趋势。

“酒精”的明显流行度始终高于“啤酒或葡萄酒”和“烈酒”,这是有道理的,因为“酒精”是控制概念。然而,2005年,"酒精"的明显流行率仅为3%,而"啤酒或葡萄酒"的流行率为5%。这可能是由于翻译困难,“酒精”的中文字符没有涵盖“啤酒或葡萄酒”和“烈酒”等所有关键词。另一方面,2005-2007年和2010年,“啤酒或葡萄酒”的明显流行度高于“烈酒”。然而,在2008年,两者不相上下。2009年,“烈酒”的明显流行度超过了“啤酒或葡萄酒”,相差17个百分点。

在这三个概念中,当它们的值增大时,表观患病率和实际患病率之间的差异变得更加明显。例如,2005年"酒精"的表观流行率为3,与实际流行率相同;但在2006年,随着前者增加到26个,两者相差了12个。到2010年“酒精”的表观流行度达到1390时,“酒精”的实际流行度仅为195,相差1195。特别值得注意的是,由于博客中的垃圾邮件,2008年和2009年“烈酒”的实际流行度分别为12和13,远低于表面流行度(分别为73和115)。“酒精”和“啤酒或葡萄酒”的表观流行率和实际流行率的趋势基本对称,但在2010年,“啤酒或葡萄酒”的实际流行率达到峰值,而不是下降。

从2005年到2010年,在我的博客中,与酒精相关的概念的博客文章总数、表面和实际流行率。

一年 博客文章总数 表观患病率(实际患病率)
“酒精” “啤酒还是葡萄酒” “精神”
2005 394 3 (3) 5 (5) 0 (0)
2006 1810 26日(14) 16 (15) 3 (3)
2007 5620 120 (59) 27日(15) 5 (5)
2008 11500年 1180 (150一个 73 (28) 73 (12a、b
2009 16000年 1290 (190一个 98 (25) 115 (13a、b
2010 20400年 1390 (195) 70 (41c 3 (3)

一个最终的数据包括那些最初被隐藏并由博客搜索引擎提示的博客文章。

b在排除了实际上不包含关键词的垃圾博客之后。

c在排除了一篇由于安全原因无法访问的博客文章之后。

患病率及相关系数

表6结果表明,“酒精”的患病率呈倒V型,从2005年的0.76%稳步上升到2007年的2.14%,2008年达到峰值10.26%,2009年下降到8.06%,2010年下降到6.81%。“啤酒或葡萄酒”的流行率逐年下降,2007年首次跌至0.48%,2010年第二次跌至0.34%。“精神”的患病率正好相反,在2005-2007年徘徊在0% - 0.17%的低水平,然后在2008-2009年飙升至0.72%,最终在2010年回落至0.01%。

“酒精”的患病率一直高于“啤酒或葡萄酒”和“烈酒”,2005年“酒精”的患病率仅为0.76%,而“啤酒或葡萄酒”的患病率为1.27%。这可能是前面说过的翻译困难造成的。在2005-2007年和2010年,“精神”的使用率是三个概念中最低的。然而,在2008年,它的流行率与“啤酒或葡萄酒”持平,而在2009年,它的流行率完全超过了它。

人均饮酒量与“酒精”患病率有很强的相关性(Pearson相关性=0.81, P= . 05;斯皮尔曼相关= 1.00, P<措施)。线性关系边缘显著,非线性关系显著。“啤酒或葡萄酒”的患病率与啤酒和葡萄酒的人均消费量呈中度负相关(Pearson相关系数=-0.48, P=点;斯皮尔曼相关= -0.43, P= .40)。两者均无统计学意义。同样,“精神”的患病率也呈中度负线性相关(Pearson相关=-0.40, P=.43)和弱负非线性相关(Spearman相关=-0.09, P=.87)。同样,两者都不显著。

流行率和相关系数

表7显示“啤酒或葡萄酒”/“酒精”的流行率整体下降,2008年为0.06,2010年为0.05。另一方面,“烈酒”/“酒精”的流行率在2006年和2009年分别达到峰值,分别为0.12和0.09。前者在2005-2007年和2010年更高。然而,在2008年,两者持平,2009年,“烈酒”/“酒精”的流行率达到0.09,超过了“啤酒或葡萄酒”/“酒精”的0.08。

“啤酒或葡萄酒”/“酒精”的患病率与啤酒和葡萄酒的人均消费量呈强负相关(Pearson相关系数=-0.65, P= 16;斯皮尔曼相关= -0.77, P= . 07)。相关系数无统计学意义。“烈酒”/“酒精”的流行率也与人均烈酒消费量呈负相关,但只是弱相关(Pearson相关性=-0.10, P= .85;斯皮尔曼相关= -0.03, P= .96点)。同样,两个相关系数都不显著。

2005-2010年在我的博客中与酒精相关概念的流行率,以及与香港同类型酒精的人均消费量比较的相关系数。

患病率(%)
“酒精” “啤酒还是葡萄酒” “精神”
一年
2005 0.76 1.27 0
2006 1.44 0.88 0.17
2007 2.14 0.48 0.09
2008 10.26 0.63 0.63
2009 8.06 0.61 0.72
2010 6.81 0.34 0.01
相关系数( P值
皮尔森 0.81(0。) -0.48(点) -0.40(点)
斯皮尔曼 1.00(<措施) -0.43(收) -0.09(.87点)

2005-2010年,我的博客中与酒精相关概念的流行率,以及与香港同类型酒精的人均消费量的相关系数。

流行率(%)
"啤酒或葡萄酒" / "酒精" "烈酒" / "酒精"
一年
2005 1.67 0
2006 0.62 0.12
2007 0.23 0.04
2008 0.06 0.06
2009 0.08 0.09
2010 0.05 0.00
相关系数( P值
皮尔森 -0.65 (16) -0.10(新)
斯皮尔曼 -0.77 (07) -0.03(.96点)
定性分析 博客作者特点

图3说明在2005-2010年间,MySinaBlog中有相当数量的与酒精相关关键词的博客是由单个作者撰写的(97.1%,134/138)。对于那些性别已知的单身作者,他们的性别分布是平等的(女性=38.1%,51/134;男= 38.1%,51/134;未知=23.9%,32/134)( 图4)。大多数单身作者也未注明年龄(年龄不详=75.4%,101/134),其余以成年人居多(18岁及以上=22.4%,30/134)( 图5)。所有参数似乎都随着时间的推移而增加,这可能是由于博客总数的增加。

博客内容

图6而且 7在2005-2010年,并非所有与酒精相关的关键词都能在MySinaBlog的博客文章中找到。在“啤酒或葡萄酒”的关键词中,“啤酒”是最常见的。从2005年到2010年,它的累计频率为324次,并在2010年达到峰值,为153次。其次是“香槟”,其次是“波特酒”,最后是“佩里”。在“烈酒”关键词中,“威士忌”是最常见的。从2005年到2010年,它的累计频率为67次,并在2010年达到峰值,为21次。“朗姆酒”是第二常见的,其次是“白兰地”,最后是“伏特加”。这些年来,关键词出现的频率似乎有所上升,这可能是由于博客文章的实际流行度有所增加。

图8,并不是所有的博客文章都描述了作者在香港的某一段饮酒事件(由关键字指定的酒精类型),而且是在博客文章发表的同一年。事实上,他们中只有11.5%(19/165)的人这样做了,关于饮酒量和持续时间的信息有限。因此很难区分豪饮和非豪饮(豪饮=0%;非酗酒=26.3%,5/19;待定=73.7%,14/19)( 图9;[ 35])。其余以个人日记、观点、情感宣泄为主(28.1%,41/146)( 图10)。在 图10,名称是不属于酒精的地方、人或实体的名称,如歌词;Recipe是食谱或菜名;新闻是来自外部来源的新闻/复制文章;故事是故事叙事/电影梗概;健康信息是健康或教育信息;特色文章是指无主见的特色文章;个人日记是一种个人日记、观点或情感的宣泄方式。首先检查关键字周围的直接文本。如果没有做出决定或关键字太分散,则会检查整个博客文章。前一种选择应优先于后一种选择。

从2005年到2010年,MySinaBlog中使用酒精相关关键词的博客的实际流行度根据作者分类(公司或组织的博客被算作多个作者;同一注册用户在同一年内发布的不同博客被视为一个博客)。

从2005年到2010年,MySinaBlog中使用酒精相关关键词的博客的实际流行率根据单身作者的性别进行分类。

2005-2010年我的博客中与酒精相关的关键词的实际流行度根据单身作者的年龄进行分类。

2005-2010年MySinaBlog博客文章主体中“beer or wine”关键词的点频

2005-2010年MySinaBlog博客文章主体中“精神”关键词的点频

2005-2010年在我的博客中使用酒精相关关键词的博客文章的实际流行率根据对饮酒的描述进行分类(用于烹饪的酒精被排除在外)。

2005-2010年,在我的博客中,使用酒精相关关键词的博客文章的实际流行率,以及对一次饮酒事件的描述,根据饮酒模式进行分类(酗酒定义为在几个小时内连续喝5杯酒)。

2005-2010年,在我的博客中,有与酒精相关的关键词,但没有对饮酒事件进行描述的博客文章的实际流行程度按类型分类。

讨论 酒精相关概念在网上流行的变化

与酒精相关的概念在网络上的流行程度最能体现为其流行率和比例,这两项指标标准化了博客总数变化的影响[ 14].总的来说,“酒精”这个概念在2008年最为流行。在2008-2009年,“精神”这个概念在网上的流行程度也经历了短暂的、有点不稳定的上升。相比之下,“啤酒或葡萄酒”这个概念越来越不受欢迎,近年来它在网上的受欢迎程度总体呈下降趋势。有关酒精相关概念在2007-2008年后变得更流行的假设只适用于“酒精”和“烈酒”,而不适用于“啤酒或葡萄酒”。

2008-2009年“精神”关键词在网上流行的一个可能原因是同期垃圾邮件的存在。这在表观患病率中被掩盖了,这是用来计算患病率和比率的。的确,剔除2008-2009年的数据后,“精神”概念的流行率和比例相对稳定在一个较低的水平。“spirit”在线流行度的虚假上升可能也解释了“alcohol”在2008年的流行率峰值,尽管后者的幅度要大得多,但“alcohol”(酒精)而非“啤酒或葡萄酒”或“spirit”的关键词仍有可能出现真正的上升。“啤酒还是葡萄酒”在网上的流行程度下降,可能是博主们对这个话题兴趣下降的真实反映。然而,它与当地饮酒模式的关系仍然存疑,因为许多博客文章实际上并没有描述一个单独的饮酒事件。"烈酒"和"酒精"这两个概念也是如此。

验证博客搜索作为调查饮酒模式的信息监视方法

博客搜索数据的验证依赖于相关性分析和对博客作者特征和内容的人工分析。“酒精”的流行率是唯一与人均酒精消费量具有显著非线性和极显著线性相关的参数。其他相关性都不显著,尽管其中许多表现出中等至强的相关性。信息流行病学数据与当地流行病学数据显著相关的假设仅适用于“酒精”患病率。其他信息流行病学指标在统计上的不显著性可能可以用博客文章相对于人口的数量较少来解释。这可以归结为以下原因:

选择关键字。“啤酒或葡萄酒”和“烈酒”的关键词列表永远不可能详尽无遗,因为它们的类型很多,博主的表达也非常多变。在香港人的网上交流中,混杂中文和英文字母的密码并不少见。他们中的一些人实际上会输入粤语(越族方言)而不是标准中文[ 53].他们可能会用不同的中文词来翻译同一种酒。他们也可能使用他们所喝的酒的品牌名称。这在一定程度上反映在博客文章中个别与酒精相关的关键字的频率上,这表明一些根本没有被博主使用。所有这些都增加了在搜索查询的字数限制内选择适当的关键字以提供足够的覆盖范围的困难。

香港人消极写博客的行为。香港特别行政区政府在2011年2月至4月进行的一项调查显示,53.4%的互联网用户在过去12个月内曾浏览论坛或博客的内容,但同期只有约15.8%的互联网用户编辑或创建网页或博客[ 42].

从手工分析来看,大多数博客都是由单个作者管理的,这意味着博客的数量可以用来表示人口调查中个体参与者的数量。单身博客作者的性别分布与当地人口接近,但年龄范围略倾向于18岁及以上[ 54].然而,值得注意的是,许多博客作者并没有在网上公开他们的身份,这使得验证变得困难。

许多博客文章都不是关于饮酒的个别事件,而是个人日记、观点或情感宣泄。这并不奇怪,因为新的博客类型不断出现。 55].许多博客并非只是提供信息,而是情感性质的,需要进行语义分析,才能做出有意义的解释[ 25].虽然博主不太可能记录他们每次的饮酒量,但他们可能会在评论某一事件、回答某一问题、描述童年事件等时透露出他们对饮酒的理解,因此出现了与酒精相关的关键词。虽然没有足够的线索支持酒精相关关键词在线流行度的变化与当地人口饮酒模式的改变有关,但人们不应忽视其社会影响,并忽视其在评估公众对包括零啤酒和葡萄酒税在内的健康相关政策的反应方面的作用。

研究局限与对策

使用博客作为信息来源有几个固有的局限性。例如,个人博主的性别、年龄、种族等人口统计数据可能存在缺陷或被掩盖;博客作者倾向于分享与一般人不同的共同兴趣和背景;而且获取诸如饮酒模式等精确数据通常很困难。为了及时有效地构建一个更大的框架,信息学研究人员经常不得不通过使用特定的信息学指标来牺牲每个博主的个性。此外,博主的语言使用往往比较复杂,不容易通过一些预先确定的关键字的频率来解码。在提供足够技术支持的情况下,通过对博客文章的语义分析来探究博主对饮酒的看法是可行的。可以对个别博客作者进行面对面访谈和问卷调查,以阐述他们的观点,最好是那些在特定博客圈内具有最大影响力的人(使用社交网络分析工具)。

没有一个博客搜索引擎索引了所有的博客[ 56].尽管搜索引擎具有自动性,但它可能会受到编辑选择的影响,从而产生偏见[ 57].有人担心,即使在同一搜索引擎中,随着时间的推移,搜索结果可能会有所不同[ 14 44].在我们的例子中,这可能是由(1)谷歌搜索算法的固有限制所解释的,它只给出了对大结果查询的近似估计,以及(2)由于splogs(或垃圾博客)和以前没有链接的博客数量不稳定而导致的搜索数据库的不一致性[ 35 44 56].值得注意的是,谷歌搜索算法的很大一部分是不为公众所知的,这加剧了我们研究中的采样不确定性。

使用中文搜索博客的一个挑战是,由于地理差异和与英语的翻译,它往往有广泛的表达。此外,只有有限数量的博客分析工具支持中文。最理想的是自行设计的研究项目,其中包含了丰富的博客搜索算法和分析功能,尤其是针对中国博客,这在很大程度上取决于专业知识和资源的可用性。

结论与未来研究建议

利用香港中文博客服务提供商的博客搜索数据,我们得出以下结论:(1)与酒精相关的中文关键词在网上的流行程度是由包括垃圾邮件在内的许多不同因素造成的,因此不能具体反映当地的饮酒模式;(2)资讯病学数据(以酒精相关概念的患病率和比例表示)与流行病学数据(以人均酒精消费量表示)之间的相关性较差;(3)许多博客文章本质上是情感性的,而不是信息性的。虽然使用预定义的中文关键词进行博客搜索可能不是调查酒精消费量等流行病学数据的理想方法,但如果有足够的专业知识和资源,对博客内容进行语义分析将提供有关公众对健康相关政策反应的宝贵信息。

缩写 香港特别行政区

香港特别行政区

我们感谢香港大学公共卫生学院何志明博士提供统计方面的意见。

没有宣布。

国际癌症研究机构 世界卫生组织 饮酒,载于国际癌症研究机构《人类致癌风险评估专著》 1988 2013-06-26 http://monographs.iarc.fr/ENG/Monographs/vol44/volume44.pdf 6 hfisaypq 世界卫生组织 药物滥用-事实和数据 2012 2012-05-14 酒精 http://www.who.int/substance_abuse/facts/alcohol/en/index.html 67年emqsq3z 世界卫生组织 预防和控制非传染性疾病全球战略2008-2013年行动计划 2013-06-26 http://whqlibdoc.who.int/publications/2009/9789241597418_eng.pdf 6 hfixwamy 香港特别行政区卫生署,政府 减少香港酒精危害的行动计划 2011 2013-06-26 http://www.change4health.gov.hk/filemanager/common/image/strategic_framework/alcohol_action_plan/action_plan_e.pdf 6 hfj4qrrp 青年研究中心 香港青少年饮酒习惯研究,载于《青少年研究系列》 2000 香港 青少年研究系列 http://yrc.hkfyg.org.hk/news.aspx?id=6b656879-efed-4886-af11-e74caad87856&corpname=yrc&i=2527&locale=en-US 6 j48lbobx 香港特别行政区卫生署监测及流行病学科,政府 非传染性疾病观察 2012 2013-06-26 改变健康——少喝或不喝 http://www.chp.gov.hk/files/pdf/ncd_watch_may2012.pdf 6 hfj8m7yn 政府的香港特别行政区 2007-2008财政预算案演辞 2007 2012-05-14 http://www.budget.gov.hk/2007/eng/speech.htm 67年epwseow 政府的香港特别行政区 2008-2009财政预算案演辞 2008 2012-05-02 http://www.budget.gov.hk/2008/eng/speech.html 67年mhbygxi TH D 控制与酒精相关的全球健康问题 亚太公共卫生协会 2010 07 22 3个5 203年代 208年代 10.1177 / 1010539510373013 20566555 22/3_suppl / 203年代 瓦格纳博士 交流 Salois 乔丹 Komro 酒精饮料价格和税收水平对饮酒的影响:对112项研究的1003项估计的荟萃分析 上瘾 2009 02 104 2 179 90 10.1111 / j.1360-0443.2008.02438.x 19149811 ADD2438 麦克拉 P Osterberg E 另一个酒精控制支柱的削弱:2004年芬兰酒精税削减的影响回顾 上瘾 2009 04 104 4 554 63 10.1111 / j.1360-0443.2009.02517.x 19335654 ADD2517 PMC2928916 Herttua K 麦克拉 P Martikainen P 酒精价格大幅降低对与酒精相关的住院治疗的影响:基于人群的自然实验 上瘾 2011 04 106 4 759 67 10.1111 / j.1360-0443.2010.03296.x 21205044 人类研究 一个 塞壬 R Vuori E Poikolainen K 酒精税削减与酒精阳性猝死的增加:时间序列干预分析 上瘾 2007 03 102 3. 362 8 10.1111 / j.1360-0443.2006.01715.x 17298642 ADD1715 Eysenbach G 信息流行病学和信息监测:一套新兴的公共卫生信息学方法的框架,用于分析互联网上的搜索、传播和发布行为 J医疗互联网服务 2009 11 1 e11 10.2196 / jmir.1157 19329408 v11i1e11 PMC2762766 Eysenbach G 信息流行病学和信息监测跟踪在线健康信息和网络行为的公共卫生 是J Prev Med吗 2011 05 40 5补充2 S154 8 10.1016 / j.amepre.2011.02.006 21521589 s0749 - 3797 (11) 00088 - 2 Eysenbach G 信息流行病学:追踪网络上与流感相关的搜索,以进行症状监测 AMIA年度诉讼程序 2006 244 8 17238340 86095 PMC1839505 Eysenbach G 信息流行病学:信息(错误)的流行病学 Am J医学 2002 12 15 113 9 763 5 12517369 S0002934302014730 金斯堡 J Mohebbi MH 帕特尔 RS 布拉姆 l Smolinski 女士 才华横溢的 l 使用搜索引擎查询数据检测流感流行 自然 2009 02 19 457 7232 1012 4 10.1038 / nature07634 19020500 nature07634 威尔逊 K 布朗斯坦 JS 利用互联网及早发现疾病爆发 医疗协会 2009 04 14 180 8 829 31 10.1503 / cmaj.090215 19364791 180/8/829 PMC2665960 Althouse BM Ng YY 卡明斯 使用搜索查询监测预测登革热发病率 PLoS nel Trop Dis 2011 08 5 8 e1258 10.1371 / journal.pntd.0001258 21829744 pntd - d - 11 - 00369 PMC3149016 PW 千瓦 RS HH 法律 YW 党卫军 叫喊声 PS 在互联网上获取与自杀相关的信息:搜索行为的回顾性观察研究 J医疗互联网服务 2013 15 1 e3 10.2196 / jmir.2181 23305632 v15i1e3 PMC3636013 艾尔斯 JW Althouse BM Allem 摩根大通 福特 Ribisl 公里 科恩 对拉丁美洲世界无烟日的新颖评价 J医疗互联网服务 2012 14 3. e77 10.2196 / jmir.2148 22634568 v14i3e77 艾尔斯 JW Ribisl K 布朗斯坦 JS 在美国2009年“SCHIP”香烟税提高后,使用搜索查询监控来监控避税和戒烟 《公共科学图书馆•综合》 2011 6 3. e16777 10.1371 / journal.pone.0016777 21436883 PMC3059206 咀嚼 C Eysenbach G 推特时代的流行病:2009年H1N1爆发期间推特的内容分析 《公共科学图书馆•综合》 2010 5 11 e14118 10.1371 / journal.pone.0014118 21124761 PMC2993925 布洛斯卡 礼宾部主管 美联社 科里 CD 惠勒 年代 严肃应用的社会网络挖掘和开发:用于公共卫生、环境和国家安全监视的技术社会预测分析和相关技术 计算方法程序生物医学 2010 10 One hundred. 1 16 23 10.1016 / j.cmpb.2010.02.007 20236725 s0169 - 2607 (10) 00038 - 6 美国医学研究所微生物威胁论坛 全球传染病监测与检测:评估挑战——寻找解决方案,研讨会摘要 2007 华盛顿特区 国家科学院出版社 H 基于Web 2.0的知识共享机制研究 未来信息技术与管理工程国际研讨会 2008 FITME 08年 二八年十一月二十日 英国莱斯特郡 210 213 10.1109 / fitme.2008.14 罗素 年代 挖掘社交网络:分析来自Facebook、Twitter、LinkedIn和其他社交媒体网站的数据 2011 塞瓦斯托波尔, O ' reilly媒体 一个 博客圈 ACM通信 2004 12 01 47 12 30. 10.1145/1035134.1035161 葵丰IP R 瓦格纳 C 网络日志:社会计算及其对组织影响的研究 决策支持系统 2008 5 45 2 242 250 10.1016 / j.dss.2007.02.004 海关 瓦格纳 C Weblog的成功:探索技术的角色 国际人机研究杂志 2006 9 64 9 789 798 10.1016 / j.ijhcs.2006.04.002 Nardi 英航 Schiano DJ Gumbrecht 史瓦兹 l 为什么要写博客 ACM通信 2004 12 01 47 12 41 10.1145/1035134.1035163 H 克雷格 RS 博客上的匿名和自我表露 计算机媒介通信杂志 2007 12 4 1428 1451 10.1111 / j.1083-6101.2007.00380.x J J P 萧若元 B 博客挖掘框架 它教授 2009 01 11 1 36 41 10.1109 / mitp.2009.1 Thelwall 博客搜索:社会科学中第一个回顾公众意见的通用来源? 网上资料审查 2007 31 3. 277 289 10.1108 / 14684520710764069 H 博客世界与现实世界的舆论 世界舆论研究协会年会论文集 2012 世界舆论研究协会年会 2012 香港 J 挖掘社区及其在博客中的关系:对在线仇恨团体的研究 国际人机研究杂志 2007 1 65 1 57 70 10.1016 / j.ijhcs.2006.08.009 Y FS 常ydF4y2Ba 吉隆坡 商业领域的博客搜索和挖掘 2007年领域驱动数据挖掘国际研讨会论文集 2007 领域驱动数据挖掘国际研讨会 2007年8月12-15日 圣何塞,加利福尼亚州 55 60 10.1145/1288552.1288560 康拉德 席尔德 F 法律博客中的意见挖掘 第11届人工智能与法律国际会议论文集 2007 第11届人工智能与法律国际会议 2007年6月4日至8日 帕洛阿尔托 231 236 10.1145/1276318.1276363 奥利里 博客挖掘-评论和扩展:“各执己见” 决策支持系统 2011 11 51 4 821 830 10.1016 / j.dss.2011.01.016 社会调查组 政府统计处 政府的香港特别行政区 主题性住户统计调查第50号报告书 2013 2013-06-26 香港 http://www.digital21.gov.hk/eng/statistics/download/householdreport2013.pdf 6 hfjgqcwu 社会调查组 政府统计处 政府的香港特别行政区 主题性住户统计调查第49号报告 2012 2013-06-26 http://www.statistics.gov.hk/pub/B11302492012XXXXB0100.pdf 6 hfjmgso6 博客 香港博客调查结果 2012-05-02 http://blog-you.com/events/survey/ 67年m9r7q18 Thelwall 汉斯勒 l 博客搜索引擎 网上资料审查 2007 31 4 467 479 10.1108 / 14684520710780421 Gh(香港)有限公司 香港免费博客网站 2013-04-11 http://852.com/internet/free_blog.htm 6 fo1qxrhe 票选得出 2013-04-11 2013年博客服务比较 http://blog-services-review.toptenreviews.com/ 6 fo2o3kvx Alexa的互联网 2013-08-20 http://www.alexa.com/ 6 j1za5y4c StatsCrop 2013-08-20 http://www.statscrop.com/ 6 j1zbrijf Alexa的互联网 MySinaBlog。地点信息 2012-05-02 http://www.alexa.com/siteinfo/mysinablog.com 67年mroycux 林语堂《汉英现代用法大词典》(网络版) 2013-08-20 英语 http://humanum.arts.cuhk.edu.hk/Lexis/Lindict/ 6 j1zgxl06 香港海关应课税品管理处,香港特区政府 取消酒类及酒精浓度不超过30%酒类的牌照/许可证安排,2008年:香港 2013-06-26 http://www.customs.gov.hk/filemanager/common/pdf/pdf_notice/fact_sheet_eng.pdf 6 hfjs66ty 常ydF4y2Ba 汉语教学与研究的工具 中国语文教师协会 2002 37 2 1 58 WN 互联网上的语言选择:书面粤语在网站上的使用 2005 香港 香港大学 香港特别行政区政府统计处一般统计组,政府 香港统计月刊(2013年4月),2013:香港 2013-06-26 http://www.statistics.gov.hk/pub/B10100022013MM04B0100.pdf 6 hfjwrivh 鲱鱼 SC Scheidt 奖金 年代 莱特 E 弥合鸿沟:博客的体裁分析 第37届夏威夷系统科学国际会议论文集 2004 第37届夏威夷系统科学国际会议 2004年1月5日至8日 夏威夷大岛 IEEE D Walejko G 博客和被抛弃的博客:取样博主和他们的博客的危险 《信息、传播与社会 2008 03 11 2 279 296 10.1080 / 13691180801947976 高盛 E 总值 一个 齐默 搜索引擎偏见和搜索引擎乌托邦主义的消亡 网络搜索 2008 柏林 施普林格 121 133
Baidu
map