%0期刊文章%@ 1438-8871 %I Gunther Eysenbach %V 13 %N 2 %P e37 %T通过挖掘社交网络数据的计算机辅助更新消费者健康词汇% a doin - harris,Kristina M % a Zeng-Treitler,Qing %+犹他大学生物医学信息系,5775 HSEB室,26 S 2000 E,盐湖城,UT, 84112,美国,1 801 518 8636,kristina.doing-harris@utah.edu %K消费者健康信息%K词汇%K自然语言处理%K自动术语识别%K数据挖掘%K社交网络%D 2011 %7 17.05.2011 %9原始论文%J J医学互联网Res %G英语%X背景:消费者健康词汇(CHVs)已经开发出来,以帮助消费者健康信息学应用。如果词汇表随着消费者语言的变化而变化,就能最好地达到这个目的。目的:我们的目标是创建一个计算机辅助更新(CAU)系统,该系统与实时语料库一起工作,以确定新的候选术语,以纳入开放获取与协作(OAC) CHV。方法:CAU系统由三个主要部分组成:Web爬虫和HTML解析器,利用自然语言处理工具(包括术语识别方法)的候选术语过滤器,以及人工审阅界面。在评价中,CAU系统应用于与健康相关的社交网站PatientsLikeMe.com。系统的效用是通过将其生成的候选术语列表与从抓取的网页文本中手工提取的有效术语列表进行比较来评估的。结果:CAU系统在300个爬行的PatientsLikeMe.com网页中识别了88,994个1- 7克的独特术语(“n-grams”是句子中n个连续的单词)。对抓取的网页的人工审查确定了651个有效术语尚未包括在OAC CHV或统一医学语言系统(UMLS) mettathesaurus中,这是一个合并形成医学术语本体的词汇集合,(即每136.7个候选n-grams中有一个有效术语)。词汇过滤器筛选出774个候选词汇,其中有效词汇237个,即每3个或4个候选词汇中就有一个有效词汇。 Conclusion: The CAU system is effective for generating a list of candidate terms for human review during CHV development. %M 21586386 %R 10.2196/jmir.1636 %U //www.mybigtv.com/2011/2/e37/ %U https://doi.org/10.2196/jmir.1636 %U http://www.ncbi.nlm.nih.gov/pubmed/21586386
Baidu
map