TY - JOUR AU - Doing-Harris, Kristina M AU - zenge - treitler, Qing PY - 2011 DA - 2011/05/17 TI -基于社交网络数据挖掘的消费者健康词汇的计算机辅助更新JO - J Med Internet Res SP - e37 VL - 13 IS - 2kw -消费者健康信息KW -词汇KW -自然语言处理KW -术语自动识别KW -数据挖掘KW -社交网络AB -背景:消费者健康词汇(chv)已经开发,以帮助消费者健康信息的应用。如果词汇表随着消费者的语言而发展,这一目的就会得到最好的实现。目的:我们的目标是创建一个计算机辅助更新(CAU)系统,该系统与实时语料库一起工作,以识别新的候选术语,以便将其包含在开放获取和协作(OAC) CHV中。方法:CAU系统由三个主要部分组成:Web爬虫和HTML解析器,利用自然语言处理工具(包括术语识别方法)的候选术语过滤器,以及人工审阅界面。在评估中,CAU系统应用于与健康相关的社交网站PatientsLikeMe.com。通过将系统生成的候选术语列表与从抓取的网页文本中手动提取的有效术语列表进行比较,评估了系统的效用。结果:CAU系统在300个抓取的PatientsLikeMe.com网页中识别出88,994个1- 7克(“n-grams”是一个句子中连续的n个单词)的唯一术语。对抓取的网页进行人工审查,确定了651个有效术语,这些术语尚未包括在OAC CHV或统一医学语言系统(UMLS)元词典中,这是一个合并形成医学术语本体的词汇集(即每136.7个候选n-gram中有1个有效术语)。术语过滤器选出774个候选术语,其中有效术语237个,即每评审3个或4个候选术语中有1个有效术语。 Conclusion: The CAU system is effective for generating a list of candidate terms for human review during CHV development. SN - 1438-8871 UR - //www.mybigtv.com/2011/2/e37/ UR - https://doi.org/10.2196/jmir.1636 UR - http://www.ncbi.nlm.nih.gov/pubmed/21586386 DO - 10.2196/jmir.1636 ID - info:doi/10.2196/jmir.1636 ER -
Baidu
map