警告:这是一个作者提交不同行评议或编辑。预印本——除非他们显示为“接受”,不应依赖于指导临床实践或健康相关行为和新闻媒体的报道中不应该建立信息。
关系提取通过多头的注意机制在生物医学文献和句法功能的依赖
文摘
背景:
与生物医学文献的快速扩张,生物医学信息提取(IE)吸引了越来越多研究人员的关注,尤其是提取(重新)两个实体之间的关系是一个长期的研究课题。
摘要目的:
本文主要关注两个多层次关系抽取任务BioNLP 2019开放共享任务:关系提取Bacteria-Biotope任务(BB-rel)和二元关系提取的植物种子开发任务(SeeDev-binary)。从本质上讲,这两个任务的目的是提取的关系实体对从生物医学文本注释,这是一个具有挑战性的问题。
方法:
传统的研究方法采用基于功能的或基于方法,并取得了良好的性能。对于这些任务,我们提出一个基于组合深度学习模型的几个分布式特性,如嵌入特定领域的词,词性(POS)嵌入,实体类型嵌入,嵌入位置和嵌入的距离。多头的注意机制是用来提取全球整个句子的语义特征。与此同时,我们引入依赖类型特征和最短路径依赖语法依赖图中连接两个候选人的实体丰富特性表示。
结果:
实验表明,我们提出的模型具有良好的性能在生物医学关系提取,达到F1-scores 65.56%和38.04%这两个任务的测试集,分别。特别是在SeeDev-binary任务,我们模型的F1-score优于其他已存在的模型和实现最先进的性能。
结论:
我们证明了多头的注意机制可以学到相关的句法和语义特征子空间在不同的表示和提取不同位置综合特性表示。此外,语法依赖特性可以通过学习提高模型的性能依赖关系的实体在生物医学文本。
引用
请求排队。生成的文件,请稍等。可能需要一些时间。
版权
作者©。保留所有权利。这是一个特权文档目前同行评审/社区审查(或接受/拒绝的手稿)。作者JMIR出版物提供了独家许可证发布这个预卡塔尔世界杯8强波胆分析印在它的网站上为审查和先于印刷仅引用目的。虽然最后的同行评议的论文可能cc-by许可的刊物,在此阶段作者和出版商意味深长地禁止再分配的草稿纸除了用于审查。