警告:这是一份未经同行评审或编辑的作者提交。除非预印本显示为“可接受”,否则不应依赖预印本来指导临床实践或与健康有关的行为,也不应在新闻媒体上作为既定信息报道。
使用自然语言处理方法识别非结构化临床文献中糖尿病前期讨论
摘要
背景:
三分之一的美国成年人患有前驱糖尿病。大多数人没有接受循证干预,因此了解提供者如何与患者讨论前驱糖尿病将告知如何改善他们的护理。
摘要目的:
使用机器学习技术开发一种NLP算法,以识别叙事文档中关于前驱糖尿病的讨论。
方法:
我们开发并应用了一个关键词搜索策略来识别糖尿病前期患者临床文献中关于糖尿病前期的讨论。我们手动审查匹配的笔记,以确定哪些代表实际的糖尿病前期讨论。我们对手工标注应用了7个机器学习模型。
结果:
机器学习分类器能够以高达98%的准确率和召回率实现接近人类表现的分类结果,以识别临床文档中的前驱糖尿病讨论。
结论:
我们证明了使用NLP算法可以准确地识别糖尿病前期讨论。该方法可用于了解和确定初级保健中的糖尿病前期管理实践,从而为干预措施提供信息,以改善符合指南的护理。
引用
请求排队。正在生成文件,请稍候。这可能需要一些时间。
版权
©作者。版权所有。这是一份特权文件,目前正在接受同行评审/社区评审(或被接受/拒绝的手稿)。作者已向JMIR Publications提卡塔尔世界杯8强波胆分析供独家许可,在其网站上发布此预印本,仅供审查和印前引用之用。虽然最终的同行评议论文在发表时可能会根据cc-by许可进行许可,但在此阶段,作者和出版商明确禁止将该论文草稿重新分发,除非用于评审目的。