发表在9卷第七名(2021): 7月

本文的预印本(早期版本)可在https://preprints.www.mybigtv.com/preprint/26714,首次出版
生物医学知识图谱系统提出现实世界环境健康观察的机制假设:队列研究和信息学应用

生物医学知识图谱系统提出现实世界环境健康观察的机制假设:队列研究和信息学应用

生物医学知识图谱系统提出现实世界环境健康观察的机制假设:队列研究和信息学应用

原始论文

1复兴计算研究所,北卡罗来纳大学教堂山分校,教堂山,北卡罗来纳州,美国

2Copperline专业解决方案,匹茨伯勒,北卡罗来纳州,美国

3.美国北卡罗来纳州达勒姆国家环境卫生科学研究所

4CoVar应用技术,达勒姆,北卡罗来纳州,美国

5美国北卡罗来纳大学教堂山分校Eshelman药学院

通讯作者:

Karamarie Fecho博士

复兴计算研究所

北卡罗来纳大学教堂山分校

欧罗巴路100号,540室

教堂山,北卡罗莱纳州,27517

美国

电话:1 919 445 9640

电子邮件:kfecho@copperlineprofessionalsolutions.com


背景:知识图是生物医学等领域常用的知识表示形式。我们开发了一个开放的基于生物医学知识图的系统,称为在面向知识的路径中链接的生物医学对象推理(ROBOKOP)。ROBOKOP由前端用户界面和后端知识图组成。ROBOKOP用户界面允许用户提出问题并探索答案子图。用户还可以通过对底层知识图的直接Cypher查询提出问题,该知识图目前包含大约600万个节点或生物医学实体,以及描述节点之间关系的1.4亿个边或谓词,这些边或谓词来自30多个经过筛选的数据源。

摘要目的:我们的目标是应用robokopp来调查来自美国国家环境健康科学研究所环境多态性登记处(EPR)的工作场所暴露和免疫介导疾病的数据。

方法:我们分析了EPR调查数据,并确定了工作场所化学品暴露与免疫介导疾病之间的45种关联,这些关联由研究参与者自我报告(n= 4574),其中20种关联在P<。05后错误发现率纠正。然后,我们使用ROBOKOP(1)通过确定ROBOKOP知识图中是否存在合理的联系来验证这些关联;(2)提出可能解释它们的生物机制,并作为后续测试的假设。我们强调以下三个例子关联:一氧化碳-多发性硬化症,氨-哮喘和异丙醇过敏性疾病。

结果:ROBOKOP成功地返回了在驾驶示例上下文中提出的三个查询的答案集。答案集包括潜在的中介基因,以及可能解释所观察到的关联的支持证据。

结论:我们展示了ROBOKOP的真实应用,以生成工作场所化学品暴露与免疫介导疾病之间关联的机制假设。我们预计ROBOKOP将在许多生物医学领域和其他科学学科中得到广泛应用,因为它具有广泛性、发现和生成机械假设的速度以及开放性。

JMIR Med Inform 2021;9(7):e26714

doi: 10.2196/26714

关键字



“知识图”(KGs)已成为跨科学学科(包括生物医学)的知识表示的常用方法[1].在KG中,多个专家策划的“知识来源”被集成到一个图结构中,节点表示实体,边提供节点之间的关系。在生物医学KG中,节点表示生物医学实体,例如药物疾病,边描述连接节点的关系,例如对待(例如,药物治疗疾病).填充生物医学KG的策划知识来源包括两个数据库,例如DrugBank [2]和比较毒性基因组学数据库[3.],以及本体,如君主病本体[4]和人类表型本体[5].各种推理工具和推理算法通常应用于kg [1],从而允许用户构造复杂的查询,例如,如果基因X与化学暴露Y和疾病Z都有关,那么基因X的蛋白质产物可能代表潜在的药物靶点.事实上,kg的成功应用包括药物再利用[6]及寻找新的药物靶点[7].

虽然像Monarch这样的kg是公开的,但许多更复杂的kg仍然是专有的。也许最著名的专有KG是freebase衍生的谷歌KG,它支持谷歌的网页搜索功能[8].作为生物医学数据翻译计划的一部分[9-11],我们开发了一个开放的基于kg的生物医学系统,称为“基于知识导向路径链接的生物医学对象推理”(ROBOKOP) [1213].ROBOKOP的设计是为了回答诸如哪些基因与COVID-19感染的恢复有关?为什么伊马替尼治疗哮喘有效?哪些生物途径与中风相关的发病率相关?请注意,这些问题意味着查询中的术语之间存在复杂的机械关系,例如药物而且疾病.ROBOKOP KG旨在以连接查询条件的假定机械路径的形式提供答案。

在这里,我们概述了ROBOKOP及其在国家环境健康科学研究所环境多态性登记处(EPR)数据中的实际应用。具体来说,我们重点研究了一项EPR研究,旨在探索工作场所暴露对免疫介导疾病(IMDs)的影响,如哮喘、过敏、多发性硬化症、类风湿关节炎和溃疡性结肠炎。我们首先对自我报告的暴露和IMD症状进行了探索性分析,以确定工作场所化学品暴露与IMD之间的显著相关性。然后,我们使用ROBOKOP(1)通过确定ROBOKOP KG中是否存在合理的联系来验证统计学上显著的关联;(2)提出可能解释这些关联的生物学机制,并作为后续测试的假设。


ROBOKOP

ROBOKOP是一个基于生物医学KG的问答系统,由前端用户界面(UI)和后端KG组成,两者都是公开可用的[12-15].ROBOKOP KG采用Biolink模型[16]作为一种高级本体,它可以应用于将领域知识表示为生物医学实体之间的关系图。ROBOKOP KG目前包含600万个节点和1.4亿条边,其中节点代表广泛的生物实体,如基因、生物过程、解剖特征、疾病和表型,而边代表谓词,如原因,增加表达.ROBOKOP KG来自30多个精心策划的生物医学数据源(多媒体附件1)已集成到图形结构(图1).经过筛选的数据源是公开可用的,可以通过直接导入到本地Neo4j实例进行访问。有些数据源只是部分完整和/或需要预处理。

图1。用于在面向知识的路径(ROBOKOP)知识图中链接的生物医学对象推理的高级模式,显示由Biolink模型定义的节点类。请注意,该模式提供了一个用户指南,通过提供ROBOKOP知识图中连接的节点的可视化概述来帮助正确构造查询。
查看此图

ROBOKOP用户界面允许用户提出查询,并快速探索排名和得分的答案集或子图。ROBOKOP查询是元图[17-19中所示实体类型的问题图图1.元图或机器问题有一个一般的结构,由用户在感兴趣的高级问题的基础上定义。用户可以选择节点作为命名实体,指定为CURIE(紧凑统一资源标识符)或仅指定为实体类型。下拉菜单为用户提供了对自由文本节点条目的选择。答案被构造为在拓扑和类型上匹配查询的子图,以及节点和边的任何所需属性。

一个给定的查询通常会产生许多答案或子图,特别是对于没有多少关于节点和边的规范或有多个节点和边的查询。因此,根据与查询的相关性对子图进行排序以及支持证据的强度对于用户探索结果至关重要。ROBOKOP答案排序算法[13]使用基于同时引用源节点和目标节点的PubMed摘要数量的度量对每个子图中的每条边进行加权。发布支持和谓词断言由用于创建KG (多媒体附件1).另一项名为OmniCorp的ROBOKOP服务提供出版支持[20.],它包含了一个PubMed标识符图,这些标识符链接到在摘要中引用的概念(即ROBOKOP KG中的潜在节点)。OmniCorp是通过使用SciGraph命名实体识别应用程序编程接口处理所有PubMed摘要构建的。21并将标题和摘要中的文本与预定的生物本体中的概念相匹配。ROBOKOP答案排序算法根据答案子图的叶子之间的距离为每个答案子图计算一个置信分数,将边缘权重视为电阻,由欧姆定律定义[22].发表次数越多的答案子图排名越高,来自策划知识来源的发表次数比来自OmniCorp提供的发表共现的发表次数更重要。信心分数随后增加了“信息量”分数,其灵感来自NAGA评分模型[23),并处理更具体的新断言(例如,疾病X与基因相互作用NPC1),比一般的断言(例如,疾病X与免疫系统相互作用).

ROBOKOP KG也可以直接查询,独立于UI,使用Cypher查询语言[24]在KG中查找与查询结构匹配的子图。示例Cypher查询可在网上找到[15].

应用用例描述

EPR是一项对近2万名当前参与者的研究,旨在更好地了解环境暴露与健康和疾病的遗传决定因素之间的相互作用[25].该登记簿包含有关参与者接触和疾病史的调查数据,以及DNA样本和其他生物测量数据。作为更广泛努力的一部分,调查人员一直在探索工作场所暴露对imd的影响。

IMD定义为自我报告的过敏反应(过敏性鼻炎、花粉热或季节性过敏;过敏(季节性除外));哮喘状态;或自身免疫性疾病(牛皮癣、甲状腺疾病[非癌症]、甲状腺功能亢进、甲状腺功能减退、克罗恩病、多发性硬化症、乳糜泻、干燥病、类风湿性关节炎、溃疡性结肠炎、硬皮病或系统性硬化症、恶性贫血、肌炎或狼疮)。EPR调查数据提取于2018年12月。总样本量为4574名参与者。

进行了探索性分析,以检查每种IMD与具体工作场所化学品之间的关系,这些化学品被分为18类(多媒体附件2).这些化学品的调查问题来自EPR“暴露调查- A部分:外部暴露,B部分:工作中的化学和金属暴露”,一般结构如下:“请选择任何一个重金属你所接触过的每周锻炼15分钟以上在你做过的任何工作中(选择所有适用的)。”当样本量由于数据缺失或阳性病例很少而较小时,使用卡方分析或Fisher精确检验来检查工作场所化学品暴露与个体imd之间的关联。错误发现率校正应用于关联试验。化学药品分别检查,也按化学班级检查。具有下限和上界的比值比(or)按惯例计算,且不因样本量小而进行调整。由于这是一个探索性分析,显著性水平设置为α=。05或。10,我们没有控制潜在的协变量,如年龄,性别和种族。


应用用例结果

共有45个暴露- imd相关性在P<。10, with 20 associations significant atP<。05后错误发现率纠正。在所有情况下,工作场所的化学物质暴露与自我报告的IMD几率增加相关(多媒体).染料是与IMD相关的最常见的工作场所暴露类别。没有发现酸或胶水/粘合剂与IMD条件之间的关联。“过敏或过敏反应(季节性过敏除外)”和“过敏性鼻炎、花粉热或季节性过敏”是与工作场所化学品接触相关的最常见的IMD状况。

基于应用用例结果的roboop衍生机制断言

我们使用三个典型关联来突出ROBOKOP应用程序,选择这些关联是因为它们在P<。05,在特定化学品和化学品类别的水平上都很明显,并且具有不同化学品类别和imd的代表性:(1)一氧化碳-多发性硬化症,(2)氨-哮喘,(3)异丙醇-过敏性鼻炎,花粉热,或季节性过敏。下面提供了每个示例的ROBOKOP结果的概述,第一个示例突出显示了交互式UI的各种功能。

一氧化碳和多发性硬化

工作场所一氧化碳暴露与多发性硬化症之间的关联在化学水平上都是显著的(OR 6.4583, 95% CI 1.8524-18.2844;P=.006)和化学类水平(OR 3.8902, 95% CI 1.2521-10.3546;P= 03)。

我们向ROBOKOP提出了以下问题,但结构像一个机器问题:哪些基因可能介导一氧化碳暴露和多发性硬化症之间的联系?中显示通用问题、机器问题和答案集图2.ROBOKOP鉴定出7个子图和潜在的中介基因如下:肿瘤坏死因子(肿瘤坏死因子),脑源性神经营养因子(脑源性神经营养因子),IL10(白细胞介素- 10”),神经生长因子(神经生长因子),IRF8(干扰素调节因子8),KCNMA1(钾钙活化通道亚家族M α 1),以及CASP8(半胱天冬酶8)。

排名靠前的答案集有858篇PubMed出版物,由OmniCorp提供,支持多发性硬化症和癌症之间的联系肿瘤坏死因子和44篇PubMed出版物,同样由OmniCorp提供,支持一氧化碳和癌症之间的联系肿瘤坏死因子图3).另外25份PubMed出版物(来自OmniCorp)支持一氧化碳和多发性硬化症之间的联系,其中几份表明与血红素加氧酶-1有关,血红素加氧酶被描述为一种将血红素氧化为胆红素和一氧化碳的酶。〇多发性硬化症肿瘤坏死因子该协会由HETIO和Pharos共同建立。一氧化碳肿瘤坏死因子CTD建立了相关性,CTD的发表支持再次表明血红素加氧酶-1的作用[26].

图2。在面向知识的路径(ROBOKOP)中链接的生物医学对象的推理高级别问题(A)作为机器问题或元图(B)实现,旨在探索可能调解工作场所暴露于一氧化碳和环境多态性注册参与者自我报告多发性硬化症之间观察到的关联的基因。用户在ROBOKOP用户界面中选择节点和边(或通过直接Cypher查询),使用中提供的模式将所需的自然语言问题转换为可执行的机器问题图1作为向导。由此产生的聚合答案图(C)和答案子图列表(D)显示了6个潜在的中介基因。答案图和答案子图列表都是交互式的,用户可以探索。例如,在(D)中,用户可以单击每个答案子图来探索知识来源、谓词断言和发布支持。TNF:肿瘤坏死因子;BDNF:脑源性神经营养因子;IL10:白细胞介素- 10”;NGF:神经生长因子;IRF8:干扰素调节因子8;KCNMA1:钾钙活化通道亚家族M α 1; CASP8: caspase 8.
查看此图
图3。排名靠前的答案子图表明涉及肿瘤坏死因子(肿瘤坏死因子)(A)作为一种潜在基因,可能调节工作场所暴露于一氧化碳和多发性硬化症之间观察到的显著相关性。“生物医学对象推理与知识导向路径(ROBOKOP)”机器问题的结构如下:一氧化碳-基因-多发性硬化症。示例发布支持一氧化碳和肿瘤坏死因子提示血红素氧合酶-1的作用(B)。一氧化碳节点的元数据(C)。
查看此图
氨与哮喘

工作场所氨暴露与哮喘之间的关联在化学水平上均显著(OR 2.0422, 95% CI 1.4426-2.8524;P=.001)和化学等级(OR 1.5210, 95% CI 1.1938-1.9311;P =04)。

向ROBOKOP提出的查询旨在识别可能介导氨和哮喘之间联系的潜在基因,其结构与研究中的查询相似图2(ammonia-gene-asthma)。ROBOKOP通过聚合答案图确定了9个答案集或单独的路径。中间基因为艾达(腺苷脱氨酶),PRKG1(蛋白激酶cgmp依赖性1),S100B(钙结合蛋白B),肿瘤坏死因子MPO(髓过氧物酶),白细胞介素6(白细胞介素- 6),IL1B(β)PDE4A(磷酸二酯酶4A),和PARP1(聚adp -核糖聚合酶1)。

排名最低的答案子图艾达作为中介基因。与艾达表明ADA通过将腺苷转化为肌苷和氨代谢腺苷。对于这个答案子图,哮喘和氨之间的关系得到了93篇PubMed论文的支持,由OmniCorp确定。一个艾达使用Monarch建立了与哮喘的关系,OmniCorp提供了32篇支持PubMed的出版物。许多支持性出版物暗示了两者之间的关系艾达基因突变与哮喘、过敏和免疫功能[27].

异丙醇与过敏性鼻炎、花粉热或季节性过敏

工作场所异丙醇暴露与变应性鼻炎、花粉热或季节性过敏之间的关联在化学水平上是显著的(or 1.3990, 95% CI 1.1415-1.7155;P=.02)和化学类水平(OR 1.2323, 95% CI 1.0287-1.4764;P= .09点)。

与其他两个示例一样,向ROBOKOP提出的查询旨在识别中间基因,结构类似,除了“过敏性疾病”被用作疾病节点,而不是“过敏性鼻炎、花粉热或季节性过敏”,因为后一种疾病节点在ROBOKOP中不可用。

ROBOKOP鉴定出以下三个中介基因:白细胞介素6肿瘤坏死因子,CSF2(集落刺激因子2)。排名第二的答案集中的中介基因为白细胞介素6.异丙醇-白细胞介素6CTD与PubMed建立了合作关系,其中一份出版物由CTD提供,另外两份出版物由OmniCorp提供。一个白细胞介素6-过敏性疾病关系由Pharos建立,79篇支持PubMed的出版物由OmniCorp贡献。许多出版物[28]提示涉及先天免疫反应(如嗜碱性粒细胞、嗜酸性粒细胞和肥大细胞),几篇论文提示涉及神经免疫(如“过敏情绪”和海马炎症)[29].


调查结果及相关工作总结

我们在EPR队列中确定了工作场所化学品暴露与IMD状况之间的45个显著相关性,其中20个相关性在P<。05和很大程度上出乎意料的先验。关联的统计证据虽然重要,但并不能建立因果关系,也不能为潜在机制提供任何见解。因此,我们应用了开放的ROBOKOP KG系统,通过展示暴露和IMD条件之间的合理联系来验证观察到的关联,并提供了机制见解或假设来解释它们。我们重点介绍了以下三个用例应用:一氧化碳-多发性硬化症、氨-哮喘和异丙醇过敏性疾病。

ROBOKOP为一个以一氧化碳-基因-多发性硬化症为结构的问题确定了合理的答案子图,从而支持了工作场所暴露于一氧化碳和多发性硬化症之间的统计关联。ROBOKOP进一步鉴定了编码TNF的基因,肿瘤坏死因子,作为几种潜在的中介基因之一。ROBOKOP元数据和出版物支持表明,血红素氧化酶-1(将血红素氧化为胆红素和一氧化碳)起中介作用[26].血红素氧合酶-1水平在多发性硬化症患者中降低,并在疾病加重期间进一步降低[30.],而外源性一氧化碳或释放一氧化碳或诱导血红素氧合酶-1的化学物质似乎对多发性硬化症的实验模型有治疗作用[31].这些结果表明血红素氧合酶-1,通过一氧化碳具有体内平衡或抗炎作用,可以预防多发性硬化症或抑制疾病恶化。然而,最近的证据表明,胶质细胞中的慢性血红素加氧酶-1反应可能促进神经退行性变,从而加剧多发性硬化症和其他神经退行性疾病[32].

ROBOKOP返回的多个答案子图支持了工作场所氨暴露和哮喘之间的统计关联。编码ADA的基因,艾达ROBOKOP将其确定为这种关系的几个潜在中间体之一。ROBOKOP元数据表明ADA通过将腺苷转化为肌苷和氨来代谢腺苷。ROBOKOP发现了一些出版物,表明两者之间存在关联艾达突变与哮喘、过敏和免疫功能,包括一篇表明与阿斯匹林不耐受哮喘有关的出版物[27].最近的一项综述表明,ADA缺乏可能对多个器官系统产生不利影响,包括肺系统[33].一些较早的出版物表明,腺苷在哮喘患者中起着支气管收缩剂的作用[34],最近的一篇文章表明,接触氨与哮喘加重之间存在关联[35].这些结果支持了一种关系艾达突变与肺部并发症,以及氨与已确诊呼吸系统疾病患者肺部并发症之间的关联。

ROBOKOP提供了几个答案子图来支持工作场所暴露于异丙醇和过敏性疾病之间的统计关联。编码IL6的基因白细胞介素6,被ROBOKOP鉴定为几个潜在的中介基因之一,发表的支持表明参与先天免疫反应[28].此外,ROBOKOP还发现了一些文献支持,表明IL6参与了过敏性疾病的神经免疫和神经行为相关[29].虽然IL1被广泛认为在“疾病行为”中发挥着突出作用,但IL6似乎也发挥着作用[3637].这些发现表明,异丙醇暴露与过敏性疾病之间的关系实际上可能反映了异丙醇与过敏性疾病的神经/神经行为相关因素之间的关系。具体来说,结果表明异丙醇可能引发先天性神经免疫反应,导致il - 6水平升高,进而可能引发过敏性疾病的神经行为症状。

限制

ROBOKOP有几个限制,在解释这里的结果或使用应用程序时应该考虑这些限制。首先,工作场所化学品暴露和IMD之间的许多关联涉及复杂的化学混合物,如“调色剂”、“传动液”和“机油”。ROBOKOP目前将这些实体映射到医学主题标题术语,但该应用程序没有适当的方法来将这些混合物映射到构成给定混合物的单个化学品。我们正在考虑克服这一限制的方法。其次,ROBOKOP,像所有基于KG的应用程序一样,受到KG完成的挑战的限制。例如,如果在ROBOKOP KG基础上的策划数据源之一没有建立暴露-基因关系,那么这种关系将不会被识别。我们正在开发算法,通过推断KG中的边来克服这一限制,但目前,这仍然是一个限制。第三,ROBOKOP断言的证据来自以下两个主要来源:(1)用于创建KG的策展知识来源和(2)PubMed摘要中术语的共现。用于对答案子图进行排名的排名和评分算法是基于这两个证据来源,第一个来源比第二个来源更重要。其他相关因素,如发表日期和主题的研究数量(相对于出版物),目前没有考虑,但可能会被纳入应用程序的未来版本。 Fourth, as a prototype system, ROBOKOP does not yet support natural language processing capabilities or other sophisticated approaches to aid users. We encourage users to contact the developers and/or post GitHub issues should they encounter any challenges when generating queries and/or evaluating answer subgraphs. Fifth, while not a limitation of ROBOKOP itself, the workplace chemical exposure–IMD associations reported here were derived from survey data (ie, participant self-report) and were not confirmed by clinical record review or expert judgement. As such, the potential exists for misclassification and/or bias in both the reported exposures and the reported IMDs. Moreover, the timing between workplace exposure and the onset of IMD cannot be determined due to limitations of the survey design and participant recollection at the time the survey was administered. Finally, as this was an exploratory analysis, we did not adjust the ORs for small sample sizes or control for potential covariates such as age, sex, and race.

结论

ROBOKOP在支持现实世界观察和产生机械假设方面展示了其潜力。在本文中,我们重点研究了工作场所化学品暴露与IMDs之间的显著关联,这是一项更大的EPR研究的一部分。然而,我们注意到ROBOKOP还有其他用途。事实上,ROBOKOP的一个关键特征是它作为一个通用的问答系统在生物医学领域的通用性,具有支持各种机器问题的能力。例如,我们正在使用ROBOKOP来探索药物和临床结果之间的关联,包括不良事件,使用来自电子健康记录的数据。我们还在测试ROBOKOP是否可以用于支持医学院入学考试中的人类推理,我们有了很有希望的初步结果[38].虽然ROBOKOP KG目前是根据生物医学知识来源构建的,但一般方法并不局限于生物医学领域。事实上,代表我们机构的领导层,我们正在开发一个ROBOKOP KG的新版本,重点是探索研究计划和研究者特征之间的关系。

ROBOKOP的第二个关键特征是它支持快速发现的能力。例如,这里给出的示例用例只花了很少的时间来构建和执行,交互式UI甚至允许新手用户提出问题并探索答案子图。从ROBOKOP答案子图中收集到的机制见解很快得到了实现,从而实现了对结果的快速首次分析和对支持证据的评估。此外,ROBOKOP通过一个查询揭示了所有可能介导所观察到的暴露- imd关联的潜在基因;实际上,用户不需要花费数小时、数天或更长的时间来阅读可用的文献。ROBOKOP提供的这种发现速度也允许调查人员快速反驳可能只是虚假发现的关联(例如,如果ROBOKOP没有返回答案子图)。在本文强调的示例中,我们主要关注三个示例暴露- imd关联。虽然这看起来并不多,但一个完整的文献综述,以确定潜在的新见解,消除虚假的发现,并探索支持证据,将比使用ROBOKOP进行最初的首次分析所需的时间多得多。我们计划利用ROBOKOP的速度,在单核苷酸多态性和表型之间的关联的大规模分析中进行发现,这是更广泛的EPR工作和其他几项研究的一部分。

ROBOKOP的第三个关键特征是它的开放性。事实上,访问ROBOKOP,无论是通过UI还是直接通过Cypher查询底层KG,都不需要登录身份验证或帐户;相反,任何拥有URL的人都可以访问系统。此外,ROBOKOP KG可独立于应用程序下载[15].ROBOKOP的开放性和访问它的多种途径使科学民主化,再加上应用程序提供的发现速度,应该会加速生物医学和许多其他领域的进步。

致谢

作者要感谢生物医学数据翻译联盟的支持和智力投入。我们也承认并感谢更广泛的生物医学对象推理与知识导向路径(ROBOKOP)团队的贡献,包括Vinicius Alves、Jim Balhoff、Steven Cox、Yaphet Kabede、Daniel Korn、Eugene Muratov和Max Wang。此外,我们感谢环境多态性Registry (EPR)执行领导委员会成员和EPR IMD研究小组的其他成员,包括Farida Akhtari、Montserrat Ayala-Ramirez、Perry Blackshear、Askia Dunnon、David Fargo、Michael Fessler、Stavros Garantziotis、Janet E Hall、Nathaniel MacNell、John McGrath、Alison Motsinger-Reif和Christine Parks进行了有益的讨论,以及Jeremy Erickson、Andy Rooney和Vickie Walker对手稿的有益评论。这项工作得到了美国国立卫生研究院国家转化科学推进中心(OT2TR002514)和美国国立卫生研究院国家环境卫生科学研究所(ZID ES103354-01)内部研究项目临床研究分支的支持。

通讯作者(KF)可通过kfecho@copperlineprofessionalsolutions.com或kfecho@renci.org联系。

作者的贡献

所有作者都以实质性的方式对本文所述的工作做出了贡献,并批准了该手稿提交期刊。

利益冲突

没有宣布。

多媒体附件1

在面向知识路径(ROBOKOP)知识图数据源中链接的生物医学对象的推理。

PDF档案(adobepdf档案),96kb

多媒体附件2

研究了工作场所化学品暴露与免疫介导疾病的关系。

PDF档案(adobepdf档案),68 KB

多媒体

工作场所暴露与免疫介导疾病之间的显著关联,被确定为环境多态性登记的一部分。

PDF档案(adobepdf档案),153 KB

参考文献

  1. 尼克尔森DN,格林CS。构建知识图谱及其生物医学应用。计算结构生物技术2020;18:1414-1428 [免费全文] [CrossRef] [Medline
  2. 王志强,杨凤霞,李志强,等。DrugBank 5.0: 2018年对DrugBank数据库的重大更新。核酸Res 2018 Jan 04;46(D1):D1074-D1082 [免费全文] [CrossRef] [Medline
  3. Davis A, Grondin C, Johnson R, Sciaky D, McMorran R, Wiegers J,等。比较毒理学基因组学数据库:2019年更新。核酸Res 2019 Jan 08;47(D1):D948-D954 [免费全文] [CrossRef] [Medline
  4. 蒙多疾病本体论。URL:http://www.obofoundry.org/ontology/mondo.html[2021-06-25]访问
  5. Köhler S, Carmody L, Vasilevsky N, Jacobsen J, Danis D, Gourdine J,等。人类表型本体论(HPO)知识库和资源的扩展。核酸Res 2019 Jan 08;47(D1):D1018-D1027 [免费全文] [CrossRef] [Medline
  6. 陈世峰,陈世峰,陈世峰,等。生物医学知识的系统整合优先考虑药物的再利用。Elife 2017 9月22日;6:e26726 [免费全文] [CrossRef] [Medline
  7. 陈b,丁y, Wild DJ。利用语义关联数据评估药物靶标关联。科学通报,2012年7月5日;8(7):e1002574 [免费全文] [CrossRef] [Medline
  8. Bollacker K, Evans C, Paritosh P, Sturge T, Taylor J. Freebase:用于构建人类知识的协作创建的图形数据库。在:SIGMOD '08: 2008年ACM SIGMOD数据管理国际会议论文集。2008年发表于:2008年ACM SIGMOD数据管理国际会议;2008年6月9日至12日;加拿大温哥华,1247-1250年。[CrossRef
  9. Austin CP, Colvis CM, Southall NT.解构巴别塔的翻译。临床翻译科学2019 3月;12(2):85 [免费全文] [CrossRef] [Medline
  10. 生物医学数据翻译协会。生物医学数据翻译计划:概念、文化和社区。临床翻译科学2019 Mar 09;12(2):91-94 [免费全文] [CrossRef] [Medline
  11. 生物医学数据翻译协会。迈向通用生物医学数据转换器。临床翻译科学2019 Mar 09;12(2):86-90 [免费全文] [CrossRef] [Medline
  12. 王鹏,王晓明,王晓明,等。ROBOKOP KG和KGB:来自联邦资源的集成知识图表。J chemistry Inf Model 2019年12月23日;59(12):4968-4973。[CrossRef] [Medline
  13. 王鹏,王晓燕,王晓燕,王晓燕,等。ROBOKOP:知识图的抽象层和用户界面,以支持问题回答。生物信息学2019 Dec 15;35(24):5382-5384 [免费全文] [CrossRef] [Medline
  14. Robokop:在面向知识的路径中链接的生物医学对象的推理。URL:https://robokop.renci.org[2021-06-25]访问
  15. 连接到Neo4j。URL:https://robokopkg.renci.org[2021-06-25]访问
  16. Biolink模型。URL:https://biolink.github.io/biolink-model/[2021-06-25]访问
  17. 黄志,郑勇,程锐,孙勇,Mamoulis N,李霞。元结构:大型异构信息网络的计算相关性。在:KDD '16:第22届ACM SIGKDD知识发现和数据挖掘国际会议论文集。2016年发表于:第22届ACM SIGKDD知识发现和数据挖掘国际会议论文集;2016年8月13-17日;旧金山,加州1595-1604页。[CrossRef
  18. 方勇,林伟,郑伟,吴敏,常凯,李霞。基于元图学习的图语义接近搜索。2016年发表于:第32届国际数据工程会议(ICDE);2016年5月16-20日;芬兰赫尔辛基,第277-288页。[CrossRef
  19. 赵宏,姚强,李娟,宋勇,李东。基于元图的异构信息网络推荐融合。在:KDD '17:第23届ACM SIGKDD知识发现和数据挖掘国际会议论文集。2017年发表于:第23届ACM SIGKDD知识发现和数据挖掘国际会议论文集;2017年8月13-17日;纽约,NY p. 635-644。[CrossRef
  20. NCATS-gamma / omnicorp。GitHub。URL:https://github.com/NCATS-Gamma/omnicorp[2021-06-25]访问
  21. SciGraph / SciGraph。GitHub。URL:https://github.com/SciGraph/SciGraph/[2021-06-25]访问
  22. 克莱因DJ,兰迪克M.阻力距离。《数学与化学》1993年12月;12(1):81-95。[CrossRef
  23. Kasneci G, Suchanek F, Ifrim G, Ramanath M, Weikum G. NAGA:知识搜索和排名。2008发表于:第24届国际数据工程会议;2008年4月7日至12日;墨西哥坎昆。[CrossRef
  24. 密码查询语言。Neo4j。URL:https://neo4j.com/developer/cypher-query-language/[2021-06-25]访问
  25. 探索你的基因如何与环境相互作用。环境多态性登记处,北卡罗来纳州DNA库。URL:https://dnaregistry.niehs.nih.gov/[2021-06-25]访问
  26. Brouard S, Berberat PO, Tobiasch E, Seldon MP, Bach FH, Soares MP。血红素氧合酶-1来源的一氧化碳需要激活转录因子NF-κB来保护内皮细胞免受肿瘤坏死因子-α介导的凋亡。生物化学杂志2002年5月;277(20):17950-17961。[CrossRef
  27. 金森,金勇,朴h,金森,金森,叶勇,等。阿斯匹林不耐受哮喘中的腺苷脱氨酶和腺苷受体多态性。呼吸医学2009 Mar;103(3):356-363 [免费全文] [CrossRef] [Medline
  28. 杨松,吴娟,张强,李霞,刘东,曾波,等。大鼠变应性鼻炎与海马的炎症反应有关。Behav Neurol 2018 april 16;2018:8750464 [免费全文] [CrossRef] [Medline
  29. 李志刚,刘志刚,刘志刚,Rösen-Wolff;“过敏情绪”-季节性变应性鼻炎(SAR)患者的抑郁和焦虑症状及其与炎症、内分泌和过敏标志物的关系。Brain behaviour Immun 2017年10月;65:202-209。[CrossRef] [Medline
  30. Fagone P, Patti F, Mangano K, Mammana S, Coco M, Touil-Boukoffa C,等。血红素加氧酶-1在外周血单个核细胞中的表达与多发性硬化症的疾病活动性相关。中华神经免疫杂志2013年8月15日;[CrossRef] [Medline
  31. Fagone P, Mangano K, Coco M, Perciavalle V, Garotta G, Romao C,等。一氧化碳对多发性硬化症的治疗潜力。临床实验免疫学2012 Feb;167(2):179-187 [免费全文] [CrossRef] [Medline
  32. 宋伟,王志刚,王志刚。血红素氧化酶-1在脑老化和疾病中的作用。Prog神经生物学2019年1月;172:40-70。[CrossRef] [Medline
  33. 腺苷脱氨酶缺乏症综述。欧菲尼特J稀有疾病2018年4月24日;13(1):65 [免费全文] [CrossRef] [Medline
  34. 吴伟林,张志刚,张志刚。腺苷在哮喘支气管收缩中的作用机制探讨。中国临床药物学杂志1990;30增刊1:8s - 98s [免费全文] [CrossRef] [Medline
  35. Holst G, Thygesen M, Pedersen C, Peel R, Brand J, Christensen J,等。氨、铵和哮喘风险:丹麦儿童基于登记的病例对照研究。环境流行病学2018;2(3):e019。[CrossRef
  36. 细胞因子、疾病行为与抑郁。免疫过敏临床北Am 2009年5月;29(2):247-264 [免费全文] [CrossRef] [Medline
  37. Burton MD, Sparkman NL, Johnson RW。抑制大脑中的白细胞介素-6转信号,有助于从脂多糖诱导的疾病行为中恢复。《神经炎症学杂志》2011年5月19日;8(1):54 [免费全文] [CrossRef] [Medline
  38. 王鹏,张晓东,张晓东,王晓东,等。生物医学问答系统在MCAT问题推理中的应用。出席:AMIA 2020虚拟年度研讨会;2020年11月14日至18日;虚拟的。


艾达:腺苷脱氨酶
仪:比较毒理基因组学数据库
EPR:环境多态性登记处
白细胞介素6:白细胞介素- 6
洛桑国际管理发展学院:免疫介导性疾病
公斤:知识图谱
或者:优势比
ROBOKOP:基于知识导向路径的生物医学对象推理
肿瘤坏死因子:肿瘤坏死因子
界面:用户界面


C·洛维斯编辑;提交22.12.20;杨j,陈j, M Devarakonda同行评审;对作者25.02.21的评论;订正版本收到26.04.21;接受27.04.21;发表20.07.21

版权

©Karamarie Fecho, Chris Bizon, Frederick Miller, Shepherd Schurman, Charles Schmitt, William Xue, Kenneth Morton, Patrick Wang, Alexander Tropsha。最初发表于JMIR医学信息学(https://medinform.www.mybigtv.com), 20.07.2021。

这是一篇开放获取的文章,根据创作共用署名许可协议(https://creativecommons.org/licenses/by/4.0/)的条款发布,允许在任何媒介上不受限制地使用、分发和复制,前提是正确引用了首次发表在JMIR医学信息学上的原创作品。必须包括完整的书目信息,https://medinform.www.mybigtv.com/上的原始出版物的链接,以及此版权和许可信息。


Baidu
map