医学互联网研究杂志-使用深度神经网络模型检测潜在的药物不良反应

原始论文

¹国立成功大学计算机科学与资讯工程系，台南，台湾

²台湾台南，国立成功大学医学院药学院

^3.国立成功大学医学院临床药学与药学研究所，台南

⁴国立成功大学附属医院药剂科，台南，台湾

⁵国立成功大学医学资讯研究所，台南，台湾

通讯作者:

蒋重显，博士

计算机科学与信息工程系“，

国立成功大学

大学道1号

台南,701

台湾

电话:886 6 2757575 ext 62534

电子邮件:jchiang@mail.ncku.edu.tw

背景:药物不良反应(adr)很常见，是每年造成100多万人严重受伤和死亡的根本原因。最常见的检测adr的方法是依靠自发报告。不幸的是，自发报告率低是药物警戒的严重限制。

摘要目的:本研究的目的是确定一种利用深度神经网络(DNN)自动检测药物潜在不良反应的方法。

方法:我们设计了一个DNN模型，利用药物的化学、生物和生物医学信息来检测adr。该模型旨在实现两个主要目的:识别药物的潜在adr和预测新药可能的adr。为了提高检测性能，我们在向量空间中分布目标药物的表示，使用词嵌入方法来处理大量的生物医学文献，以捕获药物关系。此外，我们还构建了一个映射函数来处理数据集中没有出现的新药。

结果:利用2009年的药品信息和药品不良反应报告，我们预测了2012年的药品不良反应记录。有746种药物和232种新药，仅2012年就记录了1325个adr。实验结果表明，该模型在前10位的平均平均精度为0.523，在数据集上的ADR预测的接受者工作特征曲线(AUC)评分下的rea为0.844。

结论:我们的模型在识别药物的潜在adr和新药的可能adr方面是有效的。最重要的是，它可以检测出潜在的adr，而不管过去是否报告过。

中国医学网络杂志2019;21(2):e11016

doi: 10.2196/11016

关键字

药物不良反应；深度神经网络；药物表示；机器学习；药物警戒

药物不良反应[1，2是一个严重的问题，指的是尽管服用了常规剂量的药物，还是会出现副作用。据估计，住院患者中发生严重不良反应超过200万例，每年造成10万人死亡[3.，4］．不幸的是，由于数据不足，很难识别或预测潜在的adr。

在上市前和上市后阶段的自发报告是早期识别adr最常见的方法。具体而言，临床试验的安全性报告用于列出上市前阶段常见的adr [5]，而从各种数据库和市场调查中收集和分析的数据，如药物警戒和风险管理，则用于上市后阶段。尽管大多数新的不良反应都是从自发报告中发现的，>90%的不良反应都没有报告[6，7];这被认为是一个主要的限制。制药公司正在努力避免药物开发阶段的副作用。然而，尽管它们可以识别和处理常见的副作用，但识别或预测罕见和严重的副作用通常是不可行的。为了克服这些限制，一些研究利用大量数据和各种信息来源，使用统计方法预测不良反应[8]和机器学习方法[9］．

识别不良反应的基本方法涉及从不同的信息来源识别药物及其副作用之间的关系[10-12例如临床试验、电子病历(EMRs)、社交媒体和生物医学文献。例如，PubMed包含有助于药品不良反应检测的有价值的信息。卡里米等[13]回顾了与计算机科学相关的数据挖掘和技术，这些技术已经在药物安全领域进行了研究，以识别来自不同来源的不良反应报告。Tatonetti等[14]提出了一种构建预测模型的新算法，该模型可以检测不良事件报告中的隐藏相互作用，从而推断未报告的不良事件。王等[15]开发了一个使用数据挖掘从数百万份emr中提取信息的adr识别模型。它使用带有特定药物和已知药物不良事件(ADE)信息的临床记录，这些信息已使用统计方法进行预处理，以计算给定药物障碍对代表有效ADE关联的概率。该方法根据PubMed引用的内容自动确定特定不良事件是否由特定药物引起[16］．芬克尔斯坦等人[17]开发了一种自动检测和总结期刊论文adr信息的工具。然后，它为医生在用户友好的界面上对药物的adr进行了排名。

一些研究利用药物的化学或分子途径来预测不良反应[18］．卡米等[19]开发了一种通过使用特定药物和不良事件的信息来预测可能未知的ade的新方法。洛伯鲍姆等人[20.)假设系统生物学和化学基因组学数据可以通过突出与目标表型有机制联系的药物并过滤那些没有机制联系的药物来改善药物安全性监测。他们提出了一种算法，药物安全子网络的模块化组装，以结合系统药理学和药物警戒数据。该算法显著改善了4种临床相关adr的药物安全性监测。黄等[21]提出了一个通过整合蛋白质-蛋白质相互作用网络与药物结构来预测ADR概况的框架。一些研究人员利用药物的化学、生物学和表型特征来预测不良反应。刘等[22]提出了一种整合化学结构、生物学特性、蛋白靶点和通路信息等表型特征的机器学习预测adr的方法。

然而，这些方法大多依赖于大量手工制作的特征，并将ADR识别视为一个分类问题，这没有考虑到所发现的ADR的顺序。因此，该过程往往更昂贵，并导致模型训练阶段药物-不良反应关系的重要信息丢失。此外，这些方法无法预测新药的不良反应，增加了ADR的检测难度[19］．

为了解决这些限制，我们使用深度神经网络(DNN)模型来检测药物的不良反应。该模型有两个目的:识别不良反应，这需要从已知的不良反应记录中发现药物的潜在不良反应，以及预测不良反应，这涉及到预测新药可能的不良反应。我们使用词嵌入方法和映射函数来处理数据集中没有出现的新药。此外，我们用不同的特征组合和DNN架构中隐藏层的数量来检查模型的整体性能。

数据描述

为了开发和评估DNN模型，我们使用了Side Effect Resource (SIDER)的数据[23]，这是一个副作用药物数据库，载有2009年以来市面上药物的资料及其记录的不良反应[24］．我们从SIDER收集了2009年和2012年的ADR信息，以代表模拟前瞻性方法。这两年共记录了746种药物和1325种与这些药物相关的副作用。另有232种药物仅作为新药出现在2012年的数据集中。从临床前研究阶段到上市后监测药物整个生命周期的不良反应非常重要。药物的基本性质依赖于临床前在体外安全性分析涉及对化合物的化学和生物特性的测试。因此，我们将这些属性提取为模型中特征的一部分。我们从PubChem中提取了17种药物的分子描述符[25) (文本框1)．我们利用了DrugBank的生物学特征[26]来表示生物分子间的相互作用和途径。这些特征包括每种药物的靶标、酶、转运蛋白和载体及其作用。

为了丰富科学证据，加强药品不良反应的检测，我们从医学文献分析与检索系统在线(MEDLINE)收集了数百万篇论文[27作为辅助数据来丰富每种药物的信息。我们使用每种药物的名称作为查询词，并选择了2009年之前发表的所有与该药物相关的论文，如病例报告、临床试验和观察性研究。收集2009年以前发表的论文的原因是，我们想模拟2009年到2012年毒品监测的进展。

本研究确定了17个化学特征的分子描述符。

分子量
XLogP3
氢键供体数量
氢键受体计数
可旋转键数
准确的质量
单一同位素的质量
拓扑极表面积
重原子计数
形式电荷
复杂性
同位素原子计数
已定义原子立体中心计数
未定义原子立体中心计数
已定义Bond立体中心计数
未定义Bond立体中心计数
共价键合单位数

文本框1。本研究确定了17个化学特征的分子描述符。

药品描述的特点

我们将ADR识别视为一个信息检索问题，这样我们的模型就可以发现每种药物与记录的1325种副作用之间的潜在关系。我们用1或0对应副作用的存在或不存在的元素的二进制剖面来表示1325个维度的预测目标，Y∈ℕⁿ^×1325与n就是药物的数量。每种药物都与3类特征相关:化学性质、生物性质和文献信息。同时纳入已知药品不良反应记录。预处理后，我们过滤掉2个空属性:同位素原子计数和未定义的键立体中心计数。随后，用15维向量表示化学性质的特征X_化学∈ℝⁿ^×15对于每个元素。从DrugBank中提取的生物特性包含4个阶段的信息，包括载体、酶(用于药物代谢)、蛋白靶标和转运体(用于药物转运)。预处理后，我们利用生物信息用1048维载体表示每种药物，其中包括788个蛋白质靶点，162个酶，85个转运蛋白和13个载体X_生物∈ℕⁿ^×1048用于每个元素中的不同操作类型。已知的药品不良反应记录在识别潜在的不良反应中起着重要作用。因此，我们利用这些信息来预测2012年出现的潜在adr。

生物医学文献在本研究中发挥了重要作用，因为生物医学文献中包含了大量与药物和adr相关的信息，如临床记录和病例报告。然而，从生物医学文献中提取药物信息的一个问题是不确定哪些词或文件代表药物。因此，我们利用最流行的嵌入方法之一Word2Vec[]训练模型来理解2009年之前介绍的764种药物的230万篇生物医学论文中的药物语义特征。28-30.]来使用skip-gram模型对其进行建模。随后，我们使用药名的载体作为药物载体(drug2vec, D2V)，X_D2V∈ℝⁿ^×400,n就是药物的数量。我们在实验中观察到D2V所代表的特征比内在特征更全面。但是，由于我们使用药物名称作为查询词，我们无法识别与232种新药相关的论文。为了解决在嵌入训练步骤中未观察到的药物，我们通过引入药物描述映射函数扩展了D2V。使用V_D2V表示训练和中存在的药物向量的词嵌入空间V_DDV表示新药描述向量的是论文中与新药相关的每个词向量的总和，即映射函数f（v)：V_DDV→V_D2V是由W，以致于v ' =西弗吉尼亚州为v∈V_DDV而且v '∈V_D2V［31]使用最小绝对收缩和选择算子回归来训练W［32］．这种扩展方法使模型能够处理新的药物，使其更加灵活。

图1。深度神经网络模型的结构，用于预测和识别药物可能的不良反应(adr)。在预测之后，我们通过对模型输出的adr概率进行排序，生成了一个药物可能的adr列表。

药物不良反应检测深度神经网络模型描述

我们设计了一个DNN模型，可以识别和预测不同需求的药物的不良反应。这个模型(图1)是基于一种常见的DNN架构，多层感知器[33]，在之前的几项研究中已经成功应用。我们在每个密集层之间增加了dropout层，以避免在训练步骤中模型过拟合[34，35］．每一层的非线性转换过程保证了模型能够从输入数据中学习到更多的信息。该模型旨在识别和预测药物潜在的不良反应。识别功能是通过已知的药品不良反应记录和药品的各种特征来寻找药品的潜在不良反应。预测函数用于检测新药潜在的不良反应。我们设计了两种特征表示形式(图2)来区分识别和预测的任务。在预测中，我们假设一种新药的ADR记录为空。因此，已知ADR记录为零的特征说明新药可能的ADR仅依赖于语义特征(drug2vec)、化学性质和生物学性质。

我们将识别任务视为信息检索问题，因为药物可能有不止一种不良反应。因此，我们在最后一层设计了1325个隐藏节点，这等于数据集中adr的数量。评估不良反应发生的概率y一种给定的药物x，我们定义了p（y∣x) = σ(Wh+b)， σ为sigmoid函数，传递隐向量h取0到1之间的值。我们学过p（y∣x的交叉熵最小D．当θ表示模型的所有参数时，目标函数ℒ(D， θ)的公式如下:

ℒ(D， θ) =−求和（y_我日志［p（y | x)] + [1−y_我］日志［1−p（y | x]) / n

在这项研究中，我们对DNN模型的性能进行了详细的分析。让问表示数据集中药物的数量。我们使用接受者工作特征曲线下的面积来评估模型，如图所示表1，平均平均精度(MAP)AvePrecision（问) /问该方法已广泛应用于多标签问题和信息检索评价。首先，我们评估了不同特征组合检测药物不良反应的能力。我们检查了我们的模型的性能，参考的特征提出图3(左图)。药物特征包括生物特征、化学特征和D2V特征。化学特征被发现表现不佳，因为重复和难以区分的化学性质提取。

此外，我们去掉了D2V，保留了其他特征来训练模型。结果表明，D2V的信息量最大，这可能是因为D2V从数百万篇论文中学习了有价值的信息。然后重点比较了几种常用的方法。我们比较了3种机器学习方法的能力，即概率矩阵分解(PMF)，线性支持向量分类器和高斯Naïve贝叶斯[36，37]，以预测和识别药物的不良反应。图3(右图)显示了不同模型的性能，基于5次交叉验证，使用所有生物、化学和D2V属性作为特征，PMF除外。PMF表现最差，因为它仅基于潜在信息考虑药物和不良反应之间的关系。我们的模型优于其他模型的原因之一是，通过深度学习中的非线性转换，药物的特征丰富了信息。

随后，我们研究了我们的模型是否可以处理预测和识别的具体任务。预测任务的表现(图4(左边的图像)超过了识别任务。识别任务比预测更困难，因为前者需要检测潜在的罕见adr。尽管该模型的识别功能可以改进，但其总体性能表明其能够同时处理这两项任务。

此外，我们用不同数量的隐藏层绘制模型的性能(图4(右图)。模型的性能并没有随着隐藏层数的增加而提高。有2个隐藏层的模型优于其他模型。具体而言，由于3个隐藏层的数据大小有限，模型无法从数据中学习到好的参数。显然，隐藏层的数量依赖于DNN中的数据属性和数据量。

为了评估我们的映射功能，我们通过将药物描述转移到D2V来检查药物扩展。结果，如图所示表2，表明我们的映射函数可以适应D2V的性能。通过映射函数对药物进行描述的性能略好于D2V，这可能是因为D2V的空间中并不存在某些药物。这一发现表明，如果没有映射功能，该模型无法预测此类药物的不良反应。因此，发现映射函数使模型更灵活地处理新药。

表1。结果表明，以接受者工作特征曲线(AUC)下面积来评价模型的性能。

模型	AUC
概率矩阵分解	0.500
线性支持向量分类器	0.523
高斯Naïve贝叶斯	0.597
无隐藏层的深度神经网络不良反应(DNN ADR)	0.641
1隐含层的DNN ADR	0.823
具有2个隐藏层的DNN ADR	0.844^一个
DNN ADR具有3个隐藏层	0.814
无生物特性的DNN ADR	0.823
无化学特征的DNN ADR	0.837
无药物vec特征的DNN ADR	0.803
平均每日房价款	0.844

^一个斜体的值表示该比较中的最佳结果。

图3。左:不同特征组合检测药物不良反应的效果;右:我们的深度神经网络(DNN)模型与各种机器学习方法的比较。PMF:概率矩阵分解;线性支持向量分类器Linear svc;高斯Naïve贝叶斯。

图4。左:深度神经网络(DNN)模型在药品不良反应(ADR)识别预测任务中的表现及总体表现;右:在这个实验中，我们用几个不同的层展示了模型的性能。GaussianNB:高斯Naïve贝叶斯;线性支持向量分类器。

表2。结果显示，映射函数能够以Top N的平均精度(MAP@N)将药物描述转移到drug2vec。

MAP@N	1	3.	5	10	15	20.
映射函数	0.068^一个	0.179	0.272	0.462	0.462	0.462
drug2vec	0.065	0.174	0.267	0.453	0.453	0.453

^一个斜体的值表示该比较中的最佳结果。

主要研究结果

在这项研究中，我们的目标是增加药物信息的多样性，以提高我们检测adr的能力。因此，我们从药物的化学和生物特性以及现有的生物医学文献中提取信息。选择MEDLINE作为生物医学文献的来源，以确定重要的辅助数据，因为它包含几种类型的生物医学论文，如临床试验、病例报告和观察性研究，与药物有关。然而，从数以百万计的论文和单词中，很难使用关键词来识别特定的药物。因此，我们利用230万篇生物医学论文，使用Word2Vec中的skip-gram模型来识别药物的语义特征。特别是一个中心词w_t在考虑下，概率p（w_t_±_我∣w_t)来预测周围的单词w_t_±_我取决于w_t．下标t表示目标词，例如药物名称“Dantrolene”，而我表示目标字的Windows大小。这个特征帮助我们提取每个单词的潜在信息，包括构成药物名称的单词。在这个词嵌入训练之后，我们研究了语义特征(D2V)是否可以代表药物的性质，如生物医学和化学性质。我们将学习到的药物嵌入向量之间的关系基于它们的相似性(图5)．该图包括746种药物，并展示了这些药物与从语义特征中学习到的潜在信息之间的关系。每个节点表示一种药物，边缘表示其他药物之间的相似性。每对药物越相似，它们在图中的位置就越接近。较大的节点代表与其他药物更相似的药物。我们发现该模型似乎集中了用于特定治疗的药物。

图5。利用深度神经网络模型的语义特征(drug2vec)建立药物之间的关系。图中有746个节点，每个节点代表一种药物。聚类表示具有特定治疗的药物。上图:该组包括抗抑郁药物;中:该集群含有抗生素;下:该集群包括眼科药物。

例如，蓝色圆圈所示的簇中的药物图5(上图)包括抗抑郁药，如曲唑酮、西酞普兰、氯丙咪嗪和帕罗西汀。右边的簇含有抗生素，如氨苄西林、头孢他啶、头孢氧肟，如图所示图5(中间的图片)。此外，底部的群集包括眼科药物，如氟米隆、左旋他汀、布林唑胺和地哌弗林(图5，图片在底部)。还有其他一些小的集群，它们有自己的特定治疗方法。因此，我们从文本层面的嵌入功能所包含的论文中了解了药物与潜在信息之间的关系。因此，语义特征对模型的性能有很大的影响。

随后，我们参照Micromedex定义的严重不良反应，检查了该模型执行其识别和预测功能的能力。利用模型的识别函数，我们将潜在adr按其出现的概率在列表中排序(表3)．其中一个原因是ADR出现的概率表3不是很突出的是这些adr的阳性样本在这个数据集中很少被报道。然而，我们的模型可以确定羟氯喹导致肌肉痉挛，这是严重的神经肌肉疾病中发生的严重不良反应。此外，我们提取了仅在2012年被记录的5种药物来检验该模型的预测功能。

表3。模型的药物不良反应(ADR)预测和识别结果。

药物		严重的ADR	排名	概率
已知不良反应记录药品的鉴定结果
	丹曲林	贫血	12	0.012
	丹曲林	充血性心力衰竭	15	0.009
	羟氯喹	肌肉痉挛	1	0.997
	羟氯喹	畏光	16	0.017
	19-nortestosterone	血清胆固醇升高	4	0.150
	氯化氨甲酰胆碱	视网膜脱离	3.	0.690
无不良反应记录药品的预测结果
	Atazanavir	贫血	17	0.920
	Carbinoxamine顺丁烯二酸盐	粒细胞缺乏症	14	0.453
	Carbinoxamine顺丁烯二酸盐	贫血、溶血性	16	0.340
	内	高血糖	20.	0.750
	Temsirolimus	感染	20.	0.974
	Zoladex	心肌梗死	7	0.961
	Zoladex	超敏反应	12	0.920

结果表明，我们的模型具有预测新药严重不良反应的能力。例如，该模型预测Zoladex可能导致严重的不良反应——心肌梗死，这是发展中国家最常见的死亡原因之一。

限制

这项研究有几个局限性，需要在未来的研究中加以解决。首先，数据多样性在模型中起着重要作用。我们只使用了在SIDER上发表的数据。如果我们能从不同的数据集中包含更多的数据，我们的模型将更有说服力和可靠。由于药物的化学和生物特性对其对人体的影响影响最大，因此包含药物特性的数据库越多，我们的模型性能越好。另一方面，如果我们能够获得更多的开源数据，包括临床试验、自发报告系统和政府和制药行业支持的EMRs，我们的模型将有更好的预测。此外，我们的模型侧重于ADR的预测和识别。为了识别每个ADR发生的概率，我们在输出层设置了1325个隐藏节点和数据集中ADR的总数。换句话说，虽然我们有一个映射功能来处理新药，但这个模型只能预测现有的adr。因此，在未来的工作中，我们计划利用药物- adr相互作用等更详细的特征[13]，药物-药物相互作用，ADR-ADR相互作用网络预测不良反应。此外，我们还计划研究其他嵌入方法来表示adr，以帮助预测药物和新的adr之间的关系。

结论

基于药品的生物化学特性和语义特征(D2V)，建立了一种新的药品不良反应检测模型。在与成功大学医院和临床药学与药学研究所的领域专家讨论药物相似性后，我们发现D2V可以代表药物的一个特征。我们的模型不仅可以发现药物潜在的不良反应，还可以预测新药可能的不良反应。为了根据以往的记录发现潜在的adr，我们的模型可以识别ADR-ADR相互作用之间的隐藏关系。此外，为了预测没有任何ADR记录的新药可能的ADR，使用D2V特征，我们的映射函数在将药物描述转移到D2V方面表现出良好的分析。该模型在两项任务中都表现良好，并产生了最合适的结果。它将帮助药剂师和卫生保健提供者了解药物副作用的潜在风险，并解决自发报告漏报的问题。最重要的是，我们的模型将通过识别和预测潜在的不良反应来帮助药物警戒。

致谢

作者对科学技术部(MOST)和卫生福利部(MOHW)的支持表示非常感谢(资助号:MOST 104-2923-E-006-003-MY3, MOST 107-2634-F-006-006, MOHW105-FDA-D-113-000416)。作者还想感谢参与常规测试和案例研究的硕士生曾勇新。

利益冲突

没有宣布。

Coleman JJ, Pontefract SK.药物不良反应。Clin Med (Lond) 2016 Oct;16(5):481-485。［CrossRef] [Medline］
爱德华兹IR，阿伦森JK。药物不良反应:定义、诊断和处理。柳叶刀2000 10月07日;356(9237):1255-1259。［CrossRef] [Medline］
世界卫生组织，2002年。药品安全:检测和报告药物不良反应指南网址:http://apps.who.int/iris/bitstream/handle/10665/67378/WHO_EDM_QSM_2002.2.pdf;jsessionid=A03B5B56E0F1BCB404D0E3315FCA27F5?sequence=1[访问时间:2018-11-30][WebCite缓存］
李志强，李志强，李志强，等。住院患者药物不良反应发生率的meta分析。中国医学杂志1998年4月15日;279(15):1200-1205。［Medline］
姚波，朱林，姜青，夏哈。临床试验的安全性监测。药学2013 Jan 17;5(1):94-106 [免费全文] [CrossRef] [Medline］
Hazell L, Shakir SAW。药物不良反应漏报:一项系统综述。药物通报2006;29(5):385-396。［CrossRef] [Medline］
张志刚，张志刚，张志刚，等。在基于人群的健康网络中早期发现药物不良事件:应用顺序测试方法。药物流行病学杂志2007年12月16日(12):1275-1284。［CrossRef] [Medline］
Naranjo CA, Busto U, Sellers EM, Sandor P, Ruiz I, Roberts EA，等。一种估计药物不良反应概率的方法。临床药理学杂志1981 Aug;30(2):239-245。［Medline］
Bate A, Lindquist M, Edwards IR, Olsson S, Orre R, Lansner A，等。药物不良反应信号产生的贝叶斯神经网络方法。中国临床药物学杂志1998年6月刊;54(4):315-321。［Medline］
Nikfarjam A, Sarker A, O'Connor K, Ginn R, Gonzalez G.来自社交媒体的药物警戒:使用带有词嵌入聚类特征的序列标记挖掘药物不良反应提及。美国医学信息学会2015年5月;22(3):671-681 [免费全文] [CrossRef] [Medline］
杨敏，姜敏，尚伟。从社交媒体中过滤大数据——构建药物不良反应预警系统。J Biomed Inform 2015 Apr; 54:30 -240 [免费全文] [CrossRef] [Medline］
李勇，Salmasian H, Vilar S, Chase H, Friedman C，魏勇。一种利用电子病历检测药物不良反应的复杂混杂效应控制方法。中国医学信息杂志2014;21(2):308-314 [免费全文] [CrossRef] [Medline］
王春华，王春华，王春华，王春华。基于数据挖掘的药物不良反应检测方法。ACM计算研究2015年7月21日;47(4):1-39。［CrossRef］
Tatonetti NP, Fernald GH, Altman RB。一种用于识别不良事件报告中隐藏的药物-药物相互作用的新信号检测算法。中国医学杂志2012;19(1):79-85 [免费全文] [CrossRef] [Medline］
王刚，荣凯，温宁伯格R，沙。从临床记录中系统发现药物不良事件的方法。美国医学通报协会2015年11月;22(6):1196-1204 [免费全文] [CrossRef] [Medline］
王伟，Haerian K, Salmasian H, Harpaz R, Chase H, Friedman C.一种支持PubMed引文药物警戒知识挖掘的药物不良事件提取算法。AMIA年度会议程序2011;2011:1464-1470 [免费全文] [Medline］
陈强，陈志强，陈志强。基于PubMed的药物不良反应相关文献综述。AMIA Jt峰会翻译科学进程2016;2016:68-77 [免费全文] [Medline］
程飞，赵哲。基于机器学习的药物-药物相互作用预测，综合药物表型、治疗、化学和基因组特性。J Am Med Inform association 2014 10月;21(e2):e278-e286 [免费全文] [CrossRef] [Medline］
王晓明，李志强，李志强，李志强。应用药物网络模型预测药物不良事件。科学翻译医学2011年12月21日;3(114):114ra127 [免费全文] [CrossRef] [Medline］
Lorberbaum T, Nasir M, Keiser MJ, Vilar S, Hripcsak G, Tatonetti NP。系统药理学加强药物安全监测。临床药学杂志2015 Feb;97(2):151-158 [免费全文] [CrossRef] [Medline］
黄玲，吴霞，陈建勇。结合蛋白质相互作用网络与药物结构预测药物不良反应谱。蛋白质组学2013 Jan;13(2):313-324。［CrossRef] [Medline］
刘敏，吴勇，陈勇，孙杰，赵忠，陈旭，等。利用药物的化学、生物和表型特性大规模预测药物不良反应。J Am Med Inform association 2012 Jun;19(e1):e28-e35 [免费全文] [CrossRef] [Medline］
库恩。M . Campillos M . Letunic I . Jensen LJ . Bork P.一种捕捉药物表型效应的副作用资源。Mol Syst Biol 2010;6:343 [免费全文] [CrossRef] [Medline］
Kuhn M, Letunic I, Jensen LJ, Bork P.药物和副作用的SIDER数据库。核酸Res 2016 Jan 04;44(D1):D1075-D1079 [免费全文] [CrossRef] [Medline］
陈B, Wild D, Guha D. PubChem作为多药理学的来源。J chemistry Inf Model 2009 09月;49(9):2044-2055。［CrossRef] [Medline］
王志强，郭志强，王志强，等。DrugBank 5.0: 2018年对DrugBank数据库的重大更新。核酸Res 2018 Jan 04;46(D1):D1074-D1082 [免费全文] [CrossRef] [Medline］
文本挖掘:从MEDLINE生成假设。科学通报2004年3月30日(5):396-413。［CrossRef］
陈凯，陈志强，陈志强。基于向量空间的词表示估计算法。arXiv预印arXiv:1301.3781 2013年1月16日:-。［CrossRef] [Medline］
Le QV, Mikolov T.句子和文档的分布式表示。2014发表于:第31届国际机器学习会议ICML'14论文集;2014年6月21-26日;中国北京，p. 1188-1196。
鲍亚诺斯基，葛瑞夫，朱林，米科洛夫。利用子词信息丰富词向量。计算语言学学会学报2017年12月;5:135-146 [免费全文] [CrossRef］
Sugawara E, Nikaido H.鲍曼不动杆菌AdeABC和AdeIJK外排系统与大肠杆菌acrabb - tolc系统的性质比较。抗菌药物Chemother 2014 Dec;58(12):7250-7257 [免费全文] [CrossRef] [Medline］
套索的回归收缩和选择:回顾。中国科学院学报(自然科学版)2011;
李国强，李国强，李国强。基于文本挖掘的生物医学文献疾病-突变关系自动提取方法。J Am Med Inform association 2016年12月;23(4):766-772 [免费全文] [CrossRef] [Medline］
Hinton G, Srivastava N, Krizhevsky A, Sutskever I, Salakhutdinov R.通过阻止特征检测器的自适应来改进神经网络。2012年6月3日。URL:https://arxiv.org/pdf/1207.0580.pdf［WebCite缓存］
Srivastava N, Hinton G, Krizhevsky A, Sutskever I, Salakhutdinov R.学习使用非重叠极值区域检测细胞。机器学习研究学报2014年1月;15(1):348-356。［Medline］
Ruta D.基于朴素贝叶斯的多标签分类的鲁棒稀疏特征选择方法。2014发表于:联邦计算机科学与信息系统会议，FedCSIS;2014年9月;波兰华沙，第380页。［CrossRef］
Pinto D, Costa P, Camacho R, Costa V.使用推荐系统预测药物不良副作用。在:施普林格. 2015发表于:国际发现科学会议;10月4 - 6;班夫，加拿大，201-208页。

‎

正面:药物不良事件

美国存托凭证:药物不良反应

AUC:接收机工作特性曲线下面积

款:深度神经网络

EMR:电子病历

地图:平均精度

MEDLINE:医学文献分析与检索系统“，

及:概率矩阵分解

帮派成员:副作用资源

G·艾森巴赫(G Eysenbach)编辑;提交10.05.18;同行评议:Yang HT, Li Y;作者评论02.09.18;修订本收到日期:03.10.18;接受04.11.18;发表06.02.19

这是一篇开放获取的文章，根据创作共用署名许可(https://creativecommons.org/licenses/by/4.0/)的条款发布，允许在任何媒介上无限制地使用、分发和复制，前提是正确引用最初发表在《医学互联网研究杂志》上的原创作品。必须包括完整的书目信息，//www.mybigtv.com/上的原始出版物的链接，以及此版权和许可信息。

本文内容如下e-collection /主题问题:

利用深度神经网络模型检测潜在的药物不良反应