基于端到端异构图表示学习的药物-靶相互作用预测框架

摘要:

准确识别潜在的药物-靶点相互作用(DTI)是药物发现的关键步骤。虽然在过去的几十年里已经开展了许多相关的实验研究来识别DTI,但基于生物学实验的DTI识别仍然是耗时和昂贵的。因此,发展有效的计算方法来识别离散干扰具有重要意义。本文提出了一种基于异构“图”卷积网络的“端到端”学习框架,称为端到端图(End-to-End Graphs,EEG)-DTI。在给定包含多种生物实体(即药物、蛋白质、疾病、副作用)的异构网络的情况下,EEG-DTI使用基于图卷积网络的模型学习药物和靶点的低维特征表示,并基于学习到的特征预测DTI。在训练过程中,EEG-DTI以端到端的方式学习节点的特征表示。评估测试表明,EEG-DTI的性能优于现有最先进的方法。有关数据和源代码,请访问:https://github.com/MedicineBiology-AI/EEG-DTI.

关键词:药物-靶点相互作用预测;异构网络;端到端学习;图卷积网络。

前言

药物-靶相互作用(DTI)识别对于药物重新定位[1,2]和药物发现[3]具有重要意义。特别是,为了在药物发现过程中找到安全有效的药物,在过去的几十年里,已经测试了数千种化合物。有两种生物学实验方法被用来鉴定DTI:蛋白质微阵列[4]和亲和层析[5]。

然而,以实验为基础的药物开发是一个昂贵和耗时的过程。为了加速药物发现,开发有效的计算方法来识别DTI是至关重要的[6,7,8,9,10]。现有的基于计算的DTI识别方法可以分为三类:基于文本挖掘的方法、基于生物特征的方法和基于网络的方法。

第一类是基于文本挖掘的方法。具体地说,基于文本挖掘的方法从文献中提取信息,并使用药物和目标的描述作为特征来识别DTI[11]。利用随机森林(RF)和支持向量机(SVM)方法,提出了一种基于语义相似度的DTI识别模型[12]。该模型构建了一个跨越化学和生物空间的语义网络,并基于该语义网络进行特征提取。然而,基于文本挖掘的方法受到不同文献语义表达差异的影响,限制了其性能。

第二类是基于生物特征的方法,也称为基于特征工程的方法。这些方法的主要思想是提取药物和靶标的生物特征。基于提取的特征,使用机器学习模型来识别DTI。一种称为二部局部模型(BLM)的基于支持向量机(SVM)的方法将DTI识别问题转化为二分类问题[13]。它既考虑了DTIs,也考虑了基于化学和基因组数据的药物-药物、靶-靶相似性。在BLM的基础上,提出了一种称为BLMNII的计算框架(BLMNII[14])。BLMNII将基于邻居的交互剖面推断(NII)方法与BLM相结合。综上所述,这些方法都是基于相似度网络来识别DTI。孟等人。利用蛋白质序列预测药物靶点模型(PDTPS)[15],通过整合蛋白质序列和药物化学结构来预测药物靶点。详细地说,给定一个蛋白质序列,该模型使用特定位置迭代的基本局部比对搜索工具(BLAST)[16]来计算特定位置评分矩阵(PSSM)[17]。然后,该模型使用二元语法概率(BIGP)模型[18]来基于PSSM提取特征。最后,给定Bigp提取的蛋白质序列的特征,PDTPS使用主成分分析(PCA)对特征进行降维。对于药物,该模型根据药物的化学结构得到药物特征表示。然后,将药物和蛋白质的特征串联起来,作为药物-蛋白质对的特征。最后,PDTPS应用相关性向量机[19]来预测DTI。类似于PDTPS,Wang et al.。提出了一种基于堆叠自动编码器的模型[20]来学习基于PSSM的特征。然后,该模型使用射频来预测DTI。然而,这些方法没有考虑药物与药物或蛋白质与蛋白质之间的相互作用。

第三类是基于网络的方法。网络可以描述不同类型的生物实体(如药物、蛋白质)之间的复杂相互作用。已经开发了几种基于网络的方法来识别DTI[2,21,22,23,24,25]。更详细地说,郑等人。提出了一种称为协同矩阵分解(CMF)的DTI识别模型[21]。CMF使用协作矩阵分解来学习药物和靶标的低维特征表示。这些低阶特征由交替最小二乘算法估计。它基于药物和目标之间的低阶表示来预测药物和目标之间的相互作用。夏等人。提出了一种称为NetLapRLS的方法[22]。NetLapRLS是一种基于拉普拉斯正则化最小二乘的半监督学习算法。NetLapRLS既考虑了药物与靶之间的相互作用,又考虑了药物与药物的相似性和蛋白质与蛋白质的相似性。特别值得一提的是,Luo等人。提出了一种称为DTINet的方法,该方法预测来自异构网络的DTI[2]。DTINet整合了多种药物相关信息和蛋白质相关信息。首先,通过多个网络计算药物和蛋白质的相似度矩阵。然后,对相似度矩阵依次进行重新启动随机游走和奇异值分解,得到药物和蛋白质的特征表示。DTINet基于这些低维表示来识别DTI。最近,赵等人提出了自己的观点。提出了一种图卷积神经网络和深度神经网络相结合的基于网络的DTI识别方法[26]。该方法通过药物-药物相互作用网络、蛋白质-蛋白质相互作用网络和药物-蛋白质相互作用网络构建药物-蛋白质对(DPP)网络。DPP网络中的节点代表药物-靶点对,而边代表这些对之间的链接强度。然后,将DTI识别问题转化为节点分类问题。将药物的种类和目标的氨基酸信息作为DPP的特征。在特征提取阶段,模型采用图的卷积运算来捕捉DPP节点的特征。

药物与靶点的关系错综复杂。DTI预测应考虑几种类型的信息,如药物-疾病关联、药物-药物相互作用、药物副作用关联和疾病-蛋白质关联。现有的特征提取方法通常是基于每种类型的交互单独提取特征。然后,基于每种交互类型的特征被串联在一起。这些方法不会对单个异构网络中的异构信息进行建模。因此,现有的方法不能很好地考虑药物、疾病、蛋白质、副作用等多种生物实体之间的相关性。而且,现有的方法主要分为两个独立的步骤,即特征提取步骤和DTI预测步骤,这两个步骤都不是端到端的模型。特征提取步骤中涉及的参数不能通过最终的DTI预测任务来优化。

近年来,基于异构图表示学习的方法在许多领域都取得了巨大的成功,例如。项目建议[27,28]和多药联用副作用预测[29]。与同构网络相比,基于异构网络的方法可以对单个异构网络中多种类型的实体以及不同类型实体之间的复杂交互进行建模。图卷积网络(GCN)是一种强大的网络数据深度表示学习方法,在网络分析中表现出优异的性能,引起了人们的极大兴趣。GCN的介绍可以在补充文件中找到。

受基于异构网络和基于GCN模型的成功启发,我们提出了一种新的端到端异构图表示学习框架EEG-DTI,用于识别药物与靶之间的相互作用。为了在最终DTI预测任务的基础上优化所有参数,EEG-DTI被设计为端到端的方式。以下是四个主要贡献:
·为了更好地描述药物与靶点之间的关系,我们构建了一个多实体(即药物、蛋白质、疾病、副作用)和多种边缘类型的异构网络。
·提出了一种基于异构GCN的基于异构网络的药物和目标特征表示学习方法。
·提出了一种端到端的DTI预测框架,该框架可以根据最终的DTI预测任务对模型中的参数进行优化。
·评估结果表明,EEG-DTI在DTI预测方面优于一些最先进的方法。

方法

我们提出了一种新的端到端异构图表示学习方法,称为EEG-DTI来识别DTI。
EEG-DTI的工作流程如图1所示。我们的工作包括三个部分。首先,通过结合八种类型的生物网络来构建异构网络(图1A)。其次,我们提出了一种新的异构图卷积神经网络,以获得基于所构建的网络的药物和目标的低维表示(图1B)。第三,我们使用内积方法基于低维表示计算药物和目标之间的相互作用分数,并通过交叉熵优化模型(图1C)。

构建异构网络

在这一部分中,我们将介绍如何构建异构网络。具体而言,我们将药物-药物相互作用网络、药物-蛋白质相互作用网络、药物-疾病关联网络、药物副作用关联网络、药物-药物相似网络、蛋白质-蛋白质相互作用网络、蛋白质-疾病关联网络和蛋白质-蛋白质相似网络八种类型的网络组合成一个异构网络。在构建的异构网络中包含两种类型的边。一种类型的边是包括在组合网络中的原始交互。基于每个组合网络,基于这些生物实体之间的相似性来添加另一种类型的边,称为“相似边”。

除了网络中原有的关联性外,我们还在异构网络中添加了额外的药物-药物相似性和蛋白质-蛋白质相似性信息。利用Jaccard相似系数计算药物与药物、蛋白质与蛋白质的相似度。Jaccard相似度用来衡量两个集合之间的相似度。我们以药物-疾病关联网络为例,描述了如何计算药物-药物相似度网络。我们使用以下公式来计算药物I和药物J之间的相似值:
An_end-to-end_hetero-fig-0.png
其中Di表示药物I的疾病集合,Aij表示药物I与药物j(Aij∈[0,1])之间的相似值。

针对每对药物,分别基于药物-疾病关联网络、药物-药物相互作用网络和药物副作用关联网络计算其相似度。因此,对于给定的药物对(药物I和药物J),我们可以获得三个相似性分数。如果其中一个分数大于给定阈值,并且药物i和药物j之间没有原始关联,则我们在药物i和药物j之间添加相似边(有关详细信息,请参阅补充文档)。
对于靶(蛋白质),我们还基于蛋白质-疾病关联网络和蛋白质-蛋白质相互作用网络来计算它们的相似度。类似于添加药物之间的相似边,我们添加蛋白质之间的相似边(有关详细信息,请参阅补充文档)。

基于异构网络的特征提取框架

识别DTI的关键步骤是特征提取。近年来,GCN被广泛用于网络中节点特征的聚合。
对网络进行图卷积的实质是实现相关节点之间的特征聚合。

在这一部分中,我们介绍了如何在每一层中通过异构图卷积神经网络生成每个节点的特征表示。在构建的异构网络中,存在多种类型的边。为了提取异构网络中药物和靶标的特征,提出了一种基于不同类型边的异构图卷积网络(HGCN)来进行消息传递。

异构网络是具有多种类型的节点和边缘的网络。给定一个异构网络,它可以表示为G=(V,E,R),其中vi∈V表示异构网络中的节点,(vi,r,vj)∈E表示异构网络中的边缘,r∈R表示异构网络中的边缘类型。具体地说,在异构网络中,有四种类型的节点(Vi)(即药物、蛋白质、疾病、副作用)。因此,R中包含了药物-药物相互作用、药物-蛋白质相互作用、药物-疾病关联、药物-副作用关联、蛋白质-蛋白质相互作用、蛋白质-疾病关联、药物-药物相似性和蛋白质-蛋白质相似性等八种类型的边缘。

在异构网络中,在信息[30]期间,不同类型的边应该被不同地考虑,在每一层中,我们对边的类型信息建模如下:
An_end-to-end_hetero-fig-1.png
An_end-to-end_hetero-fig-2.png
我们已经介绍了如何为每个GCN层中的一个节点生成特征表示。在本节中,我们将介绍特征提取框架。
对于网络中的一个节点,我们知道如果图卷积神经网络层的数目只有一层,模型得到的节点特征表示只聚合其邻域的一阶信息。因此,堆叠N层的图卷积层可以使特征表示有效地卷积来自其N阶邻域信息的信息[31]。在我们的模型中,我们实现了一个三层图卷积神经网络。在每一层中,每个节点的特征表示是通过聚合由不同类型的边连接的相邻节点的特征来生成的。模型的详细信息如图1所示。
An_end-to-end_hetero-fig-3.png
图1.EEG-DTI的工作流程。我们以DR7和PR3之间的相互作用为例来描述我们的模型的过程。EEG-DTI包括三个主要步骤。(A)在第一步中,我们构建了一个异构网络。异构网络中有四种实体和八种边缘类型。其中,DR代表药物,PR代表蛋白质,Se代表副作用,Di代表疾病。这八种边缘类型分别是药物-药物相互作用、药物副作用联合、药物-疾病联合、药物-蛋白质相互作用、蛋白质-蛋白质相互作用、蛋白质-疾病联合、药物-药物相似和蛋白质-蛋白质相似。(B)针对药物和蛋白质生成低维嵌入,在生成嵌入的过程中考虑不同类型节点的特征,最后对多类型邻居信息进行聚合。在这个框架中,我们实现了一个三层的GCN。例如,在第一层中,DR7在同构节点中聚合了DR1、DR3和它自己的特征。它在异构节点上聚合了PR2、PR5、DI1和SE1的特征。对于PR3,在同构节点中聚合了PR1、PR2及其自身的特征,在异构节点中聚合了DR1、DI2的特征。©最后,我们将三层嵌入连接起来。然后,我们使用内积得到DR7和PR3之间的分数,并使用交叉熵对模型进行端到端的优化。

值得注意的是,在GCN模型中叠加更多层有可能导致常见的消失梯度问题[32,33]。换言之,当使用反向传播训练基于GCN的模型参数时,可能会导致过度平滑。由于过度平滑问题,连通分量内的顶点的特征可能收敛到相同的值[34]。此外,在表征学习中,给定一个由多层神经网络模型学习的特征,可能会丢失特征信息。基于这一机制,在计算机视觉和自然语言处理领域,已经提出了许多方法来解决这一问题。例如,为了防止递归神经网络[35]中的信息丢失,提出了长短期记忆网络[36,37]模型。为了防止卷积神经网络[38]中的信息丢失,提出了残差网络(ResNet)模型[39]。

受何等[27]和王等[40]的启发,何等提出了LightGCN模型;它考虑了不同GCN层的表示。这意味着模型考虑了不同层的信息损失。Wang等人开发了一种称为卷积空间图嵌入网络(CSGEN)的模型来预测分子性质。在他们的框架中,该模型使用串联操作来防止信息丢失,就像ResNet[39]。为了防止信息丢失和克服过度平滑,我们提出了一种简单而有效的方法。详细地说,我们在不同的层中连接每个节点的表示。给定异构网络中的药物或目标vi,特征表示vi可以如下描述:
An_end-to-end_hetero-fig-4.png
其中h(1)i∈rd,h(2)i∈rd和h(3)i∈rd分别表示在图卷积神经网络的第一层、第二层和第三层得到的vi的特征表示。⊕表示向量连接操作。经过上述操作,我们得到了每个药物或靶点在∈R3D中的特征表示。

DTI预测

在本节中,我们将介绍如何通过端到端的方式预测DTI并优化模型。
在获得药物和蛋白质的表征后,我们使用内积方法[41]来预测DTIs。具体来说,给定两个节点vi和vj,hi和hj表示它们的特征表示。vi和vj之间存在相互作用的概率可计算如下:
An_end-to-end_hetero-fig-5.png
An_end-to-end_hetero-fig-6.png
我们使用交叉熵损失来训练模型。在药物目标识别问题中,阴性样本的数量远远大于阳性样本的数量。因此,我们使用负采样[29,42,43]来优化模型。损失函数是:
An_end-to-end_hetero-fig-7.png
其中r是药物-蛋白质边缘类型或蛋白质-药物边缘类型。
pij r表示正样本被边缘类型为r的内积calculated的概率,pin r表示负样本被随机负采样的内积计算的概率,它遵循边缘类型为r的采样分布Pr。我们希望该模型通过使用交叉熵损失,将观察到的边缘的概率分配得尽可能高,将随机边缘的概率分配得尽可能低。

Results

数据准备

为了评估基于端到端异构图表示学习的DTI预测框架的性能,我们在两个数据集(即,Luo等人)上测试了我们的模型。Luo et al. dataset [2] and Yamanishi et al. dataset [44]。在以往的研究中,这两个数据集被广泛用于评估DTI识别算法。

Luo等人。数据集包含六个与药物/蛋白质相关的网络:药物-药物相互作用网络[DrugBank(3.0版)][45]、蛋白质-蛋白质相互作用网络[HPRD数据库(Release 9)][46]、药物-蛋白质相互作用网络[DrugBank(3.0版)][45]、药物-疾病关联网络(比较毒理基因组学数据库)[47]、蛋白质-疾病关联网络(比较毒理基因组学数据库)[47]和药物副作用关联网络[sider数据库(版本2)]。本文详细介绍了罗等人的研究成果。数据集可在补充文档中找到。此外,还详细介绍了如何构建基于罗等人的异构网络。数据集可在补充文档中找到。

Yamanishi等人。数据集包含四个子集:核受体(NR)、G蛋白偶联受体(GPCR)、离子通道(IC)和酶。每个子数据集包含三个网络:药物-药物结构相似网络、蛋白质-蛋白质序列相似网络和药物-蛋白质相互作用网络。Yamanishi等人的详细信息。数据集可在补充文档中找到。对于Yamanishi等人的每个子数据集。数据集上,我们构建了药物-药物二值网络和蛋白质-蛋白质二值网络两个二值网络。有关如何构建二进制网络的详细信息,请参阅补充文档。二进制网络的边缘信息可以在补充文档中找到。然后,我们将药物-药物二元网络、蛋白质-蛋白质二元网络和药物-蛋白质相互作用网络结合起来,构建了一个异构网络。一个基于Yamanishi等人的异构网络的例子。数据集如补充文档中所示。

综上所述,Luo et al. dataset and Yamanishi et al. dataset的不同之处在于, 数据集是指异构网络中包含的节点和边的类型。在罗氏等人的研究中。数据集,它包含四种节点(即药物、蛋白质、疾病、副作用)。然而,在Yamanishi et al.。数据集上,只有两种节点(即药物、蛋白质)。因此,不同类型的节点导致异构网络中不同类型的边。

实验环境

Data generation
按照[2]中使用的相同方法,我们生成评估数据集。具体而言,将已知的DTI作为正样本。我们随机选择相同数量的未知DTI作为阴性样本。采用10倍交叉验证法进行评价。对于阳性样本,我们随机拿出整个标记的DTI的10%作为测试集,并利用剩余的90%作为训练集。对于负样本,生成训练集和测试集的方法与生成正样本的方法相同。

Performance evaluation
DTI识别可以被视为链接预测任务[29]。因此,我们采用接收机工作特性曲线下面积(AUROC)和精度回调曲线下面积(AUPR)作为模型的评价标准。在评估测试中,我们比较了现有的四种算法,即BLMNII[14]、NetLapRLS[22]、CMF[21]和DTINet[2]。BLMNII、NetLapRLS、CMF和DTINet的介绍可在补充文件中找到。我们不比较GCN-DTI[26],因为它需要药物和靶的额外特征,如药物的种类、靶的氨基酸信息。此外,EEG-DTI的参数设置可以在补充文件中找到。

Performance evaluation on Luo dataset

我们在Luo等人的数据集上应用EEG-DTI来验证其performance.AUROC和AUPR的误差条形图如图2所示。罗等人的数据集在DTI识别任务上的详细AUROC和性能如表1所示。
An_end-to-end_hetero-fig-8.png
An_end-to-end_hetero-fig-9.png
我们将EEG-DTI与四种方法(即BLMNII、CMF、NetLapRLS、DTINet)进行了比较。实验结果表明,在AUROC和AUPR两种方法中,EEG-DTI取得了最高的性能。与其他方法相比,AUROC比其他方法(0.9391~0.9559)高1.68%,AUPR比其他方法(0.9504~0.9645)高1.41%。结果的改进归功于EEG-DTI能够捕获异构网络中邻居的信息,并以端到端的方式学习节点的特征表示。总而言之,EEGDTI在识别DTI方面比一些最先进的方法执行得更好。

Performance evaluation on Yamanishi etal. dataset

为了进一步的评估,我们还在Yamanishi等人上实现了EEG-DTI算法。数据集来评估其性能。比较EEG-DTI算法和其他四种方法,我们可以观察到在Yamanishi等人的所有四个子数据集上都有一致的改进。参见数据集(参见图3和表2)。An_end-to-end_hetero-fig-10.png
图3.EEG-DTI提高了Yamanishi等人的DTI预测性能。数据集。我们将EEG-DTI的DTI预测性能与BLMNNI、CMF、NetLapRLS和DTINet等其他最先进的方法进行了比较。在图中,第1行和第2行分别表示不同方法的AUROC和AUPR结果。从左到右依次为GPCR、酶、NR和IC。

实验结果表明,根据AUROC、GPCR、EEG-DTI和IC的AUROC、AUPRR和IC,EEG-DTI的识别效果最好。与其他方法相比,EEG-DTI的AUROC在GPCR、酶和IC上分别提高了4.99%、1.99%和1.49%。在AUPR性能上,GPCR提高3.16%,酶提高1.8%,IC提高1.15%。在NR数据集中,EEG-DTI的AUROC和AUPR位居第二。需要注意的是,在端到端学习模型的设计中,前提是有大量的训练数据。然而,在NR数据集中,异构网络中的药物节点和蛋白质节点非常少,因此结果不如其他子数据集。节点和边数的详细统计可以在补充文档中找到。综上所述,本实验表明,EEG-DTI在识别DTI方面与一些最先进的方法相比可以取得显著的改进。

异构网络中不同类型节点及其组合的影响

本文提出的EEG-DTI DTI预测方法主要包括两部分:异构网络构建和基于GCN的DTI预测。为了评估不同类型的节点及其组合在异构网络中的效果,我们对Luo等人进行了三个烧蚀实验。数据集。实验结果如表3所示。此外,删除节点的实质是删除异构网络中的相关边。为了评估边在异构网络中的效果,我们对边及其组合的效果进行了实验评估。结果见补充文件)。
An_end-to-end_hetero-fig-11.png
表3表明,如果使用所有网络,EEG-DTI算法显示出明显的优越性。如果消除副作用,AUROC和AUPR会下降,但下降幅度很小。然而,如果去除这些疾病,AUROC和AUPR会大大降低。原因是副作用只与异质网络中的药物有关,但疾病与药物和蛋白质有关。可以推断,在执行DTI识别任务时,增加疾病节点和相关边缘可以提高DTI的识别性能。最后,如果同时去除疾病和副作用,分别与去除疾病和副作用相比,AUROC和AUPR降低。事实证明,结合疾病和副作用组合可以提高DTI的识别性能。

GCN层的效果

我们提到,堆叠N层GCN层,可以卷积来自其N阶邻居的信息[31]。为了评估不同GCN层数对EEGDTI的影响,我们用不同GCN层数对Luo等人运行了我们的模型。数据集。实验结果如表4所示。此外,为了评价级联手术的有效性,我们应用了五个消融实验对其进行了验证。有关合并行动成效的详细结果,请参阅补充文件。结果表明,级联运算提高了EEG-DTI模型的性能。
如表4所示,如果层数等于3,则EEG-DTI算法显示出显著的优越性。具体地,如果层数小于或等于3,则AUROC和AUPR随着GCN层数的增加而增加。与三层GCN相比,当GCN层数为4层或5层时,并没有显著增加。原因可能是GCN已经对邻国进行了足够深入的探索。因此,性能不会随着GCN层数的增加而显著提高。
An_end-to-end_hetero-fig-12.png

Conclusion

本文提出了一种新的端到端HGCN算法,称为EEG-DTI,并将其应用于DTI预测。结合多个生物网络构建异构网络,学习基于异构网络的低维特征表示。然后,通过端到端学习对模型进行优化。为了展示EEGDTI的性能,我们将我们的方法与四种最先进的方法进行了比较。在两个数据集上进行了评估,命名为Luo et al.。和Yamanishi等人,证明了EEG-DTI比其他现有的最先进的方法执行得更好。此外,我们还测试了不同类型节点在异构网络中的贡献以及不同GCN层数的影响。

此外,虽然EEG-DTI主要用于预测DTI,但它是一种可扩展的方法,也可以用于预测其他生物学联系,如microRNA-小分子关联[49,50,51],microRNA-疾病关联[52]和疾病-疾病关联[53]。此外,我们还将开发一种新版本的EEG-DTI,用于处理加权和有向网络。

Supplementary material

https://academic.oup.com/bib/article-lookup/doi/10.1093/bib/bbaa430#supplementary-data

References

  1. Cheng F, Liu C, Jiang J, _et al. _Prediction of drug-target inter
    actions and drug repositioning via network-based inference.
    _PLoS Comput Biol _2012; 8(5):e1002503.

  2. Luo Y, Zhao X, Zhou J, _et al. _A network integration approach
    for drug-target interaction prediction and computational
    drug repositioning from heterogeneous information. Nat
    _Commun _2017; 8(1): 1–13.

  3. Huang Y, Zhu L, Tan H, _et al. _Predicting drug-target on het
    erogeneous network with co-rank. In: International Conference
    on Computer Engineering and Networks. Springer, 2018, 571–81.

  4. Lee H, Lee JW. Target identification for biologically active
    small molecules using chemical biology approaches. Arch
    _Pharm Res _2016; 39(9): 1193–201.

  5. Schirle M, Jenkins JL. Identifying compound efficacy targets
    in phenotypic drug discovery. _Drug Discov Today _2016; 21(1):
    82–9.

  6. Chen X, Yan CC, Zhang X, _et al. _Drug–target interaction pre
    diction: databases, web servers and computational models.
    _Brief Bioinform _2016; 17(4): 696–712.

  7. Ezzat A, Min W, Li X-L, _et al. _Computational prediction of
    drug–target interactions using chemogenomic approaches:
    an empirical survey. _Brief Bioinform _2019; 20(4): 1337–57.

  8. Chen R, Liu X, Jin S, _et al. _Machine learning for drug-target
    interaction prediction. _Molecules _2018; 23(9): 2208.

  9. Bagherian M, Sabeti E, Wang K, _et al. _Machine learning
    approaches and databases for prediction of drug–target
    interaction: a survey paper. _Brief Bioinform _2020.

  10. Dai Y-F, Zhao X-M. A survey on the computational
    approaches to identify drug targets in the postgenomic era.
    _Biomed Res Int _2015; 2015.

  11. Fleuren WWM, Alkema W. Application of text mining in the
    biomedical domain. _Methods _2015; 74:97–106.

  12. Gang Fu, Ying Ding, Abhik Seal, _et al. _Predicting drug tar
    get interactions using meta-path-based semantic network
    analysis. BMC bioinformatics, 17(1):160, 2016.

  13. Bleakley K, Yamanishi Y. Supervised prediction of drug–
    target interactions using bipartite local models. Bioinformat
    _ics _2009; 25(18): 2397–403.

  14. Mei J-P, Kwoh C-K, Yang P, _et al. _Drug–target interaction
    prediction by learning from local information and neighbors.
    _Bioinformatics _2013; 29(2): 238–45.

  15. Meng F-R, You Z-H, Chen X, _et al. _Prediction of drug–
    target interaction networks from the integration of protein
    sequences and drug chemical structures. _Molecules _2017;
    22(7): 1119.

  16. Altschul SF, Koonin EV. Iterated profile searches with psi
    blast-a tool for discovery in protein databases. Trends Biochem
    _Sci _1998; 23(11): 444–7.

  17. Gribskov M, McLachlan AD, Eisenberg D. Profile analysis:
    detection of distantly related proteins. Proc Natl Acad Sci
    1987; 84(13): 4355–8.

  18. Sharma A, Lyons J, Dehzangi A, _et al. _A feature extraction
    technique using bi-gram probabilities of position specific
    scoring matrix for protein fold recognition. _J Theor Biol _2013;
    320:41–6.

  19. Tipping ME. Sparse bayesian learning and the relevance vec
    tor machine. _Journal of machine learning research _2001; 1(Jun):
    211–44.

  20. Wang L, You Z-H, Chen X, _et al. _A computational-based
    method for predicting drug–target interactions by using
    stacked autoencoder deep neural network. J Comput Biol
    2018; 25(3): 361–73.

  21. Zheng X, Ding H, Mamitsuka H, _et al. _Collaborative matrix
    factorization with multiple similarities for predicting drug
    target interactions. In: Proceedings of the 19th ACM SIGKDD
    international conference on Knowledge discovery and data mining,
    2013, 1025–33.

  22. Xia Z, Wu L-Y, Zhou X, _et al. _Semi-supervised drug
    protein interaction prediction from heterogeneous biolog
    ical spaces. In: BMC systems biology, Vol. 4. Springer, 2010,
    S6.

  23. Chen X, Liu M-X, Yan G-Y. Drug–target interaction prediction
    by random walk on the heterogeneous network. Mol Biosyst
    2012; 8(7): 1970–8.

  24. Wang W, Yang S, Zhang X, _et al. _Drug repositioning
    by integrating target information through a
    heterogeneous network model. _Bioinformatics _2014; 30(20):
    2923–30.

  25. Yan X-Y, Zhang S-W, He C-R. Prediction of drug
    target interaction by integrating diverse heterogeneous
    information source with multiple kernel learning
    and clustering methods. _Comput Biol Chem _2019; 78:
    460–7.

  26. Zhao T, Yang H, Valsdottir LR, _et al. _Identifying drug–target
    interactions based on graph convolutional network and
    deep neural network. _Brief Bioinform _2020.

  27. He X, Deng K, Wang X, _et al. _Lightgcn: simplifying and pow
    ering graph convolution network for recommendation. arXiv
    _preprint arXiv:200202126 _2020.

  28. Wu S, Zhang Y, Gao C, _et al. _Garg: anonymous recommen
    dation of point-of-interest in mobile networks by graph
    convolution network. _Data Science and Engineering _2020; 5(4):
    433–47.

  29. Zitnik M, Agrawal M, Leskovec J. Modeling polypharmacy
    side effects with graph convolutional networks. Bioinformat
    _ics _2018; 34(13): i457–66.

  30. Schlichtkrull M, Kipf TN, Bloem P, _et al. _Modeling relational
    data with graph convolutional networks. In: European Seman
    tic Web Conference. Springer, 2018, 593–607.

  31. Kipf TN, Welling M. Semi-supervised classification
    with graph convolutional networks. arXiv preprint arXiv:
    _160902907 _2016.

  32. Li G, Muller M, Thabet A, _et al. _Deepgcns: Can gcns go as deep
    as cnns? In: Proceedings of the IEEE International Conference on
    Computer Vision, 2019, 9267–76.

  33. Rong Y, Huang W, Xu T, _et al. _Dropedge: Towards deep
    graph convolutional networks on node classification. In:
    International Conference on Learning Representations, 2019.

  34. Li Q, Han Z, Wu X-M. Deeper insights into graph convolu
    tional networks for semi-supervised learning. arXiv preprint
    _arXiv:180107606 _2018.

  35. Pearlmutter BA. Learning state space trajectories in recur
    rent neural networks. _Neural Comput _1989; 1(2): 263–9.

  36. Hochreiter S, Schmidhuber J. Long short-term memory. Neu
    _ral Comput _1997; 9(8): 1735–80.

  37. Gers FA, Schmidhuber J, Cummins F. Learning to forget: Con
    tinual prediction with lstm, 1999.

  38. Krizhevsky A, Sutskever I, Hinton GE. Imagenet classifica
    tion with deep convolutional neural networks. In: Advances
    in neural information processing systems, 2012, 1097–105.

  39. He K, Zhang X, Ren S, _et al. _Deep residual learning for image
    recognition. In: Proceedings of the IEEE conference on computer
    vision and pattern recognition, 2016, 770–8.

  40. Wang X, Li Z, Jiang M, _et al. _Molecule property prediction
    based on spatial graph embedding. _J Chem Inf Model _2019;
    59(9): 3817–28.

  41. Long Q, Jin Y, Song G, _et al. _Graph structural-topic neural
    network. In: Proceedings of the 26th ACM SIGKDD International
    Conference on Knowledge Discovery & Data Mining, 2020, 1065–

  42. Mikolov T, Sutskever I, Chen K, _et al. _Distributed represen
    tations of words and phrases and their compositionality.
    In: Advances in neural nformation processing systems, 2013,
    3111–9.

  43. Trouillon T, Welbl J, Riedel S, _et al. _Complex embeddings
    for simple link prediction. International Conference on Machine
    _Learning (ICML) _2016.

  44. Yamanishi Y, Araki M, Gutteridge A, _et al. _Prediction of drug–
    target interaction networks from the integration of chemical
    and genomic spaces. _Bioinformatics _2008; 24(13): i232–40.

  45. Knox C, Law V, Jewison T, _et al. _Drugbank 3.0: a comprehen
    sive resource for ‘omics’ research on drugs. Nucleic Acids Res
    2010; 39(suppl_1): D1035–41.

  46. Prasad TSK, Goel R, Kandasamy K, _et al. _Human protein
    reference database-2009 update. _Nucleic Acids Res _2009;
    37(suppl_1): D767–72.

  47. Davis AP, Murphy CG, Johnson R, _et al. _The comparative tox
    icogenomics database: update 2013. _Nucleic Acids Res _2013;
    41(D1): D1104–14.

  48. Kuhn M, Campillos M, Letunic I, _et al. _A side effect resource
    to capture phenotypic effects of drugs. _Mol Syst Biol _2010;
    6(1): 343.

  49. Wang C-C, Chen X. A unified framework for the prediction of
    small molecule–microrna association based on cross-layer
    dependency inference on multilayered networks. J Chem Inf
    _Model _2019; 59(12): 5281–93.

  50. Zhao Y, Chen X, Yin J, _et al. _Snmfsmma: using symmetric
    nonnegative matrix factorization and kronecker regularized
    least squares to predict potential small molecule-microrna
    association. _RNA Biol _2020; 17(2): 281–91.

  51. Chen X, Guan N-N, Sun Y-Z, _et al. _Microrna-small molecule
    association identification: from experimental results to
    computational models. _Brief Bioinform _2020; 21(1): 47–61.

  52. Peng J, Hui W, Li Q, _et al. _A learning-based framework
    for mirna-disease association identification using neural
    networks. _Bioinformatics _2019; 35(21): 4364–71.

  53. Peng J, Guan J, Hui W, _et al. _A novel subnetwork repre
    sentation learning method for uncovering disease-disease
    relationships. _Methods _2020.
    Downloaded from https://academic.oup.com/bib/advance-article/doi/10.109