基于交互推理网络的药物靶标相互作用预测方法.pdf

上传人:刘** 文档编号:14333363 上传时间:2024-02-15 格式:PDF 页数:14 大小:1.68MB
收藏 版权申诉 举报 下载
基于交互推理网络的药物靶标相互作用预测方法.pdf_第1页
第1页 / 共14页
基于交互推理网络的药物靶标相互作用预测方法.pdf_第2页
第2页 / 共14页
基于交互推理网络的药物靶标相互作用预测方法.pdf_第3页
第3页 / 共14页
文档描述:

《基于交互推理网络的药物靶标相互作用预测方法.pdf》由会员分享,可在线阅读,更多相关《基于交互推理网络的药物靶标相互作用预测方法.pdf(14页完成版)》请在专利查询网上搜索。

1、(19)国家知识产权局(12)发明专利申请(10)申请公布号 (43)申请公布日 (21)申请号 202310507847.8(22)申请日 2023.05.08(71)申请人 汕头大学地址 515063 广东省汕头市大学路汕头大学(72)发明人 陈亮梁晓敏陈煜其毛胜东(74)专利代理机构 广州三环专利商标代理有限公司 44202专利代理师 周增元(51)Int.Cl.G16B 15/30(2019.01)G06N 5/04(2023.01)G06N 3/0464(2023.01)G06N 3/08(2023.01)(54)发明名称一种基于交互推理网络的药物靶标相互作用预测方法(57)摘要本发。

2、明实施例公开了一种基于交互推理网络的药物靶标相互作用预测方法,该网络包括嵌入层、编码层、交互层、特征提取层和输出层。嵌入层中生成药物和靶标分子的序列嵌入,编码层获得药物和靶标的编码后的分子表征,交互层进行药物和靶标相互作用模拟,特征提取层提取交互矩阵的交互特征,最后获得预测结果。本发明可以应用于药物与靶标关系的预测。采用本发明,解决了传统DTI预测模型训练拘泥于数量稀缺的有标记数据集,未标记数据不能被充分利用的问题;其次,提高了模型在DTI预测方面的可解释性。权利要求书3页 说明书8页 附图2页CN 116612810 A2023.08.18CN 116612810 A1.一种基于交互推理网络。

3、的药物靶标相互作用预测方法,其特征在于,包括以下步骤:S1:分别从BIOSNAP、BindingDB和DAVIS数据库中获取药物、靶标以及药物靶标相互作用的数据,获取三个数据集正样本对数据;S2:获取与生成负样本对数据;S3:依据所述药物、靶标和药物靶标相互作用的数据,以及生成的负样本对数据,对三个数据集进行整合,构造训练集、验证集和测试集;S4:嵌入层中生成药物分子和靶标序列的嵌入并分别通过编码层;S5:所述编码层获得药物和靶标的编码后的分子表征;S6:交互层进行药物和靶标相互作用模拟;S7:特征提取层捕获交互矩阵的交互特征;S8:最后接入全连接网络进行药物靶标相互作用预测。2.根据权利要求。

4、1所述的基于交互推理网络的药物靶标相互作用预测方法,其特征在于,所述S1包括步骤:将Kd值=30的视为负样本的样本对,再从BIOSNAP数据库随机生成负样本的样本对。3.根据权利要求2所述的基于交互推理网络的药物靶标相互作用预测方法,其特征在于,所述S3包括步骤:将数据集正负样本分层采样,使用留出法按照7:1:2的比例划分为互斥子集,作为训练集、验证集和测试集。4.根据权利要求3所述的基于交互推理网络的药物靶标相互作用预测方法,其特征在于,所述S4包括步骤:使用分子全序列直接编码、分子子序列编码和指纹编码三种方式分别将分子序列转换为向量表示,将序列信息整合到特征向量中;嵌入的时候将药物分子的S。

5、MILES表达式和靶标的氨基酸序列分别编码,生成药物和靶标的序列嵌入和,分别输入编码层。5.根据权利要求4所述的基于交互推理网络的药物靶标相互作用预测方法,其特征在于,所述分子全序列直接编码的步骤包括:直接对SMILES和氨基酸序列进行编码,设定SMILES描述符生成嵌入的最大长度为100,氨基酸序列生成嵌入的最大长度为1000,对长度大于最大长度的嵌入进行截取,对长度不足最大长度的用0进行补全,生成靶标和药物的嵌入和;所述分子子序列编码的步骤包括:从Uniprot数据集和ChEMBL数据库中提取药物和靶标的子结构,使用ESPF算法通过设置不同的频繁阈值和数据来源,得到不同规模的词汇集V,使用。

6、频繁子序列C作为分割标准,将药物和靶标序列分解为一组子序列;药物和靶标序列都被分解成子结构,转换为对应的嵌入矩阵,通过可查询内容嵌入矩阵生成对应的靶标嵌入和药物嵌入,生成规则如下:权利要求书1/3 页2CN 116612810 A2其中,和分别是根据靶标和药物分解子序列词汇集 的大小及预设定嵌入长度自动构成的可查询矩阵;所述指纹编码的步骤包括:使用分子指纹作为指纹嵌入,并通过标记位编码方式对其进行压缩。6.根据权利要求5所述的基于交互推理网络的药物靶标相互作用预测方法,其特征在于,所述S5包括步骤:编码层分别采取三种编码方式:多层感知机编码、卷积神经网络编码、自注意力机制编码,通过融合上下文信。

7、息提取特征来对嵌入进行编码:其中和分别代表通过编码层之后的药物和靶标序列的编码。7.根据权利要求6所述的基于交互推理网络的药物靶标相互作用预测方法,其特征在于,所述多层感知机编码的方法包括:叠加三层全连接神经网络,隐藏层分别采用1024,256和64个神经元,在每层网络中,输入向量与隐藏单元的连接权重相乘,得到各自的输出并通过一个非线性激活函数,经过三层神经元之后得到指纹编码;所述卷积神经网络编码的方法包括:使用三层一维卷积神经网络作为药物和靶标嵌入的编码器,将SMILES和氨基酸序列分别直接编码,生成药物和靶标的序列嵌入和,输入CNN编码器中;卷积神经网络编码叠加三层一维卷积神经网络,药物按。

8、层数依次使用大小为4、6、8的卷积核,靶标按层数依次使用大小为4、8、12的卷积核,在进行卷积操作之后对结果进行一次池化操作并通过全连接层,最后得到药物和靶标的编码和;所述自注意力机制编码的方法包括:利用位置编码将顺序信息与内容嵌入结合起来,形成具备学习序列顺序信息能力的序列嵌入,药物和靶标的位置编码和通过学习获得,学习位置编码每一个位置学习一个独立的向量,通过可查询位置嵌入矩阵生成,生成规则如下:其中,和分别是靶标第i个子序列和药物对应的第j个子序列的独热编码;和是根据药物和靶标分解后的子序列最大长度和预设定嵌入长度自动构成的可查询二维嵌入矩阵,预设定嵌入与内容嵌入的长度在生成时保持一致;权。

9、利要求书2/3 页3CN 116612810 A3其中,自注意力机制编码器的输入和通过内容嵌入和位置嵌入相加获得。8.根据权利要求1所述的基于交互推理网络的药物靶标相互作用预测方法,其特征在于,所述S6具体包括步骤:对于每个靶标子序列i和每个药物子序列j,生成交互值:其中F为聚集函数,用来衡量药物靶标对之间的相互作用,在交互层之后得到张量矩阵I,使用点乘作为聚集函数能够产生单一标量,以衡量单对药物靶标最小单元对之间的相互作用强度。9.根据权利要求1所述的基于交互推理网络的药物靶标相互作用预测方法,其特征在于,所述S7具体包括步骤:对子结构个体之间邻近区域的相互作用进行建模,在交互图上使用卷积神。

10、经网络进行特征提取。10.根据权利要求1所述的基于交互推理网络的药物靶标相互作用预测方法,其特征在于,所述S8具体包括步骤:输出层对采集到的特征进行解码,将提取的交互特征平铺为一个向量,经过线性层输出预测结果。权利要求书3/3 页4CN 116612810 A4一种基于交互推理网络的药物靶标相互作用预测方法技术领域0001本发明涉及药物与靶标关系预测技术领域,尤其涉及一种基于交互推理网络的药物靶标相互作用预测方法背景技术新药研发时间长、成本高,一般分为临床前和临床研究两个阶段。利用已有的药物治疗新疾病是一个可行的策略,因为这些“旧”药物已经通过机理研究和临床实验,可以降低研发费用和时间。000。

11、2药物靶标是指能与药物发生作用的生物大分子,如蛋白质、核酸等。预先识别这些靶标对于针对特定疾病的药物研发非常重要。但是传统的药物发现方法只考虑了单一疾病的单个靶标,忽略了药物和靶标之间的复杂相互作用以及许多疾病涉及多个靶标的情况。因此,现在的研究越来越关注同时针对多个靶标的多靶点药物和药物联合研究,以提高药物的疗效并克服耐药性和毒副作用。虽然药物的多药理学特性可能导致意想不到的副作用,但也可能带来新的治疗效果,即所谓的药物的重新定位。0003药物通常通过与细胞内的蛋白质相互作用来改善疾病症状。其中数量庞大的化合物可以作为药物候选,而药物靶标多为蛋白质。目前仅有很少一部分药物与靶蛋白的匹配关系已。

12、知,还有很多未知的药物靶标相互作用有待发现。0004正确识别和验证药物与其靶标之间的相互作用对于发现新药或重新定位药物至关重要。然而,由于化学空间和蛋白组空间之间的复杂关系,识别新型药物及其靶标仍然是一个非常困难的过程。存在多种因素,如化学键和亲和力等,会影响药物与其靶标之间的相互作用。0005因此需要有效的计算预测方法来检测复杂的药物靶标关联,以提高我们对生物相互作用和生物过程的理解,并为生物实验提供新的潜在药物靶标相互作用候选对象。目前主要的计算预测方法是分子对接模拟和机器学习。虽然分子对接模拟在生物学中被广泛接受,但对接过程很耗时,且需要靶标和药物的三维结构,而获得靶标和药物三维结构的难。

13、度较大。相比之下,机器学习方法使用已知的药物和靶标相互作用的信息来训练预测模型,以预测新药和靶标之间的相互作用。使用计算机来筛选可能的药物和靶标相互作用作为候选可以减少时间和成本,最后再通过生物实验验证药物靶标相互作用。发明内容0006本发明实施例提供一种基于交互推理网络的药物靶标相互作用预测方法,可解决大部分DTI预测模型训练拘泥于数量稀缺的有标记数据集,未标记数据不能被充分利用,以及基于机器学习的模型在DTI预测方面存在可解释性差的技术问题。包括以下步骤:S1:分别从BIOSNAP、BindingDB和DAVIS数据库中获取药物、靶标以及药物靶标相互作用的数据,获取三个数据集正样本对数据;。

14、S2:获取与生成负样本对数据;说明书1/8 页5CN 116612810 A5S3:依据所述药物、靶标以及药物靶标相互作用的数据(即正样本对数据),以及生成的负样本对数据,对三个数据集进行数据整理合并成训练集、验证集和测试集;S4:嵌入层中生成药物分子和靶标序列的嵌入并分别通过编码层;S5:所述编码层获得药物和靶标的编码后的分子表征;S6:交互层进行药物和靶标相互作用模拟;S7:特征提取层捕获交互矩阵的交互特征;S8:最后接入全连接网络进行药物靶标相互作用预测。0007其中,所述S1包括步骤:将Kd值=30的视为负样本的样本对,再从BIOSNAP数据库随机生成负样本的样本对。0008其中,所述。

15、S3包括步骤:将数据集正负样本分层采样,使用留出法按照7:1:2的比例划分为互斥子集,作为训练集、验证集和测试集。0009其中,所述S4包括步骤:使用分子全序列直接编码、分子子序列编码和指纹编码三种方式分别将分子序列转换为向量表示,将序列信息整合到特征向量中;嵌入的时候将药物分子的SMILES表达式和靶标的氨基酸序列分别编码,生成药物和靶标的序列嵌入和,分别输入编码层中。0010其中,所述分子全序列直接编码的步骤包括:直接对SMILES和氨基酸序列进行编码,设定SMILES描述符生成嵌入的最大长度为100,氨基酸序列生成嵌入的最大长度为1000,对长度大于最大长度的嵌入进行截取,对长度不足最大。

16、长度的用0进行补全,生成靶标和药物的嵌入和;所述分子子序列编码的步骤包括:将ESPF算法应用于从Uniprot数据集和ChEMBL数据库中提取药物和靶标的子结构,通过设置不同的频繁阈值和数据来源,得到不同规模的词汇集V,使用频繁子序列C作为分割标准,将药物和靶标序列分解为一组子序列;药物和靶标序列都被分解成子结构,转换为对应的嵌入矩阵,通过可查询内容嵌入矩阵生成对应的靶标嵌入和药物嵌入,生成规则如下:其中,和分别是根据靶标和药物分解子序列词汇集 的大小及预设定嵌入长度自动构成的可查询矩阵;所述指纹编码的步骤包括:使用分子指纹作为指纹嵌入,并通过标记位编码方式对其进行压缩。0011其中,所述S5。

17、包括步骤:编码层分别采取三种编码方式:多层感知机编码、卷积神经网络编码、自注意力机制编码,通过融合上下文信息提取特征来对嵌入进行编码:说明书2/8 页6CN 116612810 A6其中和分别代表通过编码层之后的药物和靶标序列的编码。0012其中,所述多层感知机编码的方法包括:叠加三层全连接神经网络,隐藏层分别采用1024,256和64个神经元,在每层网络中,输入向量与隐藏单元的连接权重相乘,得到各自的输出并通过一个非线性激活函数,经过三层神经元之后得到指纹编码;所述卷积神经网络编码的方法包括:使用三层一维卷积神经网络作为药物和靶标嵌入的编码器,将SMILES和氨基酸序列分别直接编码,生成药物。

18、和靶标的序列嵌入和,输入CNN编码器中;卷积神经网络编码叠加三层一维卷积神经网络,药物按层数依次使用大小为4、6、8的卷积核,靶标按层数依次使用大小为4、8、12的卷积核,在进行卷积操作之后对结果进行一次池化操作并通过全连接层,最后得到药物和靶标的编码和;所述自注意力机制编码的方法包括:利用位置编码将顺序信息与内容嵌入结合起来,形成具备学习序列顺序信息能力的序列嵌入,药物和靶标的位置编码和通过学习获得,学习位置编码每一个位置学习一个独立的向量,通过可查询位置嵌入矩阵生成,生成规则如下:其中,和分别是靶标第i个子序列和药物对应的第j个子序列的独热编码;和是根据药物和靶标分解后的子序列最大长度和预。

19、设定嵌入长度自动构成的可查询二维嵌入矩阵,预设定嵌入与内容嵌入的长度生成时保持一致;自注意力机制编码器的输入和通过内容嵌入和位置嵌入相加获得。0013其中,所述S6具体包括步骤:对于每个靶标子序列i和每个药物子序列j,生成交互值:其中F为聚集函数,用来衡量药物靶标对之间的相互作用,在交互层之后得到张量矩阵I,使用点乘作为聚集函数能够产生单一标量,以衡量单对药物靶标最小单元对之间的相互作用强度。0014其中,所述S7具体包括步骤:对子结构个体之间邻近区域的相互作用进行建模,在交互图上使用卷积神经网络进行特征提取。0015其中,所述S8具体包括步骤:输出层对采集到的特征进行解码,将提取的交互特征平。

20、铺为一个向量,经过线性层输出预测结果。说明书3/8 页7CN 116612810 A70016实施本发明实施例,具有如下有益效果:本发明将交互推理网络用于药物靶标相互作用,包括嵌入层、编码层、交互层、特征提取层和输出层。在嵌入层中:为了药物和靶标嵌入能够拥有更丰富的特征信息,使用药物分子指纹作为补充,同时使用ESPF算法分割药物和靶标序列成子序列。在编码层中:为了捕获药物和靶标等分子序列各个官能团的特征,采用卷积神经网络对分子原始序列进行编码;为了捕获官能团之间的关联特征,采用SelfAttention编码器对分子的子序列进行编码。交互层设计采取模拟交互过程,使用点乘作为聚集函数产生单一标量,。

21、以衡量单对药物靶标最小单元对之间的相互作用强度,为模型交互预测结果提供可解释性。交互推理网络嵌入层和编码层的组件化设计,使其具有极强的可扩展性。通过选择不同嵌入生成方式配合不同的编码器,可以获得不同的预测效果和实验意义。附图说明0017图1是本发明实施的网络结构;图2是DAVIS、BindingDB和BIOSNAP数据集统计表;图3是训练集、验证集和测试集分配表。具体实施方式0018为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步地详细描述。0019如图1所示,本发明实施例的一种基于交互推理网络的药物靶标相互作用预测方法通过以下步骤内容进行实施。00201、数据获取与预。

22、处理分别从BIOSNAP、BindingDB和DAVIS数据库中收集药物、靶标以及药物靶标相互作用的数据。BIOSNAP数据库用于本发明的数据主要以MINER DTI数据集为主,该数据集包含4510种药物信息和2181种靶标信息,并被视为正样本的DTI对。除了BIOSNAP数据集,还加入了两个数据集DAVIS和BindingDB。DAVIS数据集包含68种药物和379种靶标的实验检测Kd值,BindingDB包含7165种药物和1254种靶标的实验检测Kd值。Kd值=30的被视为负样本的DTI对,再从BIOSNAP数据库随机生成负样本的DTI对,总共 三组负样本DTI对,如图2所示。00223。

23、、将三个数据集的数据整理合并,该步骤具体包括:将数据集正负样本分层采样,使用留出法按照7:1:2的比例划分为互斥子集,作为训练集、验证集和测试集,分配情况如图3所示。对于每个实验,分别进行了5次独立运行。00234、嵌入层中生成药物和靶标分子的序列嵌入,该步骤具体包括:采用分子全序列直接编码、分子子序列编码和指纹编码(Morgan指纹和PubChem指纹编码)三种方式将分子序列转换为向量表示,将序列信息整合到特征向量中;嵌入的时候将SMILES和氨基酸序列分别编码,生成药物和靶标的序列嵌入和,分别输入编码层说明书4/8 页8CN 116612810 A8中。0024采用分子全序列直接编码、分子。

24、子序列编码和指纹编码(Morgan指纹和PubChem指纹编码)三种方式将分子序列转换为向量表示,将序列信息整合到特征向量中;嵌入的时候将SMILES和氨基酸序列分别编码,生成药物和靶标的序列嵌入和,分别输入编码层中;其中,分子全序列直接编码、分子子序列编码和指纹编码(Morgan指纹和PubChem指纹编码)三种方式具体步骤如下:(1)分子全序列直接编码由于SMILES和氨基酸序列都是字母符号表示的,因此可以直接编码。设定SMILES描述符生成嵌入的最大长度为100,氨基酸序列生成嵌入的最大长度为1000,对长度大于最大长度的嵌入进行截取,对长度不足最大长度的用 0 进行补全,生成靶标和药物。

25、的嵌入和。0025本实验中SMILES由63个标号表示,氨基酸序列由21个标号表示。根据标号固定表示SMILES描述符和氨基酸序列。例如 C、H、N 分别用 1、2、3 表示,那么SMILES序列 CN=C=O 则表示为C N=C=O=1 3 63 1 63 5。0026(2)分子子序列编码本发明使用ESPF算法对从Uniprot数据集和ChEMBL数据库中提取药物和靶标的子结构,通过设置不同的频繁阈值(指分解的单个子序列在该数据集中出现的最低次数)和数据来源,得到不同规模的词汇集V。使用频繁子序列C作为分割标准,将药物和靶标序列分解为一组子序列。编码为位向量并生成嵌入。被分解的SMILES描。

26、述符和氨基酸序列长度分布较短,为了保留更多原始信息,选择频繁阈值较小的药物(100)和靶标(500)。在这个实验中,药物序列的最大长度为50个子序列,靶标序列的最大长度为545个子序列。靶标序列和药物序列都被分解成子结构,转换为对应的嵌入矩阵。这些矩阵通过可查询内容嵌入矩阵生成对应的靶标嵌入和药物嵌入。生成规则如下:其中,和分别是根据靶标和药物分解子序列词汇集 的大小及预设定嵌入长度自动构成的可查询矩阵。0027(3)指纹编码指纹编码又分为指纹直接嵌入和指纹标记位编码两种。由于分子指纹是由0、1 组成的二进制向量,因此可以直接使用此向量作为指纹嵌入。但由于分子指纹较长,信息密度稀疏,可以 通过。

27、标记位 编码方式 对其进行压缩。识别分子指纹中所有值为1的标记位,而忽略值为0的标记位,根据指纹中的原始次序编码,提取标记位对应的次序i,再按提取次序生成一个较短的二进制向量并作为嵌入。0028由于每种药物对应的指纹标记位数不同,向量长度也不一致,需要设定最说明书5/8 页9CN 116612810 A9大长度。根据Morgan指纹和PubChem指纹编码的长度分布。最终设定Morgan指纹编码生成嵌入最大长度为76,设定PubChem编码生成嵌入的最大长度为250。对于编码后长度不足最大长度的嵌入用 0 进行补全。00295、编码层获得药物和靶标的编码后的分子表征,该步骤具体包括:编码层分别。

28、采取三种编码方式,多层感知机(MLP)编码、卷积神经网络(CNN)编码、自注意力机制(SelfAttention)编码,通过融合上下文信息提取特征来对嵌入进行编码:其中和分别代表通过编码层之后的药物和靶标序列的编码。0030其中三种编码方式,多层感知机(MLP)编码、卷积神经网络(CNN)编码、自注意力机制(SelfAttention)编码具体步骤如下:(1)多层感知机(MLP)编码指纹直接生成的嵌入表达形式简单,上下文无关且具有非线性的特点。可以将药物分子指纹直接生成的嵌入输入MLP编码器。MLP编码器叠加三层全连接神经网络,隐藏层分别采用1024,256和64个神经元。在每层网络中,输入向。

29、量与隐藏单元的连接权重相乘,得到各自的输出并通过一个非线性激活函数。经过三层神经元之后得到指纹编码:(2)卷积神经网络(CNN)编码用直接编码的SMILES和氨基酸全分子序列生成的嵌入长度能够达到1000个单位。可以使用全连接神经网络来编码,但这种方法容易导致过拟合且不符合药物和靶标基于基团相互作用的特性。卷积神经网络通过卷积核直接连接上下层神经元,并共享参数,能够提取分子的局部特征,减少数据处理量并保留有用信息,因此更适合用来编码。0031实验采取三层一维卷积神经网络作为药物和靶标嵌入的编码器,将SMILES和氨基酸序列分别直接编码,生成药物和靶标的序列嵌入和,输入CNN编码器中。0032C。

30、NN编码器叠加三层一维卷积神经网络,药物按层数依次使用大小为4、6、8的卷积核,靶标按层数依次使用大小为4、8、12的卷积核。在进行卷积操作之后对结果进行一次池化操作并通过全连接层,最后得到药物和靶标的编码和:(3)自注意力机制(SelfAttention)编码SelfAttention编码器的计算时间和存储量的消耗约为输入大小的二次项,因此说明书6/8 页10CN 116612810 A10使用直接编码的全分子结构生成的嵌入作为输入在计算上是不可行的。而分子子序列编码生成的嵌入长度相对较短,基于自注意力机制编码器能够捕获药物和靶标子结构的化学语义及上下文之间的关联,因此将子序列编码生成的嵌入。

31、作为SelfAttention编码器的输入。0033由于药物和靶标按序分解的子序列生成的嵌入并不包含分子序列的上下文信息。SelfAttention编码器利用位置编码(Positional Encoding)将顺序信息与内容嵌入结合起来,形成具备学习序列顺序信息能力的序列嵌入。药物和靶标的位置编码和可通过学习获得。学习位置编码每一个位置学习一个独立的向量,通过可查询位置嵌入矩阵生成,生成规则如下:其中,和分别是靶标第i个子序列和药物对应的第j个子序列的独热编码;和是根据药物和靶标分解后的子序列最大长度和预设定嵌入长度自动构成的可查询二维嵌入矩阵,预设定嵌入长度与内容嵌入生成时保持一致。0034。

32、最终,SelfAttention编码器的输入和通过内容嵌入和位置嵌入相加获得,为了保持指纹生成的嵌入内容与位置的一致性,通过内容嵌入与常数相加获得:将生成的包含位置信息的嵌入输入到SelfAttention编码器中,由N个相同层组成,每层由两个子层组成,首先是一个多头自注意力编码器。多头自注意力编码器是通过个不同的线性变换后将不同的Attention结果拼接起来,使用多头注意力能够使模型专注于不同的位置,在本发明中使用的是12头自注意力机制:然后将自注意力层的结果输出到前馈(feedforward)神经网络中。同时,自注意力层和前馈神经网络层后面都会接一个子层,作拼接和归一化处理。最后获得药物。

33、和靶标的编码和:。00356、交互层进行药物和靶标相互作用模拟,该步骤具体包括:说明书7/8 页11CN 116612810 A11为了模拟成对药物靶标的相互作用,对于每个靶标子序列i和每个药物子序列j,生成交互值:其中F为聚集函数,用来衡量药物靶标对之间的相互作用,在实验中使用点乘表示。在交互层之后得到张量矩阵I,这个交互表中的每一列都考虑了靶标和药物的单个最小单元的相互作用。使用点乘作为聚集函数能够产生单一标量,以衡量单对药物靶标最小单元对之间的相互作用强度。00367、特征提取层提取交互矩阵的交互特征,该步骤具体包括:交互层输出二维交互表I,然后在下游层进行特征提取。交互表中的值越高,D。

34、TI相互作用的可能性就越高。若交互表中对应位置的点乘积较高,则表示交互单元确实相互作用。可视化交互表可以更直观地看到哪些单元为最终结果作出了贡献,尽可能阐明药物和靶标相互预测模型的内部工作原理,进而为生物学解释提供有力支持。0037药物序列和靶标序列中相邻的最小单元可能会对彼此产生影响并引发相互作用。因此,需要模拟邻近区域的相互作用,而不仅仅是两两之间的相互作用。为了实现这一点,通过卷积神经网络在交互表I上进行特征提取。通过使用定量的顺序不变的卷积核,卷积层可以捕获和聚合邻域之间的相互作用,并输出一个矩阵O:8、最后获得预测结果,该步骤具体包括:输出层对采集到的特征进行解码,将提取的交互特征平。

35、铺为一个向量,经过线性层输出预测结果L:其中,和分别表示全连接层的权重矩阵和偏移量,表示该药物靶标相互作用对的真实标签。本发明实施例中,所使用基于交互推理网络的药物靶标相互作用预测模型包括5种不同组合的算法,(1)通过全分子序列直接编码生成嵌入,使用CNN编码器编码进行预测;(2)通过子序列编码生成嵌入,使用SelfAttention编码器编码进行预测;(3)PubChem指纹直接编码生成嵌入,使用MLP编码器生成药物编码,与(1)中生成的药物编码串联后进行预测;(4)Morgan指纹直接编码生成嵌入,使用MLP编码器生成药物编码,与(1)中生成的药物编码串联后进行预测;(5)PubChem指纹标记位编码生成嵌入,使用SelfAttention编码器生成药物编码,与(2)中生成的药物编码串联后进行预测。0038以上所揭露的仅为本发明一种较佳实施例而已,当然不能以此来限定本发明之权利范围,因此依本发明权利要求所作的等同变化,仍属本发明所涵盖的范围。说明书8/8 页12CN 116612810 A12图1说明书附图1/2 页13CN 116612810 A13图2图3说明书附图2/2 页14CN 116612810 A14。

展开阅读全文
内容关键字: 基于 交互 推理 网络 药物 靶标 相互作用 预测 方法
关于本文
本文标题:基于交互推理网络的药物靶标相互作用预测方法.pdf
链接地址:https://www.zhuanlichaxun.net/pdf/14333363.html
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2017-2018 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1 
 


收起
展开