【摘要】 基于“一个基因、一种药物、一种疾病”的传统药物发现模式,一直以追求单靶标高活性和高选择性配体为目标。但是,近年来这种设计理念受到临床试验结果高失败率的巨大冲击和挑战。许多高活性、高选择性药物分子在体外试验中表现出非常理想的生物活性,但是这些药物真正应用到人体时,往往表现出不理想的疗效或严重毒副作用,其原因主要是由于生物系统和药物体内行为及作用模式的复杂性。化合物作为药物,在体内行为包括吸收、分布、代谢和清除,而作用模式则包括与人体内各种蛋白质的相互作用、毒性等,简称药物ADMET性质和药物-靶标相互作用谱。在上述因素驱动下,近年出现了系统药物设计概念,即以系统(整合)方法论研究药物设计问题,整合化学、生物学、数学、信息学、计算机科学等多学科技术,利用各种试验数据,建立计算机模型或数学方程,用于识别药物分子在整体细胞或有机体中复杂行为、作用网络和通路,以期发现高效、低毒的药物分子,造福人类健康。本论文旨在发展几种系统药物设计相关的方法和工具,包括两个主要部分。论文第一部分围绕药物-靶标网络和药物临床副作用理论预测展开研究,发展新算法和工具,推动系统药物设计发展和应用。第二章,我们发展了药物相似性推理、靶标相似性推理、网络推理和加权网络推理方法,用于药物-靶标相互作用预测和药物重定位研究。结合计算预测和体外试验,成功发现人类雌激素受体和二肽基肽酶-IV是五个老药孟鲁司特、双氯芬酸钠、辛伐他汀、酮康唑和伊曲康唑新的潜在靶标,他们之间的半数最大抑制浓度或有效浓度达到微摩尔或亚摩尔水平。另外,通过对基于边加权网络推理方法模拟研究,首次发现药物-靶标网络中的“弱相互作用假设”。第三章使用数据库整合和文本挖掘技术,发展了目前较大的免费药物副作用数据库MetaADEDB。为了证实MetaADEDB应用价值,开发了基于药物表型网络推理和药物副作用推理方法用于药物副作用和药物体内作用谱预测,获得了较好预测准确度并成功解释了数个老药未知临床副作用的分子机制。第四章,我们系统性地发展和评价了多靶标QSAR和计算化学基因组学方法在化合物-蛋白质相互作用网络预测中的应用。结果发现基于蛋白质一级序列的计算化学基因组学方法虽然在内部交叉验证中获得较高预测准确度,但是在外部测试集中却出现较高的假阳性率。基于多个高准确度的多靶标QSAR模型,发展了软件和相应的基于网页工具CPI-Predictor,用于全新化合物的靶标识别。论文第二部分,我们围绕小分子ADMET性质理论预测算法、数据库和软件发展开展研究。第五章,首先利用模式识别技术,发展一种新的组合分类器算法用于细胞色素P450抑制剂的分类预测研究。通过系统建模研究,证实我们发展的组合分类器算法优于几种传统方法,如最大值法、最小值法和乘积法。发展了基于信息熵指数用于小分子化合物细胞色素P450酶抑制杂泛性定量表征和预测研究。结果显示分子芳香性与其P450抑制杂泛性存在中等相关性,而分子亲脂性、分子复杂度、氢键结合能力和拓扑极性表面积与其P450抑制杂泛性没有或低相关性。基于目前最大的化合物生物降解性数据库,系统地发展了化合物生物降解性概率预测方法和模型,试验结果表明我们方法和模型具有较好泛化能力。第六章,针对几种常见模式生物,包括梨形四膜虫、黑头呆鱼和蜜蜂毒性的理论预测开展研究,发展和构建了多个高质量定性分类和定量回归模型用于毒性的理论预测。同时,又探索发展基于计算系统毒理学框架用于化合物毒性评价。与传统的QSAR方法相比,计算系统毒理学的计算框架不仅可以预测化合物毒性,还可以预测化合物与人体毒性相关基因或蛋白作用网络,这对化学物毒性分子机制阐明和环境风险评估更有指导和应用价值。论文第七章,通过文本挖掘方法构建了一个免费的化合物ADMET相关数据库admetSAR (www.admetexp.org).该数据库包含近10万个不重复小分子的22万条ADMET相关的试验数据。用户可以使用admetSAR中的文本搜索、分子相似性搜索等功能免费评价化合物的ADMET性质。另外27个高准确度的计算模型,包括22个定性分类和5个定量回归模型被安转至admetSAR数据库,供用户进行全新分子的ADMET性质计算预测。数剧库admetSAR不仅可以用于药物设计和药物发现,还可以用于环境风险评估研究,并在化合物生物降解性预测方面表现出较好的应用价值。目前该数据库访问量超过5000余次,并且被国内外30多家大型制药公司和学术机构广泛使用。
【关键词】 系统药物设计; 药物代谢; 药物-靶标网络; 系统生物学; 药物重定位;
摘要 5-7
Abstract 7-9
第1章 系统药物设计概述 15-39
1.1 引言 15-16
1.2 复杂网络 16-17
1.3 生物网络 17-22
1.3.1 药物-靶标相互作用网络 17
1.3.2 蛋白-蛋白相互作用网络 17-19
1.3.3 代谢网络 19-20
1.3.4 疾病网络 20-22
1.4 药物-靶标相互作用网络预测方法学 22-26
1.4.1 基于配体方法 22-23
1.4.2 基于靶标三维结构方法 23
1.4.3 基于计算化学基因组学方法 23
1.4.4 基于生物网络推理方法 23-24
1.4.5 基于基因型和表型网络推理方法 24-26
1.5 药物重定位 26-27
1.6 计算机辅助的化合物药代动力学性质及毒性预测方法学 27-37
1.6.1 化合物描述符计算 28-30
1.6.2 数学建模方法 30-35
1.6.3 模型评价方法 35-36
1.6.4 化合物药代动力学和毒性计算预测方法学存在的科学问题和挑战 36-37
1.7 论文总体安排 37-39
第2章 基于网络推理的药物靶标发现及药物重定位预测研究 39-70
2.1 引言 39-40
2.2 材料和方法 40-47
2.2.1 数据收集和整理 40-41
2.2.2 药物-靶标二部网络构建 41
2.2.3 基于药物相似性推理 41
2.2.4 基于靶标一级序列相似性推理 41-42
2.2.5 基于网络推理 42
2.2.6 基于边加权的网络推理 42-44
2.2.7 基于节点加权的网络推理 44-45
2.2.8 结果评价 45-46
2.2.9 生物测试化合物购买 46-47
2.2.10 二肽基肽酶-Ⅳ抑制活性评价 47
2.2.11 雌激素受体的激动和拮抗活性评价 47
2.2.12 MTT测试 47
2.3 无加权网络推理方法试验结果 47-56
2.3.1 基准数据集的预测结果 47-48
2.3.2 预测新的药物-靶标相互作用 48-51
2.3.3 试验验证结果 51-54
2.3.4 药物-靶标相互作用可视化网络分析 54-56
2.4 加权网络推理方法试验结果 56-66
2.4.1 网络拓扑特征分析 56-58
2.4.2 基于节点加权的网络推理预测结果 58-59
2.4.3 基于边加权的网络推理预测结果 59-60
2.4.4 化合物-蛋白质网络中的“弱相互作用假设”发现 60-62
2.4.5 预测药物新靶标 62-66
2.5 讨论 66-69
2.5.1 方法比较 66
2.5.2 网络推理算法在药物重定位中的潜在应用 66-67
2.5.3 新DPP-Ⅳ抑制剂孟鲁司特的多向药理学特征 67-68
2.5.4 新雌激素活性配体的多向药理学特征 68-69
2.5.5 药物-靶标网络中的“弱相互作用假设” 69
2.6 本章小结 69-70
第3章 基于表型网络推理的药物副作用及体内复杂行为预测 70-87
3.1 引言 70-71
3.2 材料和方法 71-74
3.2.1 药物副作用数据库MetaADEDB构建 71
3.2.2 药物-ADE关联性网络构建 71
3.2.3 基于表型网络推理的的药物副作用 71-73
3.2.4 基于药物副作用相似性的药物靶标预测 73-74
3.2.5 预测结果评价 74
3.3 试验结果 74-81
3.3.1 药物副作用数据库MetaADEDB介绍 74-77
3.3.2 药物-药物副作用网络 77-79
3.3.3 药物-靶标相互作用网络 79
3.3.4 药物-药物网络 79
3.3.5 预测药物新的副作用结果 79
3.3.6 预测新的药物-靶标相互作用结果 79-81
3.3.7 发现药物新靶标 81
3.4 讨论 81-86
3.4.1 方法优势与局限性 81-85
3.4.2 药物脱靶蛋白-副作用事件网络 85-86
3.5 本章小结 86-87
第4章 计算化学基因组学和mt-QSAR方法发展和应用研究 87-105
4.1 引言 87
4.2 材料和方法 87-91
4.2.1 实验原理 87
4.2.2 数据收集与处理 87-89
4.2.3 小分子描述符计算 89
4.2.4 靶标蛋白描述符计算 89
4.2.5 mt-QSAR方法原理 89
4.2.6 计算化学基因组方法 89-90
4.2.7 建模方法 90
4.2.8 软件和在线服务CPI-Predictor发展 90-91
4.3 实验结果 91-98
4.3.1 数据集多样性分析 91
4.3.2 mt-QSAR模型结果 91
4.3.3 计算化学基因组学模型结果 91-96
4.3.4 外部确证集的预测结果 96-98
4.4 软件和基于网页服务CPI-Predictor的功能介绍 98-100
4.4.1 CPI-Predictor特点 98-99
4.4.2 基于Web服务CPI-Predictor 99-100
4.5 讨论 100-104
4.5.1 药物多向药理学特征分析 100
4.5.2 计算化学基因组学与mt-QSAR方法比较 100-103
4.5.3 化学基因组学方法展望 103-104
4.6 本章小结 104-105
第5章 化合物代谢相关性质预测方法发展和应用研究 105-151
5.1 引言 105-106
5.2 细胞色素P450抑制剂分类预测研究 106-127
5.2.1 材料与方法 106-114
5.2.2 结果 114-122
5.2.3 讨论 122-126
5.2.4 小结 126-127
5.3 小分子细胞色素P450抑制杂泛性表征和预测 127-142
5.3.1 材料和方法 127-128
5.3.2 结果和讨论 128-141
5.3.3 小结 141-142
5.4 化合物生物降解性预测 142-149
5.4.1 材料和方法 142-144
5.4.2 结果和讨论 144-149
5.4.3 小结 149
5.5 本章小结 149-151
第6章 化合物毒性预测方法发展和应用研究 151-163
6.1 引言 151-152
6.2 化合物水生毒性预测 152-155
6.2.1 材料和方法 152-154
6.2.2 结果和讨论 154-155
6.3 化合物陆生毒性预测 155-157
6.3.1 材料和方法 155-156
6.3.2 结果和讨论 156-157
6.4 计算系统毒理学方法发展 157-161
6.4.1 材料和方法 157-158
6.4.2 结果与讨论 158-161
6.5 本章小结 161-163
第7章 ADMET相关数据库构建和预测软件发展 163-175
7.1 引言 163-164
7.2 材料和方法 164-168
7.2.1 数据准备 164-165
7.2.2 admetSAR数据库构建 165-166
7.2.3 ADMET-Simulator程序设计 166-168
7.3 admetSAR数据库介绍 168-171
7.3.1 admetSAR数据库描述 168-169
7.3.2 预测全新分子药代动力学性质及毒性 169-171
7.3.3 admetSAR数据库的使用和特点 171
7.4 软件ADMET-Simulator功能及应用介绍 171-174
7.4.1 ADMET-Simulator软件的模块功能介绍 171-172
7.4.2 ADMET-Simulator特点 172
7.4.3 ADMET-Simulator使用简单介绍 172-174
7.5 本章小结 174-175
第8章 全文总结和展望 175-178
参考文献 178-209
攻读博士期间撰写的论文和成果 209-213
致谢 213-214
学术论文网Tag: |