蛋白结合位点预测及基于GPU加速的反向对接研究

项目基本信息

项目批准号:61303099申请代码1:F020504

批准金额:23.0000万元负责人:高军

依托单位:上海海事大学资助类别:青年科学基金项目

结题摘要

药物潜在靶点的识别对于早期药物分子的研发、天然产物的生物活性、安全性评价和老药新用等领域都有着非常重要的意义。传统实验方法已经不能满足大规模数据分析的需求。

本研究从基于复合物稳定性校验及同源索引约束的结构比对位点预测算法、引入GPU加速两方面入手,对现有反向对接技术进行优化,最终建立一个快速识别药物体内全部可能靶标的平台。

在基于结构比对的方法在蛋白结合位点预测的研究中引入同源索引、链长索引、复合物稳定性以及多模板链聚类优化。与其他算法相比,预测的准确率提高2-10%,而且效率也有所提高。同时提供对外服务的Web平台(http://binfo.shmtu.edu.cn/bsitefinder/)。在蛋白结合位点预测的研究中基于Hadoop进行结构比对,同时引入残基的保守性信息、构建大的模板库。由于Hadoop大数据并行加速,大大提高了比对效率。在蛋白结构分类研究中提出了一种新的集成分类方法,在该方法中引入蛋白的三维结构特征,同时采用了一种新的集成策略。在相同的数据集上,比其他算法的准确率都有所提高。同时提供对外服务的Web平台(http://binfo.shmtu.edu.cn/profold/)。最后,利用最新的GPU技术改造当前的对接算法。最终整合结合位点预测、蛋白结构分类、GPU加速的反向对接程序中涉及的各个模块和结果分析工具,为用户提供一个自动化的分子寻靶平台。

研究成果

[1] Gao, J.; Zhang, Q.; Liu, M.; Zhu, L.; Wu, D.; Cao, Z.; Zhu, R. bSiteFinder, an Improved Protein-Binding Sites Prediction Server Based on Structural Alignment: More Accurate and Less Time-Consuming. J Cheminform, 2016, 8, 38.

[2] Chen, D.; Tian, X.; Zhou, B.; Gao, J*. ProFold: Protein Fold Classification with Additional Structural Features and a Novel Ensemble Classifier. BioMed Research International, 2016, 2016, e6802832.

[3] Liu, G.; Liu, M.; Chen, D.; Chen, L.; Zhu, J.; Zhou, B.; Gao, J*. Predicting Protein Ligand Binding Sites with Structure Alignment Method on Hadoop. Current Proteomics, 2016, 13, 113–121.