介绍
近年,人工智能的开发与应用得到了极快的推广,新药研发更是首当其冲。从早年计算机辅助药物设计的普及,到今天人工智能概念的渗透,创新型制药公司已不仅仅是在接受这种药物发现与开发的理念,甚至更是大力的引入与利用,以更好的对新药品种进行运营。那么,从早年的CADD到今天的AI,计算机如何助力新药的发现?新药的发现最终会全部交给机器吗?本稿件将抛砖引玉,与君共同分享。
1计算机辅助药物设计(CADD)
新药发现,是融合基因组学、蛋白组学、分子生物学、结构生物学、生物信息学,以及组合化学、计算化学、高通量筛选等相互渗透、紧密结合的多学科协同工作;而随着计算机算力的提升,计算已更多的应用于新药研发的各个环节当中。
CADD,是以计算机化学为基础,通过模拟来预测和计算配体与受体之间的作用特点,从而进行先导化合物的发现和优化。自年“锁钥模型”首次被提出,CADD的研究正在走向成熟,并逐步成为药物发现过程中的必备技术手段之一。
从计算方式来看,CADD可分为间接药物设计即基于配体的药物设计(LBDD)和直接药物设计即基于结构的药物设计(SBDD)两种。LBDD一般适用于药物三维结构未知,仅仅已知活性化合物;SBDD一般适用于已通过实验方法(如X射线晶体衍射或核磁共振等)或者用理论模拟预测方法(如从头设计、虚拟筛选、同源模建等方法)得到受体或与配体复合物的三维结构关系。
图1.1计算机辅助药物设计流程图
(图片源:见参考文献1)
2CADD的新药成功案例
CADD的推广应用,经过数十年的积累,已成为当今药物研发不可或缺的一部分,且国内外产出了部分实质性的成果。国外一些大型制药公司如默克、罗氏、诺华等,已经有一些领域通过CADD技术获得了更优的产品,甚至已成功上市,如血管紧张素转化酶抑制剂卡托普利、HIV-1蛋白酶抑制剂沙奎那韦、神经氨酸酶抑制剂扎那米韦等,均用到了一定的CADD来辅助结构优化设计。
举例如下:流感治疗药物扎那米韦,科研人员以已知的NA抑制剂为设计模板,根据结构中羟基与NA活性位点的作用特点,使用电子等排的氨基取代羟基(同步保留氢键作用)得到了相应的化合物,该化合物可以形成盐桥,从而与NA产生了更高的亲和力,在此基础上又进一步使用胍基取代氨基,最终得到了扎那米韦。
图2.1使用CADD成功上市的药物案例
(图片源:见参考文献1)
3CADD和AI的区别
AI,是近年来非常火热的技术应用,且已经介入到新药设计到研发的大部分环节当中,为新药发现与开发带来了极大的助力。不过,虽然AI和CADD的硬件基础都是计算机,但本质上还是存在着很大的区别。
首先,CADD的基础学科是计算化学,是通过计算机模拟来计算受体与配体之间的作用强弱,从而进一步为优化化合物的结构提供方向;相对而言,这一过程参与了更多的人的智慧和对药物结构的敏感经验。
而AI,更倾向于机器对数据库信息的自我学习,可以对数据进行提取和学习,一定程度上避免了化合物设计过程中的试错路径,同时还会带来很多全新的结构,为药物发现打破常规的结构壁垒。
4AI逐步介入到新药设计
AI,范围来说覆盖了机器学习和深度学习,能与新药研发相结合并实质性的应用到靶点预测、高通量筛选、药物设计、药物的ADMET性质预测,等;且算力方面,由早期应用于药物发现领域的决策树、随机向量机等机器学习模型,进展到深度神经网络、卷积神经网络、循环神经网络等深度学习算法。
图4.1人工智能机器学习深度学习的关系
(图片源:见参考文献2)
具体到新药研发环节:如靶点识别,基于决策树来预测与疾病相关的基因,有研究者发现了多种EF在信号通路和胞外定位中的调控作用,并进一步基于靶点的结构和几何特征,选取一定量蛋白的数十个结合位点以及大量的非药物结合位点,构建随机森林分类器来预测药物靶点,并有研究者进一步采样提升了随机森林算法,成功的从非药物靶点中区分了药物靶点。
再如,活性筛选方面,AI可以对候选化合物进行筛选,从而更快的筛选出作用于特定靶点且具有较高活性的化合物。通过采用决策树和随机森林的机器算法,国内研究者分别对脾酪氨酸激酶Syk抑制剂和非抑制剂建模,并从相应的分子数据库筛选得到了极具潜力的Syk抑制剂。
此外,近年来随着新冠病毒肆虐全球,针对于此的药物开发得到了集中的