众所周知,蛋白质是生命的基石,在所有的生物过程中发挥着关键的作用。因此,了解它们如何与环境相互作用,对于开发有效的治疗方法和设计人工细胞的基础至关重要。
近日,由瑞士联邦理工学院(EPFL)生物工程研究所蛋白质设计与免疫工程实验室(LPDI)与USI信息学院计算科学研究所、英国帝国理工学院等单位合作,开发了一种突破性的机器学习驱动技术,用于预测蛋白质与环境间的相互作用,并实现仅根据表面描述蛋白质的生化活性。除了加深我们对蛋白质功能的理解,这种被称为MaSIF的方法还可以支持未来人造细胞中基于蛋白质成分的开发。这项研究已于12月9日发表在Nature Methods上。
在这项新研究中,该研究团队获取了大量的蛋白质表面数据,并将这些化学和几何特性输入到机器学习算法中,并对其进行训练,使它们与特定的行为模式和生化活性相匹配。然后,他们使用剩余的数据来测试算法。
该研究第一作者、EPFL生物工程研究所和瑞士生物信息学研究所的Pablo Gainza博士说:“通过扫描蛋白质的表面,我们的方法可以定义一个‘指纹’,然后可以在蛋白质之间进行比较。”
科学家已经开发出一种新的方法来预测蛋白质与其他蛋白质和生物分子间的相互作用,以及仅通过观察其表面来预测其生化活性。研究团队发现,具有类似相互作用的蛋白质都有共同的“指纹”。
研究通讯作者、LPDI主任Bruno Correia博士说:“该算法每秒可以分析数十亿个蛋白质表面。我们的研究对人造蛋白质的设计具有重要的意义,它使我们能够编程让蛋白质仅通过改变其表面化学和几何特性就能表现出某种特定的行为方式。”
该方法以开源的形式发表,也可以用来分析其他类型分子的表面结构。