准确的蛋白质结构原子模型不仅能够帮助研究者理解生命活动的内在原理,还能为药物研发提供指导。蛋白质结构预测主要在已知蛋白质序列中寻找相似序列,根据序列的相似性来判断使用哪些已知结构来构建未知结构,同时考虑其他可能改变蛋白质结构的因素。总结下来就是找相同序列,使用已知结构推测未知结构。
AlphaFold2利用AI技术建立蛋白质序列和蛋白质结构的关系,不断学习已知序列和结构进而进行蛋白质结构预测。在强大的算法与算力的支持下,DeepMind将运算时间从数月缩短至了数小时,这对于人类攻克疑难杂症有着划时代的意义。
据了解,目前解析蛋白质结构的主流方法有x射线晶体学(x-ray crystallography)、核磁共振波谱法(nuclear magnetic resonance spectroscopy)和冷冻电镜方法(cryo-electron microscopy),其中前两者需具有长时间的实践积累、成熟的工作流程及较为严苛的使用条件。随着软硬件方面的突破,冷冻电镜方法,尤其是冷冻电镜单颗粒分析(single-particle cryo-EM)逐渐成为首选方案。但是出于准确度要求,此项工作仍旧繁琐。
为了满足医学科研等领域的海量算力需求,阿里云弹性高性能计算(Elastic High Performance Computing,E-HPC)基于第三代英特尔®至强®可扩展处理器(Cooper Lake)打造算力平台。依托阿里云基础设施,该平台可面向教育科研、企事业单位和个人,提供快捷、弹性、安全的一站式公共云HPC服务。
据悉,本次大赛基于阿里云E-HPC平台和第七代服务器ECS高主频实例进行,以冷冻电镜三维结构解析的实际应用场景为基础,提供生物大分子的氨基酸序列以及在冷冻电镜下取得的电势能分布,要求参赛选手结合从数据库中选取的训练数据集,利用深度学习方法搭配云端算力支持,探索从实验数据到高精度蛋白质原子结构的智能化解决方案。以期达到改善目前蛋白质结构搭建工作的整体效率和准确率、减轻科研工作者负担。
据介绍,本次大赛赛题由达摩院建议发起,阿里云天池平台承办,联合了国家蛋白质科学中心等权威团队。后续,达摩院药学AI组还将追踪和优化相关技术对行业的提升效果。
即日起到9月28日,个人、高等院校、科研单位、企业、创客团队等人员均可报名,参赛人员在成功完成同期的初赛环节后,经过复赛、决赛,将有机会角逐28万元人民币的奖金池。