近日,中山大学医学院施莽教授团队与阿里云李兆融团队在《细胞》杂志(Cell)发表论文,报告了全球范围共180个超群、16万馀种RNA(核糖核酸)病毒的发现,大幅扩展了全球RNA病毒的多样性。该研究将人工智能技术应用于病毒鉴定,发现了传统研究方法未能发现的病毒“暗物质”,探索了病毒学研究的新路径。据悉,研究团队开发的LucaProt人工智能算法,能够深度学习病毒和非病毒基因组序列,并在数据集中自主判断病毒序列。利用这套算法,研究团队在来自全球生物环境样本的10487份RNA测序数据中,发现了超过51万条病毒基因组,代表超过16万个潜在病毒种及180个RNA病毒超群存在。
“人工智能的算法模型能够挖掘出我们之前忽略或根本不知道的病毒,这种能力在疾病防控和新病原的快速识别中尤为重要。特别是在疫情暴发时,人工智能的速度和精度可以帮助科学家更快地锁定潜在病原体。”施莽介绍说。
通过进一步分析,研究团队报告了迄今最长的RNA病毒基因组,其长度达到47250个核甘酸;发现了超出以往认知的基因组结构;识别到多种病毒功能蛋白,特别是与细菌相关的功能蛋白,进一步表明还有更多类型的RNA噬菌体亟待探索。这些新病毒的发现,刷新着科学家对病毒圈的认识。