10月10日,中山大學(xué)醫(yī)學(xué)院施莽教授團(tuán)隊(duì)與阿里云李兆融團(tuán)隊(duì)在《細(xì)胞》雜志(Cell)發(fā)表的論文報(bào)告了全球范圍的180個超群、16萬余種的RNA病毒發(fā)現(xiàn),大幅擴(kuò)展了全球RNA病毒的多樣性。該研究將人工智能技術(shù)應(yīng)用于病毒鑒定,發(fā)現(xiàn)了傳統(tǒng)研究方法未能發(fā)現(xiàn)的病毒“暗物質(zhì)”,探索了病毒學(xué)研究的新路徑。在該研究中,團(tuán)隊(duì)開發(fā)的人工智能算法能夠?qū)Σ《竞头遣《净蚪M序列深度學(xué)習(xí),并在數(shù)據(jù)集中自主判斷病毒序列。利用這套算法,研究團(tuán)隊(duì)在來自全球生物環(huán)境樣本的10487份RNA測序數(shù)據(jù)中發(fā)現(xiàn)了超過51萬條病毒基因組,代表超過16萬個潛在病毒種及180個RNA病毒超群。其中23個超群無法通過序列同源方法識別。
【機(jī)會前瞻】
近日,中山大學(xué)與阿里云聯(lián)合研究團(tuán)隊(duì)在國際頂級學(xué)術(shù)期刊《Cell》上發(fā)表了一項(xiàng)重大科研成果,利用云計(jì)算與AI技術(shù)發(fā)現(xiàn)了超過16萬種全新的RNA病毒。這一發(fā)現(xiàn)不僅極大地?cái)U(kuò)展了科學(xué)界對RNA病毒多樣性的認(rèn)識,也突顯了AI技術(shù)在現(xiàn)代科學(xué)研究中的巨大潛力。
研究團(tuán)隊(duì)運(yùn)用深度學(xué)習(xí)算法LucaProt,對來自全球的10487份RNA測序數(shù)據(jù)進(jìn)行了深入分析,從而成功識別出51萬條病毒基因組、161979個潛在病毒種以及180個RNA病毒超群。尤為引人注目的是,其中23個超群無法通過傳統(tǒng)的序列同源方法識別,這些被稱為病毒圈“暗物質(zhì)”的存在,為我們理解病毒的復(fù)雜性和多樣性提供了新的視角。
此次研究還揭示了迄今為止已知最長的RNA病毒基因組,長度達(dá)到47250個核苷酸,這一發(fā)現(xiàn)展示了RNA病毒基因組進(jìn)化的靈活性和適應(yīng)性。新發(fā)現(xiàn)的RNA病毒遍布于多種環(huán)境,包括空氣和溫泉等,且不同生態(tài)系統(tǒng)中病毒的多樣性和豐度存在顯著差異。