文|動(dòng)脈網(wǎng)
傳統(tǒng)制藥行業(yè)發(fā)展多年,雖然藥品種類繁多,但具體到藥物靶點(diǎn)上其實(shí)十分局限。在人類蛋白質(zhì)組中,難成藥靶點(diǎn)占據(jù)75%以上。目前已驗(yàn)證有效的靶點(diǎn)如PD-1、GLP-1等則競(jìng)爭(zhēng)激烈。許多腫瘤疾病、神經(jīng)性疾病或是遺傳疾病到今天還是無(wú)藥可治,或者藥效不夠好。
AI技術(shù)的發(fā)展在一定程度上改變了生物醫(yī)藥的發(fā)展格局。隨著AI技術(shù)的突飛猛進(jìn),從全新目標(biāo)蛋白發(fā)現(xiàn),計(jì)算結(jié)構(gòu)預(yù)測(cè)、實(shí)驗(yàn)結(jié)構(gòu)測(cè)定、專用模擬算法開發(fā)到藥物設(shè)計(jì),AI已經(jīng)滲透到新藥研發(fā)的多個(gè)環(huán)節(jié)當(dāng)中。
然而藥物發(fā)現(xiàn)始終是一個(gè)不斷試錯(cuò)的過(guò)程,需要在實(shí)驗(yàn)數(shù)據(jù)基礎(chǔ)上進(jìn)行多輪分析迭代,篩選出最優(yōu)藥物分子。如今,AI制藥多集中于早期藥物發(fā)現(xiàn)階段,在后續(xù)的臨床試驗(yàn)和商業(yè)化階段缺乏動(dòng)力。
更重要的是,AI制藥企業(yè)仍面臨數(shù)據(jù)之困,大量的高質(zhì)量數(shù)據(jù)對(duì)AI制藥至關(guān)重要。為彌補(bǔ)數(shù)據(jù)體量和質(zhì)量上的不足,許多AI藥企開始自建實(shí)驗(yàn)室,尋求干濕實(shí)驗(yàn)閉環(huán),以積累高質(zhì)量標(biāo)準(zhǔn)化數(shù)據(jù)。
半年融資21起,干濕實(shí)驗(yàn)室成為AI制藥押注的下一站
當(dāng)生物體系越來(lái)越復(fù)雜,尺度越來(lái)越紛繁,信號(hào)越來(lái)越模糊,數(shù)據(jù)越來(lái)越龐大,生物研究對(duì)計(jì)算方法的依賴便會(huì)越來(lái)越強(qiáng),計(jì)算生物學(xué)將變得越來(lái)越重要。
在以往的新藥開發(fā)過(guò)程中,長(zhǎng)周期的特性,開發(fā)出一款新藥,僅在數(shù)量龐大的類藥物分子中,找出一個(gè)有開發(fā)潛力的就是漫長(zhǎng)的過(guò)程。2023年,隨著ChatGPT重新引燃人工智能熱潮后,研究人員意識(shí)到AI篩選新藥,算力還沒(méi)到達(dá)真正的上限,AI制藥在資本市場(chǎng)的熱度似乎又被重燃。
據(jù)不完全統(tǒng)計(jì),2023年上半年,國(guó)內(nèi)有超過(guò)20家AI制藥企業(yè)獲得新一輪融資,融資總額超20億人民幣。這些AI藥物研發(fā)公司多數(shù)集中在較早期的發(fā)展階段,僅有少數(shù)融資是在B+輪及C輪,多數(shù)均為A輪或更早期融資。
AI藥物研發(fā),描繪的是人類試圖馴服疾病的遠(yuǎn)大藍(lán)圖。但就目前來(lái)看,AI真的會(huì)給行業(yè)帶來(lái)顛覆性改變嗎?
據(jù)動(dòng)脈網(wǎng)此前采訪,不少行業(yè)人士認(rèn)為,AI只是加速了新藥篩選的過(guò)程,雖然在此環(huán)節(jié)提升了效率,但新藥開發(fā)除了早期篩選階段,還有后續(xù)的臨床試驗(yàn)、上市審批、商業(yè)化漫漫長(zhǎng)路。
與此同時(shí),AI制藥企業(yè)還面臨著許多障礙以及難以避免的虧損問(wèn)題。AI制藥公司的盈利模式主要為CRO和生物科技公司兩種類別。由于CRO行業(yè)進(jìn)入門檻高,能爭(zhēng)取到足夠多藥企的青睞與合作也很難,最好的情況便是生物科技公司自身具有AI能力,利用自己的技術(shù)平臺(tái)不斷發(fā)現(xiàn)新藥,儲(chǔ)備大量管線、藥物資產(chǎn),從中評(píng)估選擇最有潛力的進(jìn)行開發(fā)。
也正因此,如今行業(yè)談及AI制藥,除了算法、數(shù)據(jù)之外,開始更加偏重實(shí)驗(yàn)室里的開創(chuàng)性研究。AI 模型的主要制約在于,沒(méi)有通過(guò)足夠?qū)嶒?yàn)數(shù)據(jù)校正和檢驗(yàn),跟現(xiàn)實(shí)有差距,不能取代真實(shí)數(shù)據(jù)的驗(yàn)證。沒(méi)有高通量多輪濕實(shí)驗(yàn)的閉環(huán)驗(yàn)證和數(shù)據(jù)補(bǔ)充,很難讓AI模型發(fā)揮關(guān)鍵價(jià)值。只有把 AI 模型和濕實(shí)驗(yàn)有機(jī)結(jié)合,才能真正解決這個(gè)問(wèn)題。
搭建干濕結(jié)合閉環(huán)平臺(tái),將實(shí)驗(yàn)室儀器都連入一個(gè)操作系統(tǒng),通過(guò)AI模型進(jìn)行規(guī)劃,有選擇性地做實(shí)驗(yàn),形成干濕實(shí)驗(yàn)閉環(huán)驗(yàn)證。未來(lái)通過(guò)AI大腦控制實(shí)現(xiàn)全自動(dòng)實(shí)驗(yàn)室,將是整個(gè)行業(yè)未來(lái)發(fā)展的趨勢(shì)。
干濕實(shí)驗(yàn)室興起的背后,是AI制藥的數(shù)據(jù)匱乏
隨著國(guó)內(nèi)AI技術(shù)和生物技術(shù)不斷取得突破,AI制藥不斷走向新的高峰,在新藥研發(fā)的各個(gè)環(huán)節(jié)帶來(lái)了突破??煽癖贾?,AI制藥的發(fā)展也顯出疲態(tài)。
首先,AI技術(shù)在新藥研發(fā)方面中作用主要在臨床前階段,在靶點(diǎn)發(fā)現(xiàn)環(huán)節(jié)雖然有突破,但對(duì)許多難成藥靶點(diǎn)也無(wú)能為力。其次在臨床試驗(yàn)階段,AI究竟能多大程度提高研發(fā)成功率,降低成本,目前也依然無(wú)法取得行業(yè)信任。最重要的是,數(shù)據(jù)問(wèn)題是限制當(dāng)前AI制藥行業(yè)發(fā)展的最大壁壘,AI制藥行業(yè)的數(shù)據(jù)面臨質(zhì)和量的雙重問(wèn)題。
數(shù)據(jù)質(zhì)量、數(shù)據(jù)結(jié)構(gòu)和數(shù)據(jù)生成速度對(duì)于AI的應(yīng)用來(lái)說(shuō)極為關(guān)鍵。如果想獲取更多一手的藥物研發(fā)信息,尤其是將藥物分子的數(shù)據(jù)與藥動(dòng)學(xué)數(shù)據(jù)、藥效學(xué)數(shù)據(jù)、臨床數(shù)據(jù)結(jié)合到一起,除了通過(guò)與藥企合作,干濕實(shí)驗(yàn)室是一大重要途徑。
因此,自建干濕一體化實(shí)驗(yàn)室不僅是當(dāng)前AI制藥企業(yè)解決數(shù)據(jù)問(wèn)題的一種重要解決方案,也是未來(lái)AI制藥行業(yè)發(fā)展的必然趨勢(shì)。
目前已有眾多AI制藥企業(yè)搭建干濕實(shí)驗(yàn)室,試圖打造“干濕結(jié)合”閉環(huán),以此獲取高質(zhì)量數(shù)據(jù),加速藥物研發(fā)。
濕實(shí)驗(yàn)指的是在實(shí)驗(yàn)室里采用分子、細(xì)胞、生理學(xué)試驗(yàn)方法進(jìn)行研究,也就是傳統(tǒng)的藥物研發(fā)實(shí)驗(yàn)室。干實(shí)驗(yàn)是通過(guò)計(jì)算機(jī)模擬及生物信息學(xué)方法來(lái)進(jìn)行研究,也就是AI平臺(tái)做的事情。
動(dòng)脈網(wǎng)對(duì)國(guó)內(nèi)開展干濕結(jié)合實(shí)驗(yàn)并逐步實(shí)現(xiàn)閉環(huán)迭代的企業(yè)路徑進(jìn)行了不完全統(tǒng)計(jì)。接下來(lái),動(dòng)脈網(wǎng)也將持續(xù)報(bào)道國(guó)內(nèi)AI制藥企業(yè)在干濕實(shí)驗(yàn)室搭建方面的進(jìn)程,如您有最新干濕實(shí)驗(yàn)室項(xiàng)目進(jìn)展,歡迎聯(lián)系我們進(jìn)行報(bào)道。
事實(shí)上,干濕實(shí)驗(yàn)室這一概念并不新,許多行業(yè)頭部企業(yè)在發(fā)展早期就配備了濕實(shí)驗(yàn)室來(lái)自主產(chǎn)生數(shù)據(jù),比如百圖生科自成立起便著力于打造干濕一體化實(shí)驗(yàn)平臺(tái),晶泰在2018年開始自建大規(guī)模實(shí)驗(yàn)室等等。
通常情況下,完成靶點(diǎn)驗(yàn)證與確定、開發(fā)和篩選,大概需要12個(gè)月,接下來(lái)經(jīng)過(guò)18個(gè)月的 DMTA(Design-Make-Test-Analyse)循環(huán),才能將化合物優(yōu)化為先導(dǎo)化合物,而先導(dǎo)化合物又需要12個(gè)月的持續(xù)進(jìn)化才能生成臨床前候選藥物(PCC)。這里面涉及連續(xù)不斷的制造、純化、定量和鑒定所需的化合物,以及后續(xù)的效力,選擇性和毒性分析,每個(gè)循環(huán)都需要科學(xué)家3-6周的時(shí)間。
干濕實(shí)驗(yàn)室可以將干濕實(shí)驗(yàn)平臺(tái)相互結(jié)合在一起,一方面通過(guò)濕實(shí)驗(yàn)室平臺(tái),生產(chǎn)大量現(xiàn)實(shí)環(huán)境中的濕實(shí)驗(yàn)數(shù)據(jù),另一方面在干實(shí)驗(yàn)平臺(tái)通過(guò)分子模擬及人工智能模型預(yù)測(cè)藥物的物理及動(dòng)力學(xué)性質(zhì),最后通過(guò)機(jī)器學(xué)習(xí)來(lái)連接微觀相互作用和宏觀的物理現(xiàn)象,從而不斷根據(jù)干濕實(shí)驗(yàn)室中產(chǎn)生的數(shù)據(jù)迭代算法。
一方面能節(jié)省多輪實(shí)驗(yàn)的時(shí)間,另一方面也能干濕相互驗(yàn)證。因此,目前“干濕結(jié)合”被行業(yè)內(nèi)普遍認(rèn)為是對(duì)AI技術(shù)最好的使用,自動(dòng)化與AI的結(jié)合使用也是行業(yè)未來(lái)的趨勢(shì)。
干濕實(shí)驗(yàn)閉環(huán)的底層邏輯,是回歸藥物研發(fā)本質(zhì)
通常,人們對(duì)于AI技術(shù)賦能藥物研發(fā)的描述為,AI可以深入藥物開發(fā)的各個(gè)環(huán)節(jié)進(jìn)行深度賦能。然而回歸到現(xiàn)實(shí),AI制藥最常用的場(chǎng)景是用于發(fā)現(xiàn)新靶點(diǎn)和篩選化合物,這是新藥開發(fā)中極為繁瑣卻也極為關(guān)鍵的環(huán)節(jié)。
AI技術(shù)可用于簡(jiǎn)化藥物篩選、合成,降低成本。對(duì)于篩選出來(lái)的化合物,往往還需要進(jìn)行溶解度、活性/選擇性、毒性、代謝、藥代動(dòng)力/藥效以及可合成性等維度條件,這些高度重復(fù)性的工作拔高了臨床前研究階段的成本,涉及多次大量計(jì)算,這些正是AI所擅長(zhǎng)的部分。
AI技術(shù)也可以用來(lái)實(shí)現(xiàn)分子生成,通過(guò)對(duì)海量的化合物或者藥物分子的學(xué)習(xí),獲得化合物分子結(jié)構(gòu)和成藥性方面的規(guī)律,進(jìn)而根據(jù)這些規(guī)律生成很多自然界從未存在過(guò)的化合物作為候選藥物分子,有效構(gòu)建擁有一定規(guī)模且高質(zhì)量的分子庫(kù)。
此外,AI技術(shù)還被用來(lái)完成化學(xué)反應(yīng)設(shè)計(jì)和化合物篩選。目前,AI正在取得進(jìn)展的化學(xué)領(lǐng)域之一是對(duì)化學(xué)反應(yīng)和合成路線進(jìn)行建模和預(yù)測(cè)。基于AI技術(shù),將分子結(jié)構(gòu)映射為可以由機(jī)器學(xué)習(xí)算法處理的形式,根據(jù)已知化合物的結(jié)構(gòu),形成多條合成路線,并推薦最佳合成路線。反過(guò)來(lái),在給定反應(yīng)物的情況下,深度學(xué)習(xí)、遷移學(xué)習(xí)可以預(yù)測(cè)化學(xué)反應(yīng)結(jié)果。AI技術(shù)甚至還可用來(lái)探索新的化學(xué)反應(yīng)。在化合物篩選中,AI技術(shù)被用來(lái)對(duì)化合物的化學(xué)結(jié)構(gòu)與生物活性之間的關(guān)系進(jìn)行建模,預(yù)測(cè)化合物的作用機(jī)制。
可以說(shuō),在藥物開發(fā)的獨(dú)立節(jié)點(diǎn)上,AI制藥都取得了很大的突破。但從本質(zhì)上來(lái)說(shuō),AI制藥更追求效率,通過(guò)壓縮開發(fā)時(shí)間來(lái)驗(yàn)證自身價(jià)值,然而制藥的本質(zhì)邏輯是反復(fù)論證。AI制藥或許需要停下單點(diǎn)突破的嘗試,融入新藥研發(fā)的閉環(huán)思路,回歸藥物研發(fā)的本質(zhì)。
當(dāng)前,主流藥企其實(shí)都配備了生信、統(tǒng)計(jì)、數(shù)據(jù)分析的人員,但存在大量濕實(shí)驗(yàn)團(tuán)隊(duì)和AI團(tuán)隊(duì)獨(dú)立開展工作的情況。事實(shí)上,將AI模型和實(shí)驗(yàn)平臺(tái)統(tǒng)一規(guī)劃,協(xié)同工作,才能更好推進(jìn)干濕結(jié)合。在這個(gè)過(guò)程中,生物人員可以通過(guò)和算法人員的合作,更好地判斷現(xiàn)有算法能夠提供什么。算法人員可以從生物人員處了解到基于現(xiàn)有問(wèn)題,如何去適配或者創(chuàng)造一個(gè)新的模型,從而更好解決問(wèn)題。
干濕閉環(huán)一體化驗(yàn)證,推動(dòng)AI制藥走出數(shù)據(jù)困頓
新藥研發(fā)的數(shù)據(jù)規(guī)模極大,類型、結(jié)構(gòu)也頗為復(fù)雜,構(gòu)建干濕實(shí)驗(yàn)室平臺(tái),可以更高效地完成設(shè)計(jì)、驗(yàn)證的閉環(huán)。
一方面,傳統(tǒng)的藥物研發(fā)以實(shí)驗(yàn)科學(xué)為主,數(shù)據(jù)的記錄、治理和儲(chǔ)存方式都以實(shí)驗(yàn)為核心,數(shù)據(jù)只是實(shí)驗(yàn)的副產(chǎn)品。而數(shù)據(jù)對(duì)于AI的重要性毋庸置疑,這就要求藥企在藥物研發(fā)中,嚴(yán)格規(guī)范數(shù)據(jù)的格式、標(biāo)準(zhǔn)、質(zhì)量、數(shù)量等。
另一方面,AI制藥企業(yè)的算法模型也得針對(duì)性地優(yōu)化。AI與制藥行業(yè)的核心業(yè)務(wù)深度融合,需要對(duì)藥物研發(fā)有深刻的理解,具備充分發(fā)掘提煉實(shí)時(shí)實(shí)驗(yàn)數(shù)據(jù)的能力,并根據(jù)數(shù)據(jù)反饋,優(yōu)化模型、迭代算法。
2022年,阿斯利康、德國(guó)默克等 6 家大藥廠與亞馬遜、以色列生物科技基金(IBF)共同推出了一個(gè)創(chuàng)新實(shí)驗(yàn)室AION Labs。該實(shí)驗(yàn)室旨在創(chuàng)造和采用突破性的新型 AI 技術(shù),改變藥物發(fā)現(xiàn)和開發(fā)的過(guò)程。它包括一個(gè)進(jìn)行生物醫(yī)學(xué)研究的濕實(shí)驗(yàn)室和一個(gè)基于云計(jì)算的干實(shí)驗(yàn)室,專注于新算法和計(jì)算方法的開發(fā),加速潛在新療法的發(fā)現(xiàn)和開發(fā)。
AION Labs的云/AI+濕實(shí)驗(yàn)方式基于AI與精確預(yù)測(cè)算法打開創(chuàng)新源頭,再利用針對(duì)性的實(shí)驗(yàn)進(jìn)行快速驗(yàn)證,然后以資本驅(qū)動(dòng)持續(xù)創(chuàng)新。這一模式可以進(jìn)一步加速AI制藥技術(shù)落地的速度,也能篩選出真正有實(shí)力的創(chuàng)新團(tuán)隊(duì),給予他們更好的發(fā)展資源與機(jī)會(huì)。當(dāng)前,AI制藥行業(yè)仍處于早期發(fā)展階段,AION Labs 的商業(yè)發(fā)展模式或許可以為行業(yè)的發(fā)展注入一劑 “強(qiáng)心針”。
在國(guó)內(nèi),晶泰科技、英矽智能、百圖生科等AI制藥公司,紛紛建立了“全自動(dòng)化的智能機(jī)器人實(shí)驗(yàn)室”,可以24小時(shí)不間斷產(chǎn)生數(shù)據(jù),服務(wù)于新藥研發(fā)的最前端的部分。
2022年下半年,英矽智能已經(jīng)將ChatGPT接入到生物學(xué)平臺(tái)Biology42中,并通過(guò)二次訓(xùn)練實(shí)現(xiàn)關(guān)于分子生物學(xué)和新穎靶點(diǎn)發(fā)現(xiàn)的即時(shí)專業(yè)問(wèn)答。2023年6月,英矽智能又基于GPT-4的底層技術(shù)多模態(tài)Transformer算法,推出了有望賦能抗衰老和疾病的雙效靶點(diǎn)發(fā)現(xiàn)的多模態(tài)衰老時(shí)鐘Precious1GPT。
根據(jù)英矽智能招股書,公司將推進(jìn)全自動(dòng)化的智能機(jī)器人藥物研發(fā)實(shí)驗(yàn)室和機(jī)器人生物數(shù)據(jù)工廠的建設(shè),以不斷補(bǔ)充英矽智能龐大的數(shù)據(jù)資源。招股書表示,一款藥物從項(xiàng)目啟動(dòng)到籌備臨床需要4.5年的時(shí)間,利用英矽智能的Pharma.AI研發(fā)平臺(tái),則只需要12個(gè)月。Pharma.AI平臺(tái)有發(fā)現(xiàn)新靶點(diǎn)、生成候選藥物,預(yù)測(cè)候選藥物的臨床成功可能性等功能。
晶泰科技已建立起一整套量子物理干實(shí)驗(yàn)室與先進(jìn)濕實(shí)驗(yàn)室緊密結(jié)合的研發(fā)迭代流程,挑戰(zhàn)傳統(tǒng)研發(fā)的效率瓶頸,賦能新藥研發(fā)實(shí)現(xiàn)創(chuàng)新速度與規(guī)模的突破。晶泰科技的智能藥物研發(fā)平臺(tái)將基于云端超算數(shù)字化研發(fā)工具與先進(jìn)的實(shí)驗(yàn)?zāi)芰M(jìn)行整合,形成高精度預(yù)測(cè)與針對(duì)性實(shí)驗(yàn)相互印證、相互指導(dǎo)的研發(fā)系統(tǒng)。
騰訊AI藥物發(fā)現(xiàn)平臺(tái)做了一個(gè)分布外研究框架DrugOOD,在框架下對(duì)現(xiàn)有的數(shù)據(jù)庫(kù)進(jìn)行了分門別類,劃分了非常多的實(shí)際場(chǎng)景,并利用AI評(píng)分體系評(píng)價(jià)AI在不同靶點(diǎn)之間生成結(jié)果的可靠性,在后續(xù)研究中及早發(fā)現(xiàn)模型與靶點(diǎn)不適配的問(wèn)題,優(yōu)化研發(fā)效率。目前,騰訊AI藥物發(fā)現(xiàn)平臺(tái)已與多家藥企達(dá)成合作,模型預(yù)測(cè)精度在多項(xiàng)實(shí)際研發(fā)場(chǎng)景的濕試驗(yàn)中得到驗(yàn)證;基于藥物篩選云服務(wù)的超強(qiáng)算力,使篩選速度和篩選的化學(xué)結(jié)構(gòu)空間獲得數(shù)量級(jí)提升。
百圖生科依托百度多年的AI技術(shù)積累,以生物計(jì)算引擎為核心,構(gòu)建了高通量干濕一體的實(shí)驗(yàn)化技術(shù)引擎和高質(zhì)量數(shù)據(jù)生態(tài)體系的復(fù)合型戰(zhàn)略。百圖生科通過(guò)大規(guī)模的蛋白預(yù)訓(xùn)練,提高AI對(duì)大分子藥物設(shè)計(jì)問(wèn)題的預(yù)測(cè)能力,并基于高通量濕實(shí)驗(yàn)平臺(tái),圍繞具體的管線研發(fā)問(wèn)題產(chǎn)生大量的實(shí)驗(yàn)數(shù)據(jù),干濕閉環(huán),幫助模型的迭代優(yōu)化,最終提高抗體工程效率。
干濕實(shí)驗(yàn)室的搭建門檻較高,首先需要有交叉領(lǐng)域的團(tuán)隊(duì),既有能夠做實(shí)驗(yàn)、對(duì)生物信息、對(duì)制藥、對(duì)前沿生物技術(shù)有理解的人才,也要有經(jīng)驗(yàn)豐富的系統(tǒng)工程人才,以及 AI 算法人才。其次需要強(qiáng)大的硬件支持,包括實(shí)驗(yàn)設(shè)備以及計(jì)算資源,以及把這兩種資源整合在一起的能力。最重要的是,要回歸做藥的本質(zhì),以濕實(shí)驗(yàn)數(shù)據(jù)作為補(bǔ)充支撐通過(guò)AI進(jìn)行反復(fù)多輪驗(yàn)證,最終實(shí)現(xiàn)干濕閉環(huán)一體化。
生成式AI的飛速發(fā)展為藥物發(fā)現(xiàn)帶來(lái)了新的驚喜,但距離真正落地還有一段時(shí)間。隨著新化學(xué)方法與新計(jì)算工具的不斷深入結(jié)合,干濕實(shí)驗(yàn)閉環(huán)的模式構(gòu)建或?qū)⒊蔀樗幬镅邪l(fā)的標(biāo)配,引領(lǐng)AI制藥的新范式到來(lái)。
參考資料:
當(dāng)AI給人類造藥吃——財(cái)經(jīng)大健康