文|動脈網
2020年,沈思(化名)帶著團隊與國家藥監(jiān)局開了一場臨時評審會,探討一款創(chuàng)新的包含三個眼底病種的輔助診斷AI。會上一下子來了30個專家,其中有審評方人員告訴沈思:這是他們有史以來見過的最為復雜的產品。
“我們現(xiàn)在獲批的AI都是單病種AI,即一個AI能夠處理一個病種。這樣的AI在臨床試驗時相對比較容易,需要處理的相似病例可能只有一種。但要做多病種AI,臨床試驗的問題就變得復雜起來,不僅需要我們對每一個單病種AI進行驗證,還需要驗證兩個病種的交集部分與兩個病種的都不存在的部分。”沈思解釋道。
“這時,相似病例與排他病例會變得特別多,把近90%的眼科疾病都覆蓋了進去?!?/p>
現(xiàn)有的監(jiān)管程序并不適用于這樣一款復雜的醫(yī)療器械。為了將審評審批進行下去,沈思團隊與藥監(jiān)局一同開始了多病種AI的監(jiān)管流程探索。從無到有,兩撥人花了整整兩年的時間。
2022年9月1日,團隊的眼底病變眼底圖像輔助診斷軟件終于獲得了NMPA頒布的三類證,拿下國內首個多病種AI三類證,在國內AI的注冊準入史中寫上了“里程碑式”的一筆。
唯一的遺憾來源于覆蓋的病種。與最初的計劃相比,此次批下來的三類證僅留下了糖尿病視網膜病變、青光眼兩個病種。
除沈思背后的百度靈醫(yī)智惠外,國內聯(lián)影智能、致遠慧圖、鷹瞳科技也已在多病種AI的審評審批上有所建樹。眾多頭部企業(yè)發(fā)力的多病種AI,能夠改變醫(yī)療人工智能時代嗎?
多病種人工智能的審評審批為何如此困難?
如果無視軟件的安全性與可解釋性,只是制造一個合理的算法對影像進行概率上的判別,足夠數據量的深度學習訓練下,大部分企業(yè)都能給出一個較為不錯的結果。但循證醫(yī)學需要證據,黑盒之下,我們無法得知結果如何產生。
沈思告訴動脈網:“大數據下AI給出的部分概率確實能夠一定程度反映征象與病癥之間潛在的關聯(lián)可能,但這些關聯(lián)僅是統(tǒng)計學上的關聯(lián),算法得出結論的過程本身不可解釋。需要強調的是,AI首先是一個醫(yī)療屬性的產品,也就是說,如果你只是通過算法計算一個概率,這個概率醫(yī)生診療路徑無關,那么這樣的人工智能便難以通過審評審批?!?/p>
前文已經提到,多病種AI的臨床試驗設計是一個復雜的過程。譬如,多病種AI(以N=2為例)在進行數據集構建與算法驗證時,不僅需要構建病種A數據庫與病種B數據庫,還需要構建A∩B數據庫,并需在模型之中添加醫(yī)學知識,使其能基于醫(yī)學原理解釋交集數據的概率得出過程。
當病種數量較少時,構建融合數據庫的難度尚且可控。而在當前審評審批邏輯下,病種數量一旦增多,各病種組合的樣式及需要的數據集豐富程度則迅速上升,整體呈指數趨勢。
對于一個企業(yè)而言,依靠堆砌人力或許能夠拼湊出多病種AI驗證過程中需要的算法,但在構建完整的數據集方面,研發(fā)者將面臨一些難以解決的現(xiàn)實難題。譬如,糖網病變的0期、6期患者數據天然較少,企業(yè)很難在真實世界中找到滿足驗證數據集要求的數據量。若將病種的組合考慮在內,相關數據收集復雜程度將極速擴增,最終變成一個現(xiàn)實之中無法解決的難題。
多病種AI如何突破“多病種”?
盡管多病種AI面臨無法落地的難題,但面對理想之中的AI對于人類特定能力的極致復刻,創(chuàng)造一個媲美放射科醫(yī)生的AI依然是眾多企業(yè)追逐這項技術的最終目的。
從理論上講,多病種AI的實際應用價值、研發(fā)難度與覆蓋病種數量呈指數關系,不同覆蓋量下的算法在各方面均存在天壤之別。只有當N足夠大、覆蓋的大通量疾病足夠多,能夠處理多模態(tài)融合影像時,AI的價值才能向醫(yī)生趨同。
在這條路徑上,如何選擇多病種AI作用的對象,如何確定多病種AI病種的數量,企業(yè)必須做出細致考量。
回顧國內企業(yè)在多病種AI上的突破,目前各大醫(yī)療器械監(jiān)督機構總計批準兩張多病種AI三類證,一張是百度靈醫(yī)智惠新近拿下的眼底多病種AI三類證,包含糖網病變、青光眼兩種可診斷疾病,一張則是聯(lián)影智能于2020年在CE獲得的胸部多病種AI輔助診斷產品,包含肺炎、肺結節(jié)、胸部骨折三個病種。除此之外,致遠慧圖的多病種眼底影像輔助診斷軟件自2020年進入創(chuàng)新醫(yī)療器械通道之后仍處于審評審批中,該模型總計包含了13個種疾病。
鷹瞳科技的眼底多病種尚未披露審評審批消息,但其科研成果也有所披露。2022年7月,首都醫(yī)科大學附屬北京同仁醫(yī)院副院長魏文斌教授團隊與鷹瞳科技、愛康集團在《美國醫(yī)學會雜志》子刊JAMA Network Open雜志(IF=13.4)聯(lián)合發(fā)表題為“Artificial Intelligence for Screening of Multiple Retinal and Optic Nerve Diseases”的研究論文。
研究結果顯示,基于眼底照片訓練的AI算法模型在全國多中心的真實世界驗證中,對10種常見眼底病篩查的敏感度堪比資深眼底科專家,且篩查用時節(jié)省了約75%。該試驗一定程度驗證了視網膜(眼底)影像人工智能多病種診斷算法能力和應用價值。
綜合討論上述4個多病種人工智能。聯(lián)影智能擁有唯一一個服務胸部CT影像的人工智能,而其余三個均是圍繞眼底影像展開,這兩個病種擁有最為豐富的數據,最悠久的發(fā)展歷史,因而在多病種時代的開端走在了最前列。
不過,病種的數據量可以說明人工智能企業(yè)在策劃多病種AI研發(fā)時選擇的發(fā)展方向,但要將其轉化為產品,更具決定性的因素是多病種AI包含病種的數量。
兩個通過了監(jiān)察機構審評審批的多病種AI均有其鮮明特征。胸部多病種AI包含的肺炎、肺結節(jié)、骨折征象各異,人或機器均能輕松通過視覺進行分辨。另一方面,肺炎、肺結節(jié)、骨折各自的單病種AI較為成熟,研發(fā)、臨床試驗難度相對較低。因而該產品在2020年便已獲得CE認證。
百度靈醫(yī)智惠的眼底多病種AI同樣存在區(qū)分較為簡單的征象,且眼底數據獲取成本、難度較低。此外,該多病種AI涉及的病種僅為兩種,臨床試驗復雜度都仍處于可控的范圍。相比之下,鷹瞳科技的“10病種”AI與致遠慧圖的“13病種”AI雖同樣攻堅眼底疾病,但由于其涉及病種數量過多,臨床試驗設計難度極大。
對此,有專家表示:“盡管有多病種AI進入了創(chuàng)新醫(yī)療器械審評審批綠色通道,但要在現(xiàn)行醫(yī)療器械審查制度之下完成審批,基本上不可能實現(xiàn)。因此,要突破臨床試驗這個環(huán)節(jié),企業(yè)必須與器審中心共同探索新的審批路徑,這可能需要很長時間?!?/p>
綜上所述,多病種人工智能仍處于發(fā)展初期,獲證偏向于投身通量較大、單病種AI較為成熟的領域,且均嚴格控制了覆蓋病種的數量,避免承擔在研發(fā)之中產生無效投入的風險。而對于覆蓋病種數量較多的AI,由于缺乏可解釋性,此類AI仍需進行審批路徑上的創(chuàng)新。
研發(fā)多病種AI值得嗎?
多病種AI的研發(fā)過程漫長而艱難,但其價值是否能夠匹配企業(yè)的投入呢?答案目前并不確定。
一種相對簡單的方式是將其與單病種AI進行對比。醫(yī)生閱片時通常會對影像數據顯示的各類征象進行全面分析,而單病種AI只能對影像中的某一類征象進行分析,因而只能在特定場景之下使用,更多的價值在于輔助醫(yī)生降本增效、查漏補缺。
多病種AI的價值需要視N的數量而定。對于N較小、征象差異較大的多病種AI,它的能力與多個單病種AI結合作用時的準確率差異不大,很多產線較為豐富的人工智能同樣將其融合了多個單病種AI產品的平臺稱之外多病種AI。因此,當N較小時,多病種AI較單病種AI的輔助診斷上的優(yōu)勢較為有限。
再看研發(fā)難度,多病種AI要在臨床中發(fā)揮有效作用,既需要對每一個包含的病種進行研究,使其具備等同于多個單病種AI的診斷能力,又需要保證在復雜病癥下,得出包含多個疾病診斷的結果足夠準確且不會相互排斥。因此,多病種AI的研發(fā)以單病種AI能力為基礎,整體研發(fā)難度大于等于多個單病種AI,當N較小時,多病種AI在效益上不具備過多的優(yōu)勢,而當N值足夠大,覆蓋的患者數量足夠多,有能力處理多模態(tài)數據時,多病種AI的價值將與單病種AI迅速拉開差距。
不過,較大N值的理想狀態(tài)其技術難度與審批難度過大。當下,多病種AI帶來的創(chuàng)新絕大多數談不上技術層面的創(chuàng)新,而是商業(yè)模式上的創(chuàng)新,用于壓縮了醫(yī)療機構購置醫(yī)療AI的成本。此時,多病種AI與單病種AI的關系也并非替代關系,而是協(xié)同賦能的關系,用智能化手段打通每一個醫(yī)療場景。
具體而言,目前單病種AI的主要落地場景仍是醫(yī)院,因其價格與功能上的限制,醫(yī)療AI的購置方多為三級醫(yī)院。畢竟,基層醫(yī)療、體檢中心等機構的功能在于“篩防”,單個AI顯然很難完成這一任務,同時購置多個AI又太貴。在這種情況下,多病種AI便可成為單病種AI的補充,給予基層醫(yī)療機構一個價格相對便宜、覆蓋面相對較廣的選項。
當然,由于審查過程中包含了單個病種的診斷能力,多病種AI從理論上講亦可落足于醫(yī)院這一關鍵場景,與單病種AI開啟市場競爭。只是當下缺乏成熟的物價準入,尚無實際數據對這一模式進行支持。
我們距離理想的多病種AI時代還有多遠?
誠然,當前階段的多病種AI仍面臨重重困難,并不具備改變時代的能力。但從長遠的未來看,多病種AI乃至全病種AI將是醫(yī)療AI發(fā)展的必然。
那么在這個階段,醫(yī)療人工智能企業(yè)要發(fā)展多病種AI,可能不應將多病種AI作為研發(fā)的核心。
作為國內首個獲得多病種AI注冊證的企業(yè),聯(lián)影智能在此后的兩年并沒有急著加速多病種AI的研發(fā),而是選擇完善“全?!苯鉀Q方案的打造,讓其AI盡可能覆蓋更多的病種與流程。
對此,聯(lián)影智能某位高管在過去的采訪中表示:“單病種AI與多病種AI都服務于臨床需求,且多病種AI需要單病種AI最為支撐。目前人工智能發(fā)展覆蓋的領域有限,要在未來更多的發(fā)展人工智能,還需要打下更為牢固的地基?!?/p>
至于聯(lián)影智能如何選擇AI研發(fā)路徑這一問題,他用四個成語概括了聯(lián)影智能的選擇原則。當下,企業(yè)現(xiàn)在還是會更多的把重心放在“草里尋針”與“視而不見”上。具體而言,前者指許多疾病在影像學上很不易找見,如鉬靶里小的鈣化點、磁共振中大腦里的轉移瘤,這些應用會熱得最快;后者指當人眼在專注一種病癥時,往往容易忽視另一病癥,如乳腺增強磁共振掃描,需要對時序圖像進行柔性配準,然后對造影劑的變化進行復雜的量化分析。而這些人眼“看不見的東西”正是AI可以大有作為的場景。
“霧里看花”,即有些病癥影像學表現(xiàn)不明顯,譬如病灶由于其他物體的遮擋而若隱若現(xiàn),似有似無;“捕風捉影”,即模仿醫(yī)生根據零星的患者信息,基于影像或者影像之外的各種臨床信息,做出一些睿智的猜測、判斷和決定。這種應用場景要格外小心。對于這兩類場景,雖不是聯(lián)姻智能當前的重心,但也會在審慎考慮的基礎上進行一定程度的探索。
總的來說,多病種AI雖脫離于單病種AI的審評審批程序,但卻極度依賴單病種AI的研發(fā)支持。從上述四個方向之中我們不難看出理想多病種AI乃至全病種AI的形態(tài)——這將是一個能夠綜合多個模態(tài)信息進行決策,能夠同時處理多個診斷路徑的綜合體。
顯然,我們距離理想中的AI仍太過遙遠,但現(xiàn)有的AI仍處于快速發(fā)展中,不斷優(yōu)化當下的醫(yī)療體系。面對未來不必過多擔心,畢竟,當前的成就沒能讓所有人都停滯,總有探索者沿著夢想的路徑不懈努力。