文|動脈網
剛結束的2023世界人工智能大會上,聯影智能CEO周翔在談及大語言模型時,將這一技術及其背后時代的特征歸納為兩個詞,一個是“融合”,一個是“涌現”。
“涌現”一詞的廣泛認知歸功于凱文·凱利那本經典的《失控》,用以描述一個系統中個體間預設的簡單互動行為所造就的無法預知的復雜樣態的現象。如今的大語言模型便是如此,當模型的尺度不斷增加,模型的能力會在一定范圍內維持類線性的走勢(深度學習便是如此),并在突破閾值后實現爆發式增長。
“融合”未來產業的發展路徑,也是是涌現的“增程器”,指借助生態這一模式,跨越軟件與硬件之間的邊界、影像和文本之間的邊界、環節與流程之間的邊界,生成跨場景的多模態數據與多線程能力。這個過程,“融合”可為“涌現”供給多元、巨量的數據。
“融合”與“涌現”貫穿了整個世界人工智能大會,其中的健康高峰論壇同樣試圖探究這兩個詞的背后邏輯。
然后將它應用于未來的醫療領域。
天壤之別,醫療大模型不能套用通用大模型
與通用領域相比,醫療領域的大模型雖有相似之處,但在模型的設計、訓練、應用等環節方面均有天壤之別。
“定位”是醫療大模型與通用大模型最大的相似之處。無論是過去的機器學習、后續的深度學習還是如今的生成式AI及大語言模型,AI的本質都是一種“工具的工具”,以“賦能”為價值實現路徑。AI——至少現階段的AI——不會成為一個醫生,也不會獨立研制一款藥物,否則Google、Microsoft早該撕下科技公司的標簽,成為世界級的制藥公司。
“場景需求”、“訓練數據”、“應用對象”構成了醫療大模型與通用大模型的差異,三個要點將兩類模型遠遠分隔開,開啟了各自的發展路徑。
先談“場景需求”。周翔在演講中對于兩者之間的場景需求差異進行了完整解釋,他認為通用的語言大模型不能完全滿足醫療場景需求原因有三:
首先,醫療行業的專業性與嚴肅性毋庸置疑,醫療場景對問題的容錯率低,這自然對語言大模型提出了更高的要求,即AI需要基于醫療專業語料給出更專業、更精準的醫療建議;其次,目前醫療數據中有超過90%的數據來自于醫學影像,這也意味著一個切實有效的、能作復雜決策的醫療人工智能大模型,需要融合醫學影像、文本,甚至語音或是視頻等多模態信息以賦能各種醫療場景。最后,考慮到現階段醫院實際的部署環境和數據安全性要求,“大模型”不能無限“大”,院內應用的可及性是必須考慮的一環。
其次是“訓練數據”。醫療數據多模態的特性實際上是對整個數據集的稀釋,將海量醫療大數據分散至各個場景中,每個子數據集的數量很難沖破系統發生涌現效應需要的閾值。
已經發布的醫療大模型大都聚焦于文本數據方面,譬如醫聯新近發布的MedGPT,便是鏈接了主訴、復診、購藥等醫患文本溝通的環節,尚未將影像數據接入大模型。
從長期看,大模型在醫療領域充分釋放價值仍需要影像大數據助力。如今的CV、隱私計算等算法相關技術已經到了應用階段,反而是算力分配基礎設施、影像數據數據量兩項要素成了制約模型發展的關鍵所在。因此,算力分配、影像大數據等基礎設施建設及跨醫院數據集的構建仍需推進,這需要數據管理方在觀念上進行改變,并輔以時間的堆砌,實現醫療領域自有的“融合”。
最后是“應用對象”。醫療大模型的服務方絕大多數為B端、G端,是一個極為嚴肅的領域,需要精準的判斷并給出支撐判斷的證據,不能像通用語言模型那樣給出一個模棱兩可的答案,繪制要素堆砌的圖像——這需要醫療大模型在結論精度上進行提升,給出精準的決策及建議。
9個方向,醫療大模型的“涌現”與“融合”
厘清大模型差異的目的是為了確立大模型的發展路徑。對于醫療大模型而言,這些差異的存在意味著它不能復刻通用大模型取得的“涌現”與“融合”,而需走出一條獨特的道路改進模型、探尋價值。
健康高峰論壇上,中國信通院云大所副所長閔棟便對醫療大模型可能的應用方向進行了完整概括,總計9點,或能為這一新興行業的發展給予啟迪。
1、輔助診斷、輔助決策
相對于傳統CDSS而言,大模型的訓練數據來源更為廣泛,自我凈化能力更為高效,因而能為CDSS帶來較大幅度的提升。
輔助診斷方面,醫生在診斷中需要調動大量醫學知識,記憶大量的患者信息,常會出現疲憊的問題。此類大模型的引入可以幫助醫生記錄信息,緩解疲勞。同時,大模型還能通過學習電子病歷、醫學文獻等數據同醫生進行一些語言互動,提升診斷的準確性及效率。兩條作用路徑均能提升醫生診斷質量、診斷效率。
2、治療方案生成
可在急救藥學服務、骨科、細菌感染等領域接受患者后迅速生成治療方案。尤其是在急救場景中,大模型在急救過程中迅速根據患者信息生成治療方案,可以輔助醫生更快做出診斷,為患者謀取更多救治時間。
3、質控
可對結構化的醫療文書進行自動錄入、形式質控、內涵質控。各個醫生書寫習慣不同,精力有限,大模型可快速的生成規范醫療文書模板,該模板具備質控邏輯清晰、內容表達豐富等特征,能夠按照標準準確錄入文書,減輕醫生在書寫、檢查等環節的負擔。
4、患者服務
可通過通俗的語言為患者進行導診、答疑。傳統的患者教育需要醫生投入大量精力進行編寫,并在專業性、易讀性方面這個取得平衡,還會常常在后續溝通中為患者釋疑。大模型可以針對患者母語背景生成相關的患教資料;與患者對話提供患者需要的信息。
5、醫院管理
可生成醫院管理所需的各類表單,為醫院管理者提供輔助管理決策支持,統計包含醫生基礎信息、臨床能力、醫院后勤、醫院財務等各個方面的數據,然后生成匹配醫院現狀的動態管理計劃,對醫療資源進行一個智能高效的配置。以醫療設備管理為例,大模型可以規劃各項醫療設備采購、維護計劃,生成維修相關表單,有效提高管理效率。
6、教科研
研究方面,可在選題立項、研究方案設計、結果分析、成果編寫方面發揮很大作用。需要注意的是,大模型也會出現偽造參考文獻引文、無法甄別科研貢獻,無法對于生成內容負責等等問題,有待后續逐一解決。
教育方面,可協助醫生編寫教案,替代醫生解答部分問題。醫生在履行教學職能時需耗費大量時間編寫教案,回答學生提出的各類高重復度問題,導致有臨床、科研任務的醫生其精力被重復性勞動占用。大模型的引入可以分擔醫生壓力,如輔導第一年資學生的學習,將醫生從醫學教學的任務中解放出來,幫助其專注臨床科研工作。
7、中醫
中醫常面臨其醫療知識難以顯性化、結構化的問題,導致知識傳承相對困難。引入大模型可對中醫相關知識進行數據挖掘,推動相關知識體系的構建,以標準化的形式為患者生成診療方案。
8、藥物研發、銷售
研發方面,大模型可在藥物發現、臨床前研究等環節中的提高靶點發現效率,構建復雜分子;亦可在臨床實驗環節對臨床試驗的設計思路、統計方法的推薦等等方面提供支撐,極大提升藥物研發效率。
銷售方面,可在藥物市場推廣時以自動化、智能化的方式連接目標用戶,降低營銷成本,提升營銷效率。
9、公共衛生
用于輔助流行病學的大數據分析及趨勢判斷。由于傳播方式和傳播路徑具備復雜性、偶然性,疾病發展的不確信性和變化性非常大,超出常規算法的能力范疇。相比之下,大模型可以對流行病學的大數據分析和這個預測進行有效支撐,給出較為精確的判斷。目前國內外擁有大量研究機構和醫院進行相關探索,并已取得了不錯的研究結果。
標準與倫理,制約大模型?保護大模型?
我們無法判斷上述的9個方向哪一個會最先跑出優質的醫療大模型成果,但可以確定的是,要實現大模型的蓬勃發展,必須創造一個包容企業、醫院、高校、研究機構等角色發力的舞臺。這需要需監管機構出臺法案,行業專家出臺標準共識,為大模型盡早創造公平的競爭環境,引導科技朝著向善的方向發展。
健康高峰論壇上,中國信息通信研究院、國家衛生健康委醫療管理服務指導中心、中國信通院上海工創中心、訊飛醫療科技股份有限公司、北京協和醫院、復旦大學智能醫學研究院、華中科技大學同濟醫學院、中國科學技術大學附屬第一醫院、國家骨科與運動康復臨床醫學研究中心、心血管健康聯盟共同參與了 醫療健康行業大模型標準研究啟動儀式,踏出了推動醫療大模型規范發展的第一步。
未來,以中國信通院為首的機構們將加速開展前沿研究;研制符合醫療健康行業應用特色的AI大模型三層技術標準框架(基礎設施層、模型層、應用層);從數據處理、算法模型、服務管理等三個層面,依托實驗室開展醫療AI大模型合規性、安全性、可控性、可靠性評估,促進行業在發展中規范,在規范中發展。
標準研究之外,生成式AI的倫理問題也是今年世界人工智能大會討論的核心。《生成式AI倫理與治理倡議書》、《人工智能醫學影像倫理手冊》相繼發布,一方面要解決當代AI遺留的可信問題、隱私問題、醫療問題;另一方面要為生成式AI做好準備,防止新興技術身處濫用的境地。
對于世界人工智能大會的各類標準制定,現場中專家們的聲音并不統一。有專家認為:醫療行業需謹慎對待新技術的發展,借助層層標準解構技術,在保證可信的前提下實現技術落地,既是對患者的保護,也是對AI技術本身的保護。
也有專家認為:技術和監管不會協同發展,總是螺旋上升。因此,面對新興技術, 應盡力探尋監管行為最為合適的“度”,避免過輕監管導致技術的應用偏離的向善的方向,也避免過度監管抑制了技術的應用與創新。
理性看待醫療大模型
盡管世界人工智能大會的每一個論壇都被大模型、生成式AI所包圍,但仍有一部分企業堅持著自己的思路,按部就班的發展自己的AI應用。
譬如GE醫療便在論壇之上發布了無關于大模型的《2023創想健康新未來報告》,并將愛迪生數字醫療生態全新升級到了2.0;數坤科技董事長毛新生談的是中國AI的創新,要在心血管疾病、肺部疾病等領域做出原創的符合中國人特征的AI產品;91360則專注于數字病理的創新,仍在努力解決乳腺癌等常見癌種的篩查問題。
畢竟,當下醫療大模型“涌現”與“融合”的產物沒有跳出深度學習一代AI的應用范疇,也尚未展示新的商業路徑,解決各類AI長期面臨的高成本低收益問題。它還需要時間積累,既要完成技術的自我涌現,又要深入臨床,與醫療進行深度融合。
在抵達那個關鍵閾值之前,當代醫療AI不能遺棄。