從“可用”邁向“可靠” 逐步解決“幻覺”難題
“醫(yī)療大模型應用空間廣泛,其落地方向包括:做醫(yī)生的成長工具,通過醫(yī)療大模型的使用降低醫(yī)生的培訓成本;做患者的管理工具,借助醫(yī)療大模型打造直接面向消費者的AI健康智能體;釋放醫(yī)生時間和精力,讓醫(yī)生更多參與到審核環(huán)節(jié),而非全流程操作。”京東健康探索研究院首席科學家王國鑫說。
醫(yī)療大模型的“可用”與“幻覺”問題的逐步解決密切相關。在技術層面,傳統(tǒng)AI大模型由于數據噪聲和知識盲區(qū)容易產生“幻覺”,一旦模型在生成內容時出現偏差,醫(yī)療場景中的錯誤推斷將導致嚴重后果。
對此,技術人員正在通過多種方式消除大模型“幻覺”:一是設立“安全圍欄”,限制模型處理超出能力范圍的問題;二是廣泛使用外部工具,以實時內容為核心,補充人工智能對當前情境的理解;三是從模型底層能力入手,例如在推理過程中不斷自我驗證,從不同的角度交叉驗證自己的結論。
“前兩種方式是抑制幻覺,后一種是實現推理過程白盒化,即便有錯誤也可以被人識別。”王國鑫向記者介紹,目前,這三種方式相互配合,可在一定程度上抑制“幻覺”問題。
以國家兒童醫(yī)學中心、復旦大學附屬兒科醫(yī)院推出的全新升級版DS-小布醫(yī)生2.0系統(tǒng)為例,復旦大學附屬兒科醫(yī)院副院長張曉波介紹,在抑制大模型“幻覺”方面,依托自建的“兒科增強檢索知識庫”,能夠精準匹配權威醫(yī)學知識,提升診療推理能力。
如何進一步提高醫(yī)療大模型在復雜臨床環(huán)境中的安全性和可信度?北京大學信息科學技術學院研究員楊仝建議,可從模型內外組合防御。
“通過對抗訓練提高模型魯棒性、利用數據預處理削弱對抗攻擊效果、引入公平性約束減少算法偏差等方式,提升模型自身安全性。同時,在模型與用戶間部署獨立的安全互聯系統(tǒng),實時檢測并攔截異常輸入數據,過濾敏感或惡意請求,并對模型輸出進行審核和糾錯。”楊仝說。
DeepSeek助力 高質量數據成關鍵支撐
降低技術門檻、優(yōu)化模型部署效率……作為國產開源大模型,DeepSeek為醫(yī)療大模型落地提供了重要突破口:醫(yī)院可采用“大模型基座+小樣本微調+專業(yè)知識融合”的方式,直接基于DeepSeek進行微調。
“這并非傳統(tǒng)意義上從零訓練,而是僅需較小數據和計算資源就能快速開發(fā)適用于自身場景的AI應用。”張曉波介紹。但她也認識到,想要訓練出高質量醫(yī)療大模型,仍需綜合運用大規(guī)模高質量數據資源。
為提高對復雜病例的精準識別和推理能力,DS-小布醫(yī)生2.0系統(tǒng)依托醫(yī)院大數據管控平臺,整合電子病歷、實驗室檢查、醫(yī)學影像、基因組學數據、可穿戴設備監(jiān)測等多模態(tài)數據,實現標準化存儲、統(tǒng)一管理與高效調用。通過數據治理技術,如數據清洗、語義解析和智能標注等,確保數據的準確性、時效性和一致性,并結合專家審校,精準提取臨床關鍵信息。
作為同樣致力于將AI技術應用于三甲醫(yī)院的科技企業(yè),麒麟合盛網絡技術股份有限公司董事長兼首席執(zhí)行官李濤表示,DeepSeek是通用模型,要使其具備醫(yī)療能力,必須利用大量專業(yè)知識進行增量訓練,特別是結合醫(yī)院自身病例、知識庫,如特定醫(yī)院的罕見病病例數據、特定地區(qū)的特殊病例數據等,進一步優(yōu)化與微調模型,使其能夠更好地適應特定場景需求。
受訪業(yè)內人士表示,醫(yī)療大模型最需要的真實醫(yī)療數據是臨床專家的應用數據以及臨床醫(yī)生的培訓數據,這部分數據往往是以多模態(tài)的形式存放在不同的醫(yī)療機構。
“先進的數據蒸餾技術能大幅提升模型表現。”楊仝建議,統(tǒng)一數據格式,提高數據互操作性,并請醫(yī)學專家深度參與數據蒸餾過程。
“專家團隊要準確記錄患者的癥狀、體征、診斷過程、治療方案以及治療效果等信息,并對其中的關鍵信息進行標注和解讀,通過人機協(xié)同優(yōu)化模型診斷能力。”李濤表示,可通過開展醫(yī)學研究項目,邀請專家共同參與,收集更多有價值的醫(yī)療數據。
完善治理體系 筑牢安全與倫理防線
在將大模型應用于醫(yī)療的過程中,倫理風險始終受到業(yè)界重點關注。中國工程院院士、清華大學臨床醫(yī)學院(北京清華長庚醫(yī)院)院長董家鴻分析,大模型本質上是一種統(tǒng)計模型,難免會產生事實錯誤、邏輯錯誤等,模型的“黑箱”特性使醫(yī)療決策邏輯難以被理解,增加了倫理審查的難度。
受訪業(yè)內人士表示,醫(yī)療大模型倫理風險治理的復雜性源于其需要同時考慮醫(yī)學倫理與科技倫理兩個維度,所處視角不同,且均涉及復雜而廣泛的問題,并存在彼此交叉,亟待“多維”規(guī)范。
第一,在醫(yī)療等需要透明度的領域,大模型需提高解釋性,幫助用戶理解決策過程和建立信任,并通過使用多樣化的數據集和開發(fā)新算法,確保模型在不同人群中的公平表現,消除潛在的偏見與歧視。
楊仝表示,最新的大模型具備強大的思維鏈能力,可將診斷推理過程逐步細化并清晰呈現。借助這一能力,可要求模型輸出詳細且結構化的推理步驟,解釋每個診斷或建議背后的邏輯依據。同時,基于細化后的思維鏈,模型可與醫(yī)生、患者展開多輪互動式溝通,進一步解釋診斷邏輯與決策理由。
第二,應構建貫穿技術全生命周期的倫理治理閉環(huán),以“科技向善”為原則打造智慧醫(yī)療新范式。
“在搭建DS-小布醫(yī)生2.0系統(tǒng)中,我們將倫理治理深度嵌入技術創(chuàng)新鏈條的實踐范式,構建了醫(yī)療AI臨床應用的知信行量表,通過對332名醫(yī)務工作者的抽樣調研,系統(tǒng)梳理倫理治理議題。在實際運行中構建接受度和滿意度的雙向反饋通道,使系統(tǒng)迭代與患者信任間形成正向循環(huán)。”張曉波說。
第三,醫(yī)療數據大多涉及患者隱私,大模型未來的發(fā)展趨勢必將強化數據隱私保護措施。
“應提升醫(yī)療人員對數據合規(guī)性和隱私保護的意識,確保在AI應用過程中遵循倫理標準。”董家鴻建議,利用數據加密、匿名處理和差分隱私技術,防止未授權訪問和數據泄露,并采用區(qū)塊鏈、隱私計算等新興技術,增強數據治理的透明性和可追溯性。
上一篇:可食用機器人開啟舌尖上的新科技
下一篇:最后一頁
凡本網注明“XXX(非汪清新聞網)提供”的作品,均轉載自其它媒體,轉載目的在于傳遞更多信息,并不代表本網贊同其觀點和其真實性負責。
1、成都作詞:趙雷作曲:趙雷編曲:趙雷,喜子演唱:趙雷讓我掉下眼淚的
2023-09-09 15:28
永琰小楷書《御制詠文房四事詩》,清宮舊藏。此卷永琰書《文房四事
2023-09-09 13:15
點擊藍字關注我們2023年9月9日至10日高校迎新期間,新鄉(xiāng)東站北側P1停車
2023-09-09 11:25
邁凱輪GT的4 0升雙渦輪V8發(fā)動機確實非常特別。憑借612bhp的功率和465lb
2023-09-09 10:00
領克08,終于上市了。不出所料,領克延續(xù)了「預售價即煙霧彈」的車圈定
2023-09-09 08:21
9月8日,在財政部指導下,中國資產評估協(xié)會印發(fā)《數據資產評估指導意見
2023-09-09 06:00
同花順(300033)金融研究中心9月8日訊,有投資者向威爾高提問,您好董
2023-09-08 23:59
9月8日,貴州省第十屆慈善項目推介會在六盤水舉行。推介會以“新思想引
2023-09-08 21:38
證券時報e公司訊,電科數字(600850)9月8日晚間發(fā)布異動公告,2022年公
2023-09-08 20:34
@氣象北京消息,北京市氣象臺發(fā)布8日4時至19時降水量(毫米):全市平
2023-09-08 20:02