人工智能挑戰(zhàn)賽模型能夠獨立解讀乳腺鉬靶影像
近日發(fā)表在《Radiology》雜志上的一項研究顯示,由北美放射學(xué)會(RSNA)舉辦的乳腺癌篩查人工智能挑戰(zhàn)賽中提交的算法表現(xiàn)優(yōu)異,顯著提升了乳腺癌篩查的靈敏度,同時保持了較低的誤召回率,為乳腺癌的早期發(fā)現(xiàn)和診斷帶來了新的希望。
該挑戰(zhàn)賽于2023年舉行,吸引了來自全球超過1500支團隊的參與,規(guī)模之大創(chuàng)下了RSNA歷屆人工智能挑戰(zhàn)賽的紀錄。此次比賽旨在尋找能夠提升乳腺X線攝影(乳腺鉬靶)癌癥檢測自動化水平的AI模型,幫助放射科醫(yī)生更高效地完成篩查任務(wù),提升患者護理質(zhì)量與安全性,同時降低醫(yī)療成本和避免不必要的醫(yī)療程序。
來自英國諾丁漢大學(xué)的癌癥篩查教授陳艷(Yan Chen, Ph.D.)帶領(lǐng)的研究團隊對所有參賽算法進行了全面性能評估。訓(xùn)練數(shù)據(jù)集由美國佐治亞州埃默里大學(xué)和澳大利亞維多利亞乳腺篩查中心提供,共計約11,000張乳腺篩查影像,參賽者也可使用其他公開的訓(xùn)練數(shù)據(jù)。評測使用了一套獨立的測試數(shù)據(jù),包括10,830個單側(cè)乳腺檢查影像,這些病例均由病理學(xué)結(jié)果確診為陽性或陰性。
結(jié)果顯示,所有算法的中位特異性高達98.7%,即對無癌病例的正確識別率極高;靈敏度為27.6%,即對陽性癌癥病例的檢出率;誤召回率僅為1.7%。更值得關(guān)注的是,當(dāng)將排名前三和排名前十的算法組合(ensemble)使用時,靈敏度分別提升至60.7%和67.8%,表明不同算法之間在癌癥檢測上具有很強的互補性。
陳教授表示:“不同AI算法在檢測癌癥時關(guān)注的圖像特征存在差異,這種互補性使得組合算法能夠覆蓋更多癌癥類型和表現(xiàn),提高整體的檢測效果?!彼€指出,組合十款表現(xiàn)最好的算法,其檢測性能已經(jīng)接近歐洲或澳大利亞篩查放射科醫(yī)師的平均水平。
然而,算法的表現(xiàn)受多種因素影響,包括癌癥類型、影像設(shè)備廠商及采集影像的臨床場所??傮w而言,算法對侵襲性癌癥的檢測靈敏度高于非侵襲性癌癥。
由于許多參賽AI模型均為開源,陳教授認為此次挑戰(zhàn)賽的成果將促進實驗性和商業(yè)化乳腺癌AI工具的進一步優(yōu)化,助力全球乳腺癌篩查水平的提升。她強調(diào):“通過公開算法及綜合影像數(shù)據(jù)集,參賽者為后續(xù)研究提供了寶貴資源,也為AI安全有效地融入臨床實踐奠定了基石?!?/p>
接下來,研究團隊計劃用更大規(guī)模、更具多樣性的影像數(shù)據(jù)集,對本次挑戰(zhàn)賽表現(xiàn)最優(yōu)的算法與市場上的商業(yè)產(chǎn)品進行對比測試。此外,團隊還將探索基于更小、更具挑戰(zhàn)性的測試集與強人類讀片基準(如英國PERFORMS計劃制定的標(biāo)準)相結(jié)合的評估方法,以驗證其對AI性能評價的有效性。
值得一提的是,RSNA每年都會舉辦AI挑戰(zhàn)賽,2025年賽事的主題將聚焦于腦動脈瘤的檢測與定位,持續(xù)推動醫(yī)學(xué)影像人工智能領(lǐng)域的發(fā)展與應(yīng)用。
參考文獻:Performance of Algorithms Submitted in the 2023 RSNA Screening Mammography Breast Cancer Detection AI Challenge,?Radiology?(2025).
編輯:周敏
排版:李麗


本文系作者 @TIMEDOO 原創(chuàng)發(fā)布在 肽度TIMEDOO。未經(jīng)許可,禁止轉(zhuǎn)載。