方玉安 Yu-Ann, Fang

【屆數】第一屆

【研究興趣】醫療大數據資料庫

【喜歡的食物】泰式料理

【現職】雙和醫院心臟內科研究助理

【聯絡方式】runawayyu@hotmail.com

【想說的話】Life is short, play more and happy more

論文

預測第四期轉移性攝護腺癌病患去勢治療後發生MCRPC之風險

【摘要】

背景

對於初診斷的轉移性攝護腺癌病患來說,預後差異極大,有些病患接受副作用小的賀爾蒙治療即有相當長的存活時間,但有些預後差的病患若能及早預測其為高風險族群,給予更積極之化療,對其預後將更有幫助。

材料與方法

本研究利用長庚醫院臨床研究資料庫中2000至2016年攝護腺癌病患的資料,分析其中初診斷為轉移性攝護腺癌病患且有作過去勢治療共799人,並利用17種機器學習方法來開發預測病人去勢後一年內快速進展至mCRPC的機率,找出高危險病患族群,最後並從最佳的分類器中利用遞歸特徵消除(Recursive Feature Elimination)算法找出預測病人為高危險病患族群的最佳特徵。

結果

初診斷的轉移性攝護腺癌病患若於一年內進展至mCRPC,其存活中位數為21.9個月,統計顯著差於一年內沒進展至mCRPC,其存活中位數為80.7個月(adjusted hazard ratio[aHR]: 6.43,P<0.001),在所有模型中,XGBoost分類模型的綜合表現最好(AUC=0.7000,Accuracy=0.7143),而模型中刪掉有>=50%資料是missing data的特徵,預測也較把所有特徵放入模型好(AUC=0.7042,Accuracy=0.7239),而經過遞歸特徵消除(Recursive Feature Elimination)算法找出的11個特徵也在預測上表現最好(AUC=0.7131,Accuracy=0.7267)。

結論

經過遞歸特徵消除(Recursive Feature Elimination)算法消除冗餘的特徵,不只預測力較好,在模型建立的時間上也縮短不少的時間,未來我們可以利用XGBoost分類模型來當作臨床上預測攝護腺癌高危險病患族群的工具,並當作臨床決策的指標。

關鍵字:機器學習、轉移性攝護腺癌病人、預測模型、特徵選擇、XGBoost

研究著作