Simulation study for the machine learning models and evaluation measures in survival data

Hyunjin Song, Jae Hee Jung,Seungbong Han

Journal of the Korean Data & Information Science Society（2023）

引用 0|浏览0

暂无评分

摘要

생존 예측 모형에서 더 나은 예측은 질병의 재발, 사망과 같은 관심 사건의 정확한 예측을 통해 경제적 낭비와 환자의 고통을 감소시킬 수 있고 궁극적으로 환자의 생존 가능성을 증가시킬 수 있다. 콕스 비례위험모형이 많이 사용되지만 실제 자료에서 비례위험 가정을 따르지 않는 경우도 존재한다. 따라서 본 논문에서는 유연하게 사용 가능하고 예측 모형의 정확성이 뛰어난 기계학습모형인 콕스비례위험 심층 신경망 (DeepSurv), 랜덤 생존 포레스트 (RSF), 생존 그래디언트 부스팅 의사결정 나무 (SurvXGBoost) 모형을 비교하여 높은 예측력을 가지는 모형을 찾고자 한다. 모의실험을 통해 다양한 생존 자료에서 생존 예측 모형에 대해 기존에 제안된 성능 평가 방법을 비교하여 예측 성능을 평가하고 향후 예측 모형 개발의 베이스 모형으로 활용하고자 한다. 모의실험 결과 기계학습모형 중 DeepSurv 모형의 예측 성능이 가장 우수하게 나타났다. 비례위험 가정이 어느 정도 만족하지 않더라도 DeepSurv 모형을 적합해 볼 것을 제안한다. 생존 예측 모형의 성능 평가 방법으로는 위험률의 변화와 중도절단율에 따라 성능 평가력이 일정하지 않게 나타나 특정 방법을 제안하기는 어렵다고 판단된다. 추가적으로 로테르담 유방암 환자의 자료분석을 토대로 모형 성능에 대한 평가 결과를 비교하였다.

查看译文

关键词

machine learning models,simulation study,survival,machine learning

AI 理解论文

溯源树

样例

生成溯源树，研究论文发展脉络

Chat Paper

正在生成论文摘要