Please use this identifier to cite or link to this item: http://repository.ipb.ac.id/handle/123456789/162437
Full metadata record
DC FieldValueLanguage
dc.contributor.advisorAidi, Muhammad Nur-
dc.contributor.advisorOktarina, Sachnaz Desta-
dc.contributor.authorSafrizal, Hanung-
dc.date.accessioned2025-06-11T00:24:59Z-
dc.date.available2025-06-11T00:24:59Z-
dc.date.issued2025-
dc.identifier.urihttp://repository.ipb.ac.id/handle/123456789/162437-
dc.description.abstractAnalisis survival yaitu teknik statistik yang digunakan untuk menganalisis data dengan peubah respon berupa waktu hingga suatu kejadian terjadi (time-toevent), seperti kematian atau diagnosa penyakit. Dalam praktiknya, data lengkap seringkali tidak tersedia karena banyak subjek belum mengalami kejadian sampai akhir pengamatan, sehingga muncul kebutuhan akan metode yang dapat menangani data tersensor, terutama sensor kanan. Metode Cox Proportional Hazard (CPH) merupakan pendekatan semiparametrik yang banyak digunakan dalam analisis survival. Kelebihan utama CPH adalah interpretasi hasil yang jelas melalui hazard ratio serta kemampuannya dalam mengevaluasi efek kovariat secara simultan, meskipun sangat bergantung pada asumsi proportional hazard. Sebagai alternatif, Random Survival Forest (RSF) diperkenalkan sebagai metode non-parametrik berbasis pembelajaran mesin yang lebih fleksibel terhadap struktur data kompleks dan tidak memerlukan asumsi model tertentu. Penerapan analisis survival sangat penting dalam memahami penyakit jantung koroner (PJK), yang merupakan penyebab utama kematian di dunia. WHO memperkirakan bahwa kasus kematian akibat PJK akan meningkat drastis pada tahun 2030. Mengingat sebagian besar faktor risiko PJK dapat dicegah, prediksi onset penyakit ini menjadi krusial dalam upaya pencegahan dan intervensi dini. Oleh karena itu, penelitian ini berfokus pada evaluasi kinerja model CPH dan RSF dalam memprediksi kejadian PJK menggunakan data simulasi dan data aktual dari Studi Kohort Faktor Risiko Penyakit Tidak Menular. Hasil simulasi menunjukkan bahwa CPH memiliki kinerja yang lebih stabil terutama pada prediktor biner dengan tingkat sensor rendah dan ukuran sampel besar. Sebaliknya, RSF memberikan hasil yang lebih baik pada prediktor campuran dan kondisi sensor tinggi. Pada data aktual, model CPH terstratifikasi tanpa interaksi dipilih karena nilai c-index yang tinggi (0,936), interpretasi yang lebih sederhana, dan hasil yang lebih stabil. Peubah-peubah signifikan yang memengaruhi risiko penyakit jantung koroner mencakup gula darah, kolesterol, LDL, tekanan darah, HDL, dan riwayat PJK keluarga. LDL memberikan efek terbesar dengan hazard ratio sebesar 6,591. Risiko PJK bisa meningkat hingga 297,3 kali lipat jika semua peubah berada dalam kondisi berisiko. Temuan ini menunjukkan pentingnya pengelolaan faktor risiko dalam pencegahan PJK, terutama pada kelompok usia lanjut dan perokok yang memiliki baseline hazard tertinggi.-
dc.description.abstractSurvival analysis is a statistical technique used to analyze data where the response variable is the time until an event occurs (time-to-event), such as death or disease diagnosis. In practice, complete data is often unavailable because many subjects have not yet experienced the event by the end of the observation period, resulting in the need for methods that can handle censored data, particularly rightcensored data. The Cox Proportional Hazard (CPH) model is a widely used semiparametric approach in survival analysis. Its main strengths lie in its clear interpretation through hazard ratios and its ability to evaluate the effect of multiple covariates simultaneously, although it strongly relies on the assumption of proportional hazards. As an alternative, the Random Survival Forest (RSF) method, a non-parametric machine learning-based approach, offers greater flexibility in handling complex data structures without requiring strict model assumptions. The application of survival analysis is particularly important in understanding coronary heart disease (CHD), one of the leading causes of death worldwide. The World Health Organization (WHO) estimates that deaths due to CHD will rise significantly by 2030. Since most CHD risk factors are preventable, predicting the onset of this disease is crucial for early intervention and prevention efforts. Therefore, this study focuses on evaluating the performance of the CPH and RSF models in predicting CHD events using both simulated and empirical data from the Cohort Study on Non-Communicable Disease Risk Factors. Simulation results indicate that the CPH model performs more consistently, especially for binary predictors under low censoring levels and large sample sizes. Conversely, RSF yields better results for mixed-type predictors and higher censoring conditions. For the empirical data, the stratified CPH model without interaction was selected due to its high c-index value (0.936), simpler interpretation, and greater stability. Significant predictors of coronary heart disease include blood glucose, total cholesterol, LDL, blood pressure, HDL, and family history of CHD. LDL was the strongest factor, with a hazard ratio of 6.591. The overall CHD risk can increase up to 297.3 times when all predictors are in high-risk states. These findings highlight the importance of managing modifiable risk factors, especially among older adults and smokers, who exhibit the highest baseline hazard levels.-
dc.description.sponsorshipnull-
dc.language.isoid-
dc.publisherIPB Universityid
dc.titleKajian Simulasi Analisis Survival Semi Parametrik dan Nonparametrik pada Studi Kohort Faktor Risiko Penyakit Tidak Menularid
dc.title.alternativeA Study of Semi-Parametric and Non-Parametric Survival Analysis Simulation on Cohort Studies of Risk Factors for Non-communicable Diseases-
dc.typeTesis-
dc.subject.keywordCox Proportional Hazardid
dc.subject.keywordrandom survival forestid
dc.subject.keywordAnalisis survivalid
dc.subject.keywordPenyakit jantung koronerid
dc.subject.keywordResiko Faktorid
Appears in Collections:MT - School of Data Science, Mathematic and Informatics

Files in This Item:
File Description SizeFormat 
cover_M0501241093_30bc2d1fd8ba4e68bccc4c3ba17ef119.pdfCover1.63 MBAdobe PDFView/Open
fulltext_M0501241093_006e063209194e7db095f0abde50e99c.pdf
  Restricted Access
Fulltext2.92 MBAdobe PDFView/Open
lampiran_M0501241093_9c40741eadaa4b039ac57c759c094f93.pdf
  Restricted Access
Lampiran1.67 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.