| dc.contributor.advisor | Aidi, Muhammad Nur | |
| dc.contributor.advisor | Oktarina, Sachnaz Desta | |
| dc.contributor.author | Safrizal, Hanung | |
| dc.date.accessioned | 2025-06-11T00:24:59Z | |
| dc.date.available | 2025-06-11T00:24:59Z | |
| dc.date.issued | 2025 | |
| dc.identifier.uri | http://repository.ipb.ac.id/handle/123456789/162437 | |
| dc.description.abstract | Analisis survival yaitu teknik statistik yang digunakan untuk menganalisis
data dengan peubah respon berupa waktu hingga suatu kejadian terjadi (time-toevent), seperti kematian atau diagnosa penyakit. Dalam praktiknya, data lengkap
seringkali tidak tersedia karena banyak subjek belum mengalami kejadian sampai
akhir pengamatan, sehingga muncul kebutuhan akan metode yang dapat menangani
data tersensor, terutama sensor kanan.
Metode Cox Proportional Hazard (CPH) merupakan pendekatan semiparametrik yang banyak digunakan dalam analisis survival. Kelebihan utama CPH
adalah interpretasi hasil yang jelas melalui hazard ratio serta kemampuannya dalam
mengevaluasi efek kovariat secara simultan, meskipun sangat bergantung pada
asumsi proportional hazard. Sebagai alternatif, Random Survival Forest (RSF)
diperkenalkan sebagai metode non-parametrik berbasis pembelajaran mesin yang
lebih fleksibel terhadap struktur data kompleks dan tidak memerlukan asumsi
model tertentu.
Penerapan analisis survival sangat penting dalam memahami penyakit
jantung koroner (PJK), yang merupakan penyebab utama kematian di dunia. WHO
memperkirakan bahwa kasus kematian akibat PJK akan meningkat drastis pada
tahun 2030. Mengingat sebagian besar faktor risiko PJK dapat dicegah, prediksi
onset penyakit ini menjadi krusial dalam upaya pencegahan dan intervensi dini.
Oleh karena itu, penelitian ini berfokus pada evaluasi kinerja model CPH dan RSF
dalam memprediksi kejadian PJK menggunakan data simulasi dan data aktual dari
Studi Kohort Faktor Risiko Penyakit Tidak Menular.
Hasil simulasi menunjukkan bahwa CPH memiliki kinerja yang lebih stabil
terutama pada prediktor biner dengan tingkat sensor rendah dan ukuran sampel
besar. Sebaliknya, RSF memberikan hasil yang lebih baik pada prediktor campuran
dan kondisi sensor tinggi. Pada data aktual, model CPH terstratifikasi tanpa
interaksi dipilih karena nilai c-index yang tinggi (0,936), interpretasi yang lebih
sederhana, dan hasil yang lebih stabil.
Peubah-peubah signifikan yang memengaruhi risiko penyakit jantung
koroner mencakup gula darah, kolesterol, LDL, tekanan darah, HDL, dan riwayat
PJK keluarga. LDL memberikan efek terbesar dengan hazard ratio sebesar 6,591.
Risiko PJK bisa meningkat hingga 297,3 kali lipat jika semua peubah berada dalam
kondisi berisiko. Temuan ini menunjukkan pentingnya pengelolaan faktor risiko
dalam pencegahan PJK, terutama pada kelompok usia lanjut dan perokok yang
memiliki baseline hazard tertinggi. | |
| dc.description.abstract | Survival analysis is a statistical technique used to analyze data where the
response variable is the time until an event occurs (time-to-event), such as death or
disease diagnosis. In practice, complete data is often unavailable because many
subjects have not yet experienced the event by the end of the observation period,
resulting in the need for methods that can handle censored data, particularly rightcensored data.
The Cox Proportional Hazard (CPH) model is a widely used semiparametric approach in survival analysis. Its main strengths lie in its clear
interpretation through hazard ratios and its ability to evaluate the effect of multiple
covariates simultaneously, although it strongly relies on the assumption of
proportional hazards. As an alternative, the Random Survival Forest (RSF) method,
a non-parametric machine learning-based approach, offers greater flexibility in
handling complex data structures without requiring strict model assumptions.
The application of survival analysis is particularly important in
understanding coronary heart disease (CHD), one of the leading causes of death
worldwide. The World Health Organization (WHO) estimates that deaths due to
CHD will rise significantly by 2030. Since most CHD risk factors are preventable,
predicting the onset of this disease is crucial for early intervention and prevention
efforts. Therefore, this study focuses on evaluating the performance of the CPH and
RSF models in predicting CHD events using both simulated and empirical data
from the Cohort Study on Non-Communicable Disease Risk Factors.
Simulation results indicate that the CPH model performs more consistently,
especially for binary predictors under low censoring levels and large sample sizes.
Conversely, RSF yields better results for mixed-type predictors and higher
censoring conditions. For the empirical data, the stratified CPH model without
interaction was selected due to its high c-index value (0.936), simpler interpretation,
and greater stability.
Significant predictors of coronary heart disease include blood glucose, total
cholesterol, LDL, blood pressure, HDL, and family history of CHD. LDL was the
strongest factor, with a hazard ratio of 6.591. The overall CHD risk can increase up
to 297.3 times when all predictors are in high-risk states. These findings highlight
the importance of managing modifiable risk factors, especially among older adults
and smokers, who exhibit the highest baseline hazard levels. | |
| dc.description.sponsorship | | |
| dc.language.iso | id | |
| dc.publisher | IPB University | id |
| dc.title | Kajian Simulasi Analisis Survival Semi Parametrik dan Nonparametrik pada Studi Kohort Faktor Risiko Penyakit Tidak Menular | id |
| dc.title.alternative | A Study of Semi-Parametric and Non-Parametric Survival Analysis Simulation on Cohort Studies of Risk Factors for Non-communicable Diseases | |
| dc.type | Tesis | |
| dc.subject.keyword | Cox Proportional Hazard | id |
| dc.subject.keyword | random survival forest | id |
| dc.subject.keyword | Analisis survival | id |
| dc.subject.keyword | Penyakit jantung koroner | id |
| dc.subject.keyword | Resiko Faktor | id |