Perbandingan Metode Regresi Logistik Biner dan Random Forest dalam Klasifikasi Status Penyakit Jantung Koroner (Studi Kohort Faktor Risiko Penyakit Tidak Menular)
Date
2024-05Author
Safrizal, Hanung
Aidi, Muhammad Nur
Oktarina, Sachnaz Desta
Letelay, Alfons Maryono
Metadata
Show full item recordAbstract
Penyakit tidak menular (PTM) menjadi tantangan global, hal ini ditunjukkan
dari penyertaanya sebagai target dalam Sustainable Development Goals (SDGs) 2030 yang bertujuan mengurangi sepertiga kematian dini akibat PTM. Indonesia, seperti banyak negara lain, menghadapi beban PTM yang signifikan, termasuk penyakit jantung koroner (PJK) yang merupakan penyebab utama kematian di seluruh dunia. Faktor risiko terkait gaya hidup seperti hipertensi, kebiasaan merokok, dan obesitas berkontribusi terhadap prevalensi PJK. Penelitian kali ini menggunakan metode regresi logistik dan random forest untuk mengidentifikasi faktor-faktor yang mempengaruhi PJK, sehingga mampu menyoroti strategi pencegahan dan membuat model prediksi. Random forest memiliki kinerja yang lebih baik dalam mengidentifikasi kasus negatif, dengan spesifisitas 98,90% dibandingkan dengan regresi logistik biner sebesar 97,53%. Regresi logistik biner unggul dalam nilai akurasi yang sedikit lebih tinggi sebesar 93,90% dibandingkan dengan random forest sebesar 93,41%. Regresi logistik biner juga unggul dalam sensitivitas sebesar 77,84%, melampaui random forest sebesar 69,46%. Kedua model tersebut menempatkan tekanan darah dan kolestrol total sebagai faktor risiko PJK, namun terdapat variasi dalam penekanan pada faktor risiko lainnya. Non-communicable diseases (NCDs) represent a global challenge, with the
Sustainable Development Goals (SDGs) for 2030 aiming to reduce premature NCD related deaths by one-third. Indonesia, like many other countries, faces the significant burden of NCDs, including coronary heart disease (CHD), a leading cause of mortality worldwide. Lifestyle-related risk factors such as hypertension, smoking, and obesity contribute to the prevalence of CHD. This study utilizes binary logistic regression and random forest models to investigate these factors, shedding light on prevention and prediction strategies. Random forest performed better in identifying negative cases, with a specificity of 98,90% compared to binary
logistic regression of 97,53%. Binary logistic regression excels in a slightly higher accuracy value of 93,90% compared to random forest of 93,41%. Binary logistic regression also excels in sensitivity at 77,84%, surpassing random forest at 69,46%. Both models place blood pressure and total cholesterol as risk factors for CHD, but there are variations in the emphasis on other risk factors.