Please use this identifier to cite or link to this item:
http://repository.ipb.ac.id/handle/123456789/134442
Title: | Kajian Metode Ensemble dengan Pendekatan Riam (Cascade) pada Kelas Tak Seimbang untuk Pendeteksian Faktor Risiko Stroke |
Authors: | Indahwati, Indahwati Afendi, Farit Mochamad Nurmawati, Widya Putri |
Issue Date: | Jan-2024 |
Publisher: | IPB University |
Abstract: | Prevalensi penyakit stroke di Indonesia terus mengalami peningkatan. Salah satu survei di Indonesia yang memuat informasi mengenai kondisi kesehatan masyarakat Indonesia adalah Indonesian Family Life Survey (IFLS). Data responden dengan penyakit stroke pada IFLS5 menunjukan data yang tidak seimbang, dengan imbalance ratio sebesar 99:1. Tingkat ketidakseimbangan ini termasuk ekstrem maka penelitian ini bertujuan mengatasi masalah tersebut dengan metode SMOTE, SMOTE-Tomek Link, dan SMOTE-ENN, kemudian dataset yang sudah seimbang diklasifikasi menggunakan kombinasi metode ensemble dengan pendekatan metode riam, serta mengidentifikasi peubah penting untuk meningkatkan pendeteksian risiko stroke. Hasil penelitian menunjukkan setelah data latih diseimbangkan responden stroke masih sulit diklasifikasikan, hal tersebut dapat terjadi karena jumlah data sebelum dan sesudah penyeimbangan cukup banyak sehingga membuat plot kelas mayor dan minor saling tumpang tindih. Sehingga solusi untuk menangani hal ini yaitu dilakukan penanganan ketidakseimbangan pada data latih menggunakan SMOTE dengan berbagai persentase yang berbeda yaitu 100%, 75%, 50%, 25%, dan 5%. Persentase terbaik ketika metode ensemble diterapkan pada 5% dari data latih yang diseimbangkan dengan metode SMOTE-ENN. Sehingga model yang dibangun hanya mengambil 5% dari data latih untuk mengklasifikasi responden stroke dan tidak stroke pada data uji. Hasil kinerja metode ensemble dengan metode riam meningkatkan nilai sensitivitas dan balanced accuracy. Hal ini berarti metode riam cukup efektif dalam mengklasifikasikan responden yang stroke. Random forest dan regresi logistik merupakan kombinasi model yang menghasilkan performa terbaik, dengan pohon klasifikasi sebagai model akhir. Peubah penting yang diperoleh dari kombinasi ini adalah penambahan peluang dari regresi logistik, random forest, riwayat penyakit hipertensi, usia, dan aktivitas fisik. |
URI: | http://repository.ipb.ac.id/handle/123456789/134442 |
Appears in Collections: | MT - Mathematics and Natural Science |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
Full teks.pdf Restricted Access | Full Text | 1.27 MB | Adobe PDF | View/Open |
BAB I PENDAHULUAN.pdf Restricted Access | Bab I Pendahuluan | 245.09 kB | Adobe PDF | View/Open |
BAB II TINJAUAN PUSTAKA.pdf Restricted Access | Bab II Tinjauan Pustaka | 454.72 kB | Adobe PDF | View/Open |
BAB III METODE.pdf Restricted Access | Bab III Metode Penelitian | 282.28 kB | Adobe PDF | View/Open |
BAB IV HASIL DAN PEMBAHASAN.pdf Restricted Access | Bab IV Hasil dan Pembahasan | 669.47 kB | Adobe PDF | View/Open |
BAB V SIMPULAN DAN SARAN.pdf Restricted Access | Bab V Simpulan dan Saran | 171.77 kB | Adobe PDF | View/Open |
Abstrak.pdf Restricted Access | Abstrak | 95.79 kB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.