Please use this identifier to cite or link to this item: http://repository.ipb.ac.id/handle/123456789/134442
Title: Kajian Metode Ensemble dengan Pendekatan Riam (Cascade) pada Kelas Tak Seimbang untuk Pendeteksian Faktor Risiko Stroke
Authors: Indahwati, Indahwati
Afendi, Farit Mochamad
Nurmawati, Widya Putri
Issue Date: Jan-2024
Publisher: IPB University
Abstract: Prevalensi penyakit stroke di Indonesia terus mengalami peningkatan. Salah satu survei di Indonesia yang memuat informasi mengenai kondisi kesehatan masyarakat Indonesia adalah Indonesian Family Life Survey (IFLS). Data responden dengan penyakit stroke pada IFLS5 menunjukan data yang tidak seimbang, dengan imbalance ratio sebesar 99:1. Tingkat ketidakseimbangan ini termasuk ekstrem maka penelitian ini bertujuan mengatasi masalah tersebut dengan metode SMOTE, SMOTE-Tomek Link, dan SMOTE-ENN, kemudian dataset yang sudah seimbang diklasifikasi menggunakan kombinasi metode ensemble dengan pendekatan metode riam, serta mengidentifikasi peubah penting untuk meningkatkan pendeteksian risiko stroke. Hasil penelitian menunjukkan setelah data latih diseimbangkan responden stroke masih sulit diklasifikasikan, hal tersebut dapat terjadi karena jumlah data sebelum dan sesudah penyeimbangan cukup banyak sehingga membuat plot kelas mayor dan minor saling tumpang tindih. Sehingga solusi untuk menangani hal ini yaitu dilakukan penanganan ketidakseimbangan pada data latih menggunakan SMOTE dengan berbagai persentase yang berbeda yaitu 100%, 75%, 50%, 25%, dan 5%. Persentase terbaik ketika metode ensemble diterapkan pada 5% dari data latih yang diseimbangkan dengan metode SMOTE-ENN. Sehingga model yang dibangun hanya mengambil 5% dari data latih untuk mengklasifikasi responden stroke dan tidak stroke pada data uji. Hasil kinerja metode ensemble dengan metode riam meningkatkan nilai sensitivitas dan balanced accuracy. Hal ini berarti metode riam cukup efektif dalam mengklasifikasikan responden yang stroke. Random forest dan regresi logistik merupakan kombinasi model yang menghasilkan performa terbaik, dengan pohon klasifikasi sebagai model akhir. Peubah penting yang diperoleh dari kombinasi ini adalah penambahan peluang dari regresi logistik, random forest, riwayat penyakit hipertensi, usia, dan aktivitas fisik.
URI: http://repository.ipb.ac.id/handle/123456789/134442
Appears in Collections:MT - Mathematics and Natural Science

Files in This Item:
File Description SizeFormat 
Full teks.pdf
  Restricted Access
Full Text1.27 MBAdobe PDFView/Open
BAB I PENDAHULUAN.pdf
  Restricted Access
Bab I Pendahuluan245.09 kBAdobe PDFView/Open
BAB II TINJAUAN PUSTAKA.pdf
  Restricted Access
Bab II Tinjauan Pustaka454.72 kBAdobe PDFView/Open
BAB III METODE.pdf
  Restricted Access
Bab III Metode Penelitian282.28 kBAdobe PDFView/Open
BAB IV HASIL DAN PEMBAHASAN.pdf
  Restricted Access
Bab IV Hasil dan Pembahasan669.47 kBAdobe PDFView/Open
BAB V SIMPULAN DAN SARAN.pdf
  Restricted Access
Bab V Simpulan dan Saran171.77 kBAdobe PDFView/Open
Abstrak.pdf
  Restricted Access
Abstrak95.79 kBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.