Please use this identifier to cite or link to this item:
http://repository.ipb.ac.id/handle/123456789/170363Full metadata record
| DC Field | Value | Language |
|---|---|---|
| dc.contributor.advisor | Erfiani | - |
| dc.contributor.advisor | Susetyo, Budi | - |
| dc.contributor.author | Qalbi, Asyifah | - |
| dc.date.accessioned | 2025-08-25T23:21:00Z | - |
| dc.date.available | 2025-08-25T23:21:00Z | - |
| dc.date.issued | 2025 | - |
| dc.identifier.uri | http://repository.ipb.ac.id/handle/123456789/170363 | - |
| dc.description.abstract | Klasifikasi merupakan salah satu topik yang banyak diteliti oleh para peneliti pada bidang machine learning dan data mining. ML terbagi menjadi dua yaitu supervised machine learning and unsupervised machine learning. Beberapa algoritma supervised machine learning yang sering digunakan yaitu Support Vector Machine (SVM), Random Forest (RF) dan Neural Network (NN). Salah satu jenis unsupervised machine learning yang sering digunakan adalah clustering dengan algoritma K-Means. SVM merupakan algoritma pembelajaran yang menganalisis data untuk klasifikasi dan analisis regresi. Penerapan SVM sudah digunakan dalam banyak penelitian dan nilai akurasi SVM tidak selalu memberikan hasil yang baik. SVM memiliki tantangan ketika diterapkan pada data yang tidak seimbang, bervariasi dan dimensi yang tinggi. Di samping itu, tidak terdapat satu metode terbaik untuk semua masalah klasifikasi. Setiap metode memiliki keterbatasan dan kinerjanya bergantung pada karakteristik data serta kemampuan algoritma yang digunakan. Pada saat ini, pendekatan metode hybrid untuk penggunaan alat data mining menjadi semakin populer. Metode hybrid yang sudah diterapkan yaitu SVM-RF, SVM-NN dan K-Means-SVM. Ketiga penelitian tersebut memberikan akurasi yang tinggi. Penelitian ini mengkaji metode hybrid SVM-RF dan SVM-NN dengan K-Means pada data simulasi dan data empiris. Data simulasi digunakan untuk mengkaji kinerja metode hybrid pada berbagai kondisi data seperti proporsi kelas tidak seimbang, korelasi antar prediktor dan distribusi data peubah X4. Kombinasi ketiga kondisi tersebut menghasilkan 12 jenis populasi. Setiap populasi dibangkitkan sebanyak N = 1.000.000. Setiap populasi akan diambil dua jenis jumlah amatan yaitu n = 800 dan n = 4000 sehingga diperoleh 24 skenario analisis data simulasi. Data empiris yang digunakan adalah data kesehatan yang terhimpun dalam Riset Kesehatan Dasar (Riskesdas) 2018. Amatan yang diteliti yaitu dari kelompok ibu hamil sebanyak 3783 yang tersebar di 34 Provinsi di Indonesia. Tujuan dari penelitian ini yaitu (1) melakukan kajian kinerja metode SVM-RF dan SVM-NN menggunakan data simulasi, (2) membandingkan metode klasifikasi SVM-RF dengan SVM-NN pada klasifikasi faktor risiko anemia ibu hamil di Indonesia dan (3) memperoleh peubah yang menjadi faktor risiko anemia ibu hamil di Indonesia. Pada kajian data simulasi menunjukkan kinerja model hybrid SVM-RF dan hybrid SVM-NN cukup baik dalam melakukan klasifikasi dibandingkan dengan model SVM saja. Penggunaan n = 4000 menghasilkan nilai median balanced accuracy sedikit lebih tinggi pada sebagian besar populasi dibandingkan dengan n = 800. Beberapa kondisi yang digunakan dalam pembangkitan data menunjukkan bahwa dengan penanganan data tidak seimbang menggunakan SMOTE model mampu belajar dengan cukup baik pada kedua kelas. Korelasi yang tinggi dapat menurunkan kinerja model dan tidak terdapat perbedaan kinerja model baik pada data berdistribusi normal maupun tidak normal (skew kanan). Model SVM-RF menunjukkan kinerja yang lebih baik dibandingkan dengan SVM-NN baik pada kajian data simulasi maupun pada kajian data empiris. Pada kajian data empiris, hasil evaluasi model SVM menunjukkan kinerja model SVM belum cukup baik dalam melakukan klasifikasi faktor risiko anemia pada ibu hamil. Data yang diprediksi benar hanya berkisar 64% dan kemampuan dalam mengenali kelas positif (kelas anemia) hanya berkisar 47%. Nilai balanced accuracy sebesar 0,569 menunjukkan kemampuan rata-rata model dalam mengklasifikasikan kedua kelas masih cukup rendah. Penggunaan metode hybrid SVM-RF dan SVM-NN menunjukkan kedua model ini dapat meningkatkan kinerja model SVM. 98% data bisa diprediksi dengan benar oleh kedua metode. SVM-RF menunjukkan metrik evaluasi yang sedikit lebih tinggi dibandingkan dengan SVM-NN. Nilai sensitivity SVM-RF menunjukkan kemampuan memprediksi kelas positif atau pada penelitian ini sebagai kelas minoritas lebih tinggi 3% dibandingkan dengan SVM-NN. Nilai balanced accuracy SVM-RF sebesar 0,989 atau 98,9% menunjukkan bahwa kemampuan rata-rata model dalam memprediksi kelas anemia dan tidak anemia sangat baik. Hasil keempat metrik evaluasinya yaitu accuracy sebesar 0,989; sensitivity sebesar 0,988; specificity sebesar 0,989 dan balanced accuracy sebesar 0,989. Pada analisis kontribusi peubah menggunakan SHAP Global, peubah yang memberikan kontribusi yang paling besar ke kontribusi paling kecil terhadap prediksi anemia pada ibu hamil berturut-turut adalah Usia, Tablet Fe, Status Bekerja, Pendidikan, Status Gizi dan ANC. | - |
| dc.description.sponsorship | Beasiswa Indonesia Bangkit (BIB) | - |
| dc.language.iso | id | - |
| dc.publisher | IPB University | id |
| dc.title | Perbandingan Kinerja Model Hybrid Classification SVM-RF dengan SVM-NN Terhadap Faktor Risiko Anemia Ibu Hamil di Indonesia | id |
| dc.title.alternative | null | - |
| dc.type | Tesis | - |
| dc.subject.keyword | Klasifikasi | id |
| dc.subject.keyword | Anemia | id |
| dc.subject.keyword | Hybrid | id |
| dc.subject.keyword | SVM-RF | id |
| dc.subject.keyword | SVM-NN | id |
| Appears in Collections: | MT - School of Data Science, Mathematic and Informatics | |
Files in This Item:
| File | Description | Size | Format | |
|---|---|---|---|---|
| cover_G1501231006_c92c1ddb310a4921a6d58d6417c0297c.pdf | Cover | 2.58 MB | Adobe PDF | View/Open |
| fulltext_G1501231006_58f9afb40ff6461d9ebd6da56969dd9d.pdf Restricted Access | Fulltext | 9.81 MB | Adobe PDF | View/Open |
| lampiran_G1501231006_a044c595c20c4a01b65f4ad6187f979f.pdf Restricted Access | Lampiran | 857.84 kB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.