Integrasi Analisis Varian pada Algoritma Lebah untuk Seleksi Fitur pada Model Klasifikasi Tingkat Keparahan Penyakit Embun Bulu
Date
2024Author
Rozikin, Chaerur
Buono, Agus
Wahjuni, Sri
Arif, Chusnul
Widodo
Metadata
Show full item recordAbstract
Penyakit pada daun melon dapat diamati melalui gejala yang tampak pada
permukaan daun melon. Penyakit daun pada tanaman melon yaitu downy mildew
(Embun Bulu) memiliki gejala bercak kuning pada area daun melon, Powdery
Mildew memiliki gejala ada bintik putih pada daun melon dan layu fusarium dengan
gejala daun dan batang melon tampak layu. Penyakit daun melon yaitu downy
mildew menyerang bagian daun dengan sangat cepat dan menyebabkan kematian
tanaman jika tidak dilakukan tindakan pencegahan secara dini. Deteksi dan
Klasifikasi tingkat keparahan penyakit downy mildew pada daun melon dapat
dilakukan dengan menggunakan tenaga ahli dan hasil analisis laboratorium. Tenaga
ahli memiliki kekurangan yaitu tidak semua daerah memiliki tenaga ahli tanaman
khususnya penyakit tanaman melon. Hasil analisis lab memiliki kekurangan yaitu
tidak semua petani melon memiliki laboratorium untuk mendeteksi penyakit daun
pada tanaman melon. Permasalahan ini dapat diselesaikan dengan bantuan
teknologi untuk mengenali tingkat keparahan penyakit downy mildew secara dini
melalui pendekatan image processing dan machine learning.
Tujuan umum penelitian ini adalah membuat model klasifikasi tingkat
keparahan penyakit pada daun tanaman melon dengan akurasi tinggi, waktu
komputasi rendah, dan penggunaan memori rendah. Tujuan khusus penelitian ini
adalah Pertama membuat model klasifikasi menggunakan model LGBM, kedua
membuat model perbandingan pembagian dataset untuk mendapatkan nilai akurasi
tertinggi, dan ketiga mengembangkan model seleksi fitur berdasarkan artificial bee
colony optimization dan Analisis varians sebagai fungsi fitnessnya.
Klasifikasi tingkat keparahan penyakit daun downy mildew dibagi kedalam 4
kelas yaitu kelas dauns sehat (DS), downy mildew grade 1 (DM1), downy mildew
grade 2 (DM2), downy mildew grade 3 (DM3). Dalam klasifisikasi tingkat
keparahan penyakit daun downy mildew membutuhkan data gambar daun. Gambar
daun melon tersebut dilakukan praproses dan ekstraksi fitur untuk mendapatkan
dataset penyakit daun downy mildew. Praproses yang dilakukan dalam penelitian
ini yaitu resize dan cropping gambar daun melon. Ekstraksi fitur yang dilakukan
yaitu fitur warna, tepi, entropi dan tekstur. Hasil ekstraksi fitur berupa dataset fitur
gabungan. Fitur gabungan rentan terhadap noise seperti redudansi fitur dan fitur
tidak relevan. Untuk mengatasi masalah tersebut fitur gabungan diseleksi dengan
menggunakan algoritma Artificial Bee Colony (ABC) Optimization untuk
mendapatkan fitur optimal. Pada tahapan ABC terdapat menghitung fungsi fitness
dan peneliti banyak menggunakan model akurasi sebagai fungsi fitness. Fungsi
fitness menggunakan model akurasi memiliki kelemahan yaitu proses pencarian
fitur membutuhkan waktu lama sehingga tidak efisien. Untuk mengatasi masalah
tersebut penelitian ini mengusulkan konsep Artificial Bee Colony (ABC)
Optimization dan Analisis Varian (ANOVA) untuk seleksi fitur yang diberi nama
AVABC. ANOVA digunakan untuk menghitung fungsi fitness pada tahapan
Artificial Bee Colony (ABC) Optimization.
Hasil pengujian dengan menggunakan model klasifikasi LGBM tanpa seleksi
fitur rata-rata akurasi 86,07%, penggunaan CPU 26,20%, penggunaan memori
7,27GB, waktu komputasi 0,44 detik. Hasil pengujian menggunakan seleksi fitur
AVABC akurasi 81,61%, penggunaan CPU 15,70%, penggunaan memori 7,38GB,
waktu komputasi 0,14 detik. Hasil pengujian dengan menggunakan skenario
perbandingan dataset akurasi tertinggi pada skenario 3 dengan pembagian dataset
70% data latih dan 30% data uji. Hasil pengujian performa akurasi model LGBM
85%, random forest 82%, dan XGBoost 86%. Proses pencarian fitur terbaik
menggunakan artificial bee colony optimization dengan fungsi fitness ANOVA
membutuhkan waktu 5 menit 23 detik. Proses pencarian fitur terbaik menggunakan
artificial bee colony optimization dengan fungsi fitness model akurasi seperti
random forest membutuhkan waktu 14 jam 35 menit 19 detik, LGBM
membutuhkan waktu 16 jam 52 menit 04 detik, dan XGBoost membutuhkan waktu
20 jam 08 menit 55 detik.
Berdasarkan hasil pengujian tersebut hasil klasifikasi dengan data hasil
seleksi fitur AVABC memiliki keunggulan dari sisi penggunaan CPU lebih rendah,
waktu komputasi lebih cepat dan dari sisi penggunaan memori tidak jauh berbeda
sementara kekurangan terletak pada hasil akurasi lebih rendah 4% dibandingkan
klasifikasi tanpa menggunakan seleksi fitur. Dari sisi proses pencarian 8 fitur
terbaik algoritma Articial Bee Colony Optimization dengan fungsi fitness ANOVA
memiliki keunggulan dari sisi waktu pencarian fitur terbaik lebih cepat yaitu
membutuhkan waktu 5 menit 23 detik.