Identifikasi Pemalsuan Kumis Kucing dari Babadotan dan Tekelan Menggunakan Machine Learning
Date
2022Author
Prabowo, Ary
Kusuma, Wisnu Ananta
Annisa, Annisa
Rafi, Mohamad
Metadata
Show full item recordAbstract
Identifikasi pemalsuan terhadap tanaman obat merupakan hal penting dalam kendali mutu. Pemalsuan tanaman obat pada kumis kucing (Orthosiphon Aristatus) dengan tanaman lain yang mirip seperti babadotan dan tekelan sulit untuk diidentifikasi, hal ini disebabkan karena tingkat kemiripan yang tinggi. Metode yang diterapkan pada penelitian sebelumnya menggunakan PCA dan discriminant analysis untuk praproses dan klasifikasi termasuk dalam metode reduksi dimensi. Metode reduksi dimensi memiliki keunggulan yaitu kompresi data, efisiensi waktu komputasi, dan juga menghapus fitur-fitur yang redundant namun memiliki kelemahan seperti akan mengubah representasi aslinya, sulit memahami hubungan antar fitur sehinga tidak informatif. Selain itu, metode reduksi dimensi belum bisa memisahkan dengan jelas, tingkat kemiripan yang tinggi sehingga sulit untuk mengidentifikasi pemalsuan kumis kucing dengan tekelan dan babadotan. Penelitian ini menggunakan pendekatan machine learning untuk mengklasifikasikan absorban campuran kumis kucing dengan babadotan dan tekelan serta hasil validasi silang tergolong rendah yaitu 74% (Fitria et al. 2018). Penelitian ini menggunakan dataset absorban dari penelitian Fitria (2018) yang terdiri atas 29 sampel yaitu 10 sampel kumis kucing, 10 sampel babadotan, dan 9 sampel tekelan. Tahapan selanjutnya dilakukan praproses dan didapatkan variabel dependen yaitu panjang gelombang sebagai fitur sebanyak 1201, sedangkan variabel independen yaitu kelas. Kelas terdiri atas enam kelas yaitu kelas kumis kucing dengan 5%, 25%, 50% babadotan dan kumis kucing dengan 5%, 25%, 50% tekelan. Data yang telah dilakukan praproses selanjutnya diidentifikasi dengan menggunakan metode klasifikasi antara lain Support Vector Machine, k-NN, Naive Bayes, Decision Tree, Random Forest, serta seleksi fitur yaitu PCA dan Recursive Fitur Elimination (RFE). Pembentukan model klasifikasi dengan tiga skenario percobaan yang pertama tanpa menggunakan PCA, dengan PCA, dan Recursive Feature Elimination untuk dilakukan seleksi fitur yang bertujuan mereduksi dimensi data dan optimalisasi kinerja model. Berdasarkan tiga percobaan tersebut didapat dua model yang terbaik yang pertama metode SVM dan PCA tingkat akurasi 79,55% dengan waktu training dataset 4.300 detik, sedangkan hasil tertinggi didapat dengan metode Random Forest dan (RFE) mencapai akurasi 81,82% dengan waktu training 259.000 detik dan jika dibandingkan dengan penelitian sebelumnya mengalami peningkatan sebesar 8%.