Identifikasi Malware APK Android Berdasarkan Estraksi Fitur Lokal dan Global dengan Meta Classifier
Date
2024Author
Herawan, Yoga
Sitanggang, Imas Sukaesih
Neyman, Shelvie Nidya
Metadata
Show full item recordAbstract
Android merupakan sistem operasi perangkat cerdas yang paling banyak
digunakan saat ini. Tingginya popularitas Android menjadikannya sebagai platform
yang paling rentan terhadap persebaran malware. Untuk meningkatkan keamanan
perangkat, teknik analisis statis dan dinamis dapat digunakan. Pembuatan malware
saat ini menjadi semakin canggih yang didukung oleh perkembangan framework.
yang ada. Beberapa teknik pembuatan malware dapat dikerjakan diantaranya
adalah teknik pengemasan code program, pengaburan code program, dan teknik
enkripsi untuk menghindari model pada sistem deteksi. Kemudahan dalam
melakukan kustomisasi code program dan kompleksitas struktur komponen dalam
satu berkas APK menjadikan teknik deteksi tradisional tidak lagi dapat diandalkan
untuk mendeteksi malware yang baru disebar. Berbagai penelitian telah dikerjakan
menggunakan metode kecerdasan buatan yang diklaim mampu mendeteksi
malware secara cepat dan fleksibel dengan tingkat akurasi yang tinggi.
Penelitian ini bertujuan untuk melakukan perbandingan deteksi malware
Android menggunakan kombinasi meta-classifier yang menggabungkan base classifier LightGBM, Support Vector Machine dan Random Forest. Selain
menggabungkan base-classifer, penelitian ini juga melihat pengaruh fitur lokal dan
global serta gabungannya terhadap performa dari model yang dihasilkan. Data yang
digunakan adalah dataset malware APK Android utuh yang diunduh pada website
Canadian Institute for Cybersecurity. Dataset malware APK Android dilakukan
proses deteksi malware menggunakan pendekatan Machine Learning pada data
yang sudah divisualkan. Teknik ini dapat digunakan untuk mendeteksi malware
tanpa perlu melakukan analisis mendalam. Tahapan dari teknik ini adalah merubah
berkas classes.dex yang berada dalam berkas APK menjadi citra grayscale yang
kemudian fiturnya diekstraksi menggunakan algoritma ekstraksi fitur global
maupun lokal. Fitur citra tersebut kemudian diproses menggunakan meta-classifier
untuk mengklasifikasikan model deteksi malware. Penelitian ini berhasil
melakukan praproses data, transformasi citra, ekstraksi fitur lokal dan global dan
pembentukan model prediksi malware. Hasil uji keseluruhan dari model ini
memuaskan. Nilai Akurasi dan F1 Score mendapatkan nilai terbaik pada 97% yaitu
pada model deteksi yang merupakan model gabungan antar classifier yang bekerja
pada gabungan ekstraksi fitur global dan lokal. Model prediksi meta-classifier yang
dihasilkan sangat penting untuk melakukan deteksi malware dengan cepat dan
akurat sebagai upaya pencegahan dari kejahatan siber yang merugikan masyarakat
luas. Android is the most widely used operating system for smart devices today.
The high popularity of Android makes it the most vulnerable platform to the spread
of malware. Static and dynamic analysis techniques can be used to improve device
security. Malware creation is becoming more sophisticated, supporting the
development of existing frameworks. Several malware creation techniques can be
worked on, including program code packaging techniques, program code
obfuscation, and encryption techniques to avoid models in the detection system.
The ease of customizing program code and the complexity of the component
structure in one APK file make traditional detection techniques no longer reliable
for detecting newly distributed malware. Various studies have been done using
artificial intelligence methods that are claimed to be able to detect malware quickly
and flexibly with a high level of accuracy.
This research aims to compare Android malware detection using a
combination of meta-classifiers that combine the LightGBM base-classifier,
Support Vector Machine, and Random Forest. In addition to combining base
classifiers, this research also looks at the effect of local and global features and their
combination on the performance of the resulting model. The entire Android APK
malware dataset was downloaded from the Canadian Institute for Cybersecurity
website. The Android APK malware dataset is carried out in the malware detection
process using the Machine Learning approach on data that has been visualized. This
technique can be used to detect malware without the need for in-depth analysis. The
stage of this technique is to convert the classes.dex file in the APK file into a
grayscale image whose features are then extracted using global and local feature
extraction algorithms. The image features are then processed using a meta-classifier
to classify the malware detection model. This research successfully performs data
preprocessing, image transformation, local and global feature extraction, and the
formation of malware prediction models. The overall test results of this model are
satisfactory. Accuracy and F1-Score values get the best value at 97%, namely in the
detection model, a combined model between classifiers that works on a
combination of global and local feature extraction. The resulting meta-classifier
prediction model is critical to perform malware detection quickly and accurately in
an effort to prevent cybercrime that harms the wider community.