| dc.description.abstract | Data iklim memiliki peran penting dalam berbagai bidang kehidupan.
Namun, sering kali ditemukan data hilang yang dapat mengganggu proses
pengolahan data dan menurunkan kualitas analisis. Oleh karena itu, diperlukan
metode penanganan yang tepat agar hasil analisis tetap valid. Penelitian ini
bertujuan membandingkan performa beberapa metode imputasi untuk data
hilang multivariat berdasarkan identifikasi pola hilang data aktual, serta
menentukan metode yang paling sesuai dengan mekanisme data hilangnya.
Metode yang digunakan meliputi mean per bulan, missRanger, k-Nearest
Neighbor (k-NN), dan Iterative Robust-Model Imputation (IRMI). Informasi
data hilang diperoleh dari Data Global Surface Summary of the Day (GSOD),
dengan proporsi data hilang sebesar 11,4%, lalu pola data hilang tersebut
diterapkan pada Data NasaPower yang relatif lengkap untuk evaluasi hasil
imputasi. Hasil penelitian menunjukkan bahwa IRMI kurang mampu menangani
kondisi data hilang ekstrem. Sebaliknya, k-NN, missRanger dan mean per bulan
memberikan hasil yang lebih baik pada kondisi ekstrem maupun non-ekstrem.
Dari keempat metode, mean per bulan terbukti paling unggul karena mampu
mengatasi data hilang sekaligus mempertahankan struktur multivariat. | |