Please use this identifier to cite or link to this item: http://repository.ipb.ac.id/handle/123456789/109291
Title: Determination of The Best Outlier Detection Method: An Application on Indonesian Air Quality Data
Other Titles: Penentuan Metode Pendeteksian Pencilan Terbaik: Penerapan Pada Data Kualitas Udara Indonesia
Authors: Fitrianto, Anwar
Kurnia, Anang
Kholifatunnisa, Amalia
Issue Date: 2021
Publisher: IPB University
Abstract: Outliers detection in univariate data aims to see the characteristics of a single variable before entering the next analysis. There are many methods for detecting outliers, but only a few methods consider the data distribution. This research determines the best outlier detection method on univariate data with a skewed distribution. Outliers detection methods used in this research are Tukey's boxplot, adjusted boxplot, sequential fences, and adjusted sequential fences. It identifies areas of concern due to poor air quality during the Implementation of Micro-Community Activity Restrictions. The data used in this research is air quality index data for each province in Indonesia on June 08, 2021. The adjusted boxplot method performs best based on the number of outliers detected, error rate, accuracy, precision, specificity, sensitivity, and robustness. Adjusted boxplot and adjusted sequential fences can detect tails that contain outliers accurately because the skewness coefficient makes them more robust. Meanwhile, Tukey's boxplot and sequential fences are poor methods since they couldn’t detect true outliers and outliers tail. Based on the results, adjusted boxplot is the best method. Then, areas that need attention due to poor air quality include South Sumatera, South Sulawesi, West Java, Riau, North Sumatera, Jambi, Jakarta, and East Java. Keywords: adjusted boxplot, adjusted sequential fences, outlier, sequential fences, Tukey's boxplot.
Pendeteksian pencilan pada data univariat bertujuan untuk melihat karakteristik peubah tunggal sebelum memasuki analisis selanjutnya. Ada banyak metode untuk mendeteksi pencilan, tetapi dalam pembentukannya hanya beberapa metode yang mempertimbangkan sebaran data. Penelitian ini menentukan metode pendeteksian pencilan terbaik pada data univariat dengan sebaran menjulur. Metode pendeteksian pencilan yang digunakan adalah Tukey’s boxplot, adjusted boxplot, sequential fences, dan adjusted sequential fences. Selain itu, dilakukan pengidentifikasian wilayah yang menjadi perhatian karena memiliki kualitas udara buruk selama penerapan Pembatasan Kegiatan Masyarakat Mikro. Data yang digunakan dalam penelitian ini adalah data indeks kualitas udara setiap provinsi di Indonesia pada tanggal 08 Juni 2021. Metode adjusted boxplot memiliki kinerja terbaik berdasarkan jumlah pencilan yang berhasil terdeteksi, tingkat kesalahan, akurasi, presisi, spesifisitas, sensitivitas, dan resistensi terhadap pencilan. Adjusted boxplot dan adjusted sequential fences dapat mendeteksi sisi ekor data yang mengandung pencilan secara akurat karena memiliki koefisien kemenjuluran yang membuatnya lebih kuat. Sementara itu, Tukey’s boxplot dan sequential fences merupakan metode yang buruk karena tidak berhasil mendeteksi pencilan dan sisi ekor yang mengandung pencilan. Berdasarkan hasil tersebut, adjusted boxplot merupakan metode terbaik. Wilayah yang perlu menjadi perhatian akibat kualitas udara buruk antara lain Sumatera Selatan, Sulawesi Selatan, Jawa Barat, Riau, Sumatera Utara, Jambi, Jakarta, dan Jawa Timur. Kata kunci: adjusted boxplot, adjusted sequential fences, pencilan, sequential fences, Tukey's boxplot
URI: http://repository.ipb.ac.id/handle/123456789/109291
Appears in Collections:UT - Statistics and Data Sciences

Files in This Item:
File Description SizeFormat 
Cover, Lembar Pernyataan, Abstrak, Lembar Pengesahan, Prakata, dan Daftar Isi.pdf
  Restricted Access
Cover4.63 MBAdobe PDFView/Open
G14170010_Amalia Kholifatunnisa.pdf
  Restricted Access
Fullteks5.73 MBAdobe PDFView/Open
Lampiran.pdf
  Restricted Access
Lampiran4.61 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.