Please use this identifier to cite or link to this item: http://repository.ipb.ac.id/handle/123456789/71601
Title: Algoritma genetika untuk pendeteksian pencilan pada analisis regresi linier
Other Titles: Detecting outliers in regression analysis using genetic algorithm
Authors: Sartono, Bagus
Najih, Amri Luthfi
Issue Date: 2014
Publisher: Bogor Agricultural University (IPB)
Abstract: Masalah yang sering dihadapi ketika melakukan analisis regresi linier adalah keberadaan data pencilan. Pencilan merupakan suatu keganjilan. Seringkali data pencilan memiliki nilai yang berbeda, lain dari biasanya dan tidak mencerminkan karakteristik data secara umum. Pencilan dapat mempengaruhi dugaan model. Dugaan model yang dihasilkan tidak dapat menggambarkan hubungan antara variabel secara umum. Sehingga, analisis atau interpretasi yang dihasilkan menjadi salah. Oleh karena itu perlu dilakukan pendeteksian pencilan sebelum melakukan analisis regresi. Kriteria Informasi dapat digunakan untuk mendeteksi pencilan. Kriteria Informasi dihitung dengan menyisihkan amatan yang diduga sebagai pencilan. Nilai Kriteria Informasi minimum menunjukkan bahwa amatan yang disisihkan merupakan pencilan. Namun akan banyak kombinasi amatan yang diduga sebagai pencilan yang mungkin ditemukan dalam satu gugus data. Hal tersebut akan menyita waktu ketika dilakukan secara manual. Algoritma genetika dapat digunakan untuk menghitung nilai Kriteria Informasi, sehingga dapat digunakan untuk menentukan nilai minimumnya. Algoritma genetika dapat melakukan pendeteksian seluruh amatan yang berpotensi sebagai pencilan secara serempak. Namun ada beberapa kekurangan dalam program ini, yaitu masalah kecepatan program. Semakin banyak amatan semakin banyak juga waktu yang diperlukan. Banyaknya peubah dalam data tidak mempengaruhi kemampuan program untuk mencapai nilai kriteria informasi minimum.
A common problem in linear regression analysis is the existence of outliers. Outlier is an oddity. Frequently the outliers have different values, different from the usual and do not reflect the characteristics of the data in general. Outliers can be affect to models estimation. models estimation can not describe the relationship between variables in general. So that, analysis or interpretation of the result will be incorrect. Therefore it is necessary for the detection of outliers before the analysis. Information criterion can be used to detect outliers. Information criteria calculated by eliminate the observations suspected as outliers. Minimum Information Criterion value indicates an observations eliminated as outlier. But it would be a lot of combinations of observations suspected as outliers that might be found in a set of data. Genetic algorithms can be used to calculate the value of information criteria, so it can be used to determine the minimum value. Genetic algorithm can used to detection of all possible outliers simultaneously. However there are some disadvantages in this program, that is the problem of program speed. The more observations the more time is required. The number of variables in the data does not affect the program's ability to achieve the minimum information criterion. Keywords: Genetic Algorithms, Information Criteria, Outlier, linear regression
URI: http://repository.ipb.ac.id/handle/123456789/71601
Appears in Collections:UT - Statistics and Data Sciences

Files in This Item:
File Description SizeFormat 
G14aln.pdf
  Restricted Access
Full Text674.1 kBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.