| dc.description.abstract | Penelitian ini bertujuan untuk membuat suatu aplikasi data mining menggunakan fuzzy classifier. Konsep himpunan fuzzy dipilih karena lebih baik dalam menangani data numerik dan dapat ”memperhalus” batasan yang tegas. Aplikasi ini diterapkan pada data potensi desa di Indonesia tahun 2003. Data potensi desa 2003 memiliki 750 atribut dan 65536 record. Untuk kebutuhan penelitian diambil 5 atribut numerik (jumlah keluarga prasejahtera sejahtera 1, jumlah pengangguran, jumlah keluarga pengguna listrik PLN, jumlah bangunan permanen, dan jumlah murid SD yang drop-out) dan 10500 record data (7500 record untuk data training dan 3000 data untuk data tes). Aplikasi yang dibuat dapat dimanfaatkan untuk menentukan nilai dan kelas atribut yang belum diketahui berdasarkan aturan-aturan yang ditemukan. Ada beberapa proses yang harus dilakukan antara lain merubah data ke dalam himpunan fuzzy, membangkitkan aturan fuzzy, memprediksi nilai dan kelas data target, mengevaluasi performa akurasi dan rms, terakhir menyajikan informasi dalam bentuk grafik dan tabel. Setelah dicobakan dari berbagai data training dan data tes yang ada, didapatkan informasi sebagai berikut: Semakin banyak data training yang digunakan, maka jumlah aturan yang terbentuk semakin besar dengan kenaikan terbesar terjadi pada selang 1000 sampai 1500 data training. Semakin banyak antecedent yang ingin dibuat maka jumlah aturan yang terbentuk semakin sedikit. Semakin banyak data training yang digunakan, maka waktu untuk membangkitkan aturan juga semakin besar dengan kenaikannya secara linier. Banyaknya data training yang ada tidak berpengaruh signifikan dengan nilai akurasi dan rmse, yang mempengaruhi adalah nilai bobot dari masing-masing aturan. Persentase akurasi terbesar (80%) didapatkan jika atribut targetnya C3 (jumlah keluarga pengguna listrik PLN) dengan jumlah data training sebanyak 1000 data. Persentase terkecil (13%) didapatkan jika atribut targetnya C5 (Jumlah murid SD yang DO) untuk setiap jumlah data training yang ada. Evaluasi akurasi dan rmse akan mendapatkan hasil yang baik jika atribut yang dijadikan kelas target berasal dari atribut C3 (jumlah keluarga pengguna listrik PLN) atau C4 (jumlah bangunan permanen) dan digunakan sebagai model yang terbaik untuk memprediksi nilai dan kelas suatu data. | id |