Pengembangan Algoritma EM untuk Data Tidak Lengkap (Incomplete Data) pada Model Log-Linear
Abstract
Pada data kategori terkadang terdapat beberapa data yang tidak lengkap pada salah satu kategorinya, sehingga ringkasan dari data kategori dalam bentuk tabel kontingensinya terbagi menjadi dua bagian yaitu tabel kontingensi data lengkap dan data tidak lengkap. Analisa yang dapat digunakan untuk kasus tersebut adalah dengan memodelkan data lengkap mengunakan model log-linear. Kemudian dilakukan pendugaan data tidak lengkap menggunakan algoritma EM. Algoritma EM terdiri dari dari dua tahapan yaitu tahapan M (Maximization) diperoleh dari pendugaan maksimum likelihood berupa nilai proporsi setiap sel pengamatan, tahapan E (Expectation) merupakan proses pendistribusian data tidak lengkap berdasarkan proporsi yang telah ditentukan sehingga setiap nilai sel pengamatan mengalami penyesuaian nilai. Algoritma EM ini merupakan proses iterasi yang terus berlangsung hingga diperoleh nilai yang konvergen. Data yang digunakan dalam penelitian ini adalah status kesehetan bayi setelah dilahirkan di dua klinik yang berbeda. Data yang diamati adalah clinic (C), prenatal care (P) dan survival (S). Terdapat data tidak lengkap pada kategori clinic. Model Log-linear terbaik untuk data lengkap adalah model (SC,PC) karena memiliki nilai uji kebaikan suai dan model ini cukup sederhana untuk mendistribusikan data tidak lengkap ke data lengkap dibandingkan model lainnya. Model ini memberi gambaran hubungan antara peubah clinic (C) dengan peubah lainnya.