Please use this identifier to cite or link to this item: http://repository.ipb.ac.id/handle/123456789/116115
Title: Regresi Logistik Ordinal dengan Bobot Percontohan dan Aplikasinya dalam Klasifikasi Status Kesehatan Penduduk Lanjut Usia
Other Titles: Ordinal Logistic Regression with Sampling Weights and Its Application in Classification of Health Status of the Elderly People
Authors: Indahwati
Erfiani
Amelia, Reni
Issue Date: 2022
Publisher: IPB University
Abstract: Regresi logistik ordinal merupakan metode yang mendeskripsikan hubungan antara peubah respon berskala ordinal dengan satu atau lebih peubah penjelas. Salah satu metode pendugaan parameter model regresi logistik ordinal adalah metode kemungkinan maksimum (Maximum Likelihood Estimator/MLE). Pendugaan parameter model dengan MLE mengasumsikan bahwa setiap unit contoh memiliki peluang yang sama untuk terpilih. Dalam memenuhi asumsi tersebut, penarikan contoh harus menggunakan teknik penarikan contoh acak sederhana (Simple Random Sampling/SRS). Apabila teknik penarikan contoh bukan SRS, perlu menambahkan bobot percontohan pada metode pendugaan parameter yang digunakan. Salah satu metode pendugaan yang dapat digunakan adalah Pseudo Maximum Likelihood (PML). Regresi logistik ordinal dengan bobot percontohan pada penelitian ini menggunakan metode pendugaan parameter PML karena terdapat perlakuan tertentu pada pendugaan parameter modelnya. Perlakuannya adalah dengan menambahkan bobot percontohan pada peubah respon ketika peubah bebas diketahui. Penelitian ini menggunakan data yang berasal dari Survei Sosial Ekonomi Nasional (SUSENAS). Survei ini dilakukan oleh Badan Pusat Statistik (BPS) pada Maret 2020. Desain penarikan contoh SUSENAS bukan SRS, melainkan two stage one phase sampling. Penarikan contoh dilakukan dengan mengambil contoh blok sensus pada tahap pertama dan mengambil contoh rumah tangga pada blok sensus yang terpilih pada tahap kedua. Desain penarikan contoh SUSENAS membuat setiap unit contoh memiliki peluang tidak sama untuk terpilih sehingga perhitungan penduga parameter perlu dilakukan penyesuaian dengan menggunakan bobot percontohan. Model regresi logistik ordinal dengan bobot percontohan dalam penelitian ini digunakan untuk menduga status kesehatan penduduk lansia (lanjut usia). Hal ini seiring dengan tujuan 3 Sustainable Development Goals (SDGs) yaitu menjamin kehidupan yang sehat dan mendorong kesejahteraan bagi semua di segala usia. Perhatian terhadap lansia didasari dengan populasi penduduk dunia yang mulai memasuki era penduduk menua (ageing population). Fenomena era penduduk menua terjadi di semua negara termasuk negara berkembang. Indonesia sebagai salah satu negara berkembang diprediksi akan mengalami pertumbuhan penduduk lansia yang pesat. Jumlah penduduk lansia di Indonesia tahun 2020 hasil Sensus Penduduk 2020 sebesar 9,78 persen. Pada tahun 2045 penduduk lansia Indonesia diproyeksikan mencapai hampir seperlima dari total penduduk. Perhatian pemerintah terhadap peningkatan populasi penduduk lansia tertuang dalam berbagai kebijakan. Salah satu kebijakan yang telah disusun adalah Rencana Aksi Nasional (RAN) Kesehatan Lansia 2020-2024 yang berfokus untuk meningkatkan status kesehatan lansia. Hasil SUSENAS Maret 2020 menyebutkan bahwa 48,14 persen lansia di Indonesia memiliki status kesehatan sedang dan 24,35 persen lansia mengalami status kesehatan buruk. Status kesehatan lansia dipengaruhi oleh berbagai faktor. Faktor-faktor yang memengaruhi status kesehatan lansia perlu dikaji lebih dalam agar kebijakan yang dibuat tepat sasaran. Berdasarkan permasalahan sebelumnya, penelitian ini bertujuan mendeskripsikan dan mengevaluasi metode regresi logistik ordinal dengan mempertimbangkan bobot percontohan. Bobot percontohan tersebut berdasarkan desain percontohan SUSENAS. Penelitian ini juga bertujuan untuk mengaplikasikan model tersebut untuk memprediksi dan mengidentifikasi faktor-faktor yang memengaruhi status kesehatan lansia. Total contoh yang digunakan adalah 121.961 lansia yang tersebar dalam 514 kab/kota di Indonesia. Peubah respon yang digunakan adalah status kesehatan lansia yang terdiri atas tiga kategori, yaitu status kesehatan baik, sedang, dan buruk. Peubah bebas yang digunakan adalah tingkat pendidikan, jenis kelamin, status perkawinan, status bekerja, tipe daerah tempat tinggal, dan kebiasaan merokok. Peubah bebas lainnya adalah peubah yang berhubungan dengan rumah tangga, yaitu status kerawanan pangan, jumlah anggota rumah tangga, dan rata-rata pengeluaran per kapita sebulan. Metode imputasi melalui model regresi logistik dilakukan untuk menangani peubah yang memiliki jawaban “tidak tahu”. Proses imputasi digunakan karena jika responden tersebut dikeluarkan dalam penyusunan model akan menyebabkan terjadi perubahan dalam bobot percontohan akhir yang telah dihitung oleh BPS. Salah satu tantangan dalam melakukan evaluasi model regresi logistik ordinal dengan bobot percontohan adalah pada saat menyusun tabel ketepatan klasifikasi dengan membagi data menjadi data latih dan data uji. Proses pembagian data ini tidak dapat dilakukan secara langsung dengan mengacak contoh penduduk lansia karena dapat memengaruhi bobot percontohan yang telah dihitung oleh BPS. Dari daftar 514 kabupaten/kota di Indonesia, diambil contoh secara acak sebanyak 80% kab/kota untuk data latih sedangkan sisanya untuk data uji. Seluruh lansia yang berada dalam kab/kota yang terpilih menjadi data latih digunakan menjadi data latih untuk menyusun model. Seluruh lansia yang termasuk dalam kab/kota yang terpilih menjadi data uji digunakan untuk data uji untuk menyusun tabel ketepatan klasifikasi serta menghitung nilai akurasi. Hasil penelitian menyimpulkan faktor-faktor yang memengaruhi status kesehatan lansia berdasarkan model regresi logistik ordinal dengan bobot percontohan adalah pendidikan, jenis kelamin, status pekerjaan, dan status merokok. Faktor-faktor terkait rumah tangga lansia, yaitu status kerawanan pangan, jumlah anggota rumah tangga, dan rata-rata pengeluaran per kapita per bulan juga memengaruhi status kesehatan lansia. Lansia yang memiliki status kesehatan lebih baik adalah lansia yang minimal tamat SD, perempuan, bekerja, dan perokok ringan/sedang. Lansia yang juga memiliki status kesehatan yang lebih baik adalah lansia yang tinggal di rumah tangga tidak rawan pangan, anggota rumah tangga lebih banyak, dan pengeluaran per kapita per bulan lebih dari 2 juta rupiah. Nilai akurasi model regresi logistik ordinal dengan bobot percontohan sebesar 53%. Model regresi logistik ordinal dengan dan tanpa menggunakan bobot percontohan memiliki perbedaan pada peubah yang signifikan memengaruhi status kesehatan lansia. Model regresi logistik ordinal dengan bobot percontohan lebih mampu memprediksi kategori minoritas peubah respon (status kesehatan buruk dan sedang) dibandingkan model tanpa menggunakan bobot percontohan.
Ordinal logistic regression is a method that describes the relationship between response variables on an ordinal scale with one or more explanatory variables. One method of estimating the parameters of the ordinal logistic regression model is the Maximum Likelihood Estimator (MLE) method. Estimating model parameters with MLE assumes that each sample unit has the same chance of being selected. In meeting these assumptions, sampling must use the Simple Random Sampling/SRS method. If the sampling technique is not SRS, it is necessary to add a sampling weight to the parameter estimation method used. One of the estimation methods that can be used is Pseudo Maximum Likelihood (PML). Ordinal logistic regression with sampling weights in this study uses the PML parameter estimation method because there is a certain treatment for the model parameter estimation. The treatment is to add sampling weights to the response variables when the independent variables are known. This study uses data from the National Socioeconomic Survey (SUSENAS). This survey was conducted by BPS-Statistics Indonesia in March 2020. The sampling method for the March 2020 SUSENAS is not SRS, but two-stage one-phase sampling. Sampling is done by taking samples of the census blocks in the first stage and taking samples of households in the selected census blocks in the second stage. The SUSENAS sampling design makes each sample unit have an unequal chance of being selected so that the calculation of the parameter estimator needs to be adjusted using sampling weights. The ordinal logistic regression model with sampling weight in this study was used to estimate the health status of the elderly population. This is in line with 3rd goal in the Sustainable Development Goals (SDGs), which is to ensure a healthy life and promote well-being for all people of all ages. Attention to the elderly is based on the world's population which has begun to enter the era of the ageing population. The phenomenon of the ageing population era occurs in all countries, including developing countries. Indonesia as a developing country is predicted to experience rapid growth of the elderly population. The number of elderly people in Indonesia in 2020 as a result of the 2020 Population Census is 9,78 percent. In 2045 Indonesia's elderly population is projected to reach almost one-fifth of the total population. The government's attention to increasing the elderly population is contained in various policies. One of the policies that have been prepared is the National Action Plan for Elderly Health 2020-2024 which focuses on improving the health status of the elderly. The results of the March 2020 SUSENAS stated that 48,14 percent of the elderly in Indonesia had moderate health status and 24,35 percent of the elderly experienced poor health status. The health status of the elderly is influenced by various factors. The factors that influence the health status of the elderly need to be studied more deeply so that the policies made are right on target. Based on the previous problems, this study aims to describe and evaluate the ordinal logistic regression method by considering the sampling weight. The sampling weight is based on the sampling design of SUSENAS. This study also aims to apply the model to predict and identify the factors that influence the health status of the elderly. The total sample used is 121.961 elderly spread across 514 regencies/cities in Indonesia. The response variable used is the health status of the elderly which consists of three categories, namely good, moderate, and poor health status. The independent variables used were education level, gender, marital status, working status, type of area of residence, and smoking habit. Other independent variables are variables related to households, namely household food insecurity status, number of household members, and average monthly expenditure per capita. The imputation method through the logistic regression model is carried out to handle variables that have "don't know" answers. The imputation process is used because if the respondent is excluded, it will cause a change in the final sampling weight that has been calculated by BPS-Statistics Indonesia. One of the challenges in evaluating the ordinal logistic regression model with sampling weights is when compiling a classification accuracy table by dividing the data into training and testing data. The process of sharing this data cannot be done directly by randomizing the sample of the elderly population because it can affect the sampling weight that has been compiled by BPS-Statistics Indonesia. From a list of 514 districts/cities in Indonesia, 80% of districts/cities were randomly sampled for training data while the rest were for testing data. All elderly who are in the district/city selected as training data are used as training data to develop models. All elderly who are included in the selected regencies/cities as testing data are used for testing data to compile a classification accuracy table and calculate accuracy values. The results of the study concluded that the factors affecting the health status of the elderly based on the ordinal logistic regression model with sampling weights were education, gender, employment status, and smoking status. Factors related to elderly households, namely food insecurity status, number of household members, and average expenditure per capita per month also affect the elderly health status. The elderly who has better health status are the elderly who have at least graduated from elementary school, female, work, and light/moderate smokers. Elderly people who also have better health status are those who live in households that are not food insecure, have more household members, and spend more than 2 million rupiahs per capita per month. The accuracy value of the ordinal logistic regression model with sampling weight is 53%. Ordinal logistic regression models with and without using sampling weights have different variables that significantly affect the health status of the elderly. Ordinal logistic regression models with sampling weights are better able to predict minority categories of response variables (poor and moderate health status) than models without sampling weights.
URI: http://repository.ipb.ac.id/handle/123456789/116115
Appears in Collections:MT - Mathematics and Natural Science

Files in This Item:
File Description SizeFormat 
01 Watermark_Cover - TESIS - (G1501202071) RENI AMELIA (1).pdf
  Restricted Access
Cover1.18 MBAdobe PDFView/Open
02 Watermark_Fullteks - TESIS - (G1501202071) RENI AMELIA.pdf
  Restricted Access
Fullteks3.91 MBAdobe PDFView/Open
03 Watermark_Lampiran - TESIS - (G1501202071) RENI AMELIA.pdf
  Restricted Access
Lampiran206.22 kBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.