dc.contributor.advisor | Sartono, Bagus | |
dc.contributor.advisor | Soleh, Agus M | |
dc.contributor.author | Hardiyani, Emeralda | |
dc.date.accessioned | 2021-02-20T06:34:12Z | |
dc.date.available | 2021-02-20T06:34:12Z | |
dc.date.issued | 2020-08 | |
dc.identifier.uri | http://repository.ipb.ac.id/handle/123456789/106017 | |
dc.description.abstract | Microarray merupakan media yang digunakan dalam analisis ekspresi gen.
Intesitas ekspresi gen disimpan dalam bentuk warna pada setiap probe microarray
yang dikuantifikasi ke dalam bentuk numerik. Data ekspresi gen merupakan salah
satu data berdimensi tinggi dengan jumlah peubah penjelas (gen) jauh lebih banyak
dari jumlah observasi. Pada data ekspresi gen, peubah penjelas berupa gen dan
peubah respon berupa observasi. Suatu gen memiliki keterkaitan dengan gen
lainnya atau bersifat pathway. Oleh karena itu, dibutuhkan matriks presisi (R inv)
untuk menggambarkan keterkaitan antar gen. Respon pada data ekspresi gen
biasanya bersifat biner, yaitu jaringan sakit atau jaringan normal. Salah satu metode
yang tepat untuk menganalisis data ekspresi gen dengan respon biner adalah model
regresi logistik terpinalti. Nilai penduga parameter dapat diduga dengan
menggunakan metode Iterative Weighted Least Squares (IWLS).
Pada penelitian ini diterapkan metode IWLS dengan menambahkan ridge
regression (L2) sebagai pinalti model regresi logistik. Penerapan ridge regression
tidak dapat menyeleksi peubah secara langsung, namun peubah yang dihasilkan
didiskretisasi menggunakan kuantil 0.8. Gen dengan koefisien lebih besar dari
kuantil 0.8 diseleksi sebagai gen aktif. Pada penelitian ini, proses seleksi gen
dilakukan baik secara individu maupun pathway.
Pada kajian simulasi, ditentukan nilai rata-rata pengaruh gen terhadap respon,
besaran hubungan antar gen yang saling berkontribusi, dan jumlah gen aktif yang
terlibat dalam pathway. Data simulasi dibangkitkan berdasarkan karakteristik data
riil dan diterapkan pada metode IWLS dengan model regresi logistik terpinalti L2
.
Evaluasi dilakukan pada dugaan parameter yang dihasilkan. Evaluasi dilihat
berdasarkan sensitivitas dalam menduga gen dan pathway aktif, FPR dalam
menduga gen aktif, rata-rata koefisien gen aktif dan gen non aktif, serta persentase
gen non aktif dalam pathway yang terseleksi. Setelah evaluasi menunjukkan hasil
yang memuaskan, kemudian data riil diterapkan pada metode tersebut.
Pada kajian terapan digunakan data ekspresi gen colorectal cancer (CRC).
Data tersebut terdiri 18 observasi dan 23477 gen. Matriks presisi dibangun dengan
melihat gen yang terlibat dalam pathway pada data CRC. Seluruh data tersebut
diterapkan pada IWLS dengan model regresi logistik terpinalti L2.
Hasil evaluasi menunjukkan bahwa kenaikan nilai rata-rata pengaruh gen
aktif dan jumlah gen aktif dalam pathway dapat meningkatkan sensitivitas menduga
gen dan pathway aktif. Selain itu, terjadi penurunan FPR dalam menduga gen aktif.
Rata-rata koefisien gen aktif meningkat dan rata-rata gen non aktif mendekati 0.
Persentase gen non aktif yang terseleksi dalam pathway meningkat. Hasil evaluasi
sensitivitas menunjukkan metode IWLS dengan regresi logistik terpinalti L2 dapat
melakukan seleksi secara pathway. Data CRC diterapkan pada metode tersebut dan
dihasilkan 8 pathway dan 635 gen yang terseleksi. | id |
dc.description.sponsorship | Penelitian Kerjasama Luar Negeri (PKLN) | id |
dc.language.iso | id | id |
dc.publisher | IPB University | id |
dc.title | Pengembangan Teknik Seleksi Peubah pada Model Regresi Logistik Terpinalti dengan Peubah yang Berkaitan. | id |
dc.title.alternative | The Development of Variable Selection Technique in Penalized Logistic Regression Method with Pathway Variable | id |
dc.type | Thesis | id |
dc.subject.keyword | iterative weighted least squares (IWLS) | id |
dc.subject.keyword | pathway variable selection | id |
dc.subject.keyword | penalized logistic regression | id |
dc.subject.keyword | ridge regression | id |
dc.subject.keyword | the genes expression | id |