Please use this identifier to cite or link to this item: http://repository.ipb.ac.id/handle/123456789/106017
Title: Pengembangan Teknik Seleksi Peubah pada Model Regresi Logistik Terpinalti dengan Peubah yang Berkaitan.
Other Titles: The Development of Variable Selection Technique in Penalized Logistic Regression Method with Pathway Variable
Authors: Sartono, Bagus
Soleh, Agus M
Hardiyani, Emeralda
Issue Date: Aug-2020
Publisher: IPB University
Abstract: Microarray merupakan media yang digunakan dalam analisis ekspresi gen. Intesitas ekspresi gen disimpan dalam bentuk warna pada setiap probe microarray yang dikuantifikasi ke dalam bentuk numerik. Data ekspresi gen merupakan salah satu data berdimensi tinggi dengan jumlah peubah penjelas (gen) jauh lebih banyak dari jumlah observasi. Pada data ekspresi gen, peubah penjelas berupa gen dan peubah respon berupa observasi. Suatu gen memiliki keterkaitan dengan gen lainnya atau bersifat pathway. Oleh karena itu, dibutuhkan matriks presisi (R inv) untuk menggambarkan keterkaitan antar gen. Respon pada data ekspresi gen biasanya bersifat biner, yaitu jaringan sakit atau jaringan normal. Salah satu metode yang tepat untuk menganalisis data ekspresi gen dengan respon biner adalah model regresi logistik terpinalti. Nilai penduga parameter dapat diduga dengan menggunakan metode Iterative Weighted Least Squares (IWLS). Pada penelitian ini diterapkan metode IWLS dengan menambahkan ridge regression (L2) sebagai pinalti model regresi logistik. Penerapan ridge regression tidak dapat menyeleksi peubah secara langsung, namun peubah yang dihasilkan didiskretisasi menggunakan kuantil 0.8. Gen dengan koefisien lebih besar dari kuantil 0.8 diseleksi sebagai gen aktif. Pada penelitian ini, proses seleksi gen dilakukan baik secara individu maupun pathway. Pada kajian simulasi, ditentukan nilai rata-rata pengaruh gen terhadap respon, besaran hubungan antar gen yang saling berkontribusi, dan jumlah gen aktif yang terlibat dalam pathway. Data simulasi dibangkitkan berdasarkan karakteristik data riil dan diterapkan pada metode IWLS dengan model regresi logistik terpinalti L2 . Evaluasi dilakukan pada dugaan parameter yang dihasilkan. Evaluasi dilihat berdasarkan sensitivitas dalam menduga gen dan pathway aktif, FPR dalam menduga gen aktif, rata-rata koefisien gen aktif dan gen non aktif, serta persentase gen non aktif dalam pathway yang terseleksi. Setelah evaluasi menunjukkan hasil yang memuaskan, kemudian data riil diterapkan pada metode tersebut. Pada kajian terapan digunakan data ekspresi gen colorectal cancer (CRC). Data tersebut terdiri 18 observasi dan 23477 gen. Matriks presisi dibangun dengan melihat gen yang terlibat dalam pathway pada data CRC. Seluruh data tersebut diterapkan pada IWLS dengan model regresi logistik terpinalti L2. Hasil evaluasi menunjukkan bahwa kenaikan nilai rata-rata pengaruh gen aktif dan jumlah gen aktif dalam pathway dapat meningkatkan sensitivitas menduga gen dan pathway aktif. Selain itu, terjadi penurunan FPR dalam menduga gen aktif. Rata-rata koefisien gen aktif meningkat dan rata-rata gen non aktif mendekati 0. Persentase gen non aktif yang terseleksi dalam pathway meningkat. Hasil evaluasi sensitivitas menunjukkan metode IWLS dengan regresi logistik terpinalti L2 dapat melakukan seleksi secara pathway. Data CRC diterapkan pada metode tersebut dan dihasilkan 8 pathway dan 635 gen yang terseleksi.
URI: http://repository.ipb.ac.id/handle/123456789/106017
Appears in Collections:MT - Mathematics and Natural Science

Files in This Item:
File Description SizeFormat 
Cover, Lembar Pengesahan, Prakata, Daftar Isi.pdf
  Restricted Access
Cover2.62 MBAdobe PDFView/Open
G152180011_Emeralda Hardiyani.pdf
  Restricted Access
Fullteks2.89 MBAdobe PDFView/Open
Lampiran.pdf
  Restricted Access
Lampiran394.87 kBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.