Show simple item record

dc.contributor.advisorSartono, Bagus
dc.contributor.advisorSoleh, Agus M
dc.contributor.authorHardiyani, Emeralda
dc.date.accessioned2021-02-20T06:34:12Z
dc.date.available2021-02-20T06:34:12Z
dc.date.issued2020-08
dc.identifier.urihttp://repository.ipb.ac.id/handle/123456789/106017
dc.description.abstractMicroarray merupakan media yang digunakan dalam analisis ekspresi gen. Intesitas ekspresi gen disimpan dalam bentuk warna pada setiap probe microarray yang dikuantifikasi ke dalam bentuk numerik. Data ekspresi gen merupakan salah satu data berdimensi tinggi dengan jumlah peubah penjelas (gen) jauh lebih banyak dari jumlah observasi. Pada data ekspresi gen, peubah penjelas berupa gen dan peubah respon berupa observasi. Suatu gen memiliki keterkaitan dengan gen lainnya atau bersifat pathway. Oleh karena itu, dibutuhkan matriks presisi (R inv) untuk menggambarkan keterkaitan antar gen. Respon pada data ekspresi gen biasanya bersifat biner, yaitu jaringan sakit atau jaringan normal. Salah satu metode yang tepat untuk menganalisis data ekspresi gen dengan respon biner adalah model regresi logistik terpinalti. Nilai penduga parameter dapat diduga dengan menggunakan metode Iterative Weighted Least Squares (IWLS). Pada penelitian ini diterapkan metode IWLS dengan menambahkan ridge regression (L2) sebagai pinalti model regresi logistik. Penerapan ridge regression tidak dapat menyeleksi peubah secara langsung, namun peubah yang dihasilkan didiskretisasi menggunakan kuantil 0.8. Gen dengan koefisien lebih besar dari kuantil 0.8 diseleksi sebagai gen aktif. Pada penelitian ini, proses seleksi gen dilakukan baik secara individu maupun pathway. Pada kajian simulasi, ditentukan nilai rata-rata pengaruh gen terhadap respon, besaran hubungan antar gen yang saling berkontribusi, dan jumlah gen aktif yang terlibat dalam pathway. Data simulasi dibangkitkan berdasarkan karakteristik data riil dan diterapkan pada metode IWLS dengan model regresi logistik terpinalti L2 . Evaluasi dilakukan pada dugaan parameter yang dihasilkan. Evaluasi dilihat berdasarkan sensitivitas dalam menduga gen dan pathway aktif, FPR dalam menduga gen aktif, rata-rata koefisien gen aktif dan gen non aktif, serta persentase gen non aktif dalam pathway yang terseleksi. Setelah evaluasi menunjukkan hasil yang memuaskan, kemudian data riil diterapkan pada metode tersebut. Pada kajian terapan digunakan data ekspresi gen colorectal cancer (CRC). Data tersebut terdiri 18 observasi dan 23477 gen. Matriks presisi dibangun dengan melihat gen yang terlibat dalam pathway pada data CRC. Seluruh data tersebut diterapkan pada IWLS dengan model regresi logistik terpinalti L2. Hasil evaluasi menunjukkan bahwa kenaikan nilai rata-rata pengaruh gen aktif dan jumlah gen aktif dalam pathway dapat meningkatkan sensitivitas menduga gen dan pathway aktif. Selain itu, terjadi penurunan FPR dalam menduga gen aktif. Rata-rata koefisien gen aktif meningkat dan rata-rata gen non aktif mendekati 0. Persentase gen non aktif yang terseleksi dalam pathway meningkat. Hasil evaluasi sensitivitas menunjukkan metode IWLS dengan regresi logistik terpinalti L2 dapat melakukan seleksi secara pathway. Data CRC diterapkan pada metode tersebut dan dihasilkan 8 pathway dan 635 gen yang terseleksi.id
dc.description.sponsorshipPenelitian Kerjasama Luar Negeri (PKLN)id
dc.language.isoidid
dc.publisherIPB Universityid
dc.titlePengembangan Teknik Seleksi Peubah pada Model Regresi Logistik Terpinalti dengan Peubah yang Berkaitan.id
dc.title.alternativeThe Development of Variable Selection Technique in Penalized Logistic Regression Method with Pathway Variableid
dc.typeThesisid
dc.subject.keyworditerative weighted least squares (IWLS)id
dc.subject.keywordpathway variable selectionid
dc.subject.keywordpenalized logistic regressionid
dc.subject.keywordridge regressionid
dc.subject.keywordthe genes expressionid


Files in this item

Thumbnail
Thumbnail
Thumbnail

This item appears in the following Collection(s)

Show simple item record