Asosiasi Single Nucleotide Polymorphism pada Penyakit Diabetes Mellitus Tipe 2 Menggunakan Random Forest Regression
View/ Open
Date
2019Author
Tresnawati, Lina Herlina
Ananta, Wisnu Ananta
Wijaya, Sony Hartono
Metadata
Show full item recordAbstract
Personalized medicine adalah perawatan medis berdasarkan karakteristik
masing-masing pasien yang dapat meningkatkan perawatan medis yang dilakukan
kepada pasien yang tepat. Perkembangan personalized medicine bisa didekati oleh
precision medicine. Saat ini, perkembangan precision medicine difokuskan
mempelajari penyakit kompleks, salah satunya adalah Diabetes mellitustipe 2
(T2D). Penyakit ini menjadi penyakit global karena merupakan penyakit
mematikan terbesar di Asia Tenggara dan Pasifik Barat. Asosiasi antara data
genomik yang direpresentasikan oleh single nucleotide polymorphism (SNP) dan
fenotipe penyakit T2D dapat menghasilkan informasi untuk precision medicine.
Asosiasi yang sudah ada dilakukan menggunakan pendekatan statistik, salah satu
yang sudah dikenal adalah CART (classification or regression tree). Ketika
terdapat banyak noise pada data dan sedikitnya informasi yang terdapat pada
masing-masing variabel menyebabkan kemampuan prediktif CART berkurang, hal
ini bisa diatasi dengan random forest. Oleh karena itu, pada penelitian ini dilakukan
asosiasi SNP menggunakan random forest regression.
Tujuan dari penelitian ini adalah memperoleh asosiasi SNP dan fenotipe, serta
melakukan pemeriksaan epistatis untuk mengetahui apakah terdapat interaksi antar
SNP. Adapun tahapan penelitian yang akan dilakukan terdiri atas enam tahap yaitu
pengumpulan data SNP yang diperoleh dari situs The Mouse Phenome Database
(MPD) dengan alamat website https://phenome.jax.org/, praproses data,
penyusunan peringkat SNP, pemetaan asosiasi, pemeriksaan interaksi SNP, dan
evaluasi.
Penelitian ini menghasilkan dua buah model asosiasi, yaitu model yang
menggunakan data hanya tikus jantan, dan model asosiasi yang menggunakan tikus
jantan dan betina. Untuk data tikus jantan, SNP importance yang dihasilkan
sebanyak 88 buah SNP. Asosiasi SNP terhadap fenotipe terpenting adalah
rs28164866 dengan kandidat protein FAF1. Evaluasi model dilakukan
menggunakan mean absolute error (MAE). Diperoleh nilai MAE sebesar 0.153.
Nilai epistatis yang masuk dalam kategori high dihasilkan oleh satu buah pasangan
SNP, yaitu rs29231750 (kandidat protein ARL15) dan rs46153935 (kandidat
protein TCF7L2). Adapun untuk data tikus jantan dan betina, semua hasil yang
diperoleh lebih baik dari model asosiasi tikus jantan saja. SNP importance yang
dihasilkan lebih banyak, yaitu 301 SNP. Nilai MAE yang diperoleh lebih kecil yaitu
sebesar 0.062, dan epistatis yang berkategori high dihasilkan oleh 13 pasang SNP.