Please use this identifier to cite or link to this item: http://repository.ipb.ac.id/handle/123456789/79005
Title: Kajian Koefisien Kemiripan Struktur Kimia Bahan Aktif Tanaman Obat Berbasiskan Data Biner.
Authors: Wijayanto, Hari
Afendi, Farit Mochamad
Bakri, Rizal
Issue Date: 2015
Publisher: Bogor Agricultural University (IPB)
Bogor Agricultural University (IPB)
Abstract: Penelitian mengenai bioaktivitas atau analisis komponen senyawa aktif yang terdapat dalam tanaman obat yang digunakan di jamu telah banyak dilakukan bahkan telah terdokumentasi dengan baik dalam suatu pangkalan data bioinformatika namun penjelasan detail mengenai mekanisme kerja secara molekuler dan aktivitas farmakologi masih perlu dikembangkan (Sari 2014). Dalam penelitian in silico, salah satu pendekatan yang umum dilakukan untuk melihat mekanisme kerja suatu senyawa adalah mempertimbangkan aspek kemiripan struktur kimia antar senyawa. Pengukuran kemiripan struktur kimia suatu senyawa mengacu pada kesamaan unsur kimia, molekul atau substruktur senyawa. Pada prinsipnya diasumsikan bahwa senyawa yang struktur kimianya mirip memiliki sifat biologis yang mirip (Johnson & Maggiora 1990). Dari sudut pandang statistika, pengukuran kemiripan struktur kimia ini pada dasarnya adalah pengukuran kemiripan objek berbasis peubah biner seperti penelitian yang dilakukan oleh Godden et al. (2000) yaitu struktur kimia suatu senyawa direpresentasikan sebagai peubah biner untuk menghitung kemiripan antar senyawa menggunakan koefisien Tanimoto. Struktur kimia yang direpresentasikan sebagai data biner merupakan fitur sidik jari molekuler seperti ada tidaknya unsur kimia, ikatan tunggal, cincin, dan sebagainya. Sidik jari molekuler merupakan fitur yang terdiri atas kumpulan substruktur kimia suatu senyawa. Klekota dan Roth (2008) telah mengumpulkan 4860 fitur sidik jari molekuler unik yang merupakan substruktur berbagai senyawa melalui berbagai jenis teknik fragmentasi. Koefisien Tanimoto merupakan ukuran yang paling sering digunakan dalam pengukuran kemiripan struktur kimia antar senyawa. Namun koefisien Tanimoto memiliki kelemahan seperti dalam penelitian Willet et al. (1986) yang menunjukkan bahwa koefisien Tanimoto menghasilkan nilai bias untuk menghitung perbedaan pada pasangan senyawa kecil. Di sisi lain, terdapat banyak koefisien yang bisa digunakan selain koefisien tersebut. Choi et al. (2010) telah mengumpulkan 76 koefisien kemiripan data biner yang digunakan lebih dari satu abad yang lalu. Sementara, Consonni dan Todeschini (2012) mengajukan 3 koefisien kemiripan data biner baru dan membutuhkan penyelidikan untuk memahami potensialnya. Dengan demikian, jumlah koefisien kemiripan data biner yang digunakan dalam penelitian ini sebanyak 79 koefisien. Koefisien-koefisien kemiripan data biner tersebut digerombolkan untuk melihat kemiripan antar koefisien. Metode penggerombolan yang digunakan adalah metode Ward dengan matriks jarak awal berkaitan dengan matriks korelasi. Korelasi tinggi ditemukan pada beberapa koefisien kemiripan data biner yang mengikutsertakan 𝑑����� (negative matches). Menurut Sokal et al. (1963) ada tidaknya 𝑑����� dalam koefisien kemiripan data biner merupakan isu yang berkelanjutan, namun keberadaan 𝑑����� bukan berarti selalu ada kemiripan antara dua objek karena hampir tak hingga jumlah fitur yang memungkinkan tidak terdapat dalam dua objek tersebut. Penelitian ini menunjukkan bahwa rata-rata persentase 𝑑����� pada pasangan senyawa sebesar 98,15%. Nilai ini sangat besar dibanding dengan rata-rata persentase 𝑎�����, 𝑏�����, dan 𝑐����� namun terlihat pada dendogram bahwa koefisien kemiripan data biner yang memuat 𝑑����� tidak bergerombol dalam suatu kelompok tertentu sehingga berdasarkan penelitian ini menyatakan bahwa koefisien kemiripan data biner yang memuat 𝑑����� memiliki performa yang berbeda untuk menghitung kemiripan pasangan suatu senyawa. Di sisi lain, dendogram menunjukkan terdapat 5 gerombol yang terbentuk berdasarkan nilai cut off yang dipilih yaitu 1. Jumlah gerombol yang terbentuk ini memberikan keragaman yang rendah pada koefisien kemiripan data biner dalam kelompok yang sama dan keragaman yang tinggi antar kelompok yang berbeda. Hal ini disebabkan karena beberapa koefisien kemiripan data biner dalam kelompok yang sama saling berkombinasi linear serta terdapat pula beberapa koefisien kemiripan data biner yang dibentuk dari koefisien lainnya setelah dimodifikasi secara aljabar sehingga tingkat korelasi antar koefisien dalam kelompok yang sama tinggi. Kurva ROC telah dibuat untuk masing-masing koefisien kemiripan data biner untuk membandingkan performanya namun terdapat beberapa koefisien ketidakmiripan data biner sehingga koefisien tersebut ditransformasi ke koefisien kemiripan data biner. AUC dari masing-masing koefisien kemiripan data biner dibuat dengan anggapan nilai aktual adalah kesesuaian kelompok pasangan senyawa dan nilai prediksi adalah nilai yang dihasilkan masing-masing koefisien kemiripan data biner. Analisis ROC menunjukkan bahwa terdapat beberapa koefisien kemiripan data biner menghasilkan nilai AUC yang mirip. Koefisien kemiripan data biner yang menghasilkan performa yang mirip ini merupakan koefisien kemiripan data biner yang terdapat pada gerombol yang sama. Hal ini disebabkan karena beberapa koefisien kemiripan data biner saling berkombinasi linear dan dapat dibentuk dari koefisien kemiripan data biner lainnya. Koefisien kemiripan data biner yang menghasilkan nilai AUC yang tinggi adalah koefisien kemiripan data biner Forbes-2 sebesar 0.87606 sedangkan koefisien Tanimoto menghasilkan nilai yaitu 0.79755 dan merupakan urutan ke-35. Di sisi lain, hasil penggerombolan menunjukkan bahwa koefisien-koefisien yang segerombol dengan koefisien Forbes-2 adalah koefisien Simpson, Var of Correlation, Yulew, Yuleq, D-Yuleq, dan Pearson&Heron-2, sehingga koefisien-koefisien kemiripan data biner tersebut dapat dijadikan sebagai alternatif lain sebagai ukuran kemiripan struktur kimia suatu senyawa.
URI: http://repository.ipb.ac.id/handle/123456789/79005
Appears in Collections:MT - Mathematics and Natural Science

Files in This Item:
File SizeFormat 
2015rba.pdf
  Restricted Access
4.98 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.