Please use this identifier to cite or link to this item: http://repository.ipb.ac.id/handle/123456789/154477
Title: Diskriminasi Centella asiatica dari Hydrocotyle verticillata dengan Partial Least Square-Discriminant Analysis (PLS-DA) dan Kombinasinya
Other Titles: Discrimination Centella asiatica from Hyrocotyle verticillata using Partial Least Square-Discriminant Analysis (PLS-DA) and The Combined Approach
Authors: Syafitri, Utami Dyah
Indahwati
Rafi, Mohamad
Fitriyanti, Sri
Issue Date: 2024
Publisher: IPB University
Abstract: Diskriminasi atau pembedaan kelompok merupakan masalah yang cukup rumit untuk data hasil pengukuran berupa absorbansi dari spektrofotometer Ultraviolet-visible (UV-Vis) karena data yang memiliki karakteristik data berdimensi tinggi (n«p) dan banyak memiliki noise. Metode yang telah banyak digunakan dalam menganalisis pembedaan kelompok pada data spektrum adalah Partial Least Squares-Analysis Diskriminant (PLS-DA), yang memberikan hasil yang baik dan akurat. Perkembangan metode diskriminan melalui machine learning mencakup Orthogonal Partial Least Squares-Analysis Diskriminant (OPLS-DA) dan Artificial Neural Netrwok (ANN), kedua metode ini menawarkan peningkatan akurasi dan efisiensi dalam analisis spektrum. Metode OPLS-DA yang menggunakan tambahan komponen ortogonal untuk mengidentifikasi variabilitas yang tidak relavan dan PLS-ANN metode campuran dari PLS dan ANN yang mengatasi masalah non-linier, keduanya diharapkan dapat meningkatkan akurasi dan efisiensi model. Penelitian ini bertujuan untuk membandingan performa metode diskriminan PLS-DA, OPLS-DA dan PLS-ANN pada penerapan data empiris yang memiliki karakteristik rumit. Data empiris yang digunakan, yaitu data spektrum UV-Vis dari tumbuhan Centella asiatica merupakan data dari tumbuhan yang sering ditemui dalam berbagai bidang kehidupan sehari-hari seperti bidang pengobatan tradisional, kosmetik, dan pangan. Tumbuhan C. asiatica merupakan tumbuhan yang berpotensi dipalsukan yang memiliki arti diganti dengan tumbuhan yang memiliki kemiripan, tumbuhan tersebut yaitu Hydrocotyle verticillata. Diskriminasi data spektrum UV-Vis dari kedua kelompok C. asiatica dan H. verticillata dilakukan dengan menggunakan ketiga metode diskriminan yaitu PLS-DA, OPLS-DA dan PLS-ANN. Berdasarkan data empiris yang digunakan, sampel C. asiatica dan H. verticillata sebagai peubah respon dan panjang gelombang dari spketrofotometer UV-Vis sebagai peubah bebas dengan panjang gelombang total digunakan yaitu 200-800nm sehingga terdapat total 600 peubah bebas. Sampel C. asiatica dan H. verticillata berasal dari daerah yang berbeda yaitu sampel tumbuhan C. asiatica dari lima lokasi yaitu Garut, Malang, Tasikmalaya, Tawangmangu dan Magetan, kemudian tumbuhan H. verticillata dari empat lokasi yaitu Malang, Bogor, Gunung Kidul dan Pati, dengan setiap sampel tersebut diteliti dengan enam kali perulangan sehingga total amatan sebanyak 54 amatan. Pembedaan kelompok C. asiatica dan H. verticillata dengan pemodelan diskriminan PLS-DA, OPLS-DA dan PLS-ANN melalui tahapan awal pra-pengolahan data yang perlu dilakukan pada data spektrum. Metode pra-pengolahan yang digunakan yaitu Standar Normal Variate (SNV) dan Smoothing Savizky-Golay (SG), pra-pengolahan sangat perlu dilakukan untuk menyiapkan data yang konsisten sebelum memasukin analisis selanjutnya. Hasil analisis yang diperoleh menunjukkan bahwa model PLS-ANN memiliki performa yang lebih baik jika dibandingkan dengan metode PLS-DA dan OPLS-DA dalam memisahkan antara kelompok C. asiatica dan kelompok H. verticillata. Performa model yang di evaluasi dengan menggunakan metrik-metrik dari tabel ketepatan klasifikasi seperti sensitivitas, spesifisitas, presisi, F-1 score dan akurasi model. Hasil evaluasi model terbaik PLS-ANN diperoleh memiliki rata-rata nilai diatas 80% menunjukkan bahwa model mampu melakukan pembedaan kelompok dengan sangat baik, akurat, efisien dan juga tepat
Discrimination is challenging problem for data obtained from ultraviolet-visible (UV-Vis) spectrophotometers because it has the characteristics of high-dimensional data (n«p) and the presence of considerable noise. The method that has been commonly used for discriminant sample using spectrum like UV-Vis is partial least squares-discriminant analysis (PLS-DA), yield robust and accurate results. The development of discriminant method through machine learning namely orthogonal partial least squares-discriminant analysis (OPLS-DA) and artificial neural network (ANN) is also widely used, these two methods offer improvements in accuracy and effiency in spectrum analysis. The OPLS-DA method which uses additional orthogonal components to identify irrelevant variabilities and combination between PLS-ANN which overcomes non-linear problem, both methods are expected can enhance the accuracy and efficiency of the models. This research aims to see a comparison of classification methods, namely PLS-DA, OPLS-DA and PLS-ANN in the application of empirical data with complex characteristics. Based on empirical data, namely UV-Vis spectrum data from a plant, Centella asiatica, it is a problem that is commonly encountered in everyday life and is also very widely used in society today, namely in the fields of traditional medicine, cosmetics and food. C. asiatica has a potential to be replaced with plants that have similar morphilogies, namely Hydrocotyle verticillata. Discrimination of UV-Vis spectrum data from both groups, C. asiatica and H. verticillata, is conducted using the three discriminant methods, namely PLS-DA, OPLS-DA, and PLS-ANN. Based on the empirical data used, C. asiatica and H. verticillata samples are the response variables and the wavelengths of the UV-Vis spectrophotometer is independent variable with the total wavelength used being 200-800nm so there are 600 independent variables in total. Samples of C. asiatica and H. verticillata where the two samples came from different areas, namely samples of C. asiatica plants from five different locations, namely Garut, Malang, Tasikmalaya, Tawangmangu and Magetan, then plants H. verticillata from four different locations, namely Malang, Bogor, Gunung Kidul and Pati, with each sample studied in six repetitions for a total of 54 observations. The discriminant of C. asiatica and H. verticillata using the discriminant models PLS-DA, OPLS-DA and PLS-ANN involves initial pre-processing data that need to be performed on spectrum data. The pre-processing methods which is usually used on spectrum data, namely the standar normal variate (SNV) and smoothing Savitzky-Golay (SGs) methods. Pre-processing is used to prepare consistent data before entering further analysis. The analysis results obtained show that the PLS-ANN method has better classification performance when compared to the PLS-DA and OPLS-DA methods in separating between the C. asiatica (Centella asiatica) and the H. verticillata (Hydrocotyle verticillata). Model performance is evaluated using metrics from the classification accuracy metrics such as sensitivity, specificity, precision, F-1 score and accuracy. The best model of PLS-ANN evaluation results show high metric values, it’s average above 80% in average, indicating that the model is able to classification very well, accurately, efficiently and precisely.
URI: http://repository.ipb.ac.id/handle/123456789/154477
Appears in Collections:MT - Mathematics and Natural Science

Files in This Item:
File Description SizeFormat 
cover_G1501211025_b2d79e6cec50470198d5f6f70d945a95.pdfCover500.81 kBAdobe PDFView/Open
fulltext_G1501211025_bde6352616e649929791cd19c9a13ed9.pdf
  Restricted Access
Fulltext3.41 MBAdobe PDFView/Open
lampiran_G1501211025_66f78ea0e7d847f19e32c8ae72ebc175.pdf
  Restricted Access
Lampiran2.33 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.