IPB University Logo

SCIENTIFIC REPOSITORY

IPB University Scientific Repository collects, disseminates, and provides persistent and reliable access to the research and scholarship of faculty, staff, and students at IPB University

AI Repository
 
Building and Categories


      View Item 
      •   IPB Repository
      • Final Assignments
      • Master Final Assignments
      • MF - School of Data Science, Mathematic and Informatics
      • View Item
      •   IPB Repository
      • Final Assignments
      • Master Final Assignments
      • MF - School of Data Science, Mathematic and Informatics
      • View Item
      JavaScript is disabled for your browser. Some features of this site may not work without it.

      MODEL COMBINATORIAL BASE LEARNER STACKING DENGAN OPTIMASI MODIFIED CUCKOO SEARCH UNTUK KLASIFIKASI MULTICLASS SPEKTRUM FTIR KEJI BELING

      Thumbnail
      View/Open
      Cover (641.0Kb)
      Fulltext (3.092Mb)
      Lampiran (396.1Kb)
      Date
      2026
      Author
      Putra, I Gusti Ngurah Sentana
      Syafitri, Utami Dyah
      Kurnia, Anang
      Rafi, Mohamad
      Metadata
      Show full item record
      Abstract
      Spektroskopi Fourier Transform Infrared (FTIR) merupakan teknik analisis kimia yang mampu mengkarakterisasi komposisi molekuler sampel secara cepat dan tidak destruktif, sehingga banyak digunakan alam bidang farmasi, pangan, dan biologi. Salah satu tantangan utama dalam analisis data FTIR terletak pada karakteristiknya yang berdimensi sangat tinggi (high dimensional), di mana jumlah variabel spektral (p) jauh melebihi jumlah sampel (n), sehingga menimbulkan risiko multikolinearitas, overfitting, dan penurunan akurasi prediksi. Tantangan ini semakin kompleks ketika klasifikasi yang dihadapi bersifat multiclass dengan distribusi sampel yang tidak seimbang, seperti pada kasus autentikasi tanaman Keji Beling (Strobilanthes crispus) yang rentan dicampur dengan Sirih Hutan (Piper aduncum) akibat kemiripan morfologi dan selisih nilai ekonomi keduanya. Pendekatan ensemble stacking dipandang berpotensi mengatasi keterbatasan model tunggal dalam menangani data berdimensi tinggi, namun pemilihan kombinasi base learner yang tidak optimal dapat menurunkan performa model secara signifikan. Selain itu, metode stacking konvensional juga menghadapi keterbatasan dalam interpretasi kepentingan fitur akibat sifat black-box dari meta learner. Penelitian ini bertujuan untuk menganalisis pengaruh prapemrosesan data terhadap performa klasifikasi spektrum FTIR, membandingkan performa metode combinatorial base learner stacking yang dioptimasi dengan algoritma Modified Cuckoo Search (MOCS), serta mengidentifikasi gugus fungsi spektral yang membedakan Keji Beling dan Sirih Hutan. Data yang digunakan merupakan data spektrum FTIR-ATR dari 223 amatan yang terdiri atas lima kelas, yaitu 100% Keji Beling, 100% Sirih Hutan, serta campuran Sirih Hutan dengan proporsi 5%, 25%, dan 50%. Prapemrosesan dilakukan dengan empat skenario, yaitu Savitzky-Golay (SG), Standard normal variate (SNV), serta kombinasi keduanya (SNV+SG dan SG+SNV). Pendekatan combinatorial base learner stacking mengeksplorasi semua subset kombinasi dari empat base learner dengan dua pilihan meta learner, yaitu XGBoost dan regresi logistik. Optimasi hyperparameter dilakukan menggunakan algoritma MOCS yang memodifikasi Cuckoo Search standar melalui penerapan dynamic discovery probability dan fungsi objektif multi-objective. Evaluasi kinerja model dilakukan menggunakan empat metrik utama, yaitu akurasi, F1-score, Balanced Accuracy (BA), dan G-mean. Uji ANOVA empat faktor diterapkan untuk menilai pengaruh prapemrosesan, jenis model, konfigurasi cuckoo, dan rasio pembagian data secara simultan beserta interaksinya. Uji lanjut Tukey HSD digunakan untuk mengidentifikasi perbedaan antarperlakuan secara lebih rinci. Validitas dan konsistensi interpretasi kepentingan fitur antara pendekatan base learner dan stacking feature importance aggregation dinilai menggunakan Intraclass Correlation Coefficient (ICC) dan Kendall’s Coefficient of Concordance (W). Metode bagging dan boosting yang dioptimasi dengan MOCS menemukan bahwa prapemrosesan merupakan faktor penentu terhadap performa klasifikasi. Data tanpa prapemrosesan menghasilkan performa yang relatif rendah pada seluruh algoritma, dengan akurasi terbaik hanya mencapai 0,7548 pada LightGBM di skema 80:20, yang mengindikasikan bahwa variabilitas spektral akibat pergeseran garis dasar dan noise belum teratasi. Sebaliknya, penerapan SNV dikombinasikan dengan SG menghasilkan peningkatan performa konsisten pada seluruh algoritma. Dalam perbandingan metode boosting dan bagging, Analisis komparatif antara MOCS dan Cuckoo Search standar (CSO) melalui uji ANOVA menunjukkan bahwa keduanya tidak berbeda signifikan pada seluruh metrik kinerja prediktif, namun MOCS secara signifikan lebih efisien secara komputasi dengan penghematan waktu rata-rata sebesar 347 detik atau 47,56% dibandingkan CSO, sebuah perbaikan yang merepresentasikan prinsip Pareto improvement karena kualitas prediksi setara diperoleh dengan biaya komputasi yang jauh lebih rendah. Variasi konfigurasi jumlah nest (5, 15, dan 25) tidak memberikan pengaruh signifikan terhadap metrik kinerja pada seluruh skenario, menegaskan bahwa mekanisme pembaruan solusi berbasis Lévy flight pada algoritma CS bersifat independen terhadap ukuran populasi dalam rentang yang diuji. Combinatorial base learner stacking menunjukkan bahwa pendekatan ini secara konsisten dan signifikan mengungguli seluruh base learner individu maupun stacking konvensional pada hampir semua kombinasi prapemrosesan dan rasio pembagian data. Peningkatan performa paling signifikan diperoleh ketika best combinatorial base learner stacking berbasis meta learner XGBoost dipadukan dengan prapemrosesan SNV+SG atau SG+SNV, menghasilkan akurasi hingga 0,9889 dan BA sebesar 0,9821 pada skema 80:20, dengan deviasi standar yang sangat rendah yang menandakan stabilitas model antar ulangan. Analisis kombinasi base learner menunjukkan bahwa penggunaan seluruh base learner sekaligus tidak selalu menghasilkan performa tertinggi, yang menegaskan bahwa kualitas dan keberagaman antara model lebih menentukan performa dibandingkan jumlah model dalam ensemble. Hasil ANOVA empat faktor mengonfirmasi bahwa prapemrosesan dan jenis model merupakan faktor paling dominan terhadap seluruh metrik kinerja, interaksi keduanya signifikan, sementara konfigurasi cuckoo tidak berpengaruh signifikan terhadap metrik kinerja namun berpengaruh terhadap waktu komputasi. Pendekatan stacking feature importance aggregation yang menggabungkan nilai SHAP dari base learner dengan bobot koefisien meta learner berhasil meningkatkan konsistensi kepentingan fitur secara signifikan, dengan ICC meningkat sebesar 26,4% dan Kendall’s W meningkat 7,7% dibandingkan pendekatan tanpa stacking, yang memperkuat validitas kimiawi interpretasi model. Dua wilayah bilangan gelombang paling kritis yang teridentifikasi sebagai spectral marker pembeda utama kedua tanaman adalah daerah aromatik (~1602–1606 cm?¹) yang mencerminkan dominasi senyawa fenolik/flavonoid kompleks pada Keji Beling, dan daerah C–O/C–N (~1223–1225 cm?¹) yang berkaitan dengan sidik jari alkaloid aromatik pada Sirih Hutan, sehingga gugus fungsi pada kedua wilayah tersebut dapat ditetapkan sebagai penanda spektral yang andal untuk keperluan autentikasi berbasis FTIR.
      URI
      http://repository.ipb.ac.id/handle/123456789/173605
      Collections
      • MF - School of Data Science, Mathematic and Informatics [100]

      Copyright © 2020 Library of IPB University
      All rights reserved
      Contact Us | Send Feedback
      Indonesia DSpace Group 
      IPB University Scientific Repository
      UIN Syarif Hidayatullah Institutional Repository
      Universitas Jember Digital Repository
        

       

      Browse

      All of IPB RepositoryCollectionsBy Issue DateAuthorsTitlesSubjectsThis CollectionBy Issue DateAuthorsTitlesSubjects

      My Account

      Login

      Application

      google store

      Copyright © 2020 Library of IPB University
      All rights reserved
      Contact Us | Send Feedback
      Indonesia DSpace Group 
      IPB University Scientific Repository
      UIN Syarif Hidayatullah Institutional Repository
      Universitas Jember Digital Repository