IPB University Logo

SCIENTIFIC REPOSITORY

IPB University Scientific Repository collects, disseminates, and provides persistent and reliable access to the research and scholarship of faculty, staff, and students at IPB University

AI Repository
 
Building and Categories


      View Item 
      •   IPB Repository
      • Dissertations and Theses
      • Master Theses
      • MT - Forestry
      • View Item
      •   IPB Repository
      • Dissertations and Theses
      • Master Theses
      • MT - Forestry
      • View Item
      JavaScript is disabled for your browser. Some features of this site may not work without it.

      Analisis Kinerja dan Interpretabilitas Model Regresi Logistik dan Pohon Keputusan untuk Pemetaan Kerawanan Longsor

      Thumbnail
      View/Open
      Cover (932.8Kb)
      Fulltext (7.697Mb)
      Lampiran (378.6Kb)
      Date
      2026
      Author
      Rama, Khairut Tamam Dwi
      Hendrayanto
      Jaya, I Nengah Surati
      Metadata
      Show full item record
      Abstract
      Longsor merupakan salah satu bencana alam yang paling sering terjadi dan merusak di Indonesia. Pemerintah Indonesia dalam upaya pengendalian bencana longsor telah melakukan penilaian kerawanan longsor. Namun, penilaian kerawanan nasional masih menggunakan pendekatan heuristik yang didasarkan pada pendapat para ahli. Pendekatan heuristik dengan penilaian ahli dianggap praktis dalam penggunaannya, namun pendekatan ini memiliki keterbatasan dalam menafsirkan tingkat pengaruh masing-masing variabel yang menyebabkan tanah longsor. Penelitian ini mengevaluasi kinerja dan interpretasi dua model Machine Learning (ML), yaitu Regresi Logistik dan Pohon Keputusan, dibandingkan dengan kerangka kerja heuristik nasional untuk pemetaan kerawanan longsor di sub-DAS Ciujung, Jawa Barat–Banten. Model dikembangkan menggunakan NASA Global Landslide Catalog dan 13 faktor pengontrol pada resolusi spasial 30 m. Faktor-faktor ini meliputi kemiringan lereng, ketinggian, arah lereng, panjang lereng, dan akumulasi aliran permukaan yang diperoleh dari DEM Copernicus GLO 30; litologi dan jarak ke patahan dari peta geologi; NDVI dari citra Landsat 8; tekstur tanah dari SPT tanah; jarak ke sungai dan jarak ke jalan dari RBI; curah hujan tahunan dari CHIRPS; serta penggunaan lahan dari peta penggunaan lahan. Hasil menunjukkan bahwa Regresi Logistik dan Pohon Keputusan memiliki kinerja prediktif tinggi (kappa = 0.9). Pada evaluasi spasial, Pohon Keputusan unggul pada seluruh metrik termasuk recall yang mendekati sempurna, sementara model Heuristik juga mencatatkan recall tinggi namun dengan spesifisitas yang sangat rendah, mencerminkan kecenderungannya memprediksi lebih (overprediction) luas zona rawan. Analisis tingkat kepentingan faktor mengungkap bahwa kedua model Machine Learning (ML) mengidentifikasi faktor utama yang berbeda: Regresi Logistik menempatkan curah hujan tahunan sebagai faktor dengan koefisien terbesar, sedangkan Pohon Keputusan menempatkan penggunaan lahan sebagai faktor paling dominan. Keduanya menunjukkan bahwa tekstur tanah berpasir berasosiasi dengan penurunan probabilitas longsor dan penggunaan lahan pertanian lahan kering campuran cenderung meningkatkan probabilitas longsor. Sebaliknya, pendekatan Heuristik lebih menekankan faktor kemiringan dan litologi sebagai faktor utama. Peran kemiringan lereng tidak signifikan karena inventori NASA GLC didominasi oleh longsor tipe mudflow, yang terjadi akibat kejenuhan air sehingga material berperilaku seperti fluida. Dalam kondisi ini, kemiringan lebih berperan pada tahap inisiasi, tetapi tidak sebagai pembeda utama ketika kejenuhan tanah tercapai. Selain itu, poligon longsor yang mencakup area sumber, lintasan, dan deposisi menyebabkan variasi nilai kemiringan dalam kelas longsor meningkat, sehingga menurunkan daya diskriminatifnya. Secara konseptual, Regresi Logistik merepresentasikan gradien hidrogemorfik yang halus dan memberikan interpretasi probabilistik yang stabil, sementara Pohon Keputusan lebih efektif dalam menangkap interaksi nonlinier dan ambang batas lokal, terutama terkait heterogenitas penggunaan lahan dan tekstur tanah. Analisis residual menunjukkan adanya bias sistematis: Regresi Logistik cenderung memprediksi kurang (underprediction) risiko pada tanah berpasir di elevasi menengah, sedangkan Pohon Keputusan berpotensi memprediksi lebih (overprediction) pada zona pertanian dengan tanah liat. Model ML yang dapat diinterpretasikan terbukti lebih selaras dengan mekanisme fisik longsor yang sebenarnya dibandingkan dengan pendekatan heuristik yang memprioritaskan kemiringan lereng dan litologi. Penelitian ini menyimpulkan bahwa regresi logistik dan pohon keputusan merupakan pendekatan alternatif penilaian kerawanan longsor yang transparan, dapat diproduksi ulang, dan relevan untuk kebijakan, serta merekomendasikan integrasi model ini ke dalam platform pemetaan risiko nasional, dengan penguatan pada data hidrometeorologi beresolusi tinggi dan indikator perubahan penggunaan lahan.
       
      Landslides are among the most frequent and damaging natural hazards in Indonesia. In its efforts to manage landslides, the Indonesian government has conducted landslide susceptibility assessments. However, these assessments still rely on a heuristic approach based on expert opinions. The heuristic approach with expert assessment is considered practical, but it has limitations in interpreting the relative influence of each variable on landslides. This study evaluates the performance and interpretability of two Machine Learning (ML) models, Logistic Regression and Decision Tree, compared with the heuristic baseline for landslide susceptibility mapping in the Ciujung sub-watershed, West Java–Banten. The models were developed using the NASA Global Landslide Catalog and thirteen conditioning factors at a 30 m spatial resolution. These factors include slope gradient, elevation, slope aspect, slope length, and surface runoff accumulation obtained from the Copernicus GLO 30 DEM; lithology and distance to faults from geological maps; NDVI from Landsat 8 imagery; soil texture from soil SPT; distance to rivers and distance to roads from RBI; annual precipitation from CHIRPS; and land use from land-use maps. Both Logistic Regression and Decision Tree achieved high predictive accuracy (kappa = 0.9). In spatial evaluation, Decision Tree outperformed the other models across all metrics, including near-perfect recall, while the Heuristic model also recorded high recall but with very low specificity, reflecting its tendency to overestimate hazard zones. Feature analysis revealed that the two models identified different primary factors: Logistic Regression identified annual rainfall as the factor with the largest regression coefficient, whereas Decision Tree identified land use as the most dominant factor. Both models showed that sandy soil texture was associated with a lower probability of landslides and mixed dryland agricultural land use tended to increase it. In contrast, the heuristic approach placed greater emphasis on slope and lithology as the primary factors. The role of slope gradient is not significant because the NASA GLC inventory is dominated by mudflow-type landslides, which occur when water saturation causes the material to behave like a fluid. Under these conditions, slope plays a greater role during the initiation stage but is not a primary determinant once soil saturation is reached. Additionally, landslide polygons encompassing source, runout, and deposition areas cause variations in slope values within landslide classes to increase, thereby reducing their discriminatory power. Conceptually, Logistic Regression captures subtle hydrogeomorphic gradients and provides a stable probabilistic interpretation, while Decision Trees are more effective at capturing nonlinear interactions and local thresholds, particularly those related to land-use heterogeneity and soil texture. Residual analysis revealed systematic model biases: Logistic Regression tended to underpredict risk in moderately elevated sandy soils, whereas Decision Tree sometimes overpredicted risk in clay-rich agricultural zones. The Heuristic model exhibited the strongest bias, disproportionately emphasizing slope and lithology, resulting in generalized, less process-aligned hazard patterns. Interpretable ML models proved more aligned with the physical mechanisms underlying landslides than heuristic approaches that prioritize slope gradient and lithology. This study concludes that Logistic regression and decision trees are transparent, reproducible, and policy-relevant alternatives for landslide susceptibility assessment, and recommends integrating these models into national risk-mapping platforms, with an emphasis on high-resolution hydrometeorological data and dynamic land-management indicators.
       
      URI
      http://repository.ipb.ac.id/handle/123456789/173244
      Collections
      • MT - Forestry [1557]

      Copyright © 2020 Library of IPB University
      All rights reserved
      Contact Us | Send Feedback
      Indonesia DSpace Group 
      IPB University Scientific Repository
      UIN Syarif Hidayatullah Institutional Repository
      Universitas Jember Digital Repository
        

       

      Browse

      All of IPB RepositoryCollectionsBy Issue DateAuthorsTitlesSubjectsThis CollectionBy Issue DateAuthorsTitlesSubjects

      My Account

      Login

      Application

      google store

      Copyright © 2020 Library of IPB University
      All rights reserved
      Contact Us | Send Feedback
      Indonesia DSpace Group 
      IPB University Scientific Repository
      UIN Syarif Hidayatullah Institutional Repository
      Universitas Jember Digital Repository