Show simple item record

dc.contributor.advisorHendrayanto
dc.contributor.advisorJaya, I Nengah Surati
dc.contributor.authorRama, Khairut Tamam Dwi
dc.date.accessioned2026-06-04T08:50:33Z
dc.date.available2026-06-04T08:50:33Z
dc.date.issued2026
dc.identifier.urihttp://repository.ipb.ac.id/handle/123456789/173240
dc.description.abstractLongsor merupakan salah satu bencana alam yang paling sering terjadi dan merusak di Indonesia. Pemerintah Indonesia dalam upaya pengendalian bencana longsor telah melakukan penilaian kerawanan longsor. Namun, penilaian kerawanan nasional masih menggunakan pendekatan heuristik yang didasarkan pada pendapat para ahli. Pendekatan heuristik dengan penilaian ahli dianggap praktis dalam penggunaannya, namun pendekatan ini memiliki keterbatasan dalam menafsirkan tingkat pengaruh masing-masing variabel yang menyebabkan tanah longsor. Penelitian ini mengevaluasi kinerja dan interpretasi dua model Machine Learning (ML), yaitu Regresi Logistik dan Pohon Keputusan, dibandingkan dengan kerangka kerja heuristik nasional untuk pemetaan kerawanan longsor di sub-DAS Ciujung, Jawa Barat–Banten. Model dikembangkan menggunakan NASA Global Landslide Catalog dan 13 faktor pengontrol pada resolusi spasial 30 m. Faktor-faktor ini meliputi kemiringan lereng, ketinggian, arah lereng, panjang lereng, dan akumulasi aliran permukaan yang diperoleh dari DEM Copernicus GLO 30; litologi dan jarak ke patahan dari peta geologi; NDVI dari citra Landsat 8; tekstur tanah dari SPT tanah; jarak ke sungai dan jarak ke jalan dari RBI; curah hujan tahunan dari CHIRPS; serta penggunaan lahan dari peta penggunaan lahan. Hasil menunjukkan bahwa Regresi Logistik dan Pohon Keputusan memiliki kinerja prediktif tinggi (kappa = 0.9). Pada evaluasi spasial, Pohon Keputusan unggul pada seluruh metrik termasuk recall yang mendekati sempurna, sementara model Heuristik juga mencatatkan recall tinggi namun dengan spesifisitas yang sangat rendah, mencerminkan kecenderungannya memprediksi lebih (overprediction) luas zona rawan. Analisis tingkat kepentingan faktor mengungkap bahwa kedua model Machine Learning (ML) mengidentifikasi faktor utama yang berbeda: Regresi Logistik menempatkan curah hujan tahunan sebagai faktor dengan koefisien terbesar, sedangkan Pohon Keputusan menempatkan penggunaan lahan sebagai faktor paling dominan. Keduanya menunjukkan bahwa tekstur tanah berpasir berasosiasi dengan penurunan probabilitas longsor dan penggunaan lahan pertanian lahan kering campuran cenderung meningkatkan probabilitas longsor. Sebaliknya, pendekatan Heuristik lebih menekankan faktor kemiringan dan litologi sebagai faktor utama. Peran kemiringan lereng tidak signifikan karena inventori NASA GLC didominasi oleh longsor tipe mudflow, yang terjadi akibat kejenuhan air sehingga material berperilaku seperti fluida. Dalam kondisi ini, kemiringan lebih berperan pada tahap inisiasi, tetapi tidak sebagai pembeda utama ketika kejenuhan tanah tercapai. Selain itu, poligon longsor yang mencakup area sumber, lintasan, dan deposisi menyebabkan variasi nilai kemiringan dalam kelas longsor meningkat, sehingga menurunkan daya diskriminatifnya. Secara konseptual, Regresi Logistik merepresentasikan gradien hidrogemorfik yang halus dan memberikan interpretasi probabilistik yang stabil, sementara Pohon Keputusan lebih efektif dalam menangkap interaksi nonlinier dan ambang batas lokal, terutama terkait heterogenitas penggunaan lahan dan tekstur tanah. Analisis residual menunjukkan adanya bias sistematis: Regresi Logistik cenderung memprediksi kurang (underprediction) risiko pada tanah berpasir di elevasi menengah, sedangkan Pohon Keputusan berpotensi memprediksi lebih (overprediction) pada zona pertanian dengan tanah liat. Model ML yang dapat diinterpretasikan terbukti lebih selaras dengan mekanisme fisik longsor yang sebenarnya dibandingkan dengan pendekatan heuristik yang memprioritaskan kemiringan lereng dan litologi. Penelitian ini menyimpulkan bahwa regresi logistik dan pohon keputusan merupakan pendekatan alternatif penilaian kerawanan longsor yang transparan, dapat diproduksi ulang, dan relevan untuk kebijakan, serta merekomendasikan integrasi model ini ke dalam platform pemetaan risiko nasional, dengan penguatan pada data hidrometeorologi beresolusi tinggi dan indikator perubahan penggunaan lahan.
dc.description.abstractLandslides are among the most frequent and damaging natural hazards in Indonesia. In its efforts to manage landslides, the Indonesian government has conducted landslide susceptibility assessments. However, these assessments still rely on a heuristic approach based on expert opinions. The heuristic approach with expert assessment is considered practical, but it has limitations in interpreting the relative influence of each variable on landslides. This study evaluates the performance and interpretability of two Machine Learning (ML) models, Logistic Regression and Decision Tree, compared with the heuristic baseline for landslide susceptibility mapping in the Ciujung sub-watershed, West Java–Banten. The models were developed using the NASA Global Landslide Catalog and thirteen conditioning factors at a 30 m spatial resolution. These factors include slope gradient, elevation, slope aspect, slope length, and surface runoff accumulation obtained from the Copernicus GLO 30 DEM; lithology and distance to faults from geological maps; NDVI from Landsat 8 imagery; soil texture from soil SPT; distance to rivers and distance to roads from RBI; annual precipitation from CHIRPS; and land use from land-use maps. Both Logistic Regression and Decision Tree achieved high predictive accuracy (kappa = 0.9). In spatial evaluation, Decision Tree outperformed the other models across all metrics, including near-perfect recall, while the Heuristic model also recorded high recall but with very low specificity, reflecting its tendency to overestimate hazard zones. Feature analysis revealed that the two models identified different primary factors: Logistic Regression identified annual rainfall as the factor with the largest regression coefficient, whereas Decision Tree identified land use as the most dominant factor. Both models showed that sandy soil texture was associated with a lower probability of landslides and mixed dryland agricultural land use tended to increase it. In contrast, the heuristic approach placed greater emphasis on slope and lithology as the primary factors. The role of slope gradient is not significant because the NASA GLC inventory is dominated by mudflow-type landslides, which occur when water saturation causes the material to behave like a fluid. Under these conditions, slope plays a greater role during the initiation stage but is not a primary determinant once soil saturation is reached. Additionally, landslide polygons encompassing source, runout, and deposition areas cause variations in slope values within landslide classes to increase, thereby reducing their discriminatory power. Conceptually, Logistic Regression captures subtle hydrogeomorphic gradients and provides a stable probabilistic interpretation, while Decision Trees are more effective at capturing nonlinear interactions and local thresholds, particularly those related to land-use heterogeneity and soil texture. Residual analysis revealed systematic model biases: Logistic Regression tended to underpredict risk in moderately elevated sandy soils, whereas Decision Tree sometimes overpredicted risk in clay-rich agricultural zones. The Heuristic model exhibited the strongest bias, disproportionately emphasizing slope and lithology, resulting in generalized, less process-aligned hazard patterns. Interpretable ML models proved more aligned with the physical mechanisms underlying landslides than heuristic approaches that prioritize slope gradient and lithology. This study concludes that Logistic regression and decision trees are transparent, reproducible, and policy-relevant alternatives for landslide susceptibility assessment, and recommends integrating these models into national risk-mapping platforms, with an emphasis on high-resolution hydrometeorological data and dynamic land-management indicators.
dc.description.sponsorship
dc.language.isoid
dc.publisherIPB Universityid
dc.titleAnalisis Kinerja dan Interpretabilitas Model Regresi Logistik dan Pohon Keputusan untuk Pemetaan Kerawanan Longsorid
dc.title.alternativePerformance and Interpretability Analysis of Logistic Regression and Decision Tree Models for Landslide Susceptibility Mapping
dc.typeTesis
dc.subject.keywordKerawanan longsorid
dc.subject.keywordMachine learningid
dc.subject.keywordPohon Keputusanid
dc.subject.keywordregresi logistikid
dc.subject.keywordlandslide susceptibilityid
dc.subject.keyworddecision treeid
dc.subject.keywordlogistic regressionid


Files in this item

Thumbnail
Thumbnail
Thumbnail

This item appears in the following Collection(s)

Show simple item record