View Item 
      •   IPB Repository
      • Dissertations and Theses
      • Undergraduate Theses
      • UT - School of Data Science, Mathematic and Informatics
      • UT - Computer Science
      • View Item
      •   IPB Repository
      • Dissertations and Theses
      • Undergraduate Theses
      • UT - School of Data Science, Mathematic and Informatics
      • UT - Computer Science
      • View Item
      JavaScript is disabled for your browser. Some features of this site may not work without it.

      Pengembangan Modifikasi Algoritma Q-Learning melalui Reward Shaping dan Challenge Level untuk Optimasi Jalur Robot

      Thumbnail
      View/Open
      Cover (529.8Kb)
      Fulltext (1.874Mb)
      Lampiran (1.402Mb)
      Date
      2025
      Author
      Fitriyaningsih, Eva
      Hardhienata, Medria Kusuma Dewi
      Hermadi, Irman
      Metadata
      Show full item record
      Abstract
      Optimasi jalur robot di lingkungan yang berubah-ubah merupakan tantangan signifikan. Penelitian ini mengembangkan algoritma Q-Learning yang dimodifikasi menggunakan pendekatan Flow-Based Reinforcement Learning (FBRL) untuk meningkatkan efisiensi dan adaptasi agen. Algoritma ini mengintegrasikan parameter anxiety dan challenge level yang secara adaptif menyesuaikan tingkat kesulitan lingkungan berdasarkan performa agen, yang dipandu oleh reward shaping. Pengujian dilakukan pada lingkungan grid 38×28 berdasarkan peta nyata (ATP IPB), dengan rintangan statis dan non-stasioner yang disesuaikan melalui validasi Breadth-First Search (BFS). Hasil pengujian menunjukkan bahwa pada mode non-stasioner, agen melewati rata-rata 58,2–67,0 state, dengan 12,1–13,3 belokan dan waktu tempuh 70,1–85,3 detik, sesuai tingkat kesulitan lingkungan. Hasil ini kemudian diuji ulang pada mode statis. Pada mode statis dengan tingkat kesulitan rendah, algoritma modifikasi dengan reward shaping menunjukkan tingkat keberhasilan 72,2%–100%, dengan rata-rata 7,2 belokan dan waktu tempuh 61,2 detik, lebih efisien dibanding Q-Learning dasar (15,7 belokan dan waktu 71,1 detik). Pada tingkat kesulitan tinggi, algoritma dasar mengalami penurunan performa (1,8%–40,4%), sedangkan algoritma modifikasi tetap stabil dengan keberhasilan 72,2%–100%.
      URI
      http://repository.ipb.ac.id/handle/123456789/170701
      Collections
      • UT - Computer Science [88]

      Copyright © 2020 Library of IPB University
      All rights reserved
      Contact Us | Send Feedback
      Indonesia DSpace Group 
      IPB University Scientific Repository
      UIN Syarif Hidayatullah Institutional Repository
      Universitas Jember Digital Repository
        

       

      Browse

      All of IPB RepositoryCollectionsBy Issue DateAuthorsTitlesSubjectsThis CollectionBy Issue DateAuthorsTitlesSubjects

      My Account

      Login

      Application

      google store

      Copyright © 2020 Library of IPB University
      All rights reserved
      Contact Us | Send Feedback
      Indonesia DSpace Group 
      IPB University Scientific Repository
      UIN Syarif Hidayatullah Institutional Repository
      Universitas Jember Digital Repository