Please use this identifier to cite or link to this item: http://repository.ipb.ac.id/handle/123456789/134440
Title: Analisis kinerja algoretme shift-or, knuth-morris-pratt dan boyer-moore pada pelacakan string eksak
Authors: Karyadin, Rindang
Julianto, Mochamad Tito
Maryani, Sri
Issue Date: 2004
Publisher: IPB University
Abstract: Meski data dapat disimpan dalam berbagai bentuk, tetapi bentuk teks mendominasi dalam pertukaran informasi. Pelacakan string merupakan subyek penting pada pemrosesan teks. Proses pelacakan string pada suatu file teks adalah aplikasi umum yang telah diterapkan mulai dari editor teks, basis data, aplikasi biologi molekuler, temu kembali bibliografi, dan manipulasi simbol. Data akan meningkat pesat seiring dengan berjalannya waktu. Meski kapasitas penyimpanan dan kecepatan komputer turut meningkat, perlu didesain algoritme pelacakan string yang efektif dan efisien. Terdapat banyak algoritme yang digunakan pada pelacakan string eksak, di antaranya adalah algoritme Knuth-Morris-Pratt (KMP) dan algoritme Boyer-Moore (BM). KMP bekerja dengan cara menyepadankan karakter pola dengan teks mulai dari kiri ke kanan. Ketika terjadi ketidaksepadanan maka pola akan digeser sejauh tagged border. BM menyepadankan karakter pola dengan teks mulai dari kanan ke kiri. Ketika terjadi ketidaksepadanan, pola akan digeser ke kanan berdasarkan dua pendekatan yaitu: good- suffix dan bad-character. Terdapat pendekatan berbeda pada pelacakan string eksak yaitu algoritme Shift- OR (SO). Perbedaan tersebut terletak pada representasi pelacakan sebagai state bit berukuran panjang pola (m) dan menggunakan operasi bitwise left-shift dan operasi logika OR. Kelemahan algoritme ini adalah keterbatasan panjang pola yang dapat dilacak pada memory-word size machine (register). Hasil percobaan pelacakan pola pada suatu file teks menunjukkan bahwa 40.9%-45.7% waktu temu SO lebih cepat dari waktu temu KMP untuk seluruh m (2-32 karakter), dan 4.7%-63.8% lebih cepat dari waktu temu BM untuk m≤6 karakter. Waktu temu SO dan KMP dipengaruhi ukuran file (n) dan tidak dipengaruhi m, sedangkan waktu temu BM dipengaruhi oleh kombinasi m dan n. Ketiga algoritme tersebut dapat menemukan keberadaan string atau substring pada teks yang sesuai pola dengan baik. Penerapan ketiga algoritme pada pelacakan file teks menghasilkan waktu temu SO lebih cepat dari waktu temu KMP untuk semua m (2 - 32 karakter) dan lebih cepat dari waktu temu BM untuk m ≤ 3 karakter. Ketiga algoritme mampu melacak dan menampilkan file teks lebih baik dari segi jumlah temu file bila dibandingkan dengan pelacakan menggunakan fasilitas Search yang dimiliki Windows XP.
URI: http://repository.ipb.ac.id/handle/123456789/134440
Appears in Collections:UT - Computer Science

Files in This Item:
File SizeFormat 
G04sma.pdf
  Restricted Access
6.1 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.