Analisis kinerja algoretme shift-or, knuth-morris-pratt dan boyer-moore pada pelacakan string eksak

Maryani, Sri

View/Open

Fulltext (5.959Mb)

Date

2004

Author

Maryani, Sri

Karyadin, Rindang

Julianto, Mochamad Tito

Metadata

Show full item record

Abstract

Meski data dapat disimpan dalam berbagai bentuk, tetapi bentuk teks mendominasi dalam pertukaran informasi. Pelacakan string merupakan subyek penting pada pemrosesan teks. Proses pelacakan string pada suatu file teks adalah aplikasi umum yang telah diterapkan mulai dari editor teks, basis data, aplikasi biologi molekuler, temu kembali bibliografi, dan manipulasi simbol. Data akan meningkat pesat seiring dengan berjalannya waktu. Meski kapasitas penyimpanan dan kecepatan komputer turut meningkat, perlu didesain algoritme pelacakan string yang efektif dan efisien. Terdapat banyak algoritme yang digunakan pada pelacakan string eksak, di antaranya adalah algoritme Knuth-Morris-Pratt (KMP) dan algoritme Boyer-Moore (BM). KMP bekerja dengan cara menyepadankan karakter pola dengan teks mulai dari kiri ke kanan. Ketika terjadi ketidaksepadanan maka pola akan digeser sejauh tagged border. BM menyepadankan karakter pola dengan teks mulai dari kanan ke kiri. Ketika terjadi ketidaksepadanan, pola akan digeser ke kanan berdasarkan dua pendekatan yaitu: good- suffix dan bad-character. Terdapat pendekatan berbeda pada pelacakan string eksak yaitu algoritme Shift- OR (SO). Perbedaan tersebut terletak pada representasi pelacakan sebagai state bit berukuran panjang pola (m) dan menggunakan operasi bitwise left-shift dan operasi logika OR. Kelemahan algoritme ini adalah keterbatasan panjang pola yang dapat dilacak pada memory-word size machine (register). Hasil percobaan pelacakan pola pada suatu file teks menunjukkan bahwa 40.9%-45.7% waktu temu SO lebih cepat dari waktu temu KMP untuk seluruh m (2-32 karakter), dan 4.7%-63.8% lebih cepat dari waktu temu BM untuk m≤6 karakter. Waktu temu SO dan KMP dipengaruhi ukuran file (n) dan tidak dipengaruhi m, sedangkan waktu temu BM dipengaruhi oleh kombinasi m dan n. Ketiga algoritme tersebut dapat menemukan keberadaan string atau substring pada teks yang sesuai pola dengan baik. Penerapan ketiga algoritme pada pelacakan file teks menghasilkan waktu temu SO lebih cepat dari waktu temu KMP untuk semua m (2 - 32 karakter) dan lebih cepat dari waktu temu BM untuk m ≤ 3 karakter. Ketiga algoritme mampu melacak dan menampilkan file teks lebih baik dari segi jumlah temu file bila dibandingkan dengan pelacakan menggunakan fasilitas Search yang dimiliki Windows XP.

URI

http://repository.ipb.ac.id/handle/123456789/134440

Collections

UT - Computer Science [2482]