Analisis kinerja algoretme shift-or, knuth-morris-pratt dan boyer-moore pada pelacakan string eksak

Maryani, Sri

Please use this identifier to cite or link to this item: http://repository.ipb.ac.id/handle/123456789/134440

Title:	Analisis kinerja algoretme shift-or, knuth-morris-pratt dan boyer-moore pada pelacakan string eksak
Authors:	Karyadin, Rindang Julianto, Mochamad Tito Maryani, Sri
Issue Date:	2004
Publisher:	IPB University
Abstract:	Meski data dapat disimpan dalam berbagai bentuk, tetapi bentuk teks mendominasi dalam pertukaran informasi. Pelacakan string merupakan subyek penting pada pemrosesan teks. Proses pelacakan string pada suatu file teks adalah aplikasi umum yang telah diterapkan mulai dari editor teks, basis data, aplikasi biologi molekuler, temu kembali bibliografi, dan manipulasi simbol. Data akan meningkat pesat seiring dengan berjalannya waktu. Meski kapasitas penyimpanan dan kecepatan komputer turut meningkat, perlu didesain algoritme pelacakan string yang efektif dan efisien. Terdapat banyak algoritme yang digunakan pada pelacakan string eksak, di antaranya adalah algoritme Knuth-Morris-Pratt (KMP) dan algoritme Boyer-Moore (BM). KMP bekerja dengan cara menyepadankan karakter pola dengan teks mulai dari kiri ke kanan. Ketika terjadi ketidaksepadanan maka pola akan digeser sejauh tagged border. BM menyepadankan karakter pola dengan teks mulai dari kanan ke kiri. Ketika terjadi ketidaksepadanan, pola akan digeser ke kanan berdasarkan dua pendekatan yaitu: good- suffix dan bad-character. Terdapat pendekatan berbeda pada pelacakan string eksak yaitu algoritme Shift- OR (SO). Perbedaan tersebut terletak pada representasi pelacakan sebagai state bit berukuran panjang pola (m) dan menggunakan operasi bitwise left-shift dan operasi logika OR. Kelemahan algoritme ini adalah keterbatasan panjang pola yang dapat dilacak pada memory-word size machine (register). Hasil percobaan pelacakan pola pada suatu file teks menunjukkan bahwa 40.9%-45.7% waktu temu SO lebih cepat dari waktu temu KMP untuk seluruh m (2-32 karakter), dan 4.7%-63.8% lebih cepat dari waktu temu BM untuk m≤6 karakter. Waktu temu SO dan KMP dipengaruhi ukuran file (n) dan tidak dipengaruhi m, sedangkan waktu temu BM dipengaruhi oleh kombinasi m dan n. Ketiga algoritme tersebut dapat menemukan keberadaan string atau substring pada teks yang sesuai pola dengan baik. Penerapan ketiga algoritme pada pelacakan file teks menghasilkan waktu temu SO lebih cepat dari waktu temu KMP untuk semua m (2 - 32 karakter) dan lebih cepat dari waktu temu BM untuk m ≤ 3 karakter. Ketiga algoritme mampu melacak dan menampilkan file teks lebih baik dari segi jumlah temu file bila dibandingkan dengan pelacakan menggunakan fasilitas Search yang dimiliki Windows XP.
URI:	http://repository.ipb.ac.id/handle/123456789/134440
Appears in Collections:	UT - Computer Science

Files in This Item:

File	Size	Format
G04sma.pdf Restricted Access	6.1 MB	Adobe PDF	View/Open

Show full item record Recommend this item

DSpace JSPUI

DSpace preserves and enables easy and open access to all types of digital content including text, images, moving images, mpegs and data sets