Implementasi dan Analisis Kinerja Hadoop Cluster Pada Raspberry Pi untuk Penjajaran Sekuens DNA
View/ Open
Date
2015Author
Turana, Jaya Sena
Sukoco, Heru
Kusuma, Wisnu Ananta
Metadata
Show full item recordAbstract
Saat ini, hampir semua data tersimpan dalam bentuk data elektronik. Perkembangan data elektronik dari waktu ke waktu yang sangat pesat memunculkan istilah big data. Big data memiliki tiga karakteristik yaitu : volume, variety, dan velocity. Volume mengacu pada besar data, variety mengacu pada keragaman jenis data (data text, sensor, audio, video, dll), dan velocity mengacu pada frekuensi dari data yang dihasilkan oleh aplikasi atau kecepatan analisis dari data yang dihasilkan tersebut. Big data membawa dua tantangan mendasar yaitu bagaimana untuk menyimpan dan mengolah data dalam ukuran yang sangat besar, dan yang paling penting yaitu bagaimana untuk memahami data dan mengubahnya menjadi informasi yang berharga. Permasalahan utama yang timbul dalam mengelola big data pada saat ini yaitu besarnya biaya yang harus dikeluarkan baik untuk perangkat keras maupun perangkat lunak. Selain itu, penggunaan energi listrik yang cukup besar dari banyaknya perangkat keras yang digunakan juga berdampak tidak ramah terhadap lingkungan. Nowadays, most of all data stored in electronic form. The electronic data growth is quite rapid time after time so that the term big data appears. IBM defines Big data as having three characteristics: volume, variety and velocity. Volume refers to the size of the data, variety refers to the type of the data (text, sensory data, audio, video, etc.) and velocity refers to the frequency of the data that is produced by an application or the analyzing speed of the data produced. Two major challenges with big data are how to store it and how to process it. The most important thing is how to understand the data and transform it into meaningful information. The main problems in processing big data are the high cost, both for the hardware and the software, and computational power. One other problem is it requires a lot of electricity to power the hardware which in turn has an adverse effect on the environment.