Please use this identifier to cite or link to this item: http://repository.ipb.ac.id/handle/123456789/115432
Title: Pengembangan Library Python untuk Mencari Persamaan Terbaik dalam Perhitungan Kemiripan dan Jarak pada Data Biner
Authors: Wijaya, Sony Hartono
Ramdhani, Muhammad Dwiki
Issue Date: 2022
Publisher: IPB University
Abstract: Fitur biner memiliki informasi yang cukup penting dalam analisis data. Pendekatan yang biasa dilakukan dalam menganalisis data tersebut yaitu menggunakan perhitungan kemiripan dan jarak. Namun, banyaknya persamaan untuk menghitung kemiripan ataupun jarak yang ada menyebabkan pemilihan persamaan tersebut sangat penting untuk menghasilkan analisis yang lebih baik. Penelitian ini bertujuan mengembangkan library Python untuk menentukan persamaan kemiripan dan jarak yang paling baik untuk kasus kardiovaskular menggunakan metode waterfall. Hasilnya terdapat dua class utama yang dikembangkan, yaitu PairBestMeasures untuk menganalisis data berdasarkan pasangan target dan AgglomerativeBestMeasures untuk menganalisis penggunaan persamaan jarak dan kemiripan dalam agglomerative clustering. Pada kasus kardiovaskular, kemiripan Sokal Sneath 4 merupakan persamaan yang didapat untuk analisis berdasarkan pasangan target dan Baroni urbani buser 2 merupakan persamaan kemiripan yang didapat dalam analisis agglomerative clustering. Pada akhir penelitian dilakukan deployment berupa library dan dokumentasi ke situs PyPi dan readthedocs.
Binary features have quite important information in data analysis. The common approach in analyzing the data is to use similarity and dissimilarity calculations. However, from the many equations to calculate the existing similarities or distances, the selection of these equations is crucial to produce a better analysis. This study aims to develop a Python library to determine the best similarity equation for cardiovascular case using the waterfall method. As a result, there are two main classes developed, namely PairBestMeasures to analyze data based on target pairs and AgglomerativeBestMeasures to analyze the use of distance and similarity equations in agglomerative clustering. In the cardiovascular case, the Sokal Sneath 4 similarity is the equation obtained for analysis based on target pairs and Baroni urbani buser 2 is the similarity equation obtained in agglomerative clustering analysis. At the end of the research, the deployment of libraries and documentation to the PyPi and readthedocs sites is carried out.
URI: http://repository.ipb.ac.id/handle/123456789/115432
Appears in Collections:UT - Computer Science

Files in This Item:
File Description SizeFormat 
Cover.pdf
  Restricted Access
Cover905.87 kBAdobe PDFView/Open
G64180032_Muhammad Dwiki Ramdhani.pdf
  Restricted Access
Fullteks1.77 MBAdobe PDFView/Open
Lampiran.pdf
  Restricted Access
Lampiran932.05 kBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.