Show simple item record

dc.contributor.advisorWijaya, Sony Hartono
dc.contributor.authorRamdhani, Muhammad Dwiki
dc.date.accessioned2022-12-05T06:33:47Z
dc.date.available2022-12-05T06:33:47Z
dc.date.issued2022
dc.identifier.urihttp://repository.ipb.ac.id/handle/123456789/115432
dc.description.abstractFitur biner memiliki informasi yang cukup penting dalam analisis data. Pendekatan yang biasa dilakukan dalam menganalisis data tersebut yaitu menggunakan perhitungan kemiripan dan jarak. Namun, banyaknya persamaan untuk menghitung kemiripan ataupun jarak yang ada menyebabkan pemilihan persamaan tersebut sangat penting untuk menghasilkan analisis yang lebih baik. Penelitian ini bertujuan mengembangkan library Python untuk menentukan persamaan kemiripan dan jarak yang paling baik untuk kasus kardiovaskular menggunakan metode waterfall. Hasilnya terdapat dua class utama yang dikembangkan, yaitu PairBestMeasures untuk menganalisis data berdasarkan pasangan target dan AgglomerativeBestMeasures untuk menganalisis penggunaan persamaan jarak dan kemiripan dalam agglomerative clustering. Pada kasus kardiovaskular, kemiripan Sokal Sneath 4 merupakan persamaan yang didapat untuk analisis berdasarkan pasangan target dan Baroni urbani buser 2 merupakan persamaan kemiripan yang didapat dalam analisis agglomerative clustering. Pada akhir penelitian dilakukan deployment berupa library dan dokumentasi ke situs PyPi dan readthedocs.id
dc.description.abstractBinary features have quite important information in data analysis. The common approach in analyzing the data is to use similarity and dissimilarity calculations. However, from the many equations to calculate the existing similarities or distances, the selection of these equations is crucial to produce a better analysis. This study aims to develop a Python library to determine the best similarity equation for cardiovascular case using the waterfall method. As a result, there are two main classes developed, namely PairBestMeasures to analyze data based on target pairs and AgglomerativeBestMeasures to analyze the use of distance and similarity equations in agglomerative clustering. In the cardiovascular case, the Sokal Sneath 4 similarity is the equation obtained for analysis based on target pairs and Baroni urbani buser 2 is the similarity equation obtained in agglomerative clustering analysis. At the end of the research, the deployment of libraries and documentation to the PyPi and readthedocs sites is carried out.id
dc.language.isoidid
dc.publisherIPB Universityid
dc.titlePengembangan Library Python untuk Mencari Persamaan Terbaik dalam Perhitungan Kemiripan dan Jarak pada Data Binerid
dc.typeUndergraduate Thesisid
dc.subject.keywordbinaryid
dc.subject.keywordpythonid
dc.subject.keywordsimilarityid
dc.subject.keywordwaterfallid


Files in this item

Thumbnail
Thumbnail
Thumbnail

This item appears in the following Collection(s)

Show simple item record