Please use this identifier to cite or link to this item:
Full metadata record
DC FieldValueLanguage
dc.contributor.advisorNeyman, Shelvie-
dc.contributor.authorMardiah, Mardiah-
dc.description.abstractTinjauan pustaka merupakan langkah awal dalam memulai penelitian untuk pemahaman yang lebih mendalam tentang minat penelitian, namun untuk menemukan literatur yang relevan dengan minat penelitian tidaklah mudah dan membutuhkan waktu. Skyline query merupakan metode yang telah dikenal untuk memilih sejumlah kecil objek data yang menarik, yang tidak didominasi oleh objek lain, suatu objek p dikatakan mendominasi objek q jika p sama dengan q pada semua atributnya, dan p setidaknya lebih baik dari q pada satu atribut. Categorical Data Skyline Search (CDSS) adalah algoritme yang dapat digunakan untuk memfilter objek Skyline dalam tipe data kategorikal seperti dokumen. Algoritme ini menggunakan Extended Distance Wu and Palmer (DEWP) untuk menghitung jarak antara kueri pengguna dan keyword dokumen, setiap keyword dokumen dan kueri pengguna direpresentasikan sebagai node dalam ontologi ACM CCS. Namun, pada penelitian ini tidak disertakan penjelasan lengkap bagaimana menghitung jarak antara kueri dan keyword jika keyword berjumlah lebih dari satu. Penelitian ini bertujuan untuk menggunakan algoritme CDSS untuk mencari dokumen Skyline yang diwakili oleh lebih dari satu keyword dengan menambahkan fungsi agregat (rata-rata, minimum, maksimum) pada algoritme CDSS khususnya dalam perhitungan DEWP. Penelitian ini menggunakan dokumen tesis jurusan ilmu komputer IPB University sebagai sumber data. Keyword dokumen diekstraksi menggunakan metode Term Frequency-Inverse Term Frequency (TF-IDF). Keyword yang terkumpul dipetakan dalam pohon ontologi campuran yang mengacu pada ontologi Association of Computing Machinery Computing Classification System 2012 dan Computer Science Ontology (CSO) sebagai standar ontologi dalam ilmu komputer. Algoritme Skyline query yang digunakan untuk menentukan dokumen Skyline adalah Block nested Loop (BnL). Metode evaluasi yang digunakan adalah perhitungan rasio Skyline berdasarkan jumlah dokumen Skyline yang diperoleh dari masing-masing fungsi agregat dalam CDSS. Berdasarkan nilai rasio Skyline, CDSS dengan menggunakan DEWP maksimum memiliki rasio terbaik dibandingkan dengan DEWP rata-rata dan DEWP
dc.description.abstractLiterature review is the first step in starting research for a deeper understanding of research interests, but finding literature relevant to research interests is not easy and takes time. Skyline query is a well-known method for selecting a small number of data objects of interest, which are not dominated by other objects, an object p is dominate object q if p is equal to q on all its attributes, and p is at least better than q on one attribute. Categorical Data Skyline Search (CDSS) is an algorithm that can be used to filter Skyline objects in categorical data types such as documents. This algorithm uses Distance Extended Wu and Palmer (DEWP) to calculate the distance between user query and document keyword, each document keyword and user query is represented as a node in the ACM CCS ontology. However, this research does not include a complete explanation of how to calculate the distance between a query and a keyword if keyword is more than one. This research aims to use the CDSS algorithm to search for Skyline documents that are represented by more than one keyword by adding an aggregate function (average, minimum, maximum) to the CDSS algorithm, especially in DEWP calculations. This research uses the thesis document of the computer science department of IPB University as the data source. Document keywords were extracted using the Term Frequency-Inverse Term Frequency (TF-IDF) method. The collected keywords are mapped in a mixed ontology tree that refers to the ontology of the Association of Computing Machinery Computing Classification System 2012 and Computer Science Ontology (CSO) as ontology standards in computer science. The Skyline query algorithm used to determine the Skyline document is Block nested Loop (BnL). The evaluation method used is the calculation of the Skyline ratio based on the number of Skyline documents obtained from each aggregate function in the CDSS. Based on the Skyline ratio, CDSS using the maximum DEWP has the best ratio compared to the average DEWP and minimum
dc.publisherIPB Universityid
dc.titleFungsi Agregat pada Categorical Data Skyline Search untuk Pencarian Dokumen Multi-Keywordid
dc.subject.keywordblock nested loopid
dc.subject.keywordcategorical data skyline searchid
dc.subject.keywordterm frequency inverse term frequencyid
Appears in Collections:MT - Mathematics and Natural Science

Files in This Item:
File Description SizeFormat 
  Restricted Access
Cover6.98 MBAdobe PDFView/Open
  Restricted Access
Fulltext7.78 MBAdobe PDFView/Open

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.