Please use this identifier to cite or link to this item: http://repository.ipb.ac.id/handle/123456789/119459
Title: Penerapan Algoritma C4.5 dan Random Forest pada Tingkat Penjualan Serum Somethinc di Shopee
Authors: Aidi, Muhammad Nur
Wijayanto, Hari
Rismayanti
Issue Date: 2023
Publisher: IPB University
Abstract: Kegiatan jual beli online di Indonesia semakin meningkat. Shopee merupakan platform jual beli online dengan kunjungan tertinggi di Indonesia pada kuartal IV tahun 2022. Kategori barang yang memiliki transaksi tertinggi di Shopee adalah produk kecantikan. Brand Somethinc merupakan produk kecantikan lokal yang sangat sukses di Shopee dengan menempati peringkat pertama dalam penjualan produk serum di Indonesia. Penelitian ini menerapkan metode klasifikasi C4.5 dan Random Forest untuk melihat peubah penting dalam penjualan serum Somethinc di Shopee. Peubah yang digunakan berasal dari profil toko yang meliputi: jumlah pengikut, jumlah produk, performa pesan, rating toko, dan waktu bergabung. Data penjualan yang kontinyu didiskritisasi menggunakan k-means menjadi data ordinal dengan tingkat rendah, sedang, tinggi, dan sangat tinggi. Terdapat ketidakseimbangan pada kelas penjualan sehingga dilakukan teknik SMOTE. Penerapan teknik SMOTE meningkatkan nilai akurasi dan F1-score. Algoritma C4.5 menghasilkan pohon keputusan yang berisikan aturan dalam klasifikasi. Random Forest menghasilkan urutan kepentingan peubah berdasarkan nilai MDG berturut-turut dari tinggi ke rendah yaitu: jumlah pengikut, jumlah produk, performa pesan, waktu bergabung, dan rating toko.
Online buying and selling activities in Indonesia are increasing. Shopee is an online buying and selling platform with the highest visits in Indonesia in the fourth quarter of 2022. The category with the highest transactions at Shopee is beauty products. Somethinc is a very successful local beauty product at Shopee which have highest sales of serum products in Indonesia. This study applies the classification method C4.5 and Random Forest to see important variables in the sales of Somethinc serum at Shopee. The variables used come from store profiles which include: number of followers, number of products, chat performance, store rating, and length of stay. Continuous sales data is discretized using k-means into ordinal data with low, medium, and high levels. There is an imbalance of data in the sales class so that the SMOTE technique is used. The C4.5 algorithm produces a decision tree that contains rules for classification. Random Forest generates the order of variable importance based on the Mean Decrease Gini (MDG) values in descending order, which are as follows: number of followers, number of products, message performance, joining time, and store rating.
URI: http://repository.ipb.ac.id/handle/123456789/119459
Appears in Collections:UT - Statistics and Data Sciences

Files in This Item:
File Description SizeFormat 
Cover (2).pdf
  Restricted Access
Cover370.99 kBAdobe PDFView/Open
G14170035_Rismayanti.pdf
  Restricted Access
Fullteks633.02 kBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.