2024-03-28T13:34:29Zhttp://repository.ipb.ac.id/oai/requestoai:repository.ipb.ac.id:123456789/1141862022-08-29T13:01:16Zcom_123456789_7470com_123456789_25com_123456789_9col_123456789_33
Perbandingan antara Multinomial Naïve Bayes dan Regresi Logistik pada Analisis Sentimen Ulasan Aplikasi Sayurbox
Fildzah, Adinda Nur
Notodiputro, Khairil Anwar
Rahman, La Ode Abdul
Sayurbox needs to know the satisfaction of users regarding the applications they make to keep users' loyalty. One way to find out users satisfaction is to look at the users' reviews through the Google Play Store. Sentiment analysis is useful for managing these reviews and allows reviews to have certain categories such as positive or negative. The classification process can be done manually, but it will take a long time if the number of reviews that need to be classified is large. Therefore, a model is required to classify reviews automatically for saving time. The algorithms to be used in this study are Multinomial Naïve Bayes and logistic regression, and these algorithms will be combined with different kinds of n-gram (unigram, bigram, trigram, unibigram, unitrigram, bitrigram). The study was conducted to compare both algorithms and the six types of n- gram, select the best model combinations, and predict review sentiment from June 2022 to July 2022. The results have shown that the use of two different algorithms and several types of n-gram had a significant effect on the accuracy value, AUC, and f1-score. Interaction between algorithms and n-gram also had significant influence. The result shows that Multinomial Naïve Bayes with unibigram has been the best algorithm because it has shown the highest average of accuracy (91,02%), AUC (83,66%), and f1-score (94,38%). Multinomial Naïve Bayes with unibigram was used to predict reviews from June 2022 – July 2022. It has been predicted that there were 153 positive reviews and 37 negative reviews.
2022-08-29T13:01:13Z
2022-08-29T13:01:13Z
2022-08-29T13:01:13Z
2022
Undergraduate Thesis
http://repository.ipb.ac.id/handle/123456789/114186
en
IPB University
oai:repository.ipb.ac.id:123456789/1153272022-11-23T07:34:40Zcom_123456789_7470com_123456789_25com_123456789_9col_123456789_33
Penerapan Metode Generalized AutoRegressive Conditional Heteroskedasticity untuk Peramalan Harga Minyak Mentah Dunia.
Zainal, Putri Hernanda
Angraini, Yenni
Rizki, Akbar
Minyak mentah merupakan salah satu komoditas yang sangat dibutuhkan di berbagai bidang. Harga minyak mentah dunia yang terus mengalami fluktuasi tentunya mengambil pengaruh yang besar terhadap perekonomian negara. Data harga minyak mentah yang dikumpulkan bersifat time series atau proses pengumpulannya dilakukan dari waktu ke waktu dengan periode bulanan. Oleh karena itu, diperlukan suatu sistem yang dapat membuat peramalan harga minyak mentah dunia kedepannya yang diharapkan dapat menjadi bahan pertimbangan pemerintah untuk pengambilan keputusan. Salah satu metode yang dapat digunakan untuk meramalkan harga minyak mentah dunia adalah ARIMA (Auto-Regressive Integrated Moving Average) dan model GARCH (Generalized Auto-Regressive Conditional Heteroskedasticity). Pemodelan yang dilakukan terbukti bahwa data harga minyak mentah dunia periode Januari tahun 2002 hingga Juni 2022 memiliki efek heteroskedastisitas yang tidak dapat diatasi jika hanya menggunakan model ARIMA. Hasil dari pengolahan data diperoleh bahwa model ARIMA (0,1,2) yang dilanjutkan model ARCH (2) merupakan model terbaik dengan nilai MAPE sebesar 5,32%. Nilai akurasi yang diperoleh tergolong sangat baik untuk peramalan harga minyak mentah dunia.
Crude oil is one of the commodities that are needed in various fields. World crude oil prices that continue to fluctuate, of course, have a big influence on the country's economy. Crude oil price data collected is time series or the collection process is carried out from time to time with monthly periods. Therefore, we need a system that can forecast future world crude oil prices which are expected to be taken into consideration by the government for decision making. One method that can be used to predict world crude oil prices is ARIMA (Auto-Regressive Integrated Moving Average) and GARCH (Generalized Auto-Regressive Conditional Heteroskedasticity) model. After modeling, it is proven that the world crude oil price data for the period January 2002 to June 2022 has a heteroscedasticity effect that cannot be overcome if only using the ARIMA model. The results of data processing show that the ARIMA (0,1,2) followed by the ARCH model(2) is the best model with a MAPE value of 5,32%. The accuracy values obtained are classifield as very good for forecasting world crude oil prices.
2022-11-23T07:34:37Z
2022-11-23T07:34:37Z
2022-11-23T07:34:37Z
2022
Undergraduate Thesis
http://repository.ipb.ac.id/handle/123456789/115327
id
IPB University
oai:repository.ipb.ac.id:123456789/1132622022-08-08T00:28:38Zcom_123456789_7470com_123456789_25com_123456789_9col_123456789_33
Penerapan Structural Equation Model untuk Menjelaskan Faktor yang Memengaruhi Kekerasan Terhadap Anak dalam Rumah Tangga
Tobing, Yolanda Dheva
Sumertajaya, I Made
Silvianti, Pika
Kasus kekerasan terhadap anak adalah salah satu kasus yang kerap kali menjadi pembicaraan di berbagai negara karena jumlah kasusnya yang cenderung meningkat setiap tahunnya. Berdasarkan data KPAI, jumlah kasus kekerasan anak tertinggi di Indonesia terjadi pada tahun 2020 yaitu sebanyak 6519 kasus. Ada banyak faktor yang menjadi latar belakang terjadinya kekerasan terhadap anak, seperti faktor pengetahuan dan kesadaran orang tua terhadap perilaku kekerasan anak yang tergolong rendah. Partial Least Square - Analisis Structural Equation Modelling (PLS-SEM) dapat diterapkan pada kasus tersebut untuk mengidentifikasi pengaruh faktor pengetahuan dan kesadaran terhadap tindak kekerasan anak dengan ukuran sampel yang relatif kecil. Hasil penelitian menunjukkan bahwa jenis kekerasan yang paling sering dilakukan adalah kekerasan psikis. Kesadaran akan kekerasan fisik, psikis, seksual, dan secara sosial memiliki pengaruh yang signifikan terhadap perilaku kekerasan. Kesadaran memiliki hubungan yang negatif dengan perilaku maka dapat disimpulkan bahwa orang tua melakukan tindak kekerasan terhadap anak karena tingkat kesadarannya akan perilaku kekerasan masih tergolong rendah. Untuk mengatasi tingginya kasus kekerasan terhadap anak, Pemerintah perlu mengadakan edukasi perihal kekerasan anak sebagai upaya meningkatkan kesadaran orang tua. Kesadaran orang tua terhadap tindak kekerasan dapat menjadi fokus utama untuk menurunkan angka kasus kekerasan terhadap anak.
Child abuse cases are often discussed in various countries because the number of instances increases yearly. Based on KPAI data, Indonesia's highest number of child abuse cases occurred in 2020, which was 6519 cases. There are many factors behind child abuse, such as lack of knowledge and parents' awareness about child abuse behavior. Partial Least Square - Analysis Structural Equation Modeling can be applied to this case to identify the influence of knowledge and awareness factors on acts of child abuse with relatively small sample size. The results showed that the most frequent type of abuse was psychological abuse. Awareness of physical, psychological, sexual, and social abuse significantly influences behavior. Awareness has a negative relationship with behavior, and it seems that parents commit acts of child abuse because the awareness of abusive behavior is still relatively low. To overcome the high number of cases of child abuse, the Government needs to provide education about child abuse as an effort to increase parental awareness. Parental awareness of acts of abuse can be the main focus of reducing the number of cases of child abuse.
2022-08-08T00:24:26Z
2022-08-08T00:24:26Z
2022-08-08T00:24:26Z
2022
Undergraduate Thesis
http://repository.ipb.ac.id/handle/123456789/113262
id
IPB University
oai:repository.ipb.ac.id:123456789/1131902022-08-04T08:45:18Zcom_123456789_7470com_123456789_25com_123456789_9col_123456789_33
Analisis Sentimen Tanggapan Masyarakat Pengguna Twitter terhadap Pembelajaran Tatap Muka
Manaf, Silmi Annisa Rizki
Alamudi, Aam
Fitrianto, Anwar
Awal tahun 2022, pemerintah mengizinkan kembali pembelajaran tatap muka (PTM) setelah menjalani pembelajaran jarak jauh (PJJ) kurang lebih satu tahun. Saat akan diberlangsungkan PTM di beberapa wilayah, angka Covid-19 kembali meningkat dan pemerintah kembali memberlakukan PPKM. Hal ini berpengaruh pada kegiatan PTM yang akan dan sedang berlangsung. Pro dan kontra terhadap PTM juga terjadi di media sosial, salah satunya di twitter. Penelitian ini menggunakan data twitter periode 30 Januari 2022 hingga 7 Februari 2022. Opini di twitter mengenai PTM dikaji dengan analisis sentimen menggunakan metode regresi logistik biner dengan membagi menjadi kelas positif dan negatif. Pelabelan berdasarkan skor selisih antara banyaknya kata positif dan negatif. Tujuan dari penelitian ini untuk mengetahui persepsi masyarakat terhadap kebijakan penerapan
PTM di era pandemi Covid-19 di media sosial khususnya twitter. Dari penelitian ini didapatkan persepsi masyarakat cenderung ke arah negatif yang menandakan belum cukup setuju dengan adanya PTM di periode bulan Februari 2022 dengan nilai akurasi 85%, sensitivitas 77%, spesifisitas 88%, dan AUC 91%.
2022-08-04T08:45:15Z
2022-08-04T08:45:15Z
2022-08-04T08:45:15Z
2022
Undergraduate Thesis
http://repository.ipb.ac.id/handle/123456789/113190
id
IPB University
oai:repository.ipb.ac.id:123456789/1133832022-08-10T03:52:34Zcom_123456789_7470com_123456789_25com_123456789_9col_123456789_33
Linear Support Vector Machine-Recursive Feature Elimination with Cross Validation untuk Menentukan Penciri Kerawanan Pangan di Jawa Barat
Trisnawati, Dyah Arum
Sartono, Bagus
Dito, Gerry Alfa
Seleksi peubah dapat digunakan untuk mengetahui informasi mengenai penentuan tingkat kepentingan peubah yang menyebabkan suatu kejadian, salah satunya kerawanan pangan. Pengentasan kerawanan pangan merupakan tujuan kedua Sustainable Development Goals (SDGs), yaitu mengakhiri kelaparan yang diharapkan tercapai pada tahun 2030. Penelitian ini bertujuan mengukur kekuatan asosiasi peubah dengan kerawanan pangan serta mengidentifikasi peubah-peubah yang mencirikan kerawanan pangan di Jawa Barat menggunakan algoritma Support Vector Machine-Recursive Feature Elimination with Cross Validation (SVM-RFECV). Berdasarkan hasil penelitian, peubah yang memiliki asosiasi kuat dengan kerawanan pangan adalah tingkat pendidikan kepala rumah tangga (KRT) dan jumlah anggota rumah tangga (ART) yang memiliki tabungan. Umur KRT, status bekerja KRT, listrik, air minum layak, kepemilikan Jaminan Kesehatan Daerah (Jamkesda), akses Kredit Usaha Rakyat (KUR), dan jumlah ART memiliki asosiasi yang sangat lemah dengan kerawanan pangan. Peubah-peubah yang mencirikan kerawanan pangan di Jawa Barat adalah jumlah ART yang memiliki tabungan, KRT dengan pendidikan tertinggi SMP, jumlah buta huruf, jumlah ART, jumlah perokok, kepemilikan aset tanah, status bangunan dinas, penerima transfer, penerima Bantuan Pangan Non-Tunai (BPNT), kepemilikan BPJS Kesehatan, dan umur KRT. Banyaknya ART yang memiliki tabungan menempati urutan teratas peubah penciri kerawanan pangan di Jawa Barat.
Feature selection can be used to find out information about determining the level of importance of variables that cause an event, one of which is food insecurity. Alleviation of food insecurity is the second goal of the Sustainable Development Goals (SDGs), which aims to end world hunger by 2030. This study aims to measure the strength of the association of variables with food insecurity and identify the variables that characterize food insecurity in West Java using Support Vector Machine-Recursive Feature Elimination with Cross Validation (SVM-RFECV) algorithm. Based on the study’s results, the variables strongly associated with food insecurity are the education level of the head of the household and the number of household members who have savings. The age of the head of the household, the working status of the head of the household, electricity, decent drinking water, grantee of health insurance local program (Jamkesda), access to KUR, and the number of household members have very weak associations with food insecurity. The variables that characterize food insecurity in West Java are the number of household members who have savings, the head of the household with the highest education in junior high school, the number of illiterates, the number of household members, and the number of smokers. In addition, other characterized variables were ownership of land assets, ownership status of the building is an official house, transfer recipient, grantee of non cash social assistance (BPNT), grantee of health insurance national program (BPJS Kesehatan), and age of head of household. The number of household members who have savings ranks at the top of the variables that characterize food insecurity in West Java.
2022-08-10T03:52:31Z
2022-08-10T03:52:31Z
2022-08-10T03:52:31Z
2022
Undergraduate Thesis
http://repository.ipb.ac.id/handle/123456789/113383
id
IPB University
oai:repository.ipb.ac.id:123456789/1120342022-06-13T03:31:44Zcom_123456789_7470com_123456789_25com_123456789_9col_123456789_33
Analisis Regresi Data Panel pada Kasus Tingkat Pengangguran Terbuka (TPT) di Provinsi Jawa Barat
Maharani, Raihana
Anisa, Rahma
Susetyo, Budi
Pengangguran merupakan permasalahan akibat jumlah angkatan kerja yang lebih banyak dari jumlah lapangan pekerjaan yang tersedia. Tingkat pengangguran terbuka (TPT) di Provinsi Jawa Barat mengalami penurunan dari tahun 2017 sampai tahun 2019. Namun, nilai tersebut masih berada di atas nilai TPT Indonesia sehingga perlu penanganan yang tepat untuk menurunkan nilai TPT di Jawa Barat. Penelitian ini bertujuan untuk menentukan peubah peubah yang memengaruhi TPT di Provinsi Jawa Barat. Data penelitian ini terdiri atas 27 kabupaten/kota di Jawa Barat dalam kurun waktu tiga tahun, yaitu dari tahun 2017 sampai tahun 2019. Analisis regresi data panel digunakan untuk melihat adanya pengaruh spesifik unit individu maupun waktu sehingga penelitian tidak terbatas hanya mengamati satu individu atau satu kurun waktu saja. Berdasarkan hasil penelitian, model yang sesuai untuk menggambarkan TPT di Provinsi Jawa Barat adalah model pengaruh acak dengan pengaruh spesifik individu yang memiliki nilai kebaikan model sebesar 23,45%. Peubah penjelas yang berpengaruh signifikan terhadap TPT di Jawa Barat, yaitu kepadatan penduduk, upah minimum kabupaten/kota, dan harapan lama sekolah. Peubah kepadatan penduduk dan upah minimum kabupaten/kota memiliki hubungan yang positif terhadap TPT di Jawa Barat, sedangkan peubah harapan lama sekolah memiliki hubungan yang negatif dengan TPT di Jawa Barat.
Unemployment is a problem due to the number of labor force that is more than the number of available jobs. The open unemployment rate (TPT) in West Java Province has decreased from 2017 to 2019. However, this value is still above the value of Indonesia's TPT so that proper handling is needed to reduce the value of TPT in West Java. This study aims to determine the variables that affect TPT in West Java Province. This research data consists of 27 districts/cities in West Java over a period of three years, namely from 2017 to 2019. Panel data regression analysis is used to see the specific effects of individual units and time so that the research is not limited to only observing one individual or one period of time. Based on the results of the study, the appropriate model to describe TPT in West Java Province is a random effect model with an individual specific effects which has a model goodness value of 23.45%. The explanatory variables that have a significant effect on TPT in West Java, are population density, district/city minimum wages, and expected years of schooling. The variable population density and the district/city minimum wage have a positive relationship to TPT in West Java, while the variable of long-term school expectations has a negative relationship to TPT in West Java.
2022-06-13T03:31:42Z
2022-06-13T03:31:42Z
2022-06-13T03:31:42Z
2022
Undergraduate Thesis
http://repository.ipb.ac.id/handle/123456789/112034
id
IPB University
oai:repository.ipb.ac.id:123456789/1145612022-09-19T07:31:00Zcom_123456789_7470com_123456789_25com_123456789_9col_123456789_33
Identifikasi Peubah yang Berpengaruh terhadap Ketidaklulusan Mahasiswa Program Sarjana BUD IPB dengan Regresi Logistik Biner
Riaesnianda, Mahdiyah
Alamudi, Aam
Soleh, Agus M
Salah satu jalur masuk yang ada di Institut Pertanian Bogor (IPB) yaitu Beasiswa Utusan Daerah (BUD). Tidak semua mahasiswa BUD IPB dapat menyelesaikan studinya karena di Drop Out (DO) atau mengundurkan diri. Salah satu upaya yang dapat dilakukan IPB untuk menekan angka putus kuliah mahasiswa BUD IPB adalah dengan mengetahui peubah yang berpengaruh terhadap ketidaklulusan mahasiswa BUD IPB. Peubah yang berpengaruh terhadap ketidaklulusan mahasiswa BUD IPB dianalisis dengan regresi logistik biner. Terdapat ketidakseimbangan kelas data pada peubah respon sehingga metode yang dapat digunakan untuk mengatasi hal tersebut adalah Synthetic Minority Over-Sampling Technique (SMOTE). Model klasifikasi dengan SMOTE menghasilkan rata-rata sensitivitas yang lebih tinggi dibandingkan model tanpa SMOTE dari 10,66% menjadi 61,91%. Hal tersebut memperkuat bahwa model dengan SMOTE lebih baik untuk memprediksi kelas minoritas (mahasiswa BUD IPB yang tidak lulus). Peubah yang berpengaruh terhadap ketidaklulusan mahasiswa BUD IPB adalah jenis kelamin, status sekolah asal, kelompok program studi, ada tidaknya Program Pra Universitas (PPU), jenis sponsor, rataan rapor, dan IPK Tahap Persiapan Bersama (TPB) atau Program Pendidikan Kompetensi Umum (PPKU).
One of the entrances available at the Bogor Agricultural University (IPB) is the Regional Representatives Scholarship (BUD). Not all BUD IPB students were able to complete their studies because they dropped out (DO) or resigned. One of the efforts that IPB can do to reduce the dropout rate for BUD IPB students is to find out the variables that affect the failure of BUD IPB students. The variables that influence the failure of BUD IPB students are analyzed by binary logistic regression. There is an imbalance of data classes in the response variables so that the method that can be used to overcome this is the Synthetic Minority Over-Sampling Technique (SMOTE). The classification model with SMOTE resulted in a higher average sensitivity than the model without SMOTE from 10,66% to 61,91%. This confirms that the model with SMOTE is better at predicting the minority class (BUD IPB students who do not pass). The variables that affect the failure of BUD IPB students are gender, school status of origin, study program groups, the presence or absence of Pre-University Programs (PPU), type of sponsor, average report cards, and GPA in the Joint Preparation Stage (TPB) or General Competency Education Program (PPKU).
2022-09-19T07:30:57Z
2022-09-19T07:30:57Z
2022-09-19T07:30:57Z
2022
Undergraduate Thesis
http://repository.ipb.ac.id/handle/123456789/114561
id
IPB University
oai:repository.ipb.ac.id:123456789/1130992022-08-02T14:42:54Zcom_123456789_7470com_123456789_25com_123456789_9col_123456789_33
Pengelompokan Emiten Berdasarkan Fluktuasi Harga Saham Syariah Menggunakan Algoritma Agglomerative Hierarchical Clustering
Puspitasari, Anisa Dilla
Silvianti, Pika
Syafitri, Utami Dyah
Kebijakan pemerintah untuk memutus rantai penularan Covid-19 memberikan dampak pada sektor ekonomi di Indonesia. Banyak pekerja yang harus mencari sumber pendapatan lain karena kehilangan pekerjaannya di masa pandemi. Salah satu usaha yang dilakukannya yaitu berinvestasi saham. Indonesia sebagai negara dengan mayoritas penduduk muslim membuat pasar modal syariah khususnya saham syariah semakin diminati. Namun demikian, saham syariah yang memiliki tingkat pengembalian tinggi juga memiliki risiko yang tinggi. Salah satu faktor yang membuat risiko saham tinggi adalah harga saham yang bersifat fluktuatif dan stokastik. Oleh karena itu, perlu adanya sebuah analisis tentang penggerombolan emiten berdasarkan fluktuasi harga saham syariah. Berdasarkan karakteristik data harga saham syariah yang merupakan data deret waktu, algoritma penggerombolan yang akan diterapkan adalah agglomerative hierarchical clustering dengan metode jarak dynamic time warping. Parameter jarak terpilih adalah average linkage karena memiliki koefisien korelasi cophenetic tertinggi yaitu 0,643. Jumlah gerombol yang optimal berdasarkan kriteria koefisien silhouette dan rasio keragaman adalah lima gerombol. Setelah dilakukan uji chow breakpoint pada setiap emiten di setiap gerombol, terdapat tiga emiten di gerombol satu, tiga emiten di gerombol dua, satu emiten di gerombol tiga, dan satu emiten di gerombol lima yang tidak signifikan terjadi perubahan struktural pada periode sebelum dan sesudah munculnya pandemi Covid-19.
The government policies to break the chain of Covid-19 transmission have an impact on the economic sector in Indonesia. Many workers lost their job and have to find other ways to survive. One of them is by investing in stocks. Indonesia, as a country with a predominantly Islamic population, the sharia capital market, especially sharia stocks is high in demand. However, sharia stocks that have a high return rate also have high risks. One of the factors that make stock risk is high is due to the stock price that is volatile and stochastic. Therefore, it is necessary to cluster the stock issuers based on price pattern. Based on the characteristics of sharia stock price which is time series data, the clustering algorithm that were applied is agglomerative hierarchical clustering with dynamic time warping distance. The distance parameter that were chosen is the average linkage because it has the highest cophenetic correlation coefficient, 0.643. The optimal number of clusters based on the criteria of the silhouette coefficient and diversity ratio is five clusters. According to the chow breakpoint test there were three issuers in cluster one, three issuers in cluster two, one issuer in cluster three, and one issuer in cluster five with no significant structural changes the period before and after the emergence of Covid-19. The test was performed independently on each issuer in all cluster.
2022-08-02T14:42:50Z
2022-08-02T14:42:50Z
2022-08-02T14:42:50Z
2022
Undergraduate Thesis
http://repository.ipb.ac.id/handle/123456789/113099
id
IPB University
oai:repository.ipb.ac.id:123456789/1132412022-08-06T03:21:11Zcom_123456789_7470com_123456789_25com_123456789_9col_123456789_33
Identifikasi Faktor-Faktor yang Memengaruhi Kasus HIV di Indonesia Tahun 2018 Menggunakan Regresi Terboboti Geografis Campuran
El-Kautsar, Musthafa Badri
Djuraidah, Anik
Angraini, Yenni
HIV (Human Immunodeficiency Virus) merupakan penyakit yang termasuk penyakit epidemis di Indonesia. Secara nasional, angka kasus positif HIV mengalami kenaikan dari tahun 2011 hingga tahun 2019. Provinsi Papua, dan Papua Barat memiliki status generalized epidemic karena memiliki prevalensi di Kasus positif pada ibu hamil lebih dari 1%. Sedangkan di daerah Pulau Jawa, Sumatera, Kalimantan, Sulawesi, dan pulau-pulau lainnya didominasi oleh concentrated epidemic dan low level epidemic. Hal tersebut mengindikasikan adanya unsur spasial pada sebaran Kasus HIV. Penelitian ini bertujuan untuk menentukan faktor-faktor yang memengaruhi Kasus HIV di setiap kabupaten/kota menggunakan analisis Regresi Terboboti Geografis Campuran. Data yang digunakan pada penelitian ini adalah Kasus HIV sebagai peubah respon, sedangkan untuk peubah penjelas meliputi Populasi Kunci, Kasus positif pada ibu hamil, Pasien Tuberkulosis, Tingkat Kemiskinan, dan Tingkat Pengangguran yang bersumber dari Kementerian Kesehatan Republik Indonesia (Kemenkes RI), Badan Pembangunan Perencanaan Nasional (Bappenas), dan Badan Pusat Statistik (BPS). Lokasi amatan meliputi 390 kabupaten/kota di Indonesia. Metode yang akan digunakan pada penelitian ini adalah Regresi Terboboti Geografis Campuran (RTGC). Hasil dari penelitian ini menunjukkan bahwa peubah Populasi Kunci merupakan peubah yang berpengaruh secara global, sedangkan peubah penjelas Kasus positif pada ibu hamil, Pasien Tuberkulosis, Tingkat Kemiskinan, dan Tingkat Pengangguran merupakan peubah yang berpengaruh secara lokal. Pengelompokkan berdasarkan signifikansi peubah penjelas RTGC menghasilkan sebanyak 13 kelompok. Peubah Kasus positif pada ibu hamil sebagian besar berpengaruh nyata pada kabupaten/kota di Indonesia bagian timur, sedangkan pada peubah penjelas Tingkat Pengangguran berpengaruh nyata pada sebagian besar kabupaten/kota di Indonesia bagian barat. Peubah penjelas Pasien Tuberkulosis dan Tingkat Kemiskinan memilik pengaruh nyata yang menyebar rata pada seluruh kabupaten/kota di Indonesia.
2022-08-06T03:21:08Z
2022-08-06T03:21:08Z
2022-08-06T03:21:08Z
2022-08-04
Undergraduate Thesis
http://repository.ipb.ac.id/handle/123456789/113241
id
IPB University
oai:repository.ipb.ac.id:123456789/1136832022-08-16T13:33:25Zcom_123456789_7470com_123456789_25com_123456789_9col_123456789_33
Pengelompokan Emiten Saham Consumer non Cyclical Menggunakan Jarak Euclidean dan Dynamic Time Warping
Al Fatah, Rafi Syahdan
Rizki, Akbar
Masjkur, Mohammad
Kondisi pandemi saat ini membuat saham consumer non cyclical merupakan pilihan sebagai saham defensif, karena barang konsumsi primer akan terus dicari. Pergerakan harga saham merupakan data deret waktu. Analisis pengelompokan data deret waktu membutuhkan algoritme dan prosedur pengelompokan yang berbeda dibandingkan dengan data statis. Jarak yang umum digunakan pada pengelompokan ini adalah Euclidean dan dynamic time warping (DTW). Penelitian ini membandingkan kedua jarak tersebut untuk mengelompokan emiten saham consumer non cyclical. Hasil yang diperoleh dari penelitian ini adalah pengelompokan menggunakan jarak Euclidean dan DTW lebih baik dipasangkan dengan algoritme Average linkage dibandingkan Ward linkage berdasarkan nilai Cophenetic terbesar. Oleh karena itu, proses pengelompokan dilanjutkan menggunakan Average linkage. Pengelompokan kedua jarak tersebut dievaluasi oleh koefisien Silhouette dan menghasilkan tiga kelompok dari masing masing metode. Nilai Silhouette pada DTW lebih besar dibandingkan Euclidean, dengan kata lain keragaman dalam kelompok yang dihasilkan oleh DTW lebih kecil dibandingkan Euclidean. Pengelompokan menggunakan DTW menghasilkan tiga kelompok dengan kelompok pertama beranggotakan satu emiten yaitu PT Gudang Garam Tbk dengan kode emiten GGRM. Kelompok ini memiliki rata rata harga saham yang lebih tinggi dibandingkan dengan dua kelompok lainnya. Kelompok kedua beranggotakan 12 emiten, harga saham pada kelompok ini berada pada kelas menengah. Kelompok ketiga merupakan kelompok dengan anggota terbanyak dengan 49 emiten, kelompok ini memiliki harga yang jauh lebih murah dibanding kelompok lainnya.
The current pandemic condition makes non-cyclical consumer stocks an option as defensive stocks, because primary consumer goods will continue to be sought. Stock price movements are time series data. Cluster analysis of time series data requires different algorithms and clustering procedures compared to static data. The distances commonly used in this grouping are Euclidean and dynamic time warping (DTW). This study compares the two distances to classify issuers of non-cyclical consumer stocks. The results obtained from this study are that grouping using Euclidean distance and DTW is better paired with the Average linkage algorithm than Ward linkage based on the largest Cophenetic value. Therefore, the grouping process is continued using the Average linkage. The grouping of the two distances is evaluated by the Silhouette coefficient and produces three groups from each method. Silhouette value in DTW is greater than Euclidean, in other words, the diversity within the group produced by DTW is smaller than Euclidean. Grouping using DTW resulted in three groups with the first group consisting of one issuer, namely PT Gudang Garam Tbk with issuer code GGRM. This group has a higher average share price compared to the other two groups. The second group consists of 12 issuers, share prices in this group are in the middle class. The third group is the group with the most members with 49 issuers, this group has a much cheaper price than the other groups.
2022-08-16T13:33:22Z
2022-08-16T13:33:22Z
2022-08-16T13:33:22Z
2022
Undergraduate Thesis
http://repository.ipb.ac.id/handle/123456789/113683
id
IPB University
oai:repository.ipb.ac.id:123456789/1132292022-08-05T08:19:33Zcom_123456789_7470com_123456789_25com_123456789_9col_123456789_33
Perbandingan Pengelompokan Wanita Anemia dan Non-Anemia dengan Diskriminan Logistik dan Clustering Non-Hierarki Menggunakan Data Campuran
Husna, Amalia Nailul
Aidi, Muhammad Nur
Anisa, Rahma
Julianti, Elisa Diana
Anemia merupakan kondisi ketika kadar Hemoglobin (Hb) kurang dari
normal, yaitu kurang dari 12 g/dL untuk wanita usia subur. Analisis untuk
mendeteksi ketergantungan peubah pendukung risiko anemia penting dilakukan
untuk membedakan status wanita anemia dan non-anemia dengan menggunakan
metode pengelompokan. Metode pengelompokan yang digunakan pada penelitian
ini yaitu diskriminan logistik dan analisis cluster k-prototype, dengan alasan peubah
yang digunakan bertipe numerik dan kategorik. Diskriminan logistik
mengelompokkan amatan berdasarkan peubah respon dan menghasilkan suatu
model, serta peubah yang memengaruhi pengelompokan dapat diketahui dari
koefisien model yang signifikan. Analisis cluster k-prototype mengelompokkan
amatan berdasarkan ukuran kemiripan, peubah yang memengaruhi pengelompokan
dapat diketahui menggunakan uji rata-rata dan uji proporsi. Pada penelitian ini
dilakukan pengelompokan wanita anemia dan non-anemia menggunakan
diskriminan logistik yang merupakan pengelompokan terbimbing dan analisis
cluster k-prototype yang merupakan pengelompokan tidak terbimbing dengan
tujuan melihat perbedaan kedua metode tersebut berdasarkan peubah yang
memengaruhi pengelompokan dan keanggotaan hasil pengelompokan. Peubah
yang memengaruhi pengelompokan menggunakan diskriminan logistik dan analisis
cluster k-prototype diperoleh hasil yang berbeda pada peubah penyakit pneumonia.
Keanggotaan pengelompokan mengunakan diskriminan logistik dan analisis cluster
k-prototype menghasilkan keanggotaan yang berbeda. Diskriminan logistik
menghasilkan lebih banyak amatan benar negatif, sedangkan analisis cluster k-prototype menghasilkan amatan benar positif lebih banyak.
Anemia is a condition when the hemoglobin (Hb) level is less than normal,
which is less than 12 g/dL for women of reproductive age. It is important to conduct
an analysis for detecting the dependence of supporting variables for anemia risk in
order to distinguish the status of anemic and non-anemic women by using the
grouping method. The grouping method used in this research was logistic
discriminant and k-prototype cluster analysis, to facilitate numerical and categorical
variables used in this research. The logistic discriminant groups the observations
based on the response variables and obtain a model, and the variables that affect the
grouping can identified from the significant coefficients. The k-prototype cluster
analysis groups observations based on similarity distance. The variables that affect
the clustering can be identified using the average test and the proportion test. In this
study, anemia and non-anemia women were grouped using a logistic discriminant
which is supervised learning and a k-prototype cluster analysis which is
unsupervised learning with the aim of seeing the differences between the two
methods based on the variables that affect the grouping and membership of the
grouping results. Variables that affect grouping using logistic discriminant and k-prototypes cluster analysis had the different results on pneumonia variable. The
membership of grouping using logistic discriminant and k-prototype cluster
analysis had different result. The logistic discriminant obtained more true negative
observations, while the k-prototype cluster analysis obtained more true positive
observations.
2022-08-05T08:19:30Z
2022-08-05T08:19:30Z
2022-08-05T08:19:30Z
2022-08
Undergraduate Thesis
http://repository.ipb.ac.id/handle/123456789/113229
id
IPB University
oai:repository.ipb.ac.id:123456789/1209262023-07-06T05:37:54Zcom_123456789_7470com_123456789_25com_123456789_9col_123456789_33
Peramalan Harga Saham Sektor Energi dengan Pendekatan Penggerombolan Data Deret Waktu
Sakinah, Linda
Anisa, Rahma
Sumertajaya, I Made
Investasi saham menjanjikan return lebih tinggi namun memiliki risiko tinggi karena fluktuasi harga yang sulit diprediksi. Sektor energi potensial karena memiliki kenaikan indeks sektoral tertinggi tahun 2022. Namun, hal tersebut tidak menandakan kenaikan harga saham terjadi merata pada semua emiten. Oleh karena itu, perlu analisis penggerombolan emiten berdasarkan kemiripan pergerakan harga sahamnya. Hasilnya digunakan untuk peramalan harga saham level gerombol. Penelitian ini bertujuan untuk mengevaluasi kinerja penggerombolan emiten sektor energi menggunakan jarak autocorrelation-based dan dynamic time warping(DTW) serta melakukan peramalan harga saham level gerombol. Data yang digunakan adalah data harga saham penutupan periode mingguan. Proses penggerombolan menggunakan metode berhirarki pautan rataan. Peramalan harga saham setiap gerombol menggunakan model ARIMA level gerombol yang performanya dievaluasi dengan rolling-cross validation. Hasil penelitian menunjukan jarak DTW memiliki kinerja penggerombolan terbaik. Emiten sektor energi dikelompokkan menjadi empat gerombol dengan kategori strong cluster karena koefisien silhouette > 0,71. Model ARIMA setiap gerombol menghasilkan nilai MAPE antara 10-20% sehingga dikategorikan model dengan peramalan baik. Gerombol A dan D direkomendasikan untuk investor karena diduga memiliki potensi keuntungan tertinggi dari capital gain berdasarkan hasil peramalan harga saham. Gerombol A dan D juga berisi perusahaan dengan fundamental dan kebijakan deviden yang baik.
Stock investment promises higher returns but carries high risks because unpredictable price fluctuations. Energy sector shows potential due to its highest sectoral index growth in 2022. However, this does not indicate that stock price increases occur evenly among all issuers. Therefore, it’s necessary to analyze clustering of issuers based on similarity of their stock price movements and used for forecasting stock prices at cluster level. This study aims to evaluate performance of clustering energy sector issuers using autocorrelation-based distance and dynamic time warping(DTW), and to forecast stock prices at cluster level. The data used consists weekly closing stock prices. The clustering used hierarchical average linkage method. Stock price forecast for each cluster used ARIMA model and its performance was evaluated using rolling-cross validation. The results showed that DTW distance had the best clustering performance. Energy sector issuers were grouped into four clusters with strong cluster category, indicated by silhouette coefficient > 0.71. ARIMA models for each cluster produced MAPE values between 10-20%, categorizing them as good forecasting models. Clusters A and D were recommended for investors because have highest potential for capital gain based on forecasted stock prices. That clusters also consisted of companies with strong fundamentals and dividend policies.
2023-07-06T00:06:58Z
2023-07-06T00:06:58Z
2023-07-06T00:06:58Z
2023
Undergraduate Thesis
http://repository.ipb.ac.id/handle/123456789/120926
id
IPB University
oai:repository.ipb.ac.id:123456789/1136082022-08-15T06:34:02Zcom_123456789_7470com_123456789_25com_123456789_9col_123456789_33
Pemodelan Angka Kematian Bayi di Jawa Barat Menggunakan Pendekatan Analisis Regresi Spline dan Kernel
Puspita, Riska Indah
Anisa, Rahma
Rahman, La Ode Abdul
Angka Kematian Bayi (AKB) atau Infant Mortality Rate (IMR) merupakan indikator yang sangat sensitif terhadap upaya pelayanan kesehatan terutama yang berhubungan dengan bayi baru lahir. AKB juga merupakan salah satu permasalahan yang perlu ditangani dan menjadi target SDGs pada tujuan nomor 3 (kehidupan yang sehat dan sejahtera). Provinsi Jawa Barat terdiri dari 27 Kabupaten/Kota memiliki AKB sebesar 3,26/1000 kelahiran hidup pada tahun 2019. Pola data AKB di Jawa Barat memiliki bentuk pola yang berubah – ubah pada selang titik tertentu sehingga pemodelan dilakukan menggunakan regresi nonparametrik. Pendekatan regresi nonparametrik yang dipilih adalah regresi spline yang memiliki kemampuan menyesuaikan diri lebih efektif dari karakteristik data dan regresi kernel yang mudah diimplementasikan. Peubah penjelas yang digunakan adalah Angka Harapan Hidup, Persentase Penduduk Miskin, Tingkat Pengangguran Terbuka serta Rata – rata Lama Sekolah. Penelitian ini menghasilkan model terbaik regresi spline 3 knot dan model terbaik regresi kernel dengan lebar jendela 1,2; 1,2; 1,1; dan 1. Hasil evaluasi model menunjukan kinerja model regresi spline lebih baik dari regresi kernel dengan masing – masing nilai MSE, RMSE, dan MAPE sebesar 0,66; 0,81; dan 18,54%.
The Infant Mortality Rate (IMR) is a very sensitive indicator of health service efforts, especially those related to newborns. IMR is also one of the problems that need to solve and the target of the SDGs number 3 (Good health and well-being). Java Province consists of 27 regencies/cities with an IMR of 3,26/1000 live births in 2019. The pattern of IMR data in West Java province had a pattern that changes at certain points so that the modeling is carried out using nonparametric regression. The selected nonparametric regression approach was spline regression which able to adapt more effectively with the characteristics of the data and kernel regression is easy to implementation. The explanatory variables used are life expectancy, the percentage of poor people, the open unemployment rate and the average length of schooling. The best model given by spline regression at 3 knot and kernel regression with bandwidth 1.2; 1.2; 1.1; and 1. Based model evaluation, the spline regression model's performance is better than the kernel regression with MSE, RMSE, and MAPE values are 0.66; 0.81, and 18.54%.
2022-08-15T06:33:59Z
2022-08-15T06:33:59Z
2022-08-15T06:33:59Z
2022
Undergraduate Thesis
http://repository.ipb.ac.id/handle/123456789/113608
id
IPB University
oai:repository.ipb.ac.id:123456789/1129952022-07-30T03:18:27Zcom_123456789_7470com_123456789_25com_123456789_9col_123456789_33
Penggerombolan Provinsi di Indonesia Berdasarkan Kasus Kriminalitas Golongan Kejahatan Konvensional Menggunakan Metode K-Medoid
Azhari, Indah
Sulvianti, Itasia Dina
Angraini, Yenni
Tindakan kejahatan atau kriminalitas adalah suatu tindakan seseorang atau sekelompok orang yang melanggar hukum dan merugikan orang lain yang menjadi korban, baik dari segi materil (ekonomis) maupun psikologisnya. Kejahatan konvensional merupakan salah satu golongan kejahatan yang paling mendominasi di Indonesia. Banyaknya kasus kejahatan konvensional meningkat setiap tahunnya, maka perlu dilakukan penggerombolan provinsi di Indonesia berdasarkan kasus kriminalitas golongan kejahatan konvensional. Penggerombolan ini dilakukan agar jenis kejahatan konvensional yang terjadi di suatu provinsi dapat diidentifikasi. Hasil penelitian ini diharapkan dapat membantu pemerintah dan kepolisian dalam rangka menekan tingkat kejahatan konvensional (conventional crime rate). Secara eksplorasi diketahui bahwa ada beberapa provinsi yang menjadi pencilan pada beberapa jenis kejahatan, sehingga penggerombolannya menggunakan metode k-medoid dengan jarak Euclidean. Penentuan ukuran gerombol optimal dan evaluasi hasil penggerombolan dilakukan berdasarkan nilai koefisien silhouette, indeks Dunn dan indeks connectivity. Penelitian ini menghasilkan tiga gerombol dengan nilai koefisien silhouette 0,27; indeks Dunn sebesar 0,22 dan indeks connectivity sebesar 17,86.
Crime is an act of a person or group of people who violate the law and harm other people who are victims, both in terms of material (economic) and psychological. Conventional crime is one of the most dominating crime groups in Indonesia. As the number of conventional crime cases increases every year, it is necessary to cluster provinces in Indonesia based on conventional criminal cases. This clustering is carried out so that the types of conventional crimes that occur in a province can be identified. The results of this study are expected to help the government and the police to reduce the conventional crime rate. Explorationally, it is known that several provinces are outliers in several types of crime. Hence, the clustering uses the k-medoid method with Euclidean distance. Determination of the optimal cluster size and evaluation of the clustering results are carried out based on the silhouette coefficient, Dunn index, and connectivity index. This study resulted in three clusters with a silhouette coefficient value of 0,27; Dunn index of 0,22 and connectivity index of 17,86.
2022-07-30T03:18:23Z
2022-07-30T03:18:23Z
2022-07-30T03:18:23Z
2022
Undergraduate Thesis
http://repository.ipb.ac.id/handle/123456789/112995
id
IPB University
oai:repository.ipb.ac.id:123456789/1120102022-06-09T06:39:17Zcom_123456789_7470com_123456789_25com_123456789_9col_123456789_33
Comparative Study of Methods for Analyzing Factors Affecting Land Price in East Jakarta
Safira, Nadya Tasha
Saefuddin, Asep
Anisa, Rahma
The property industry is one of the real sectors that contribute to Indonesia’s
economic growth. The development in property areas indicates the beginning of a
country’s economic improvement. Due to limited space in metropolitan areas, the
demand for land increases. Land price will rise when there is a gap between land
availability and demand. East Jakarta is the most potential land because of its rapid
price growth compared to other districts in DKI Jakarta. Usually, multiple linear
regression is used to analyze factors. This research also approached the data from
dependent variable distribution and spatial aspects. Gamma regression is an
alternative approach to fit regression models with gamma distribution as the
dependent variable. Since the data contains spatial pattern, spatial analysis was also
considered. The aims of this study are: (1) to compare the performance of multiple
linear regression, gamma regression and spatial autoregressive model on land price
in East Jakarta and (2) to identify factors that affect the land price in East Jakarta.
The data was collected using web scraping from www.rumah.com. The data
contained outliers; thus, the modelling was divided into data with and without the
outlier. The results implied that gamma regression has the smallest AIC, with or
without outlier, indicating that it was the most suitable method for this study
compared to multiple linear regression and spatial autoregressive model. All models
without outlier had smaller AIC compared to the model with outlier. Gamma
regression without outlier model stated commercial establishment area, school
availability, park availability and toll road access as factors affecting land price in
East Jakarta.
Industri properti merupakan salah satu sektor riil yang berkontribusi dalam
pertumbuhan ekonomi Indonesia. Pertumbuhan pada bidang properti menunjukkan
tahap awal perbaikan ekonomi di suatu negara. Keterbatasan ruang di kawasan
metropolitan membuat permintaan lahan meningkat. Harga tanah akan naik ketika
ada kesenjangan antara ketersediaan dan permintaan tanah. Jakarta Timur
merupakan lahan yang paling potensial karena pertumbuhan harga yang cepat
dibandingkan dengan kotamadya lain di DKI Jakarta. Regresi linier berganda
umumnya digunakan untuk menganalisis faktor yang berpengaruh pada penelitian.
Penelitian ini juga melakukan pendekatan dari distribusi variabel terikat dan aspek
spasial. Regresi gamma merupakan pendekatan alternatif untuk menyesuaikan
model regresi dengan distribusi gamma sebagai variabel terikat. Analisis spasial
juga dipertimbangkan karena ada pola spasial dalam data. Penelitian ini bertujuan
untuk: (1) membandingkan kinerja model regresi linier berganda, regresi gamma,
dan autoregresif spasial pada harga tanah di Jakarta Timur dan (2) mengidentifikasi
faktor-faktor yang memengaruhi harga tanah di Jakarta Timur. Data diperoleh
dengan web scraping dari www.rumah.com. Data tersebut mengandung pencilan
sehingga pemodelan dibagi menjadi data dengan dan tanpa pencilan. Hasil
menunjukkan bahwa regresi gamma memiliki AIC terkecil, dengan atau tanpa
pencilan, menunjukkan bahwa metode ini adalah metode terbaik untuk penelitian
ini dibandingkan dengan regresi linier berganda dan model autoregresif spasial.
Semua model tanpa pencilan memiliki AIC yang lebih kecil dibandingkan dengan
model dengan pencilan. Regresi gamma tanpa pencilan menyatakan kawasan
komersial, ketersediaan sekolah, ketersediaan taman dan akses jalan tol sebagai
faktor yang memengaruhi harga tanah di Jakarta Timur.
2022-06-09T06:39:14Z
2022-06-09T06:39:14Z
2022-06-09T06:39:14Z
2022
Undergraduate Thesis
http://repository.ipb.ac.id/handle/123456789/112010
en_US
IPB University
oai:repository.ipb.ac.id:123456789/1133912022-08-10T05:43:52Zcom_123456789_7470com_123456789_25com_123456789_9col_123456789_33
Penerapan Structural Equation Modeling (SEM) untuk Menganalisis Pengaruh Keaktifan Berorganisasi terhadap Prestasi Belajar Mahasiswa (Studi Kasus Mahasiswa S1 Angkatan 2018 Institut Pertanian Bogor)
Matin, Afrian Addlu
Wijayanto, Hari
Rahman, La Ode Abdul
Kegiatan berorganisasi merupakan wadah bagi para anggota untuk
mengembangkan minat dan bakat dalam suatu wadah organisasi. Organisasi
adalah suatu sistem yang terdiri dari dua orang atau lebih, yang terlibat dalam
tindakan kooperatif, berusaha mencapai suatu tujuan. Organisasi Mahasiswa
Intitut Pertanian Bogor terdiri dari Badan Eksekutif Mahasiswa (BEM), Dewan
Perwakilan Mahasiswa (DPM), Himpunan Mahasiswa Profesi (Himpro) dan Unit
Kegiatan Mahasiswa (UKM). Dalam penelitian ini, akan diteliti bagaimana
pengaruh kegiatan berorganisasi terhadap prestasi belajar mahasiswa
menggunakan metode Structural Equation Modeling (SEM) dengan pendekatan
Partial Least Square (PLS). Penelitian yang dilakukan menunjukkan mahasiswa
yang aktif berorganisasi dan memiliki bakat berorganisasi tidak berpengaruh
secara signifikan terhadap prestasi belajar yang mereka dapat serta menunjukkan
mahasiswa yang memiliki bakat serta motivasi dalam berorganisasi maka akan
berpengaruh terhadap keaktifan berorganisasi. Hasil penelitian tersebut
memberikan informasi bahwa keaktifan berorganisasi mahasiswa sangat
dipengaruhi oleh seberapa besar motivasi dan bakat berorganisasi dalam
menjalankan kegiatan organisasi. Hasil penelitian ini juga memberikan informasi
bahwa prestasi belajar mahasiswa tidak dipengaruhi oleh seberapa seberapa aktif
mahasiswa dalam organisasi dan tidak pula dipengaruhi oleh bakat mahasiswa
dalam berorganisasi.
Organizational activities are a place for members to develop their interests
and talents in an organization. Organization is a system consisting of two or more
people, who are involved in cooperative action, trying to achieve a goal. Student
Organizations in Bogor University consists of Badan Eksekutif Mahasiswa
(BEM), Dewan Perwakilan Mahasiswa (DPM), Himpunan Mahasiswa Profesi
(Himpro) and Unit Kegiatan Mahasiswa (UKM). In this study, Researcher will
investigate how the influence of organizational activities on student achievement
using the Structural Equation Modeling (SEM) method with the Partial Least
Square (PLS) approach. The research conducted shows that students who are
active in organizations and have organizational talent don’t have significant effect
on their learning achievement and also show that students who have
organizational talent and organizational motivation will have an effect on
organizational activity. The results of this study provide information that student
organizational activity is strongly influenced by how much motivation and
organizational talent in carrying out organizational activities. The results of this
study also provide information that student’s learning achievement is not
influenced by how active students are in organizations and is not influenced by
student’s talent in organizations.
2022-08-10T05:43:48Z
2022-08-10T05:43:48Z
2022-08-10T05:43:48Z
2022
Undergraduate Thesis
http://repository.ipb.ac.id/handle/123456789/113391
id
IPB University
oai:repository.ipb.ac.id:123456789/1146272022-09-23T06:40:33Zcom_123456789_7470com_123456789_25com_123456789_9col_123456789_33
Algoritme Support Vector Machine untuk Analisis Sentimen Berbasis Aspek Ulasan Game Online Mobile Legends: Bang-Bang
Utami, Mar Atul Aji Tyas
Silvianti, Pika
Masjkur, Mohammad
Kehadiran era teknologi digital dipermudah dengan adanya koneksi internet yang mudah diakses serta menyediakan banyak fitur dan hiburan salah satunya game online. Mobile Legends: Bang-Bang merupakan game online berjenis Multiplayer Online Battle Arena (MOBA) yang populer sejak diluncurkan pada tahun 2016. Kepopuleran tersebut tidak terlepas dari ulasan pengguna yang memberikan informasi dan sentimen berbeda. Penelitian ini akan mengidentifikasi sentimen ulasan pengguna aplikasi berdasarkan aspek gameplay, performa, visualisasi, dan player. Metode klasifikasi yang digunakan dalam penelitian ini adalah Support Vector Machine (SVM). Aplikasi game online Mobile Legends: Bang-Bang cenderung memiliki sentimen negatif berdasarkan aspek gameplay, performa, dan player. Akan tetapi, dari aspek visualisasi ulasan cenderung memiliki sentimen positif. Hasil evaluasi model dilakukan berdasarkan nilai akurasi, F1-score, dan AUC didapatkan bahwa aspek gameplay, performa, dan player memberikan tingkat klasifikasi yang lebih baik dibandingkan aspek visualisasi.
The presence of the digital technology era is facilitated by an internet connection that is easily accessible and provides many features and entertainment, one of which is online games. Mobile Legends: Bang-Bang is a Multiplayer Online Battle Arena (MOBA)-type online game that has been popular since its launch in 2016. Currently, Mobile Legends: Bang-Bang is still the top free game on the Google Play Store. This popularity is inseparable from user reviews that provide different information and sentiment. This research will identify the sentiment of application user reviews based on aspects of gameplay, performance, visualization, and player. The classification method used in this study is the Support Vector Machine (SVM). The online game application Mobile Legends: Bang-Bang tends to have negative sentiment from aspects of gameplay, performance, and player. However, from the visualization aspect, they tend to have positive sentiment. The results of the evaluation of the model based on the value of accuracy, F1-score, and AUC, it was found that the gameplay, performance, and player aspects gave better classification results than the visualization aspect.
2022-09-23T06:40:31Z
2022-09-23T06:40:31Z
2022-09-23T06:40:31Z
2022
Undergraduate Thesis
http://repository.ipb.ac.id/handle/123456789/114627
id
IPB University
oai:repository.ipb.ac.id:123456789/1135782022-08-14T13:40:48Zcom_123456789_7470com_123456789_25com_123456789_9col_123456789_33
Penerapan Metode SEM-PLS pada Faktor Keberhasilan Program Jaring Pengaman Sosial di Provinsi Jawa Timur
Permadi, Delta Firdasari
Rizki, Akbar
Sumertajaya, I Made
Tingkat kemiskinan di Indonesia meningkat cukup signifikan akibat adanya pandemi Covid-19. Dampak perlambatan ekonomi nasional juga berimbas pada kemiskinan di Jawa Timur ditandai dengan peningkatan kemiskinan sebesar 0,89% yang merupakan kenaikan tertinggi dalam kurun waktu tujuh tahun terakhir. Program Jaring Pengaman Sosial (JPS) diberlakukan sebagai upaya untuk mengurangi populasi masyarakat miskin dan rentan miskin. Faktor-faktor yang memengaruhi keberhasilan program JPS penting untuk diketahui sebagai bahan evaluasi. Data diperoleh dari survei yang dihimpun oleh Badan Perencanaan Pembangunan Daerah (BAPPEDA) Provinsi Jawa Timur kepada 928 ketua RT di Jawa Timur mengenai evaluasi pelaksanaan program JPS. Data bersifat kategorik dengan skala biner dan ordinal. Analisis Structural Equation Modeling- Partial Least Square (SEM-PLS) dapat digunakan untuk mengukur faktor- faktor yang memengaruhi keberhasilan program JPS dengan data kategorik. Hasil penelitian menyatakan bahwa keberhasilan pelaksanaan program JPS berpengaruh positif dan signifikan terhadap aktivitas perekonomian pada masa pandemi. Adapun hal-hal yang memengaruhi keberhasilan pelaksanaan program JPS adalah bantuan pemerintah pusat, provinsi, dan desa.
2022-08-14T13:40:08Z
2022-08-14T13:40:08Z
2022-08-14T13:40:08Z
2022
Undergraduate Thesis
http://repository.ipb.ac.id/handle/123456789/113578
id
IPB University
oai:repository.ipb.ac.id:123456789/1133472022-08-09T06:04:18Zcom_123456789_7470com_123456789_25com_123456789_9col_123456789_33
Klasifikasi Sekolah dalam Penerimaan Mahasiswa Baru Vokasi IPB Jalur USMI Menggunakan Metode CART
Widjanarko, Erlinda Widya
Syafitri, Utami Dyah
Alamudi, Aam
Seleksi penerimaan mahasiswa baru sekolah vokasi IPB terdiri dari beberapa
jalur, salah satunya adalah jalur USMI. Dalam rangka meningkatkan performanya,
perlu dilakukan evaluasi dalam penerimaan mahasiswa baru jalur USMI tersebut.
Sebelumnya telah dilakukan penelitian dengan tujuan yang sama menggunakan
metode clustering. Penelitian tersebut menghasilkan tiga gerombol dimana sekolah sekolah dibedakan berdasarkan komitmen dan kualitas. Tujuan penelitian ini adalah
membuat model klasifikasi dari gerombol yang diperoleh menggunakan metode
CART. Metode Classification and Regression Tree (CART) merupakan teknik
klasifikasi nonparametrik yang menghasilkan pohon keputusan tunggal. Metode
CART dapat melibatkan data yang bertipe campuran. Model klasifikasi yang
dihasilkan dari data tahun 2019 menghasilkan akurasi sebesar 98,52%. Namun,
hasil evaluasi model 2019 pada data tahun 2020 masih belum cukup bagus dalam
memprediksi dengan akurasi sebesar 57,22%, sehingga dilakukan penggerombolan
ulang pada data tahun 2020 dan dihasilkan tiga gerombol. Selanjutnya, dibuat ulang
model klasifikasi dengan data tahun 2020 dan menghasilkan akurasi sebesar
97,47%. Namun, hasil evaluasi model 2020 pada data tahun 2021 masih belum
cukup bagus dalam memprediksi dengan akurasi sebesar 44,34%, sehingga
penggerombolan pada tahun sebelumnya belum bisa digunakan untuk prediksi pada
data tahun setelahnya. Hal ini dikarenakan populasi sekolah berubah setiap tahun.
Pengelompokkan sekolah pelamar USMI perlu dilakukan dengan penggerombolan
sekolah setiap tahun berjalan.
The selection of new student admissions for the IPB vocational school consists
of several routes, one of which is the USMI route. In order to improve its
performance, it is necessary to evaluate the USMI new student admission system.
Previously, research with the same objective had been carried out using the
clustering method. The study resulted in three clusters in which schools were
differentiated based on the commitment and quality of the schools. This study aims
to create a classification model of the clusters obtained using the CART method.
Classification and Regression Tree (CART) is a nonparametric classification
technique that produces a single decision tree. The CART method can involve
mixed-type data. The classification model generated from the 2019 data yields an
accuracy of 98.52%. However, the results of the 2019 model evaluation with the
2020 data are still not good enough to predict with an accuracy of 57.22%, so the
2020 data is re-clustered and produces three clusters. Furthermore, the classification
model was remade with 2020 data, resulting in an accuracy of 97.47%. However,
the results of the 2020 model evaluation with the 2021 data are still not good enough
to predict with an accuracy of 44.34%, so the clustering in the previous year cannot
be used for predictions of the following year's data. The grouping of schools for
USMI applicants needs to be done by grouping schools every year.
2022-08-09T06:04:15Z
2022-08-09T06:04:15Z
2022-08-09T06:04:15Z
2022
Undergraduate Thesis
http://repository.ipb.ac.id/handle/123456789/113347
id
IPB University
oai:repository.ipb.ac.id:123456789/1146502022-09-25T23:52:32Zcom_123456789_7470com_123456789_25com_123456789_9col_123456789_33
Analisi Kemiripan Teks Terhadap Goal Standard Menggunakan Algoritme Levenshtein Distance dan Cosine Similarity (Studi Kasus : Data Hasil Survei Perusahaan X)
Azzahra, Aulia
Kurnia, Anang
Rizki, Akbar
Text mining merupakan teknik dalam pengolahan data teks untuk
mengekstrak informasi tertentu. Salah satu contoh text mining adalah mengukur
nilai kemiripan antara dua string. Algoritme Levenshtein Distance dapat
digunakan untuk mengukur kemiripan teks dengan menghitung jarak perbedaan
antara dua string. Algoritme lain yang digunakan adalah algoritme Cosine
Similarity. Algoritme Cosine Similarity melakukan pengukuran dengan
membandingkan jarak antara dua string yang dinyatakan dalam dua buah vektor.
Penerapan algoritme ini juga dilakukan dengan berbagai teknik text pre-processing
yang dapat memberikan hasil yang lebih maksimal. Kedua algoritme tersebut
digunakan dalam penelitian ini untuk mengukur kemiripan teks antara dua dataset.
Data yang digunakan yaitu, data hasil survei dengan master data pada database
Perusahaan X. Data hasil survei berjumlah 24.659 respon sedangkan pada database
Perusahaan X berjumlah 725 daftar nama program kelas online. Objek yang diukur
kemiripannya ialah nama program kelas online pada data hasil survei dengan
database Perusahaan X. Nilai kemiripan yang dihasilkan digunakan untuk
mengidentifikasi daftar nama program kelas online yang diikuti peserta pada hasil
survei. Hasil identifikasi dari 24.659 respon hasil survei diperoleh 322 daftar nama
program kelas online dengan algoritme Levenshtein Distance dan 327 daftar nama
program kelas online dengan algoritme Cosine Similarity.
Text mining is a technique in processing text data to extract certain
information. One example of text mining is measuring the similarity value between
two strings. Levenshtein Distance algorithm can be used to measure the similarity
of text by calculating the distance difference between two strings. Another
algorithm used is the Cosine Similarity algorithm. The Cosine Similarity algorithm
performs measurements by comparing the distance between two strings expressed
in two vectors. The application of this algorithm is also carried out with various text
pre-processing techniques that can provide maximum results. The two algorithms
are used in this study to measure the similarity of the text between the two datasets.
The data used are survey results data with master data in Company X database. Data
from survey results totaled 24,659 responses, while in Company X database there
were 725 lists of online class program names. The object whose similarity is
measured is the name of the online class program in the survey data with the
Company X database. The similarity value generated is used to identify the list of
names for the online class program that participants participated in the survey
results. The identification results from 24,659 responses to the survey results
obtained 322 lists of names for online class programs with the Levenshtein Distance
algorithm and 327 lists of names for online class programs with the Cosine
Similarity algorithm.
2022-09-25T23:52:29Z
2022-09-25T23:52:29Z
2022-09-25T23:52:29Z
2022
Undergraduate Thesis
http://repository.ipb.ac.id/handle/123456789/114650
id
IPB University
oai:repository.ipb.ac.id:123456789/1148402022-10-03T07:09:21Zcom_123456789_7470com_123456789_25com_123456789_9col_123456789_33
Analisis Beban Tangan pada Layout Keyboard QWERTY Berdasarkan Letter Frequency pada Dokumen Skripsi Mahasiswa FMIPA IPB
Ameliani, Barokaturrizkia
Rizki, Akbar
Rahardiantoro, Septian
Papan ketik atau keyboard merupakan perangkat masukan pada komputer. Salah satu yang umum digunakan yaitu keyboard dengan layout QWERTY. Penempatan karakter alfabet pada layout keyboard disusun berdasarkan letter frequency. Penempatan karakter alfabet akan berpengaruh pada beban tangan saat mengetik. Beban tangan yang tidak seimbang antara tangan kanan dan kiri akan mengakibatkan rasa tidak nyaman bahkan cedera pada tangan. Penelitian ini bertujuan untuk mengetahui perbandingan beban tangan antara tangan kanan dan kiri berdasarkan letter frequency, mengetahui pengelompokan karakter alfabet dengan letter frequency tinggi pada tangan kanan dan kiri, serta mengetahui tebaran hotspot karakter alfabet pada layout keyboard QWERTY berdasarkan letter frequency pada dokumen skripsi mahasiswa Fakultas Matematika dan Ilmu Pengetahuan Alam (FMIPA) Institut Pertanian Bogor (IPB). Metode yang digunakan yaitu cluster analysis dan hotspot analysis dengan teknik penarikan contoh menggunakan stratified sampling. Hasil analisis beban tangan diperoleh nilai selisih persentase beban tangan pada Strata 1, 2, dan 3 bernilai negatif menunjukkan beban tangan kiri lebih besar dibandingkan beban tangan kanan. Jumlah gerombol optimum yang terbentuk pada Strata 1, 2, dan 3 sebanyak 4 gerombol. Penggerombolan karakter alfabet dengan letter frequency tinggi pada tangan kanan dan kiri relatif seimbang. Teridentifikasi adanya hotspot pada taraf nyata 5%.
Keyboard is an input device on the computer. One of the commonly used is a keyboard with a QWERTY layout. The placement of alphabetic characters on the keyboard layout is arranged based on the letter frequency. The placement of alphabetic characters will affect the hand load when typing on the keyboard. An unbalanced hand load between the right and left hands will cause discomfort and even injury to the hand. This study aims to determine the comparison of the hand load between the right and left hands based on letter frequency, to determine the grouping of alphabetic characters with high letter frequency on the right and left hands, and to find out the distribution of alphabetic character hotspot on the QWERTY keyboard layout based on letter frequency on student undergraduate thesis document of Faculty of Mathematics and Natural Sciences (FMIPA) IPB University (IPB). The methods used in this research are cluster analysis and hotspot analysis with sampling technique using stratified sampling. The result of the hand load analysis obtained the value of the difference in the percentage of hand load in Strata 1, 2, and 3 negative values showed that the left hand load is greater than the right hand load. The optimum number of clusters formed in Strata 1, 2, and 3 is 4 clusters. The clusters of alphabetic characters with high letter frequency on the right and left hand are relatively balanced. It is identified that there are hotspot at a significance level of 5%.
2022-10-03T07:09:19Z
2022-10-03T07:09:19Z
2022-10-03T07:09:19Z
2022
Undergraduate Thesis
http://repository.ipb.ac.id/handle/123456789/114840
id
IPB University
oai:repository.ipb.ac.id:123456789/1131692022-08-04T00:14:44Zcom_123456789_7470com_123456789_25com_123456789_9col_123456789_33
Pemodelan Autoregresif Spasial pada Data Panel (Studi Kasus Kemiskinan di Jawa Timur)
Rahayu, Melania Dwi
Sulvianti, Itasia Dina
Kurnia, Anang
Penelitian ini bertujuan mengidentifikasi peubah-peubah yang berpengaruh terhadap
persentase kemiskinan di Jawa Timur pada tahun 2017-2020. Metode yang digunakan untuk
menjawab tujuan tersebut adalah analisis spasial data panel. Matriks pembobot yang digunakan
adalah matriks jarak invers, matriks jarak eksponensial, dan matriks jarak k-tetangga terdekat.
Data yang digunakan dalam penelitian ini adalah persentase kemiskinan sebagai peubah respon,
sedangkan peubah penjelasnya adalah Indeks Pembangunan Manusia (IPM), Tingkat
Pengangguran Terbuka (TPT), angka harapan hidup, rata-rata lama sekolah, rumah tangga yang
memiliki akses terhadap sanitasi layak, rumah tangga dengan sumber air minum yang layak,
dan pengeluaran rata-rata per kapita sebulan. Hasil analisis menunjukkan bahwa terdapat
ketergantungan spasial pada peubah respon dan pengaruh waktu di dalam model data panel
sangat kecil sehingga dapat diabaikan. Oleh karena itu, model yang digunakan adalah model
panel spatial autoregressive (SAR) dengan pengaruh tetap efek individu dan matriks pembobot
jarak 2-tetangga terdekat. Hasil penelitian menunjukkan bahwa peubah-peubah yang
berpengaruh signifikan terhadap persentase kemiskinan di Jawa Timur pada tahun 2017-2020
adalah tingkat pengangguran terbuka, angka harapan hidup, dan rata-rata pengeluaran per
kapita sebulan.
The objective of this reserch is to identify the variables that affect the percentage of
poverty in East Java from 2017 to 2020. The method used to answer this objective is spatial
analysis of panel data. The weighting matrix used is the inverse distance, exponential distance,
and k-nearest neighbor. The data used in this research were the percentage of poverty as
response variable, meanwhile the predictor variables include the human development index,
open unemployment rate, life expectancy rate, average of length school, households that have
access to decent sanitation, households with decent drinking water sources, and average
expenditure per capita a month. The result of the analysis show that there is a spatial
dependence on the response variable and the effect of time in the panel data model is so small
that it can be ignored. Therefore, the model used is spatial autoregressive (SAR) panel model
with a fixed effect and an 2-nearest neighbor distance weighting matrix. The result of this study
show that the variables that have a significant effect on poverty in East Java from 2017 to 2020
are life expectancy rate, open unemployment rate, and average expenditure per capita a month.
2022-08-04T00:14:40Z
2022-08-04T00:14:40Z
2022-08-04T00:14:40Z
2022
Undergraduate Thesis
http://repository.ipb.ac.id/handle/123456789/113169
id
IPB University
oai:repository.ipb.ac.id:123456789/1141252022-08-26T07:18:29Zcom_123456789_7470com_123456789_25com_123456789_9col_123456789_33
Identifikasi Faktor yang Memengaruhi Anak Putus Sekolah di Provinsi Daerah Istimewa Yogyakarta Menggunakan Regresi Logistik Biner
Hasanah, Malikhatul
Anisa, Rahma
Alamudi, Aam
Anak putus sekolah merupakan anak yang tidak mampu menyelesaikan
pendidikannya dan berhenti sekolah sebelum masa belajarnya berakhir sehingga
belum memiliki tanda tamat belajar atau ijazah pada jenjang pendidikan tersebut.
Provinsi DIY merupakan salah satu provinsi yang memiliki kasus putus sekolah
dan mengalami peningkatan dari tahun 2018 sampai 2020. Untuk itu, penelitian ini
bertujuan memodelkan kejadian anak putus sekolah di Provinsi DIY menggunakan
regresi logistik biner dengan menerapkan metode SMOTE untuk menangani
ketidakseimbangan data sehingga diketahui faktor-faktor yang memengaruhinya.
Regresi logistik biner digunakan karena peubah respon bersifat biner (Y = 1 jika
putus sekolah dan Y = 0 jika masih aktif bersekolah). Data penelitian menggunakan
data sekunder hasil Survei Sosisal Ekonomi Nasional 2021 yang dilakukan oleh
Badan Pusat Statistik wilayah Provinsi DIY. Hasil penelitian menunjukkan faktor
yang berpengaruh, yaitu pendidikan kepala rumah tangga, rata-rata pengeluaran
rumah tangga perkapita, status bekerja anak, dan status penerima PIP dengan
ketepatan klasifikasi model berikut : akurasi 79,16%, F1-score 17,19%, dan AUC
83,22%.
Dropout schools are children who are unable to complete their education and
leave school before the end of their study period so that they do not obtain certificate
from school or a diploma at that level of education. DIY Province is one of the
provinces that has dropout cases increasing from 2018 to 2020. For this reason, this
study aims to model the incidence of school dropouts in DIY Province using binary
logistic regression by applying the SMOTE method to handle data imbalances so
that the factors that influence it are known. Binary logistic regression was used
because the response variables were binary (Y = 1 if they dropped out of school and
Y = 0 if they were still in school). This research used secondary data from the 2021
National Socio-Economic Survey conducted by the Central Statistics Agency for
the DIY Province. The results showed that the influencing factors were the
education of the head of the household, the average household expenditure per
capita, the child’s working status, and the status of PIP recipients with 79,16%
accuracy, 17,19% F1-score, and 83,22% AUC.
2022-08-26T07:18:26Z
2022-08-26T07:18:26Z
2022-08-26T07:18:26Z
2022
Undergraduate Thesis
http://repository.ipb.ac.id/handle/123456789/114125
id
IPB University
oai:repository.ipb.ac.id:123456789/1131302022-08-02T15:39:44Zcom_123456789_7470com_123456789_25com_123456789_9col_123456789_33
Identifikasi Peubah yang Berpengaruh terhadap Kejadian Rawan Pangan di Jawa Barat dengan Generalized Linear Mixed Model LASSO
Fathina, Annissa Nur Fitria
Sartono, Bagus
Alamudi, Aam
Kerawanan pangan adalah kondisi ketidakmampuan individu atau kelompok di suatu daerah untuk memperoleh pangan yang cukup dan layak untuk hidup sehat dan aktif. Pengentasan kerawanan pangan sejalan dengan tujuan pembangunan berkelanjutan, terutama tujuan kedua, tanpa kelaparan. Sehingga diperlukan kajian terkait kerawanan pangan seperti mengidentifikasi faktor-faktor yang berpengaruh terhadap kejadian rawan pangan. Penelitian ini bertujuan untuk mengidentifikasi variabel-variabel yang mempengaruhi kejadian kerawanan pangan di Jawa Barat. Dengan menggunakan data Survei Sosial Ekonomi Nasional Provinsi Jawa Barat Tahun 2020. Data tersebut memiliki tipe variabel respon kategorik dan diambil menggunakan teknik two-stage sampling sehingga dapat dianalisis menggunakan metode Generalized Linear Mixed Model LASSO. Analisis menggunakan paket glmmLasso dengan 10-fold cross-validation (CV) pada 20 nilai lambda (16 hingga 35). CV dilakukan untuk mengukur kebaikan model dan akurasi, sehingga diperoleh lambda terbaik untuk membangun model terbaik untuk diinterpretasikan. Variabel yang secara umum berpengaruh signifikan terhadap kerawanan pangan di Jawa Barat adalah variabel X14 yang menunjukkan jumlah anggota rumah tangga yang memiliki tabungan yang berpengaruh negatif terhadap kejadian rawan pangan di Jawa Barat dan variabel X19 yang menunjukkan kepemilikan penerima bantuan iuran BPJS kesehatan yang berpengaruh positif terhadap kejadian rawan pangan di Jawa Barat.
Food insecurity is a condition of the inability of an individual or group in an area to obtain sufficient and appropriate food for a healthy and active life. The alleviation of food insecurity is in line with the Sustainable Development Goals, especially the second goal, zero hunger. This study aims to identify the variables that influence the incidence of food insecurity in West Java. By using data from the National Socio-Economic Survey of West Java Province in 2020. The data has a categorical type of response variable and is taken using a two-stage sampling technique so that it can be analyzed using the Generalized Linear Mixed Model LASSO method. Analysis using the glmmLasso package with 10-fold cross-validation (CV) at 20 lambda values (16 to 35). CV is done to measure the goodness of the model and accuracy, so that the best lambda is obtained to build the best model to be interpreted. The variables that generally have a significant effect on food insecurity in West Java are the X14 variable that shows the number of household members who have savings which have a negative impact and X19 variable that shows the ownership of PBI BPJS which have a positive impact.
2022-08-02T15:39:41Z
2022-08-02T15:39:41Z
2022-08-02T15:39:41Z
2022
Undergraduate Thesis
http://repository.ipb.ac.id/handle/123456789/113130
id
IPB University
oai:repository.ipb.ac.id:123456789/1155422022-12-14T23:31:33Zcom_123456789_7470com_123456789_25com_123456789_9col_123456789_33
Penerapan Metode Geographically Weighted Regression (GWR) pada Kasus Kriminalitas di Provinsi Sumatera Utara Tahun 2020
Ritonga, Nina Sahara
Angraini, Yenni
Susetyo, Budi
Jumlah kejahatan di wilayah kerja Polda Sumatera Utara menempati urutan tertinggi pada tahun 2020 dibandingkan wilayah kerja Polda lainnya di Indonesia. Angka kejahatan tersebut meningkat dari tahun 2019 dan Provinsi Sumatera Utara tetap menempati posisi teratas dari tahun ke tahun. Tingginya kasus kriminalitas tersebut dihubungkan dengan faktor ekonomi, sosial, dan demografi. Sehingga perlu dilakukan identifikasi lebih lanjut untuk mengetahui faktor-faktor yang memengaruhi semakin tingginya kasus kriminalitas guna menekan jumlah kejahatan di Provinsi Sumatera Utara. Salah satu metode yang dapat digunakan untuk menganalisa faktor-faktor yang memengaruhi tingginya kasus kriminalitas di Provinsi Sumatera Utara adalah metode Geographically Weighted Regression (GWR) dimana metode ini dapat mempertimbangkan unsur spasial dari tiap daerah. Penelitian ini bertujuan untuk melakukan penerapan model GWR dan menentukan faktor-faktor yang memengaruhi tingginya kasus kriminalitas di Provinsi Sumatera Utara pada tahun 2020. Hasil penelitian menunjukkan bahwa model GWR dengan fungsi pembobot adaptive Gaussian kernel memiliki performa yang lebih baik dibandingkan dengan fungsi pembobot lain yang telah digunakan dengan AIC 58,683, RMSE 0,491, dan R^2 75%. Model GWR adaptive Gaussian kernel membentuk empat kelompok peubah signifikan berdasarkan wilayah hukumnya. Koefisien determinasi lokal yang diperoleh berkisar antara 50% sampai dengan 86% yang menandakan bahwa performa model yang diperoleh pada tiap wilayah hukum cukup baik.
The number of reported crimes in the working area of the Regional Police of North Sumatera ranks highest compared to other working area of Regional Police in Indonesia in 2020. The number of figures has increased from 2019 and Regional Police of North Sumatera remains in the top position yearly. The high number of criminal cases is related to economic, social, dan demographic factors. So it is necessary to identify the factors which influence the increasing number of criminal cases in North Sumatera Province in order to reduce the number of crimes in North Sumatera Province. A method that can be used to analyze the factors that affect high crime rate in North Sumatera Province is Geographically Weighted Regression (GWR) method which can consider the spatial effects of each area. This study aims to apply the GWR model and determine the factors which affect high crime rate in North Sumatera Province in 2020. The results show that the GWR model with the best weighting function adaptive Gaussian kernel has better performance than the other weighted function with AIC 58,683, RMSE 0,491, and R^2 75%. The GWR model with adaptive Gaussian kernel forms four groups of significant variables based on the jurisdiction. The coefficient of local determination obtained ranges from 50% to 86% which indicates that the performance of the model performance in each jurisdiction is fairly good.
2022-12-14T23:31:30Z
2022-12-14T23:31:30Z
2022-12-14T23:31:30Z
2022
Undergraduate Thesis
http://repository.ipb.ac.id/handle/123456789/115542
id
IPB University
oai:repository.ipb.ac.id:123456789/1138572022-08-22T04:34:09Zcom_123456789_7470com_123456789_25com_123456789_9col_123456789_33
Penanganan Overdispersi pada Kasus Jumlah Kematian Akibat Demam Berdarah Dengue di Provinsi Jawa Timur
Hendriana, Latifa
Kurnia, Anang
Angraini, Yenni
Demam berdarah dengue (DBD) merupakan salah satu penyakit yang terjadi di daerah tropis dan subtropis di dunia, termasuk Indonesia. Hingga saat ini belum ada vaksin atau obat yang bisa menyembuhkan DBD. Pencegahan penyakit ini adalah hal terbaik yang harus dilakukan. Namun, selain mengurangi jumlah penderita dengan melakukan kegiatan preventif, mengurangi jumlah kematian akibat DBD juga menjadi hal yang perlu diperhatikan. Pada tahun 2017 jumlah kasus DBD di Provinsi Jawa Timur mencapai 7838 kasus dengan jumlah kematian mencapai 105 kasus. Penanganan kasus overdispersi pada Regresi Poisson dapat dilakukan dengan metode Regresi Binomial Negatif dan Regresi Zero-Inflated Poisson. Regresi Binomial Negatif dapat menangani overdispersi pada data jumlah kematian akibat demam berdarah dengue di Provinsi Jawa Timur tahun 2017. Faktor-faktor yang memengaruhi kematian akibat demam berdarah dengue adalah X1 (Persentase rumah tangga berperilaku hidup bersih dan sehat).
Dengue hemorrhagic fever (DBD) is a diseases that occur in tropical and
subtropical regions of the world, including Indonesia. Until now there is no vaccine
or drug that can cure dengue. Prevention of this disease is the best thing to do.
However, in addition to reducing the number of sufferers by carrying out preventive
activities, reducing the number of deaths caused by dengue is also something that
needs to be considered. In 2017 the number of dengue cases in East Java Province
reached 7.838 cases, with the number of deaths reaching 105 cases. Handling cases
of overdispersion in Poisson Regression can be done by Negative Binomial
Regression and Zero-Inflated Poisson Regression. Negative Binomial Regression
can handle overdispersed data. Factors that affect cases of death due to dengue
hemorrhagic fever are X1 (percentage of household living clean and healty).
2022-08-22T04:34:06Z
2022-08-22T04:34:06Z
2022-08-22T04:34:06Z
2022-08
Undergraduate Thesis
http://repository.ipb.ac.id/handle/123456789/113857
id
IPB University
oai:repository.ipb.ac.id:123456789/1136032022-08-15T06:28:48Zcom_123456789_7470com_123456789_25com_123456789_9col_123456789_33
Klasifikasi Sekolah pada Penerimaan Mahasiswa Baru Jalur SNMPTN di IPB University Menggunakan Metode Regresi Logistik Multinomial
Aulia, Farah
Syafitri, Utami Dyah
Anisa, Rahma
IPB University merupakan perguruan tinggi yang memiliki kualitas pendidikan baik, begitu pula dengan penerimaan mahasiswa barunya. Salah satu jalur penerimaan mahasiswa baru yang ada di IPB University yaitu SNMPTN. Hal yang ingin diketahui IPB University adalah membuat fungsi klasifikasi sekolah pendaftar SNMPTN menggunakan metode regresi logistik multinomial. Sebelum dilakukan klasifikasi, dilakukan analisis gerombol dengan metode two-step cluster menggunakan data tahun 2016-2020. Metode two-step cluster menghasilkan empat gerombol optimal. Gerombol 1 adalah sekolah dengan peringkat terendah (komitmen, kualitas, dan konsistensi rendah). Gerombol 2 dan 3 adalah sekolah yang memiliki kriteria khusus pada kategori tertentu. Gerombol 4 adalah sekolah yang memiliki peringkat tertinggi (komitmen, kualitas, dan konsistensi tinggi). Hasil dari analisis gerombol akan dipakai untuk klasifikasi sebagai peubah respon. Model regresi logistik multinomial memberikan ketepatan klasifikasi sebesar 98,86%. Peluang sekolah setiap kategori dapat diperoleh dari model logit yang terbentuk. Peubah signifikan dari model yang dihasilkan mampu memprediksi peluang sekolah untuk masuk dalam gerombol tertentu. Model yang didapatkan dari hasil klasifikasi akan divalidasi menggunakan data tahun 2021. Validasi yang dihasilkan masih belum cukup bagus memprediksi karena nilai akurasinya sebesar 61,8%. Nilai akurasi dikatakan bagus jika berada pada selang 80-110%. Hal ini dikarenakan setiap tahun terjadi perubahan sekolah yang mendaftar SNMPTN di IPB University.
IPB University is considered as one of the best universities, with quite qualified student enrollment. One of the new student admissions paths at IPB University is SNMPTN. This study aimed to generate a classification function for the school of college student enrollment, in this case, SNMPTN on IPB University, with a multinomial logistic regression analysis method. The researcher conducted the cluster analysis by two-step cluster using 2016 until 2020 data and produced four optimal clusters. The clustering was proceed and resulted four optimal clusters. The first cluster ranked lowest based on commitment, quality, and high school student enrollment consistency. The second and third clusters were schools with particular criteria for specific categories. The last cluster was the other three clusters highest commitment, quality, and consistency. In this case, the multinomial logistic regression model had 98,86% accuracy. The probability of all clusters in a high school could be derived from the logit model. Logistic regression's coefficient was used to predict probability value which falls into four clusters model. The prediction model of the actual data on years interval 2016 until 2020 for data testing 2021 was still below expectation because low accuracy data was 61,8%.
2022-08-15T06:28:45Z
2022-08-15T06:28:45Z
2022-08-15T06:28:45Z
2022
Undergraduate Thesis
http://repository.ipb.ac.id/handle/123456789/113603
id
IPB University
oai:repository.ipb.ac.id:123456789/1137442022-08-18T06:00:12Zcom_123456789_7470com_123456789_25com_123456789_9col_123456789_33
Penerapan Algoritma DBSCAN untuk Penggerombolan Kota/Kabupaten di Jawa Barat Berdasarkan Indikator Rawan Pangan
Kevin, Alexander
Rizki, Akbar
Sartono, Bagus
Terdapat beberapa permasalahan umum ketika melakukan analisis gerombol,
diantaranya adalah adanya “curse of dimensionality” di ruang dimensi tinggi dan
adanya bentuk gerombol yang tidak beraturan (arbitrary) serta kehadiran outlier.
Permasalahan tersebut dapat diatasi dengan melakukan reduksi dimensi terlebih
dahulu dan menggunakan analisis gerombol yang berbasis kepadatan. Kerawanan
pangan merupakan salah satu permasalahan utama yang menjadi isu global bagi
sebagian besar negara. Di Indonesia terdapat FSVA (Food Security and
Vulnerability Atlas) yang merupakan peta tematik visualisasi geografis wilayah
rentan terhadap kerawanan pangan. Penentuan status rawan pangan suatu daerah
pada FSVA diukur dengan analisis yang relatif sederhana yaitu metode pembobotan
pada sembilan indikator kerawanan pangan kronis. Pada penelitian kali ini,
penggerombolan wilayah yang rentan terhadap kerawanan pangan untuk
kota/kabupaten di Jawa Barat dilakukan dengan metode machine learning dan
indikator yang digunakan lebih beragam (25 peubah) untuk menghasilkan gerombol
yang lebih baik. Penggerombolan dilakukan dengan metode DBSCAN (DensityBased Spatial Clustering of Applications with Noise) pada data yang telah direduksi
dimensi terlebih dahulu menggunakan metode t-SNE (t-Distributed Stochastic
Neighbor Embedding). Data yang digunakan dalam penelitian ini adalah data
Susenas (Survei Sosial Ekonomi Nasional) tahun 2020 untuk provinsi Jawa Barat.
Hasil penggerombolan terbaik ditentukan berdasarkan parameter optimal yang
dievaluasi menggunakan koefisien Silhouette dan indeks DBCV (Density Based
Clustering Validation). Parameter optimal yang menghasilkan koefisien Silhouette
dan indeks DBCV tertinggi diperoleh pada perplexity = 1, epsilon = 31, dan minPts
= 2. Penggerombolan terbaik menghasilkan lima gerombol dengan tidak ada outlier.
There are several common problems when performing cluster analysis, including
the existence of a “curse of dimensionality” in high-dimensional space and the presence
of arbitrary cluster shapes, and also the presence of outliers. These problems can be solved
by reducing the dimensions first and using density-based cluster analysis. Food insecurity
is one of the main problems that become a global issue for most countries. In Indonesia,
there is an FSVA (Food Security and Vulnerability Atlas) which is a thematic map
visualizing geographical areas vulnerable to food insecurity. Determination of the food
insecurity status of an area on the FSVA is measured by relatively simple analysis, namely
the weighting method on nine indicators of chronic food insecurity. In this study,
clustering of areas that are vulnerable to food insecurity for cities/districts of West Java
is carried out using machine learning methods and the indicators used are more diverse
(25 variables) to produce better clusters. Clustering is performed using the DBSCAN
(Density-Based Spatial Clustering of Applications with Noise) method on data that has
been reduced in dimensions first using t-SNE (t-Distributed Stochastic Neighbor
Embedding). The data used in this study is the 2020 Susenas (Survei Sosial Ekonomi
Nasional) data for the province of West Java. The best clustering result is determined
based on the optimal parameters evaluated using the Silhouette coefficient and the DBCV
(Density-Based Clustering Validation) index. Optimal parameters that produce the
highest Silhouette coefficient and DBCV index are obtained at perplexity = 1, epsilon =
31, and minPts = 2. The best clustering results in five clusters with no outliers.
2022-08-18T06:00:09Z
2022-08-18T06:00:09Z
2022-08-18T06:00:09Z
2022
Undergraduate Thesis
http://repository.ipb.ac.id/handle/123456789/113744
id
IPB University
oai:repository.ipb.ac.id:123456789/1136072022-08-15T06:33:31Zcom_123456789_7470com_123456789_25com_123456789_9col_123456789_33
Kajian Perbandingan Regresi Conway-Maxwell-Poisson dan Poisson-Tweedie dalam Mengatasi Overdispersi pada Regresi Poisson
Nasution, Ahmad Rifai
Sadik, Kusman
Rizki, Akbar
Regresi Poisson adalah model yang umum digunakan untuk memodelkan data cacah. Memodelkan data cacah sering terjadi overdispersi sehingga regresi Poisson kurang tepat digunakan karena regresi Poisson mengasumsikan data equidispersi. Overdispersi dapat diatasi menggunakan regresi Conway-Maxwell-Poisson (COM-Poisson) dan Poisson Tweedie (Poisson-Tw). Model terbaik ditentukan berdasarkan RMSE, absolute bias, ragam penduga parameter, AIC, dan BIC terkecil. Penelitian ini menggunakan data simulasi dan data riil. Peubah respon pada data simulasi dibangkitkan menyebar Generalized Poisson dengan berbagai kombinasi parameter ϕ dan n. Kajian data simulasi menunjukkan bahwa regresi COM-Poisson dan Compound Poisson-Tw adalah model alternatif untuk memodelkan data cacah overdispersi, tetapi COM-Poisson lebih baik digunakan untuk tingkatan dispersi yang tinggi. Kajian data riil menunjukkan bahwa regresi COM-Poisson lebih baik digunakan dengan peubah yang berpengaruh terhadap kasus kusta di Jawa Timur tahun 2020 adalah jumlah penduduk miskin (X3) pada taraf nyata 0,05.
Poisson regression is a standard method to model count data. Modeling count data frequently causes overdispersion which means that Poisson regression is less precise to model it as Poisson regression has the assumption of equidispersion. Overdispersion can be overcome by using Conway-Maxwell-Poisson (COM-Poisson) and Poisson Tweedie (Poisson-Tw) regression. The best model is determined based on the lowest value of RMSE, absolute bias, variance of parameter estimator, AIC, and BIC. This research uses both simulation and real data. The response variable of simulation data is generated to follow Generalized Poisson distribution with combinations of ϕ and n. The result of simulation study shows that COM-Poisson and Compound Poisson-Tw are the alternatives to model overdispersed count data, but COM-Poisson is better to overcome overdispersion with higher dispersion parameter level. Real data is modeled using COM-Poisson regression to analyze the number of leprosy cases in East Java 2020 and shows that the number of people living in poverty (X3) affects the number of leprosy cases in East Java 2020 at a 0,05 level of significance.
2022-08-15T06:33:28Z
2022-08-15T06:33:28Z
2022-08-15T06:33:28Z
2022
Undergraduate Thesis
http://repository.ipb.ac.id/handle/123456789/113607
id
IPB University
oai:repository.ipb.ac.id:123456789/1155652022-12-15T23:43:36Zcom_123456789_7470com_123456789_25com_123456789_9col_123456789_33
Peramalan Harga Batu Bara Acuan Mengunakan Metode Autoregressive Integrated Moving Average dan Fungsi Transfer
Prahesti, Suci Pujiani
Sulvianti, Itasia Dina
Angraini, Yenni
Indonesia sebagai salah satu negara penghasil komoditas batu bara terbesar di dunia memiliki peranan yang penting dalam memenuhi permintaan batu bara di dunia global. Dewasa ini, sebagian besar negara-negara di Eropa kembali beralih kepada batu bara sebagai sumber tenaga pembangkit listriknya. Hal ini disebabkan adanya pandemi Covid-19 serta adanya konflik antara Rusia dan Ukraina yang membuat sumber energi menjadi terancam. Oleh sebab itu, peramalan harga batu bara diperlukan untuk menentukan kebijakan yang tepat dalam menghadapi banyaknya permintaan kebutuhan batu bara di masa mendatang. Pergerakan harga batu bara dipengaruhi oleh harga gas alam. Faktor harga gas alam tersebut akan dimodelkan dalam peramalan harga batu bara acuan menggunakan metode fungsi transfer sebagai deret inputnya. Penelitian ini membandingkan metode ARIMA dan fungsi transfer dalam peramalan harga batu bara acuan. Hasil penelitian ini menunjukkan bahwa model ARIMA dan model fungsi transfer secara berturut-turut menghasilkan nilai MAPE sebesar 23,14% dan 17,66%. Berdasarkan nilai MAPE yang dihasilkan metode fungsi transfer memiliki kemampuan peramalan yang lebih baik dibandingkan dengan metode ARIMA.
Indonesia as one of the largest coal producing countries in the world has an
important role in coal global demand. Currently, most countries in Europe are
turning to coal as a source of electricity. This is due to Covid-19 pandemic and the
conflict between Russia and Ukraine which endangers energy sources. Therefore,
forecasting coal prices in the future is needed to determine the right policy in
dealing with the large demand for coal. Coal price fluctuation are influenced by
several factors such as the prices of the other commodities instance natural gas price.
The natural gas price factor will be modeled in coal price forecasting using the
transfer function method as the input series. This study compares the ARIMA and
Transfer Function in coal price forecasting. The results showed that MAPE values
of ARIMA and transfer function method are 23,14% and 17,66%. Based on MAPE
values that forecasting using the transfer function method has a better ability than
ARIMA method in forecasting coal prices.
2022-12-15T23:43:33Z
2022-12-15T23:43:33Z
2022-12-15T23:43:33Z
2022
Undergraduate Thesis
http://repository.ipb.ac.id/handle/123456789/115565
id
IPB University
oai:repository.ipb.ac.id:123456789/1139962022-08-24T13:14:20Zcom_123456789_7470com_123456789_25com_123456789_9col_123456789_33
Penggunaan Vector Autoregressive untuk Mengetahui Pengaruh COVID-19 terhadap Indeks Saham Sektoral
Dandi, Yusuf
Rizki, Akbar
Sadik, Kusman
Pasar modal menjadi salah satu bidang yang terkena dampak COVID-19. Hal ini terlihat dari menurunnya indeks saham di berbagai sektor di Indonesia. Penelitian ini bertujuan menguraikan pengaruh COVID-19 terhadap indeks saham sektoral. Data yang digunakan merupakan data harian periode 15 Maret 2020 hingga 16 Maret 2021 yang terdiri atas data indeks saham sektoral dan data kasus harian COVID-19. Interpolasi linier digunakan pada data indeks saham sektoral untuk menduga data hilang. Uji kausalitas Granger digunakan untuk mengetahui hubungan sebab-akibat antara COVID-19 dan indeks saham sektoral. Selanjutnya vector autoregressive digunakan untuk memodelkan pengaruh COVID-19 terhadap indeks saham sektoral. Hasil penelitian menunjukkan bahwa pengaruh guncangan sebesar satu simpangan baku perubahan kasus harian COVID-19 akan direspon perubahan relatif indeks saham sektoral selama 3 sampai dengan 4 hari ke depan. Besarnya kontribusi perubahan kasus harian COVID-19 dalam memengaruhi perubahan relatif indeks saham sektoral relatif kecil dengan persentase kurang dari 5%. Selain itu, perubahan kasus harian COVID-19 memengaruhi perubahan relatif indeks saham sektor infrastruktur, utilitas, dan transportasi pada taraf nyata 5%.
The capital market is one of the sectors affected by COVID-19. This can be seen from the decline of stock index in various sectors in Indonesia. This study aims to describe the effect of COVID-19 on sectoral indices. The data used is daily data for the period March 15, 2020 until March 16, 2021, which consists of sectoral indices data and daily COVID-19 case data. Linear imputation is used to estimate missing observations on the sectoral indices data. Granger causality test is used to determine the causal relationship between COVID-19 and sectoral indices. The effect of COVID-19 on sectoral indices is then modelled using the vector autoregressive model. The results show that one standard deviation shock in changes in daily COVID-19 cases will be responded by relative changes in sectoral indices over the next 3 to 4 days. Changes in daily COVID-19 cases contribute to a relatively small influence in the relative changes of sectoral indices, with percentage of less than 5%. Furthermore, changes in the daily COVID-19 cases affect the relative changes in the stock index of the infrastructure, utilities, and transportation sectors at a significant level of 5%.
2022-08-24T13:14:17Z
2022-08-24T13:14:17Z
2022-08-24T13:14:17Z
2022
Undergraduate Thesis
http://repository.ipb.ac.id/handle/123456789/113996
id
IPB University
oai:repository.ipb.ac.id:123456789/1149072022-10-07T06:01:09Zcom_123456789_7470com_123456789_25com_123456789_9col_123456789_33
Klasifikasi Kadar Glukosa Darah Keluaran Alat Non-Invasif Menggunakan Regresi Logistik Ordinal dengan Peringkasan Luas
Istiqomah, Yuniar
Erfiani
Syafitri, Utami Dyah
Diabetes Melitus (DM) dikenal sebagai silent killer karena gejalanya
cenderung tidak disadari. Pemeriksaan kadar glukosa darah penting dilakukan
berkala untuk mengontrol kadar glukosa darah bagi penderita maupun non-penderita DM. Tim Non-Invasif Biomarking IPB mengembangkan alat pengukur
kadar glukosa darah non-invasif untuk memudahkan proses pemantauan tersebut.
Alat tersebut menggunakan prinsip spektroskopi dan menghasilkan keluaran berupa
nilai residu intensitas cahaya. Suatu metode diperlukan untuk memprediksi kategori
kadar glukosa darah berdasarkan hasil pengukuran alat non-invasif. Pemodelan
klasifikasi merupakan salah satu metode untuk menganalisis hubungan antara kelas
kadar glukosa darah hasil pengukuran invasif dengan nilai residu intensitas hasil
pengukuran non-invasif. Salah satu metode klasifikasi yang umum digunakan
adalah regresi logistik. Regresi logistik adalah salah satu regresi dengan peubah
respon berupa kategorik. Jika skala pengukuran dari peubah respon adalah ordinal,
analisis yang digunakan adalah regresi logistik ordinal. Metode ini menghasilkan
model akhir berupa fungsi logit peluang kumulatif. Data berbasis spektrum cahaya
yang digunakan sebagai peubah prediktor X seringkali memberikan peubah yang
saling berkorelasi antara satu dengan lainnya. Principal component analysis akan
digunakan untuk mereduksi dimensinya sehingga menjadi sekumpulan peubah baru
yang tidak berkolerasi. Pendekatan peringkasan data yang baik pada tahap
prapemrosesan juga diperlukan untuk memberikan pemodelan yang baik. Beberapa
metode peringkasan telah dilakukan pada penelitian sebelumnya. Peringkasan luas
pada periode merupakan metode peringkasan terbaik karena dapat memanfaatkan
keseluruhan informasi data. Penelitian ini menggunakan metode regresi logistik
ordinal sebagai metode pemodelan dengan menerapkan principal component
analysis dan peringkasan luas yang diterapkan pada data 2017 dan data 2019.
Pemodelan klasifikasi pada data 2017 menghasilkan nilai balanced accuracy
sebesar 64,64%. Pemodelan klasifikasi pada data 2019 menghasilkan nilai balanced
accuracy sebesar 57,57%. Desain yang digunakan pada alat 2017 dan alat 2019
berbeda. Hal tersebut menyebabkan grafik residu intensitas hasil pengukuran non-invasif yang terbaca juga berbeda. Model pada data 2017 lebih baik diterapkan pada
data yang homogen dan model pada data 2019 lebih baik diterapkan pada data yang
heterogen.
2022-10-07T06:01:06Z
2022-10-07T06:01:06Z
2022-10-07T06:01:06Z
2022
Undergraduate Thesis
http://repository.ipb.ac.id/handle/123456789/114907
id
IPB University
oai:repository.ipb.ac.id:123456789/1133782022-08-10T03:25:32Zcom_123456789_7470com_123456789_25com_123456789_9col_123456789_33
Analisis Data Longitudinal Menggunakan Multivariate Latent Curve Model
Ramadhanty, Berlian Bunga
Angraini, Yenni
Rizki, Akbar
Sartono, Bagus
Kemiskinan merupakan masalah multidimensional yang terjadi di negara maju maupun berkembang. Jumlah penduduk miskin di Indonesia mencapai 25.67 juta. Kemiskinan tersebut berpengaruh terhadap kualitas hidup. Kemiskinan dan kualitas hidup tidak dapat diukur secara langsung serta mengalami perubahan setiap tahun sehingga dapat dikaji menggunakan analisis multivariate dan longitudinal. Analisis yang dapat digunakan untuk data multivariate dan longitudinal yaitu multivariate latent curve model (LCM). Pada penelitian ini, multivariate LCM diterapkan ke data longitudinal dengan kondisi kemiskinan dan kualitas hidup sebagai peubah laten. Pemodelan dilakukan dengan dua cara yaitu model dasar dan model target. Hasil evaluasi model menggunakan GFI dan AGFI menunjukkan model dasar lebih baik dibanding model target. Hal ini menunjukkan perubahan kualitas hidup dan kondisi kemiskinan dari tahun ke tahun konstan. Pernyataan ini didukung oleh nilai slope yang diperoleh pada model target mendekati nol. Model dasar menunjukkan Kabupaten/Kota di Pulau Jawa memiliki kualitas hidup lebih tinggi dan kemiskinan yang lebih rendah dibandingkan di luar Pulau Jawa. Kualitas hidup dan kondisi kemiskinan memiliki arah hubungan berlawanan, semakin tinggi kualitas hidup cenderung semakin rendah kondisi kemiskinan dan sebaliknya.
Poverty is a multidimensional problem in both developed and developing countries. The number of poor people in Indonesia reaches 25.67 million. Poverty and quality of life have a significant relationship. Both of them are unobserved and always change every year so they can be studied using multivariate and longitudinal analysis. The method that can be used for multivariate and longitudinal data is the multivariate latent curve model (LCM). In this study, multivariate LCM was applied to longitudinal data using conditions of poverty and quality of life as latent variables. This method consists of two types namely the baseline model and freed loading model. The result of the model evaluation, GFI and AGFI values show that the baseline model is better than freed loading model. This shows changes in quality of life and conditions of poverty from year to year are constant. This statement is supported by the mean value of the random slope obtained in the target model which is close to zero. The baseline model shows a higher quality of life and lower condition of poverty in Java. Quality of life and condition of poverty has a negative correlation, high quality of life tends to decrease the condition of poverty.
2022-08-10T03:25:29Z
2022-08-10T03:25:29Z
2022-08-10T03:25:29Z
2022
Undergraduate Thesis
http://repository.ipb.ac.id/handle/123456789/113378
id
IPB University
oai:repository.ipb.ac.id:123456789/1136022022-08-15T06:28:05Zcom_123456789_7470com_123456789_25com_123456789_9col_123456789_33
Penerapan Regresi Binomial Negatif untuk Mengatasi Overdispersi pada Regresi Poisson Kasus Demam Berdarah di Jawa Barat
Rafifah, Zalfa
Anisa, Rahma
Erfiani
Demam berdarah dengue (DBD) telah menjadi penyakit endemik berbagai kota besar di Indonesia, termasuk Jawa Barat sebagai provinsi dengan jumlah kasus tertinggi. Jumlah kasus DBD merupakan data cacah yang mengikuti sebaran Poisson. Model regresi paling sederhana dalam memodelkan data cacahan adalah regresi Poisson. Namun, pada penerapannya regresi Poisson mengalami masalah overdispersi. Penanganan overdispersi pada regresi Poisson dapat ditangani menggunakan regresi binomial negatif. Pada penelitian ini dilakukan pemodelan regresi binomial negatif dalam menganalisis data jumlah kasus demam berdarah di Jawa Barat yang mengalami overdispersi. Hasil pada penelitian ini adalah regresi binomial negatif merupakan model yang lebih baik dibandingkan regresi Poisson berdasarkan nilai AIC dan BIC yang diperoleh. Peubah-peubah yang terbukti berpengaruh signifikan terhadap jumlah kasus demam berdarah di Jawa Barat diantaranya adalah persentase penduduk miskin, kepadatan penduduk, dan rasio dokter umum terhadap puskesmas.
Dengue hemorrhagic fever (DHF) has become an endemic disease in many big cities in Indonesia, including West Java as the province with the highest number of cases. The number of DHF cases is a count data that follows the Poisson distribution. The simplest regression model for count data is Poisson regression. However, in its application, Poisson regression has an overdispersion problem. Overdispersion in Poisson regression can be handled using negative binomial regression. In this study, negative binomial regression will be carried out for modelling the number of dengue fever case in West Java with overdispersion conditions. This study showed that negative binomial regression model perfomed better than Poisson regression based on the obtained AIC and BIC values. The variables that have been shown to have a significant effect on the number of dengue fever cases in West Java included the percentage of poor people, population density, and the ratio of general practitioners to puskesmas.
2022-08-15T06:28:02Z
2022-08-15T06:28:02Z
2022-08-15T06:28:02Z
2022
Undergraduate Thesis
http://repository.ipb.ac.id/handle/123456789/113602
id
IPB University
oai:repository.ipb.ac.id:123456789/1137382022-08-18T04:17:51Zcom_123456789_7470com_123456789_25com_123456789_9col_123456789_33
Pendugaan Kadar Glukosa Darah Non-Invasif Menggunakan Metode Generalized Ridge Regression dengan Peringkasan luas
Mujtahid, Mohammad Kautsar Fathan Arief
Erfiani, Erfiani
Wigena, Aji Hamim
Diabetes Melitus (DM) merupakan suatu penyakit yang dapat menimbulkan
kompilasi penyakit – penyakit berbahaya lainnya hingga kematian. Pendeteksian
dini penting dilakukan sebagai upaya pencegahan bagi non penderita maupun
pengendalian kadar glukosa dalam darah bagi penderita. Tim Non-Invasive
Biomarking IPB mengembangkan suatu alat pengukur glukosa darah non-invasif.
Alat tersebut menggunakan prinsip spektroskopi dan memiliki keluaran berupa
nilai residu intensitas cahaya, sehingga diperlukan suatu pemodelan kalibrasi
untuk menduga kadar glukosa darah melalui keluaran alat tersebut. Permasalahan
yang sering terjadi pada pemodelan kalibrasi adalah multikolinieritas. Salah satu
metode yang dapat digunakan untuk mengatasi hal tersebut adalah metode
generalized ridge regression. Metode ini merupakan sebuah pengembangan dari
analisis regresi ridge dengan tetapan bias yang berbeda untuk setiap peubah bebas.
Pendekatan peringkasan data yang baik sebagai tahap prapemrosesan data juga
diperlukan demi memberikan pendugaan yang baik. Terdapat beberapa metode
peringkasan yang telah digunakan pada penelitian sebelumnya. Peringkasan luas
merupakan metode peringkasan terbaik karena dapat memanfaatkan keseluruhan
informasi data. Penelitian ini menggunakan metode regresi generalized ridge
sebagai metode pendugaan kadar glukosa dalam darah dengan pendekatan
peringkasan luas. Pendugaan dengan generalized ridge regression menghasilkan
nilai RMSEP yang lebih kecil dibandingkan dengan pemodelan menggunakan
RKTP, RKU, dan SVR tetapi lebih besar dibandingkan pemodelan menggunakan
regresi ridge robust-MM. Hasil pendugaan dengan data keluaran alat 2017 lebih
baik dibandingkan dengan data keluaran alat 2019.
2022-08-18T04:17:48Z
2022-08-18T04:17:48Z
2022-08-18T04:17:48Z
2022
Undergraduate Thesis
http://repository.ipb.ac.id/handle/123456789/113738
id
IPB University
oai:repository.ipb.ac.id:123456789/1132152022-08-05T06:20:14Zcom_123456789_7470com_123456789_25com_123456789_9col_123456789_33
Perbandingan Kinerja Random Forest dan Double Random Forest untuk Klasifikasi Status Kemiskinan di Level Kabupaten/Kota
Hidayatulloh, Nabila Ghoni Trisno
Notodiputro, Khairil Anwar
Angraini, Yenni
Prediksi berdasarkan sebuah model baik untuk dilakukan karena dapat menghasilkan prediksi yang akurat. Salah satu model yang sudah banyak digunakan dalam memprediksi adalah model klasifikasi Random Forest. Namun, ukuran minimum nodesize pada random forest mungkin kurang optimal untuk menghasilkan kinerja model yang terbaik. Double Random Forest mengatasi hal tersebut dengan membentuk pohon yang lebih besar. Penelitian ini ingin membandingkan kinerja model klasifikasi random forest dan double random forest dalam memprediksi status kemiskinan rumah tangga di Jawa Barat pada tahun 2019. Jumlah penduduk miskin yang bernilai sangat kecil dibandingkan jumlah seluruh penduduk di suatu wilayah menyebabkan adanya ketidakseimbangan pada data. Salah satu langkah penanganan yang dapat dilakukan adalah dengan menggunakan teknik SMOTE. Kinerja metode random forest dan double random forest tidak menunjukkan hasil yang berbeda dalam memprediksi status kemiskinan rumah tangga di Jawa Barat. Hal ini dikarenakan ukuran pohon yang dihasilkan random forest sudah dinilai cukup untuk memberikan kinerja model terbaik sehingga tidak diperlukan adanya perbaikan dengan double random forest. Berdasarkan model-model yang terbentuk, jumlah anggota rumah tangga (ART) merupakan peubah paling penting saat memprediksi rumah tangga miskin di Jawa Barat.
Predictive modeling leads to more accurate prediction therefore good to be used. One of model that has been widely used in prediction is Random Forest classification model. However minimum nodesize in random forest is not optimal enough to produce the best model performance, so Double Random Forest overcome this issue by forming bigger trees. This study aims to compare the performance of random forest and double random forest classification models in predicting poverty status of households in West Java at 2019. The number of people living in poverty is very small compared to total population in certain area. This causes an imbalance class in the data. One way that can be done to overcome imbalance class is by using SMOTE technique. Performance of random forest and double random forest methods did not show different result in predicting poverty status of households in West Java. This is due to size of the trees produced by random forest that considered good enough to provide best model, so there is no room for improvement with double random forest. Based on the models, age of the householder showing as the most important variable in classifying household poverty status in West Java.
2022-08-05T06:20:11Z
2022-08-05T06:20:11Z
2022-08-05T06:20:11Z
2022
Undergraduate Thesis
http://repository.ipb.ac.id/handle/123456789/113215
id
IPB University
oai:repository.ipb.ac.id:123456789/1144422022-09-12T07:00:20Zcom_123456789_7470com_123456789_25com_123456789_9col_123456789_33
Perbandingan Metode CHAID dan CART dalam Pengklasifikasian Infeksi dan Tidak Infeksi pada Ibu Hamil di Indonesia
Suryanty, Santy
Aidi, Muhammad Nur
Rahman, La Ode Abdul
Efriwati
Infeksi adalah masuknya mikroorganisme virus, bakteri, parasit, atau jamur
ke dalam tubuh sehingga menimbulkan gejala penyakit dan merupakan salah satu
penyebab kematian ibu tertinggi di Indonesia. Status infeksi dapat diketahui
berdasarkan data kadar C-Reactive Protein (CRP) yaitu dinyatakan infeksi apabila
kadar CRP > 3 mg/L. Faktor risiko penyebab infeksi perlu mendapat perhatian
serius untuk mencegah infeks, dan akhirnya menurunkan infeksi pada ibu hamil.
Analisis klasifikasi dengan metode klasifikasi CHAID dan CART dapat digunakan
untuk mengetahui peubah faktor risiko yang dapat memisahkan status ibu hamil
yang mengalami infeksi dan tidak infeksi. Penelitian ini bertujuan untuk
mengetahui peubah-peubah yang memengaruhi kejadian infeksi serta
membandingkan kinerja hasil klasifikasi CHAID dan CART. Hasil analisis
menunjukkan bahwa dua peubah yaitu status KEK dan status gizi berdasarkan IMT
dapat memisahkan infeksi dan tidak infeksi pada kedua metode. Namun dilihat dari
nilai sensitivitas yang dihasilkan, model CHAID memiliki kinerja yang lebih baik
dibandingkan model CART, yaitu 81,08% banding 51,35%. Metode CHAID
merupakan metode terbaik dalam mengklasifikasikan ibu hamil yang mengalami
infeksi. Berdasarkan model CHAID, secara umum karakteristik ibu hamil yang
mengalami infeksi adalah ibu hamil dengan IMT>25 Kg/m2
dan berstatus KEK.
Infection is the entry of microorganisms, viruses, bacteria, parasites, or
fungi into the body, causing symptoms of disease and one of the highest causes of
maternal mortality in Indonesia. The infection status is known based on data C Reactive Protein (CRP) levels, if >3 mg/L is declared infection. Risk factors that
cause infection need serious attention to prevention infection, and finally decrease
infection in pregnant women. Classification analysis with CHAID and CART
classification methods can use to determine the risk factor variables that separate
the status of pregnant woman with infaction and non-infaction. This study aims to
know the variables that influence the incidence of infection and compare the
performance of CHAID and CART classification results. The analysis showed that
two variables, namely KEK status and nutritional status based on BMI can
separating infection and non-infection in both methods. However, judging from the
sensitivity value generated, CHAID model perfoms better than CART model,
which is 81.08% vs 51.35%. The CHAID method is the best method in classifying
pregnant women who experience infection. Based on the CHAID model, in general,
the characteristics of pregnant women who experience infection are pregnant
women with BMI more than 25 Kg/m2 and KEK status.
2022-09-10T02:57:21Z
2022-09-10T02:57:21Z
2022-09-10T02:57:21Z
2022
Undergraduate Thesis
http://repository.ipb.ac.id/handle/123456789/114442
id
IPB University
oai:repository.ipb.ac.id:123456789/1143702022-09-06T04:37:38Zcom_123456789_7470com_123456789_25com_123456789_9col_123456789_33
Identifikasi Faktor-Faktor yang Memengaruhi Ketepatan Waktu Lulus Mahasiswa FMIPA IPB Angkatan 2017
Rustinasari, Khofifah Ayu
Alamudi, Aam
Sumertajaya, I Made
Tingkat kelulusan mahasiswa tepat waktu menjadi salah satu kriteria penilaian akreditasi bagi suatu perguruan tinggi atau program studi, semakin banyak mahasiswa yang lulus tepat waktu maka semakin baik pula kinerjanya. Akan tetapi, berdasarkan data lulusan dari DAPPMB IPB, hanya sekitar 37,46% mahasiswa FMIPA angkatan 2016 yang dapat menyelesaikan studi tepat waktu. Data yang digunakan pada penelitian ini berasal dari DAPPMB IPB. Faktor- faktor yang diduga dapat mempengaruhi ketepatan waktu lulus diantaranya adalah jenis kelamin, asal daerah, minor, program studi, jalur masuk, IPK terakhir, dan kestabilan prestasi. Untuk menganalisis faktor-faktor yang berpengaruh terhadap kelulusan mahasiswa digunakan analisis regresi logistik biner menggunakan regresi stepwise dan 10-fold cross validation. Berdasarkan penelitian ini, faktor-faktor yang memengaruhi ketepatan waktu lulus mahasiswa FMIPA IPB angkatan 2017 adalah program studi, minor, IPK terakhir, dan kestabilan prestasi. Model regresi logistik biner yang diperoleh menghasilkan nilai akurasi sebesar 66,75%, sensitivitas 32,65%, spesifisitas 90,69%, dan AUC sebesar 0,75.
The graduation timeliness rate of student is one of the criteria for accreditation assessment for a university or study program, the more students who graduate on time, the more better the performance. However, based on graduate’s data from DAPPMB IPB, only around 37.46% of FMIPA students, class of 2016, that can complete their studies on time. The data used in this research is from DAPPMB IPB. Factors that are suspected affect the timeliness of graduation include gender, regional origin, minor, study program, entrance pathway, the last GPA, and the stability of achievement. Binary logistic regression with stepwise regression and 10-fold cross validation was used to analyze factors that affecting student graduation. Based on this research, factors that affect the timeliness of graduation in FMIPA IPB class of 2017 student are study program, minor, the last GPA, and the stability of achievement. The binary logistic regression modeling results show that the accuracy value is 66,75%, sensitivity 32,65%, specificity 90,69%, and an AUC 0,75.
2022-09-06T04:37:35Z
2022-09-06T04:37:35Z
2022-09-06T04:37:35Z
2022
Undergraduate Thesis
http://repository.ipb.ac.id/handle/123456789/114370
id
IPB University
oai:repository.ipb.ac.id:123456789/1134212022-08-10T13:50:51Zcom_123456789_7470com_123456789_25com_123456789_9col_123456789_33
Pemodelan Persamaan Struktural pada Kasus Dependensi Spasial (Studi Kasus: Indeks Kebahagiaan di Indonesia Tahun 2021)
Hasan, M.Yusril Muiz
Sulvianti, Itasia Dina
Djuraidah, Anik
Kesejahteraan masyarakat mencerminkan keberhasilan pembangunan di suatu daerah. Indeks kebahagiaan merupakan indikator subjektif yang dapat menggambarkan kesejahteraan masyarakat di suatu daerah. Pendidikan, ekonomi, kesehatan, dan kemiskinan diasumsikan memiliki pengaruh terhadap indeks kebahagiaan. Penelitian ini bertujuan untuk mengetahui indikator yang paling berpengaruh pada tiap peubah laten serta mengetahui peubah laten yang memengaruhi indeks kebahagiaan menggunakan model spasial. Data penelitian ini diperoleh dari Badan Pusat Statistik (BPS) dengan jumlah indikator adalah 22 yang dikelompokkan ke dalam lima peubah laten. Metode yang digunakan untuk menganalisis hubungan antar peubah laten adalah Structural Equation Modeling (SEM). Pendekatan pada metode analisis SEM untuk jumlah data yang kecil dan tidak memenuhi asumsi distribusi normal adalah Structural Equation Modeling-Partial Least Square (SEM-PLS). Peubah laten yang berpengaruh signifikan terhadap indeks kebahagiaan pada beberapa model spasial adalah lag indeks kebahagiaan dan kemiskinan. Indikator yang paling berpengaruh pada peubah laten kemiskinan adalah indeks kedalaman kemiskinan, sedangkan indikator dari peubah laten indeks kebahagiaan yang paling berpengaruh adalah indeks kepuasan hidup.
Community welfare reflects the success of development in an area. The happiness index is a subjective indicator that can describe the welfare of the community in an area. Education, economy, health, and poverty are assumed to have an influence on the happiness index. This study aims to determine the most influential indicator on each latent variable and determine the latent variable that affects the happiness index using a spatial model. The data for this study were obtained from the Badan Pusat Statistik (BPS) with 22 indicators grouped into five latent variables. The method that can be used to analyze latent variables is Structural Equation Modeling (SEM). The approach to the SEM analysis method for a small amount of data and does not meet the assumption of a normal distribution is Structural Equation Modeling-Partial Least Square (SEM-PLS). Latent variables that have a significant effect on the happiness index in some spatial models are the happiness index lag and poverty. The indicator has the most influence on the latent variable of poverty is the poverty depth index, while the indicator has the most influence on the latent variable of the happiness index is the life satisfaction index.
2022-08-10T13:50:47Z
2022-08-10T13:50:47Z
2022-08-10T13:50:47Z
2022
Undergraduate Thesis
http://repository.ipb.ac.id/handle/123456789/113421
id
IPB University
oai:repository.ipb.ac.id:123456789/1125942022-07-18T16:00:15Zcom_123456789_7470com_123456789_25com_123456789_9col_123456789_33
A Study on Causality and Dependency Between Stock Return and Domestic Transaction using Granger Causality and Vector Autoregressive
Buanafijar, Adjie
Fitrianto, Anwar
Soleh, Agus Mohamad
The increasing public interest in the stock market in 2021 must be accompanied by an
improvement in stock analysis education to avoid scam. Several common are technical and
fundamental. An important but often overlooked analysis is to look at the flow of transactions.
This objective of this study is to examine the causality and dependency between domestic
transaction flows and stock returns. The stocks to be studied are six selected companies in 6
months. The methodology to test causality and dependency are Granger Casuality test and
Vector Autoregressive. The research procedure consisted of standardization, outlier handling,
stationary test, Granger causality test, VAR lag selection, VAR modeling, and diagnostic tests.
The causality relationship was shown to be significant at the 20-20 lag. Dependency
relationships are only detected simultaneously between domestic transactions and their lag
variables. Meanwhile, no substantial dependencies have been found for stock returns.
Therefore, this study shows the existence of monthly causality between the two variables with
simultaneous dependency on domestic transaction.
Meningkatnya animo publik terhadap pasar saham di tahun 2021 harus diiringi dengan
peningkatan edukasi analisis saham untuk menghindari penipuan/ scam. Analisis saham yang
sudah cukup umum yaitu teknikal dan fundamental. Analisis yang penting namun sering
dilupakan adalah dengan melihat aliran transaksi. Penelitian ini bertujuan menguji kausalitas
dan dependensi antara aliran transaksi domestik dengan return saham. Saham yang akan diteliti
adalah enam perusahaan terpilih dalam periode 6 bulan. Metode yang digunakan untuk menguji
kausalitas dan dependensi masing-masing adalah Granger Causality test dan Vector
autoregressive. Prosedur penelitian tersusun atas standardisasi, penanganan outlier, tes
kestasioneran, tes kausalitas granger, pemilihan lag VAR, pemodelan VAR, dan tes diagnostik.
Hubungan kausalitas terbukti signifikan pada lag 20-20. Hubungan dependensi hanya
terdeteksi secara simultan antara transaksi domestik dengan peubah lag-nya. Sedangkan untuk
return saham masih belum ditemukan dependensi yang substansial. Dengan demikian,
penelitian ini menunjukkan bahwa ada pola kausalitas bulanan antara kedua peubah dengan
hasil dependensi simultan yang terbukti berpengaruh terhadap transaksi domestik.
2022-07-18T16:00:12Z
2022-07-18T16:00:12Z
2022-07-18T16:00:12Z
2022
Undergraduate Thesis
http://repository.ipb.ac.id/handle/123456789/112594
en_US
IPB University
oai:repository.ipb.ac.id:123456789/1146312022-09-23T07:32:47Zcom_123456789_7470com_123456789_25com_123456789_9col_123456789_33
Perbandingan Metode Multivariate Imputation by Chained Equations (MICE) dan Regresi Data Panel untuk Menduga Data Hilang pada Dapodik
Widyadhari, Fairuzia Rahmadiyanti
Susetyo, Budi
Alamudi, Aam
Studi longitudinal telah dilakukan di berbagai bidang penelitian. Salah satu contoh studi longitudinal di bidang pendidikan adalah penelitian dengan menggunakan Dapodik. Namun ada kalanya data yang terkumpul tidak lengkap karena beberapa kemungkinan, antara lain kelalaian atau ketidakdisiplinan pihak sekolah dalam mengisi Dapodik. Oleh karena itu, diperlukan suatu penanganan data hilang dengan memasukkan nilai tertentu dalam data yang hilang, yang juga dikenal sebagai imputasi. Dalam penelitian ini akan diterapkan metode imputasi MICE dan regresi data panel untuk memprediksi data hilang pada Dapodik di DKI Jakarta tahun 2016 sampai 2020, serta membandingkan akurasi antara kedua metode tersebut dalam membuat model imputasi. Simulasi pembangkitan data hilang dilakukan pada peubah X4, X5, dan X6. Metode MICE yang menggunakan regresi dua level mampu menduga data hilang dengan baik. Model regresi data panel mampu menduga data hilang pada peubah X4 dengan cukup baik dalam penelitian ini, namun kurang baik saat digunakan untuk menduga data hilang pada peubah X6. Kedua metode menunjukkan sebaran data hasil pendugaan yang cenderung serupa dengan sebaran data aktual untuk peubah X4 dan X5. Secara keseluruhan, metode MICE menghasilkan ketepatan yang lebih baik dalam menduga data hilang pada peubah X4, X5, dan X6.
Longitudinal studies have been carried out in various fields of research. One example of a longitudinal study in the field of education is research using Dapodik. However, there are times when the collected data incomplete due to several possibilities, including the school's negligence or indiscipline in filling out the Dapodik. It is necessary to handle missing data by entering a certain value in the missing data, which is also known as imputation. In this study, MICE imputation method and panel regression will be applied to predict missing data on Dapodik in DKI Jakarta in the year 2016 until 2020, as well as compare accuracy between those two methods in making imputation models. Missing data on variables X4, X5, dan X6 are generated through simulation based on the MAR mechanism. The MICE method that uses two-level regression is able to handle missing data well. The panel data regression model is able to handle missing data on the X4 variable quite well in this study, but not suitable for handling missing data on the X6 variable. Both methods show prediction results distribution that tend to be similar to the actual data distribution for X4 and X5 variables. Overall, the MICE method produces better accuracy for handling missing data on the X4, X5, dan X6 variables.
2022-09-23T07:32:44Z
2022-09-23T07:32:44Z
2022-09-23T07:32:44Z
2022
Undergraduate Thesis
http://repository.ipb.ac.id/handle/123456789/114631
id
IPB University
oai:repository.ipb.ac.id:123456789/1136602022-08-16T03:58:02Zcom_123456789_7470com_123456789_25com_123456789_9col_123456789_33
Analisis Gerombol Pautan Ward Kabupaten/Kota di Provinsi Jawa Timur Berdasarkan Indikator Kesejahteraan Rakyat
Salsabila, Annida Marsa
Masjkur, Mohammad
Indahwati
Tujuan utama dalam pembangunan suatu negara adalah meningkatkan kesejahteraan rakyat. Salah satu penyebab dari permasalahan kesejahteraan rakyat di Indonesia yaitu pembangunan yang dilakukan oleh pemerintah tidak terlaksana secara merata dan tidak tepat sasaran, tidak terkecuali di Provinsi Jawa Timur. Oleh sebab itu, sangat penting mengelompokkan dan melihat karakteristik 38 kabupaten/kota di Provinsi Jawa Timur berdasarkan indikator kesejahteraan rakyat sehingga pemerintah dapat mengambil kebijakan dengan merata dan tepat sasaran. Penelitian ini menggunakan analisis gerombol berhirarki. Data yang digunakan adalah data indikator kesejahteraan rakyat 38 kabupaten/kota Provinsi Jawa Timur tahun 2019. Metode analisis gerombol berhirarki yang digunakan adalah metode Ward. Hasil penelitian menggunakan pemotongan dendogram dan rasio sw/sb menunjukkan bahwa kabupaten/kota di provinsi Jawa Timur dapat dibagi menjadi enam gerombol. Pada setiap gerombol dilihat karakteristiknya menggunakan kategori yang didapat dari nilai rataan masing-masing peubah yang digunakan. Daerah dengan perkembangan yang sangat baik berada pada gerombol enam dan daerah yang lebih banyak membutuhkan perkembangan pembangunan dalam banyak aspek berada pada gerombol lima.
2022-08-16T03:57:59Z
2022-08-16T03:57:59Z
2022-08-16T03:57:59Z
2022
Undergraduate Thesis
http://repository.ipb.ac.id/handle/123456789/113660
id
IPB University
oai:repository.ipb.ac.id:123456789/1131332022-08-02T23:57:23Zcom_123456789_7470com_123456789_25com_123456789_9col_123456789_33
Identifikasi Peubah yang Berpengaruh terhadap Kejadian Rawan Pangan di Jawa Barat dengan Generalized Linear Mixed Model LASSO
Fathina, Annissa Nur Fitria
Sartono, Bagus
Alamudi, Aam
Kerawanan pangan adalah kondisi ketidakmampuan individu atau kelompok di suatu daerah untuk memperoleh pangan yang cukup dan layak untuk hidup sehat dan aktif. Pengentasan kerawanan pangan sejalan dengan tujuan pembangunan berkelanjutan, terutama tujuan kedua, tanpa kelaparan. Sehingga diperlukan kajian terkait kerawanan pangan seperti mengidentifikasi faktor-faktor yang berpengaruh terhadap kejadian rawan pangan. Penelitian ini bertujuan untuk mengidentifikasi variabel-variabel yang mempengaruhi kejadian kerawanan pangan di Jawa Barat. Dengan menggunakan data Survei Sosial Ekonomi Nasional Provinsi Jawa Barat Tahun 2020. Data tersebut memiliki tipe variabel respon kategorik dan diambil menggunakan teknik two-stage sampling sehingga dapat dianalisis menggunakan metode Generalized Linear Mixed Model LASSO. Analisis menggunakan paket glmmLasso dengan 10-fold cross-validation (CV) pada 20 nilai lambda (16 hingga 35). CV dilakukan untuk mengukur kebaikan model dan akurasi, sehingga diperoleh lambda terbaik untuk membangun model terbaik untuk diinterpretasikan. Variabel yang secara umum berpengaruh signifikan terhadap kerawanan pangan di Jawa Barat adalah variabel X14 yang menunjukkan jumlah anggota rumah tangga yang memiliki tabungan yang berpengaruh negatif terhadap kejadian rawan pangan di Jawa Barat dan variabel X19 yang menunjukkan kepemilikan penerima bantuan iuran BPJS kesehatan yang berpengaruh positif terhadap kejadian rawan pangan di Jawa Barat.
Food insecurity is a condition of the inability of an individual or group in an area to obtain sufficient and appropriate food for a healthy and active life. The alleviation of food insecurity is in line with the Sustainable Development Goals, especially the second goal, zero hunger. This study aims to identify the variables that influence the incidence of food insecurity in West Java. By using data from the National Socio-Economic Survey of West Java Province in 2020. The data has a categorical type of response variable and is taken using a two-stage sampling technique so that it can be analyzed using the Generalized Linear Mixed Model LASSO method. Analysis using the glmmLasso package with 10-fold cross-validation (CV) at 20 lambda values (16 to 35). CV is done to measure the goodness of the model and accuracy, so that the best lambda is obtained to build the best model to be interpreted. The variables that generally have a significant effect on food insecurity in West Java are the X14 variable that shows the number of household members who have savings which have a negative impact and X19 variable that shows the ownership of PBI BPJS which have a positive impact.
2022-08-02T23:57:20Z
2022-08-02T23:57:20Z
2022-08-02T23:57:20Z
2022
Undergraduate Thesis
http://repository.ipb.ac.id/handle/123456789/113133
id
IPB University
oai:repository.ipb.ac.id:123456789/1150752022-10-26T00:20:56Zcom_123456789_7470com_123456789_25com_123456789_9col_123456789_33
Implementasi Algoritma Support Vector Machine untuk Analisis Sentimen Ulasan Aplikasi Flip pada Situs Google Play Store
Wahyuningsih, Fetri
Wigena, Aji Hamim
Anisa, Rahma
Flip merupakan start-up kreasi pemuda Indonesia yang memiliki popularitas dan rating tinggi pada situs Google Play Store. Hal tersebut membuat tuntutan terhadap mutu pelayanan aplikasi juga semakin meningkat, sehingga muncul beragam komentar di kolom ulasan. Analisis sentimen merupakan salah satu cara untuk mengetahui polaritas opini yang memungkinkan klasifikasi ulasan ke dalam kelas bersentimen positif, netral, atau negatif. Penelitian ini bertujuan untuk mengidentifikasi perbedaan performa algoritma Support Vector Machine (SVM) menggunakan kernel linear, kernel polynomial, dan kernel Radial Basis Function (RBF) pada tiga fitur n-gram (unigram, bigram, dan trigram) serta melakukan analisis sentimen terhadap ulasan para pengguna aplikasi Flip. Algoritma Multi-Class SVM One Against All (OAA) diterapkan karena terdapat tiga kelas sentimen. Selain itu, algoritma Synthetic Minority Oversampling Technique (SMOTE) diterapkan untuk mengatasi ketidakseimbangan pada data. Pemodelan SVM menggunakan kernel RBF pada fitur unigram menghasilkan performa terbaik dalam mengklasifikasikan sentimen dengan nilai akurasi dan macro average F1-score yang didapat sebesar 89% dan 70%. Secara keseluruhan, kernel linear dan RBF pada ketiga fitur n-gram memberikan hasil klasifikasi terbaik. Sebaliknya, kernel polynomial memberikan hasil klasifikasi terendah. Fitur unigram memberikan hasil klasifikasi terbaik dan fitur trigram memberikan hasil klasifikasi terendah untuk ketiga kernel.
Flip is a start-up created by Indonesian youth that has high popularity and ratings on the Google Play Store site. This makes the demands on the quality of application services also increase, thus various comments appear in the review column. Sentiment analysis is one way to find out the polarity of opinions that allows the classification of reviews into classes that have positive, neutral or negative sentiments. This study aims to identify differences in the performance of the Support Vector Machine (SVM) algorithm using a linear kernel, a polynomial kernel, and a Radial Basis Function (RBF) kernel on three n-gram features (unigram, bigram, and trigram) and to conduct sentiment analysis on the reviews of Flip application users. The Multi-Class SVM One Against All (OAA) algorithm is applied because there are three sentiment classes. In addition, the Synthetic Minority Oversampling Technique (SMOTE) algorithm was applied to overcome the data imbalance. SVM modeling using the RBF kernel on the unigram feature produces the best performance in classifying sentiment with an accuracy value and a macro average F1-score obtained at 89% and 70%. Overall, the linear kernel and RBF kernel on the three n-gram features give the best classification results. On the other hand, the polynomial kernel gives the lowest classification result. The unigram feature gives the best classification result and the trigram feature gives the lowest classification result for the three kernels.
2022-10-26T00:20:52Z
2022-10-26T00:20:52Z
2022-10-26T00:20:52Z
2022
Undergraduate Thesis
http://repository.ipb.ac.id/handle/123456789/115075
id
IPB University
oai:repository.ipb.ac.id:123456789/1152332022-11-10T23:36:47Zcom_123456789_7470com_123456789_25com_123456789_9col_123456789_33
Generalized LASSO Regression dalamIdentifikasi Peubah yang Memengaruhi Tingkat Kemiskinan di Pulau Jawa Tahun2020
Limbong, Monika Ristana
Alamudi, Aam
Rahardiantoro, Septian
Sustainable Development Goals (SDGs) adalah program lanjutan dari Millenium Development Goals (MGDs). Tujuan pertama SDGs adalah mewujudkan hidup tanpa kemiskinan (no poverty). Kemiskinan selalu menjadi prioritas pembangunan. Kemiskinan dapat dipengaruhi oleh peubah yang bersifat positif atau negatif. Bersifat positif apabila peningkatan peubah tersebut dapat meningkatkan kemiskinan dan sebaliknya. Pulau Jawa merupakan pulau dengan jumlah penduduk terbanyak, yaitu mencakup 56% dari total penduduk di Indonesia. Jumlah penduduk miskin di Pulau Jawa mencakup 54% dari total penduduk miskin Indonesia tahun 2020. Generalized LASSO Regression digunakan untuk menyeleksi peubah yang berpengaruh sekaligus melakukan klasterisasi untuk melihat pengaruh setiap peubah terhadap daerah. Metode ini sangat baik karena memiliki dua fungsi yang dapat dijalankan bersamaan. Hasil analisis menggunakan metode ini menyatakan bahwa peubah yang berpengaruh terhadap persentase kemiskinan di Pulau Jawa adalah Produk Domestik Regional Bruto (PDRB), Harapan Lama Sekolah (HLS), dan Rataan Lama Sekolah (RLS). Tidak ada peubah yang memiliki dampak yang sama terhadap seluruh daerah (provinsi) di Pulau Jawa. Peubah RLS memiliki dampak yang sama terhadap lima provinsi kecuali Provinsi D.I. Yogyakarta sedangkan dua peubah lainnya membentuk dua kelompok daerah. Ketiga peubah tersebut memengaruhi persentase kemiskinan secara negatif di seluruh daerah (provinsi).
The Sustainable Development Goals (SDGs) are a continuation of the Millennium Development Goals (MGDs). The first goal of the SDGs is to realize a life without poverty (no poverty). Poverty has always been a development priority. Poverty can be influenced by positive or negative variables. It is positive if the increase in this variable can increase poverty and vice versa. Java Island is the island with the largest population, which covers 56% of the total population in Indonesia. The number of poor people in Java covers 54% of the total poor population in Indonesia in 2020. Generalized LASSO Regression is used to select influential variables as well as clustering to see the effect of each variable on the region. This method is very good because it has two functions that can be executed simultaneously. The results of the analysis using this method state that the variables that affect the percentage of poverty in Java are Gross Regional Domestic Product (GRDP), Expected Years of Schooling (EYS), and the Average Length of Schooling (ALS). There is no variable that has the same impact on all regions (provinces) on the Java island. The ALS variable has the same impact on five provinces except for the Province of D.I. Yogyakarta while the other two variables form two regional groups. These three factors negatively affect the percentage of poverty across the regions (provinces).
2022-11-10T23:36:44Z
2022-11-10T23:36:44Z
2022-11-10T23:36:44Z
2022
Undergraduate Thesis
http://repository.ipb.ac.id/handle/123456789/115233
id
IPB University
oai:repository.ipb.ac.id:123456789/1149992022-10-17T05:44:35Zcom_123456789_7470com_123456789_25com_123456789_9col_123456789_33
Pemodelan Penjualan Pada Perusahaan X Dengan Menggunakan Model Fungsi Transfer Input Ganda
Zarkasie, Imam Buchori
Saefuddin, Asep
Silvianti, Pika
Model fungsi transfer input ganda merupakan suatu model peramalan deret waktu berganda yang menggabungkan beberapa karakteristik model-model ARIMA dengan beberapa karakteristik analisis regresi. Model ini digunakan untuk mengetahui pengaruh deret output terhadap deret input sehingga model fungsi transfer ini dapat digunakan untuk menganalisis faktor-faktor yang memengaruhi penjualan Perusahaan X. Faktor members, redemption, dan submission digunakan sebagai deret input. Model fungsi transfer dilakukan melalui beberapa tahap yaitu tahap identifikasi model, pendugaan model fungsi transfer, dan pengujian diagnostik model. Berdasarkan model tersebut, penjualan dipengaruhi oleh members pada satu hari sebelumnya, dan submission pada hari yang sama. Nilai Mean Absolute Prencentage Error (MAPE) hasil peramalan sebesar 0.59% menunjukkan model fungsi transfer yang diperoleh baik dalam melakukan peramalan.
2022-10-17T05:44:32Z
2022-10-17T05:44:32Z
2022-10-17T05:44:32Z
2022-10
http://repository.ipb.ac.id/handle/123456789/114999
id
IPB University
oai:repository.ipb.ac.id:123456789/1143022022-09-02T06:48:37Zcom_123456789_7470com_123456789_25com_123456789_9col_123456789_33
Analisis Spasial Data Panel Angka Buta Huruf di Provinsi Papua
Arnindhita, Nadia Putri
Rizki, Akbar
Sulvianti, Itasia Dina
Angka buta huruf merupakan salah satu indikator penyusun Indeks Pembangunan Manusia (IPM). IPM menjadi tolok ukur dalam keberhasilan upaya membangun kualitas hidup manusia dan dapat menentukan peringkat atau level pembangunan suatu wilayah negara. Provinsi Papua merupakan provinsi di Indonesia dengan angka buta huruf tertinggi dan pendidikan yang sangat minim, sehingga perlu diperhatikan peubah-peubah yang memengaruhi angka buta huruf tersebut. Data penelitian yang digunakan adalah data sekunder dari Badan Pusat Statistik (BPS) dari tahun 2017-2020 yang mencakup 29 kabupaten/kota di Provinsi Papua. Data tersebut meliputi angka buta huruf sebagai peubah respon dengan tujuh peubah penjelas (Produk Domestik Regional Bruto (PDRB) per kapita, banyaknya penduduk miskin, rasio tenaga pendidik terhadap jumlah anak usia sekolah, persentase fasilitas pendidikan, persentase penduduk yang memiliki telepon, angka partisipasi murni SD/sederajat, dan angka kesakitan). Penelitian ini bertujuan untuk mengetahui peubah-peubah yang memengaruhi angka buta huruf di Provinsi Papua. Metode yang digunakan dalam penelitian ini adalah analisis spasial data panel. Hasil penelitian menunjukkan bahwa model yang sesuai untuk menggambarkan angka buta huruf di Provinsi Papua adalah model pengaruh acak Spatial Error Model (SEM) dengan menggunakan matriks pembobot spasial jarak eksponensial. Model ini memiliki nilai koefisien determinasi (R^2) sebesar 77,969%. Peubah penjelas yang berpengaruh terhadap angka buta huruf di Papua pada taraf nyata 5% yaitu PDRB per kapita, rasio tenaga pendidik terhadap jumlah anak usia sekolah, dan banyaknya penduduk miskin. Peubah PDRB per kapita dan rasio tenaga pendidik terhadap jumlah anak usia sekolah memiliki hubungan yang negatif terhadap angka buta huruf di Provinsi Papua,
The illiteracy rate is one of the indicators that make up the Human Development Index. Human Development Index is a benchmark for the success of efforts to build the quality of human life and can determine the ranking or level of development of a country’s territory. Papua Province is the highest illiteracy rate province in Indonesia with a very minimal level of education, so it is necessary to pay attention to what factors affect the illiteracy rate. The research data used is secondary data from the Central Statistics Agency (BPS) from 2017 – 2020 which covers 29 districts/cities in Papua Province. The data includes the illiteracy rate as a response variable, GRDP per capita, the number of poor people, the ratio of educators to the number of school-age children, the percentage of educational facilities, the percentage of the population who owns a telephone, pure enrollment rate for primary school, and the morbidity rate. This study aims to determine the variables that affect the illiteracy rate in Papua Province. The method used in this research is the spatial analysis of panel data. The results show that the appropriate model to describe the illiteracy rate in Papua Province is Spatial Error Model (SEM) with random effect using an exponential matrix which has a model goodness value of 77,969%. The explanatory variables that have a significant effect on the illiteracy rate in Papua Province are GRDP per capita, the ratio of educators to the number of school-age children, and the number of poor people. The GRDP per capita and ratio of educators to number of school age children have a negative relationship with the illiteracy rate in Papua Province, while the number of poor people has a positive relationship with the illiteracy rate in Papua Province.
2022-09-02T06:48:34Z
2022-09-02T06:48:34Z
2022-09-02T06:48:34Z
2022
Undergraduate Thesis
http://repository.ipb.ac.id/handle/123456789/114302
id
IPB University
oai:repository.ipb.ac.id:123456789/1134592022-08-11T08:34:46Zcom_123456789_7470com_123456789_25com_123456789_9col_123456789_33
Gold Price Forecast through Bagging Exponential Smoothing Method
Atmaja, Arifah Afdila
Fitrianto, Anwar
Rahman, La Ode Abdul
Gold is one of the precious metals that remain popular among investors nowadays. It provides investors a safe haven when the economy is questionable. It is crucial to provide better information about the prospect of gold prices before investing. One way to do it in the statistical realm is through forecasting using the exponential smoothing method. In order to tackle challenges that may be encountered, an additional approach called bootstrap aggregating (bagging) was proposed. This study aims to compare the performance of exponential smoothing in a condition with and without bagging. Data that were used are gold prices from January 4th, 2010 until February 27th, 2022. As there is only sign of a trend component, it can be modelled using the Holt’s linear and the additive damped trend method. Models were evaluated based on MAPE and RMSE. Based on Wilcoxon signed-rank test, adding bagging is proven to bring statistically proven difference. For the daily and weekly series, the best model is Holt’s linear smoothing with bagging. While for the monthly series, the best one is Holt’s Linear smoothing without bagging. Lastly, it is predicted that gold prices will keep increasing until reaching more than Rp1000000/g in February 2023.
Emas merupakan salah satu logam mulia yang popular di kalangan investor. Emas dapat menjadi alternatif investasi yang aman ketika kondisi perekonomian sedang lesu. Tentu peramalan harga emas ke depan menjadi poin pertimbangan bagi investor sebelum menanamkan modalnya. Dalam ranah statististik, salah satu metode yang dapat digunakan ialah pemulusan eksponensial. Untuk mengatasi tantangan yang timbul saat proses pemodelan, bootstrap aggregating diperkenalkan sebagai pendekatan tambahan. Penelitian ini bertujuan untuk membandingkan performa pemulusan eksponensial pada kondisi dengan dan tanpa bagging serta meramalkan harga emas satu tahun ke depan. Data yang digunakan ialah data harian harga emas dari 4 Januari 2010 s.d 27 Februari 2022. Tipe pemulusan eksponensial yang digunakan ialah Holt’s linear dan the additive damped trend method. Model kemudian dievaluasi berdasarkan MAPE dan RMSE. Hasil pengujian dengan Wilcoxon signed-rank test menunjukkan bahwa penggunaan bagging sebagai pendekaan tambahan terbukti memberikan hasil peramalan yang berbeda nyata. Untuk data harian dan mingguan, model terbaik ialah pemulusan Holt’s linear dengan bagging sedangkan untuk data bulanan, model terbaik ialah pemulusan Holt’s linear tanpa bagging. Pada bulan Februari 2023, diprediksi harga emas akan melampaui Rp1000000/g.
2022-08-11T08:34:43Z
2022-08-11T08:34:43Z
2022-08-11T08:34:43Z
2022
Undergraduate Thesis
http://repository.ipb.ac.id/handle/123456789/113459
en
IPB University
oai:repository.ipb.ac.id:123456789/1131892022-08-04T08:04:09Zcom_123456789_7470com_123456789_25com_123456789_9col_123456789_33
Analisis Regresi Logistik dan CART untuk Credit Scoring dengan Penanganan Kelas Tak Seimbang
Pramesti, Siwi Haryu
Indahwati
Syafitri, Utami Dyah
Tidak adanya jaminan pada suatu jenis kredit akan membuat risiko kredit (gagal bayar) yang dihadapi oleh pihak bank semakin tinggi. Penerapan prinsip kehati-hatian oleh bank diterapkan dengan mengelola portofolio kredit yang dimiliki, sehingga potensi risiko yang terjadi dapat diukur dan dikontrol dalam suatu model. Credit scoring menggambarkan seberapa besar kemungkinan debitur akan macet dengan pembayaran. Pada penelitian ini dibandingkan pemodelan credit scoring antara analisis regresi logistik dan Classification and Regression Trees (CART) dalam mengklasifikasikan debitur yang nantinya dapat digunakan oleh bank untuk membuat atau mengevaluasi kebijakan terkait kredit. Permasalahan klasifikasi pada ketidakseimbangan kelas salah satunya dapat ditangani dengan Synthetic Minority Oversampling Technique (SMOTE). Hasil penelitian ini menunjukkan bahwa analisis Regresi Logistik dengan penanganan SMOTE menghasilkan kinerja yang lebih baik karena memiliki nilai sensitifitas yang lebih tinggi daripada analisis CART dan tidak terdapat perbedaan nilai terlalu besar pada nilai Area Under Curve (AUC). Peubah yang berpengaruh signifikan dalam klasifikasi debitur (lancar, macet) adalah tingkat pendidikan, status kepemilikan rumah, dan pendapatan.
The absence of collateral for a type of credit will increase the bank's credit risk (failed to pay). Banks apply the precautionary principle by managing their credit portfolios so that potential hazards that occur can be measured and controlled in a model. Credit scoring describes how likely a debtor will fail with payments. This study aimed to compare logistic regression analysis and Classification and Regression Trees (CART) in classifying debtors to evaluate credit policies. One of the problems in classification is unbalanced data. Synthetic Minority Oversampling Technique (SMOTE) is a technique to handle the unbalanced problem in classification. The results show that the logistic regression model with SMOTE has higher sensitivity than the CART model, and there was no difference in Area Under Curve (AUC). The variables that have significant effects on the classification of debtors (good, bad) are level of education, homeownership status, and income.
2022-08-04T08:00:40Z
2022-08-04T08:00:40Z
2022-08-04T08:00:40Z
2022
Undergraduate Thesis
http://repository.ipb.ac.id/handle/123456789/113189
id
IPB University
oai:repository.ipb.ac.id:123456789/1145822022-09-20T15:23:01Zcom_123456789_7470com_123456789_25com_123456789_9col_123456789_33
Perbandingan Metode Hot-deck, Regression dan K-Nearest Neighbor Imputation dalam Pendugaan Data Hilang pada Dapodik Tahun 2020
Yusuf, Inayatul Izzati Diana
Susetyo, Budi
Rahman, La Ode Abdul
Data Pokok Pendidikan (Dapodik) adalah sistem pendataan nasional yang memuat data satuan pendidikan. Data hilang pada Dapodik menyebabkan hilangnya informasi penting, sehingga dapat diatasi dengan imputasi. Imputasi merupakan prosedur untuk memprediksi nilai yang hilang dengan metode tertentu. Penelitian ini membandingkan tiga metode imputasi yaitu Hot-deck Imputation, Regression imputation dan K-Nearest Neighbor Imputation (KNNI). Hot-deck imputation adalah metode imputasi menggunakan nilai yang memiliki karakteristik serupa dari observasi lain. Regression imputation adalah metode untuk memprediksi data hilang dengan menggunakan pendekatan regresi. KNNI adalah metode imputasi dengan mengelompokkan data berdasarkan keanggotaan terdekat. Dilakukan simulasi pembangkitan data hilang dengan persentase 2%, 3%, 4% dan 5% lalu dilakukannya imputasi dengan ketiga metode tersebut. Model terbaik ditentukan berdasarkan RMSE dan MAPE terendah. Metode imputasi terbaik berdasarkan nilai RMSE dan MAPE terendah yaitu regression imputation.
Data Pokok Pendidikan (Dapodik) is a nationwide data collection system that contains data on education units. Missing value in Dapodik causes the loss of important information. To solve this problem can use imputation. Imputation is a procedure to predict the missing value with a certain method. This study aims to compare three imputation methods which are Hot-deck imputation, Regression Imputation, and K-Nearest Neighbor imputation (KNNI). Hot-deck imputation is an imputation method with values that have similar characteristics. Regression imputation is a method to predict missing values by using the regression approach. KNNI is an imputation method that groups data based on the closest neighbor. Simulation for generating missing value was carried out by dividing the percentage of 2%, 3%, 4%, and 5% then imputed with the three methods. The best model is determined based on the lowest value of RMSE and MAPE. The best imputation method based on the lowest RMSE and MAPE values is a regression imputation
2022-09-20T15:22:57Z
2022-09-20T15:22:57Z
2022-09-20T15:22:57Z
2022
Undergraduate Thesis
http://repository.ipb.ac.id/handle/123456789/114582
id
IPB University