Aplikasi Latent Dirichlet Allocation pada Respon Pengguna Twitter Terhadap Penggunaan Kendaraan Listrik di Indonesia.
Date
2023Author
Sukainah, Apriana
Rizki, Akbar
Afendi, Farit Mochamad
Metadata
Show full item recordAbstract
Indonesia berkomitmen mencapai target emisi nol bersih pada tahun 2060. Sejalan dengan hal tersebut, pemerintah berupaya mendukung percepatan penggunaan kendaraan listrik melalui peraturan perundang-undangan dan penetapan subsidi pembelian. Hal ini memunculkan berbagai tanggapan di masyarakat, salah satunya melalui unggahan di Twitter. Penelitian ini bertujuan mengetahui topik utama yang dibahas terkait penggunaan kendaraan listrik di Indonesia. Metode penelitian yang digunakan adalah Latent Dirichlet Allocation (LDA) dengan tokenisasi unigram dan bigram baik dengan maupun tanpa stemming. Data diambil selama periode 13 September 2022 hingga 28 Februari 2023 menggunakan Python. Jumlah tweet yang diperoleh sebanyak 67124 tweet dan setelah dilakukan proses pembersihan menjadi 14051 tweet. Hasil penelitian menunjukkan bahwa LDA bigram lebih baik daripada LDA unigram karena mampu mengelompokkan kata menjadi topik yang lebih sedikit sehingga lebih mudah untuk diinterpretasikan. LDA bigram menghasilkan topik yang lebih stabil dibandingkan dengan LDA unigram. Banyaknya topik pada LDA bigram baik dengan ataupun tanpa stemming adalah 8 topik, sedangkan LDA unigram menghasilkan 44 topik dengan stemming dan 47 topik tanpa stemming. Nilai koherensi yang dihasilkan oleh LDA bigram juga lebih tinggi dibandingkan dengan LDA unigram. Proses stemming baik diterapkan pada LDA bigram namun tidak pada LDA unigram. Optimisasi parameter K,α, dan β juga berpengaruh dalam peningkatan nilai koherensi. LDA bigram dengan stemming memiliki nilai koherensi tertinggi sebesar 0,639 dan menghasilkan sebanyak 8 topik utama. Topik utama yang dibahas pada masalah penggunaan kendaraan listrik di Indonesia meliputi subsidi pembelian, kendaraan listrik merek Esemka, dan peralihan ke kendaraan listrik. Indonesia is committed to achieving a net zero emission by 2060. In line with this, the government is trying to support the accelerated use of electric vehicles by establishing laws and stipulating subsidies for purchasing. This gave rise to various public responses and conveyed one of which was on Twitter. This study aims to discover the main topics regarding the use of electric vehicles in Indonesia. The research method used is Latent Dirichlet Allocation (LDA) with unigram and bigram tokenization, both with and without stemming. Data were retrieved from 13 September 2022 to 28 February 2023 using Python. The retrieved tweets in this period were 67124 tweets and after the cleaning process, there were 14051 tweets left. The results showed that bigram LDA was better than unigram LDA because it could group words into fewer topics, making it easier to interpret. Bigram LDA produces more stable topics than unigram LDA. Unigram LDA (44 topics with stemming; 47 topics without stemming) has more topics than bigram LDA (8 topics). The coherence score produced by bigram LDA is higher than unigram LDA. Stemming makes bigram LDA better but not for unigram LDA. Optimization of the parameters K, α, and β also increase the coherence score. The bigram LDA with stemming has the highest coherence score of 0,639 and produces 8 main topics. The main topics discussed on the issue of the use of electric vehicles in Indonesia are subsidies of purchasing, Esemka electric vehicles, and switching to electric vehicles.