Perbandingan Algoritma K-Prototypes dan KAMILA dalam Penggerombolan Varietas Padi di Indonesia
Abstract
Varietas padi yang sudah dirakit sangat banyak. Meskipun demikian, penyebarluasan dan adopsi varietas padi seringkali terkendala. Selain masalah adaptasi dengan kondisi lingkungan, adopsi varietas juga ditentukan oleh preferensi petani. Preferensi dan prioritas petani dalam menentukan varietas yang akan ditanam sangat beragam.
Saat ini, penggerombolan varietas yang sudah tersedia yaitu berdasarkan agroekologi pengembangannya (padi sawah untuk dikembangkan di lahan sawah, padi gogo untuk dikembangkan di ladang atau lahan kering dan padi rawa untuk dikembangkan di lahan rawa). Namun penggunaan varietas sesuai agroekologi tidak selalu selaras dengan preferensi petani.
Berdasarkan beberapa hal tersebut diperlukan penggerombolan varietas padi yang sudah tersedia berdasarkan karakteristik agronomi, gabah, beras dan nasi untuk mengefektifkan kegiatan pengembangan dan introduksi varietas padi. Namun demikian, peubah karakteristik padi merupakan peubah campuran (terdiri dari data numerik dan kategorik).
K-Prototypes yang dikembangkan Huang dan KAy-means for MIxed LArge data (KAMILA) yang dikembangkan Foss adalah algoritma penggerombolan untuk menangani data dengan peubah campuran. Keduanya merupakan pengembangan dari k-means. Kelebihan K-Prototypes yaitu tidak terlalu kompleks. Kelebihan KAMILA mampu memperoleh keseimbangan peubah numerik dan kategorik tanpa perlu menentukan bobot oleh pengguna. Keduanya juga mampu menangani data yang besar. Namun demikian, pada data yang relatif kecil masih perlu dikaji lebih lanjut.
Penelitian ini dilakukan untuk mengetahui metode penggerombolan terbaik pada data berukuran relatif kecil berdasarkan simulasi. Kemudian menerapkan metode terbaik pada data varietas padi di Indonesia.
Hasil penelitian menunjukkan bahwa K-Prototypes unggul dibandingkan KAMILA. Hasil penggerombolan menggunakan K-Prototypes menunjukkan bahwa penggerombolan varietas padi berdasarkan agroekologi tidak sepenuhnya selaras dengan kemiripan karakteristik padi yang merupakan komponen penilaian petani dalam memilih varietas. Hal tersebut tercermin dari keanggotaan varietas dalam suatu gerombol. Secara dominan, dalam suatu gerombol varietasnya tidak hanya berasal dari satu agroekologi.
Sepuluh gerombol varietas padi yang telah diperoleh diharapkan dapat menjadi informasi yang bermanfaat bagi pihak terkait khususnya para pemangku kepentingan di sektor perbenihan termasuk petani. Penggunaan varietas yang tepat sesuai dengan preferensi petani akan meningkatkan tingkat adopsi serta mengefisienkan sistem perbenihan. Sistem perbenihan yang efisien dan efektif akan meningkatkan produktivitas padi nasional dan kesejahteraan petani.
Petani yang memiliki preferensi terhadap varietas padi seperti Ciherang, Cigeulis, Cibogo, dan Situ Bagendit dapat direkomendasikan untuk menanam Inpari 30 Ciherang Sub 1 atau Cakrabuana Agritan. Selain kedua varietas tersebut, petani juga dapat menanam Inpari 46 GSR TDH untuk penggunaan pupuk yang lebih hemat.
Bagi petani yang memiliki preferensi terhadap IR-64, dapat direkomendasikan untuk mencoba Inpari 48 Blas, Inpari 47 WBC dan Cisaat. Sementara, bagi petani yang memiliki preferensi IR-64 namun tekstur nasinya pera, Inpari Gemah dapat direkomendasikan.
Inpago 12 Agritan dan Inpari 32 HDB dapat direkomendasikan ditanam di daerah yang memiliki preferensi terhadap Situ Patenggang. Selain itu, Inpari 49 bersama Respati dan Siliwangi Agritan juga dapat direkomendasikan untuk ditanam didaerah yang memiliki preferensi terhadap Mekongga.
Dilahan rawa, Inpara 10 BLB atau padi sawah seperti Cilamaya Muncul dan Inpari 6 Jete dapat juga direkomendasikan untuk ditanam. Pada agroekologi ladang, Inpago 13 Fortiz atau padi sawah seperti Ciliwung, Cisantana dan Sintanur juga dapat direkomendasikan untuk ditanam. There are so many varieties of rice that have been released. However, dissemination and adoption of rice varieties are often constrained. Apart from the problem of adaptation to environmental conditions, the adoption of varieties is also determined by the preferences of farmers. Farmers' preferences and priorities in determining which varieties to plant vary widely.
The grouping of varieties that are already available is based on agroecological development (lowland rice to be developed in paddy fields, upland rice to be developed in dry land and swamp rice to be developed in swamps). However, the use of varieties according to agroecology is not always in line with farmers' preferences.
Based on these several things, it is necessary to group rice varieties that are already available based on agronomic characteristics, grain, rice and rice to streamline the development and introduction of rice varieties. However, the rice characteristic variables are mixed variables (consisting of numerical and categorical data).
K-Prototypes developed by Huang and KAy-means for Mixed Large Data (KAMILA) developed by Foss is a clustering algorithm for dealing with data with mixed variables. Both are developments from k-means. The advantage of K-Prototypes is that they are not too complex. The advantage of KAMILA is that it can obtain a balance of numeric and categorical variables without the need to determine the weight by the user. Both are also capable of handling large data. However, for relatively small data it still needs further research.
Based on some of the things above, in this study, a simulation study was carried out to compare the use of the K-Prototypes and KAMILA clustering methods at 25 relatively small sample sizes, 5 numbers of numerical and categorical variables and 5 levels of categorical variables. The best method obtained was used to classify rice varieties in Indonesia.
The results of the study show that the K-Prototypes algorithm is superior to the KAMILA algorithm. The results of clustering using K-Prototypes show that the classification of rice varieties based on agroecology is not fully in line with the similarity of the characteristics of rice which is a component of farmers' assessment in determining variety. This is reflected in the membership of varieties in certain clusters that have been formed. Dominantly, varieties in a particular cluster do not only come from one agroecology.
The ten clusters of rice varieties that have been obtained are expected to be useful information for related parties, especially stakeholders in the seed sector including farmers. The use of the right varieties according to farmers' preferences is expected to increase the adoption rate and make seeding activities more efficient. Efficient and effective seeding activities will increase national rice productivity and farmers’ income.
Farmers who have a preference for rice varieties such as Ciherang, Cigeulis, Cibogo, and Situ Bagendit can be recommended to plant Inpari 30 Ciherang Sub 1 or Cakrabuana Agritan. Beside these varieties, farmers can also plant Inpari 46 GSR TDH for a more efficient use of fertilizer.
For farmers who have a preference for IR-64, it can be recommended to try Inpari 48 Blas, Inpari 47 WBC and Cisaat. Meanwhile, for farmers who have a preference for IR-64 but the texture of the rice is perishable, Inpari Gemah can be recommended.
Inpago 12 Agritan and Inpari 32 HDB can be recommended to be planted in areas that have a preference for Situ Patenggang. In addition, Inpari 49 with Respati and Siliwangi Agritan can also be recommended for planting in areas that have a preference for Mekongga.
