Seleksi dan Pemeringkatan Kepakaran Dari Publikasi Ilmiah Berdasarkan Language Model
View/ Open
Date
2018Author
Saputra, Fadly Akbar
Djatna, Taufik
Handoko, Laksana Tri
Metadata
Show full item recordAbstract
Pakar merupakan orang yang mempunyai keahlian, pengetahuan, dan pengalaman pada bidang tertentu. Tingkat keahlian, pengetahuan, dan pengalaman seorang pakar disebut juga kepakaran. Salah satu cara untuk menilai tingkat kepakaran seseorang adalah melalui dokumen ilmiah yang sudah ditulis oleh orang tersebut. Berbagai sumber dan bentuk data telah digunakan dalam pencarian pakar, antara lain web log, struktur link, dan komentar pada forum tanya jawab.
Salah satu sumber data untuk pencarian pakar yang paling mudah didapatkan adalah publikasi ilmiah. Publikasi ilmiah adalah salah satu bentuk pengetahuan yang mudah diakses dan dibaca yang dipublikasikan secara umum atau berkala. Publikasi ilmiah diterbitkan melalui proses reviu oleh pakar pada bidangnya, sehingga kaidah-kaidah keilmuan yang ada bisa diterima oleh orang lain. Kandidat pakar sendiri merupakan penulis pada publikasi ilmiah.
Language model (LM) merupakan salah satu metode yang paling banyak digunakan untuk menghitung kepakaran seseorang dari publikasi ilmiahnya. Berbeda dengan penelitian sebelumnya yang hanya menggunakan judul dan abstrak, penelitian ini menggunakan seluruh isi dari publikasi ilmiah untuk menghitung nilai LM. Selain itu, penelitian ini mengembangkan sebuah model baru dengan mengunakan panjang dokumen sebagai peluang prior. Ide di balik penggunaan panjang dokumen didasari pada sebuah intuisi yang mengatakan bahwa dokumen yang lebih panjang tentu lebih dalam dan meliputi lebih banyak topik dari pada dokumen yang pendek tanpa ada query yang diketahui.
Enam fitur dihitung untuk menentukan dominasi penulis dalam satu dokumen menggunakan metode learning to rank (L2R). Jumlah data latih yang tidak lebih dari 1% dalam satu topik membuat presisi model menggunakan dominasi penulis tidak lebih baik dari pada model yang sudah ada. Namun, hasil evaluasi menggunakan lima metode evaluasi membuktikan bahwa modifikasi pada model yang sudah ada menggunakan panjang dokumen dapat meningkatkan presisi dari model sebelumnya.