Penerapan Support Vector Machine (SVM) untuk Pengkategorian Penelitian
Abstract
Penelitian setiap perguruan tinggi akan terus bertambah. Penelitian akan disimpan dalam bentuk softcopy dan hardcopy. Penyusunan penelitian hendaknya harus perkategori agar mempermudah pencarian orang yang membutuhkan refrensi. Untuk mengkategorikan penelitian maka dibutuhkan sebuah metode untuk penambangan teks, salah satunya dengan implementasi Support Vector Machines (SVM). Data yang digunakan untuk mengenali ciri dari tiap kategori maka dibutuhkan data sekunder yang merupakan kumpulan dari abstrak penelitian. Data tersebut akan dilakukan praprosesing dengan beberapa tahapan yaitu case folding mengubah semua huruf menjadi huruf kecil, stopwords removing penghapusan kata-kata yang sangat umum, tokenizing membuang tanda baca, dan stemming mencari akar kata dengan membuang awalan dan akhiran. Selanjutnya data yang sudah mengalami preprocessing akan diubah menjadi bentuk numerik dengan untuk tahap term weighting yaitu pemberian bobot kontribusi setiap kata. Dari hasil term weighting maka diperoleh data yang bisa digunakan untuk data traning dan data uji. Proses training dilakukan dengan memberikan masukan berupa data teks yang diketahui kelas atau kategorinya. Kemudian dengan menggunakan algoritma Support Vector Machines, data-data hasil masukan tersebut ditransformasikan ke dalam suatu aturan, fungsi, ataupun model pengetahuan yang nantinya dapat digunakan dalam proses prediksi. Dari hasil penelitian ini diperoleh bahwa pengkategorian penelitian yang dihasilkan oleh SVM sudah sangat baik. Hal ini dibuktikan leh hasil pengujian yang menghasilkan tingkat akurasi 90%.
Downloads
References
[2] Rustam, et al. (2003), Klasifikasi Aroma Menggunakan SVM. Seminal Nasional Ilmu Komputer dan Teknologi Informasi, Vol 4, pp. 231-235.
[3] Hao Y, Lee Y, Harmer S et al. (2007) . Measurement of Complex Permittivity of Textile Materials for Body- Centric Wireless Communications. Conference: iET Seminar on Antennas and Propagation for Body-Centric Wireless Communications, London, April 2007.
[4] Yang, Y. and Liu, 1999, “Proceedings of ACM SIGIR Conference on Research and Development in Information Retrieval “, (SIGIR'99, pp 42--49).
[5] Even, Yair dan Zohar. 2002. Itroduction to Text Mining. University Of Illionis. Illionis.
[6] Feldman, R. & Sanger, J. 2007. The Text Mining Handbook-Advanced Approaches in Analyzing Unstructured Data, USA: New York.
7] Langgeni, Baizal dan Firdaus, 2010, CLUSTERING ARTIKEL BERITA BERBAHASA INDONESIA MENGGUNAKAN UNSUPERVISED FEATURE SELECTION, Seminar Nasional Informatika, Yogyakarta.
[8] Raghavan dan Schutze. 2009. Introduction to Information Retrieval, Cambridge University Press.
[9] Joachims, T. 1998. TextCotegorization with Support Vector Machines : Learning with Many Relevant Features. University Dortmund. Germany.
[10] Yang and Joachims (2008) Text categorization. 3(5):4242
Copyright (c) 2017 Jurnal RESTI (Rekayasa Sistem dan Teknologi Informasi)

This work is licensed under a Creative Commons Attribution 4.0 International License.
Copyright in each article belongs to the author
- The author acknowledges that the RESTI Journal (System Engineering and Information Technology) is the first publisher to publish with a license Creative Commons Attribution 4.0 International License.
- Authors can enter writing separately, arrange the non-exclusive distribution of manuscripts that have been published in this journal into other versions (eg sent to the author's institutional repository, publication in a book, etc.), by acknowledging that the manuscript has been published for the first time in the RESTI (Rekayasa Sistem dan Teknologi Informasi) journal ;