Penerapan Support Vector Machine (SVM) untuk Pengkategorian Penelitian

  • Fithri Selva Jumeilah STMIK GI MDP
Keywords: SVM, Text Mining, Preprocessing, Classification, Term Weighting

Abstract

Penelitian setiap perguruan tinggi akan terus bertambah. Penelitian akan disimpan dalam bentuk softcopy dan hardcopy. Penyusunan penelitian hendaknya harus perkategori agar mempermudah pencarian orang yang membutuhkan refrensi. Untuk mengkategorikan penelitian maka dibutuhkan sebuah metode untuk penambangan teks, salah satunya dengan implementasi Support Vector Machines (SVM). Data yang digunakan untuk mengenali ciri dari tiap kategori maka dibutuhkan data sekunder yang merupakan kumpulan dari abstrak penelitian. Data tersebut akan dilakukan praprosesing dengan beberapa tahapan yaitu case folding mengubah semua huruf menjadi huruf kecil, stopwords removing penghapusan kata-kata yang sangat umum, tokenizing membuang tanda baca, dan stemming mencari akar kata dengan membuang awalan dan akhiran. Selanjutnya data yang sudah mengalami preprocessing akan diubah menjadi bentuk numerik dengan untuk tahap term weighting yaitu pemberian bobot kontribusi setiap kata. Dari hasil term weighting maka diperoleh data yang bisa digunakan untuk data traning dan data uji. Proses training dilakukan dengan memberikan masukan berupa data teks yang diketahui kelas atau kategorinya. Kemudian dengan menggunakan algoritma Support Vector Machines, data-data hasil masukan tersebut ditransformasikan ke dalam suatu aturan, fungsi, ataupun model pengetahuan yang nantinya dapat digunakan dalam proses prediksi. Dari hasil penelitian ini diperoleh bahwa pengkategorian penelitian yang dihasilkan oleh SVM sudah sangat baik. Hal ini dibuktikan leh hasil pengujian yang menghasilkan tingkat akurasi 90%.

Downloads

Download data is not yet available.

References

Dumais, et al. (1998), “Inductive Learning Algorithms and Representations for Text Categorization”.
[2] Rustam, et al. (2003), Klasifikasi Aroma Menggunakan SVM. Seminal Nasional Ilmu Komputer dan Teknologi Informasi, Vol 4, pp. 231-235.
[3] Hao Y, Lee Y, Harmer S et al. (2007) . Measurement of Complex Permittivity of Textile Materials for Body- Centric Wireless Communications. Conference: iET Seminar on Antennas and Propagation for Body-Centric Wireless Communications, London, April 2007.
[4] Yang, Y. and Liu, 1999, “Proceedings of ACM SIGIR Conference on Research and Development in Information Retrieval “, (SIGIR'99, pp 42--49).
[5] Even, Yair dan Zohar. 2002. Itroduction to Text Mining. University Of Illionis. Illionis.
[6] Feldman, R. & Sanger, J. 2007. The Text Mining Handbook-Advanced Approaches in Analyzing Unstructured Data, USA: New York.
7] Langgeni, Baizal dan Firdaus, 2010, CLUSTERING ARTIKEL BERITA BERBAHASA INDONESIA MENGGUNAKAN UNSUPERVISED FEATURE SELECTION, Seminar Nasional Informatika, Yogyakarta.
[8] Raghavan dan Schutze. 2009. Introduction to Information Retrieval, Cambridge University Press.
[9] Joachims, T. 1998. TextCotegorization with Support Vector Machines : Learning with Many Relevant Features. University Dortmund. Germany.
[10] Yang and Joachims (2008) Text categorization. 3(5):4242
Published
2017-07-31
How to Cite
Jumeilah, F. S. (2017). Penerapan Support Vector Machine (SVM) untuk Pengkategorian Penelitian. Jurnal RESTI (Rekayasa Sistem Dan Teknologi Informasi), 1(1), 19 - 25. https://doi.org/10.29207/resti.v1i1.11
Section
Information Systems Engineering Articles