Klasifikasi Berita Menggunakan Algoritma Naive Bayes Classifer Dengan Seleksi Fitur Dan Boosting

  • Bobby Suryo Prakoso STMIK Nusa Mandiri
  • Didi Rosiyadi STMIK Nusa Mandiri Kramat
  • Heru Sukma Utama STMIK Nusa Mandiri Kramat
  • Dedi Aridarma LIPI
Keywords: Information Gain, Naive Bayes Classifier, Boosting, Bayesian Boosting

Abstract

Penelitian yang dilakukan ini merupakan bagian dari text mining untuk klasifikasi konten berita yang telah memiliki label berdasarkan katagori berita pada situs detik.com . Proses yang dilakukan adalah melakukan permodelan dan pengolahan data, mulai proses pre-processing, proses seleksi fitur information gain, dan penerapan model algoritma Naive Bayes Classifier dengan Bayesian Boosting. Hasil yang diperoleh atas model tersebut mendapatkan nilai evaluasi terhadap akurasi, recall, dan presisi sebesar 73.2%. Sedangkan dengan model yang lebih ringkas yaitu model algoritma Naive Bayes Classifier, dengan Bayesian Boosting mendapatkan nilai evaluasi yang sama besar yaitu 73.2%. Penilaian atas hasil evaluasi model yang telah terlaksankan berkesimpulan bahwa penerapan seleksi fitur Information Gain tidak berpengaruh besar atas kenaikan hasil performa terhadap kondisi label Polynomial.

 

Downloads

Download data is not yet available.

References

[1] APJII, “Penetrasi dan perilaku pengguna internet Indonesia,” 2017.
[2] P. R. C. Xu, Shuo /(Research Center for Information Science Theory and Methodology, Institute of Scientific and Technical Information of China, “Bayesian Naıve Bayes classifiers to text classification.pdf.” .
[3] N. D. Pratama, Y. A. Sari, and P. P. Adikara, “Analisis Sentimen Pada Review Konsumen Menggunakan Metode Naive Bayes Dengan Seleksi Fitur Chi Square Untuk Rekomendasi Lokasi Makanan Tradisional,” J. Pengemb. Teknol. Inf. dan Ilmu Komput. Univ. Brawijaya, vol. 2, no. 9, pp. 2982–2988, 2018.
[4] D. Ariadi and K. Fithriasari, “Klasifikasi Berita Indonesia Menggunakan Metode Naive Bayesian Classification dan Support Vector Machine dengan Confix Stripping Stemmer,” J. SAINS DAN SENI ITS Vol. 4, No.2, vol. 4, no. 2, pp. 248–253, 2015.
[5] S. Fanissa, M. A. Fauzi, and S. Adinugroho, “Analisis Sentimen Pariwisata di Kota Malang Menggunakan Metode Naive Bayes dan Seleksi Fitur Query Expansion Ranking,” J. Pengemb. Teknol. Inf. dan Ilmu Komput., vol. 2, no. 8, pp. 2766–2770, 2018.
[6] S. Moro et al., “Leveraging national tourist offices through data analytics Leveraging national tourist of fi ces through data analytics,” 2018.
[7] Y. Pramudita, U. T. Madura, S. S. Putro, and U. T. Madura, “Klasifikasi Berita Olahraga Menggunakan Metode Naïve Bayes dengan Enhanced Confix Stripping Stemmer,” J. Teknol. Inf. dan Ilmu Komput., vol. Vol. 5, No, no. August 2018, p. hlm. 269-276, 2019.
[8] B. Aryoyudanta, T. B. Adji, and I. Hidayah, “Semi-supervised learning approach for Indonesian Named Entity Recognition (NER) using co-training algorithm,” Proceeding - 2016 Int. Semin. Intell. Technol. Its Appl. ISITIA 2016 Recent Trends Intell. Comput. Technol. Sustain. Energy, pp. 7–12, 2017.
[9] S. Chormunge and S. Jena, “Efficient feature subset selection algorithm for high dimensional data,” Int. J. Electr. Comput. Eng., vol. 6, no. 4, pp. 1880–1888, 2016.
[10] L. Dini Utami and R. S. Wahono, “Integrasi Metode Information Gain Untuk Seleksi Fitur dan Adaboost Untuk Mengurangi Bias Pada Analisis Sentimen Review Restoran Menggunakan Algoritma Naïve Bayes,” J. Intell. Syst., vol. 1, no. 2, pp. 120–126, 2015.
[11] X. Feng, S. Li, C. Yuan, P. Zeng, and Y. Sun, “Prediction of Slope Stability using Naive Bayes Classifier,” KSCE J. Civ. Eng. 22(3)941-950, pISSN 1226-7988, eISSN 1976-3808, vol. 22, pp. 941–950, 2018.
[12] A. S. Budiman, P. Studi, T. Komputer, X. A. Parandani, P. Studi, and M. Informatika, “Uji Akurasi Klasifikasi Dan Validasi Data Pada Penggunaan Metode Membership Function Dan Algoritma C4 . 5 Dalam,” vol. 9, no. 1, pp. 565–578, 2018.
Published
2019-08-03
Section
Artikel Teknologi Informasi