# Algoritma Multinomial Naïve Bayes Untuk Klasifikasi Sentimen Pemerintah Terhadap Penanganan Covid-19 Menggunakan Data Twitter

• Yuyun STMIK Handayani Makassar
• Nurul Hidayah STMIK Handayani Makassar
• Supriadi Sahibu STMIK Handayani Makassar
Keywords: opinion, sentiment, twitter, covid-19, multinomial naïve bayes

### Abstract

Currently, the spread of information Covid-19 is spreading rapidly. Not only through electronic media, but this information is also disseminated by user posts on social media. Due to the user text posted is varies greatly, it’s needs a special approach to classify these types of posts. This research aims to classify the public sentiment towards the handling of COVID-19. The data from this study were obtained from the social media application i.e., Twitter. This study uses a derivative of the Naïve Bayes algorithm, namely Multinomial Nave Bayes to optimize the classification results.  Three class labels are used to classify public sentiment namely positive, negative, and neutral sentiments. The stage starts with text preprocessing; cleaning, case folding, tokenization, filtering and stemming. Then proceed with weighting using the TF-IDF approach. To evaluate the classification results, data is tested using confusion matrix by testing accuracy, precision, and recall. From the test results, it is found that the weighted average for precision, recall and accuracy is 74%. Research shows that the accuracy of the proposed method has fair classification levels.

### References

Kemudian untuk rata-rata dengan Weighted Average diperoleh sebesar 0,7383 atau dalam persentase adalah 74%.

Kemudian untuk akurasi adalah menghitung seberapa persen ke Tiga kelas tersebut yang benar Negatif, Netral dan Positif dari keseluruhan data? Adapun perhitungan manual untuk akurasi adalah

Akurasi = Total Correctly Clasified/Actual (7)

/600=0.7383

Diketahui rumus akurasi adalah total klasifikasi benar dibagi dengan jumlah data aktual, sehingga diperoleh 0,7383 atau dalam persentasi adalah 74%. Setelah itu, dihitung nilai AUC yaitu dengan (Rata-rata Recall + Rata-rata Specificity)/2. Sehingga hasilnya adalah: AUC= (0,6208+0,8563)/2=0,7386

Berdasarkan pengujian terhadap tiga parameter yaitu precision, recall dan akurasi terhadap Tiga kelas yaitu positif, negative dan netral diperoleh bahwa ukurasi data dipengaruhi oleh data uji. Semakin banyak jumlah data yang di uji maka semakin tinggi tingkat akurasi prediksi. 74% akurasi, 74% precission dan 73% recall data yang diperoleh menandakan bahwa sekitar 26% data dengan algoritma ini tidak tercover untuk semua jenis kelas. Dengan tingkat kerumitan tinggi pada pengolahan data dalam bentuk text, sehingga dapat disimpulkan bahwa algoritma ini mampu bekerja baik karena dapat membangkitkan dokumen yang relevan terhadap keseluruhan dokumen.

Kesimpulan

Berdasarkan analisis diatas disimpulkan bahwa sistem dapat melakukan kategorisasi sentimen teks dalam kelas Positif, Negatif dan Netral terhadap kondisi Covid-19. Prediksi yang dilakukan dengan metode Multinomial Naïve Bayes mengasilkan akurasi sebesar 74%, precision sebesar 74% dan juga recall sebesar 74%. Sehingga diperoleh nilai AUC adalah 0,74. Ini menandakan bahwa, algoritma yang diusulkan memiliki tingkatan fair classification atau (nilai diagnostik sedang/cukup baik).

Untuk penelitian selanjutnya penggunaan sosial media lain perlu dipertimbangkan. Kemudian, perlu ditambahkan algoritma lain untuk membantu kinerja algoritma Multinomial Naïve Bayes dalam proses pengklasifikasian sentimen, khususnya karena peneliti melihat bahwa Multinomial Naïve Bayes melakukan learning per satu kata maka untuk penelitian berikutnya diharapkan algoritma dapat memperhatikan lebih dari satu kata atau bahkan per satu kalimat.

Daftar Rujukan

