Open Conference Systems, Seminar Nasional Sanata Dharma Berbagi: Sains dan Teknologi 2022

Font Size: 
PERBANDINGAN PREPROCESSING DENGAN BAHASA INDONESIA DAN INGGRIS DALAM ANALISIS SENTIMEN TERKAIT KULIAH DARING MENGGUNAKAN MULTINOMIAL NAÏVE BAYES
Bayu Restu Adji, J.B Budi Darmawan

Last modified: 2022-11-08

Abstract


Abstrak

Pandemi virus corona yang semakin menyebar pada tahun 2020 membuat pelaksanaan perkuliahan dilakukan secara daring untuk mencegah penyebaran virus corona. Pelaksanaan kuliah yang dilaksanakan secara daring menimbulkan berbagai opini dari masyarakat dan para pelajar. Banyaknya opini terkait kuliah daring dapat dilakukan analisis sentimen untuk mengetahui opini apa yang banyak disampaikan masyarakat.  Data yang digunakan sebanyak 4.014 dataset dengan kata kunci “kuliah daring”. Dataset tersebut kemudian diberikan label menggunakan textblob dengan kelas positif, negatif, dan netral. Data akan diolah terlebih dahulu melalui proses preprocessing, dalam proses preprocessing akan digunakan dua skenario. Pada skenario pertama proses preprocessing akan dilakukan dengan menggunakan stopword removal dan stemming bahasa Indonesia. Pada skenario kedua data akan ditranslate terlebih dahulu kedalam bahasa Inggris lalu dilakukan proses stopword removal dan stemming menggunakan bahasa Inggris. Data kemudian akan diberikan bobot untuk setiap kata dan dilakukan klasifikasi menggunakan Multinomial Naïve Bayes. Hasil dari penelitian ini menunjukkan bahwa proses preprocessing menggunakan bahasa Inggris mendapatkan hasil akurasi lebih tinggi dalam melakukan analisis sentimen sebesar 76.47% dibandingkan dengan proses preprocessing menggunakan bahasa Indonesia sebesar 63.86% .

Kata Kunci : analisis sentimen, kuliah daring ,multinomial naïve bayes, preprocessing.