Analisis Sentimen Pembelajaran Daring Menggunakan Metode Naïve Bayes, KNN, Dan Decision Tree
Analisis Sentimen Pembelajaran Daring Menggunakan Metode Naïve Bayes, KNN, Dan Decision Tree
1,2,3 Program Studi Informatika, Fakultas Teknologi Komunikasi dan Informatika, Universitas Nasional.
Article history: Corona Virus Disease or better known as Corona Virus has attacked all corners of the world,
Received 2 June 2021 including Indonesia. It has been almost +1 year that this virus is still attacking Indonesia and has
Received in revised form an impact on various sectors, one of which is education. To contain the spread of the virus, the
13 July 2021 government has set an online education system. Many complaints were experienced by students,
Accepted 25 August 2021 especially students who returned home, many of them experienced difficulties in accessing the
Available online January 2022 internet, so many tasks to complete, and many more. The purpose of this study is to obtain the
accuracy of the classification results based on the level of accuracy of the perceptions of students
DOI:
https://doi.org/10.35870/jti who use Twitter regarding the implementation of online lectures. In this research, the method
k.v6i1.368 used is Naive Bayes, KNN, and Decision Tree. The data used in this study is Twitter data by
crawling data. From the results of this study, the Decision Tree method has a high value among
other methods with an accuracy of 61.92%, precision of 73.63%, and recall of 11.42%.
Keywords:
Corona Virus; Twitter; Naïve
Bayes; KNN; Decision Tree.
abstrak
Kata Kunci:
Virus Corona; Twitter; Naïve Corona Virus Disease atau lebih dikenal Virus Corona telah menyerang ke seluruh penjuru dunia
Bayes; KNN; Decision Tree. tidak terkecuali Indonesia. Sudah hampir +1 tahun virus ini masih menyerang Indonesia dan
berdampak di berbagai sektor bidang, salah satunya bidang pendidikan. Demi menanggulangi
penyebaran virus, pemerintah menetapkan sistem pendidikan dilaksanakan secara online. Banyak
keluh kesah yang dialami mahasiswa terutama mahasiswa yang pulang kampung, banyak yang
dialami mereka mulai kesulitan akses internet, tugas yang harus diselesaikan begitu banyak dan
masih banyak lagi. Adapun tujuan dari penelitian ini yaitu untuk mendapatkan ketepatan hasil
klasifikasi berdasarkan tingkat akurasi dari persepsi mahasiswa yang menggunakan twitter
mengenai pemberlakuan kuliah secara online. Dalam penelitian ini ada tiga metode yang akan
dipakai untuk proses klasifikasi. Metodenya tersebut yaitu Naive Bayes, KNN dan Decision Tree.
Data yang dipakai dalam penelitian ini merupakan data twitter yang diambil dengan cara crawling
data. Dari hasil pengujian diketahui metode Decision Tree memiliki nilai yang lebih tinggi
diantara metode lainnya dengan akurasi sebesar 61.92%, presisi 73.63%, dan recall 11.42%.
Crawling data Gambar diatas menunjukkan isi operator yang ada pada
Langkah pertama yang dilakukan dalam proses operator subprocess. Dalam penelitian ini digunakan
analisis sentimen adalah pengumpulan data. Proses operator replace, untuk menghilangkan huruf @ dan RT.
pengumpulan data dalam penelitian ini diambil dari Kemudian operator remove Url, untuk menghilangkan
media sosial twitter menggunakan API Twitter halaman web yang ada pada tweet. Operator Read Excel
dengan pencarian kata kuliah online. (Emoticon), digunakan untuk mengkonversi kombinasi
huruf menjadi kalimat tekstual. Operator Replace
Atribut digunakan untuk mengganti atribut satu ke
atribut satunya.
Pada gambar 2 menunjukkan proses crawling data. Ada Gambar 4. Operator dalam Precess Document Data
beberapa operator yang digunakan untuk melakukan
crawling data seperti ”search twitter”, ”select atribut”, Gambar diatas menampilkan beberapa operator yang
”remove duplicate”, dan “write excel”. Search twitter ada didalam operator process documents from data. Berikut
digunakan untuk mengambil data dari Twitter ini adalah penjelasannya.
menggunakan API Twitter, select atribut digunakan 1) Cleansing Data
untuk memilih atribut yang ingin digunakan seperti Merupakan pembersihan data terhadapap data
text, id, username dan lain-lain. Opeartor remove yang tidak diperlukan [2,7]. Hal ini dilakukan
duplicates dipakai untuk menghapus jika ada data yang untuk mengurangi kesalahan ketika memproses
sama, kemudian operator write excel dipakai untuk data. Dalam penelitian ini adapun yang
menyimpan data dalam format excel. Kemudian dihilangkan yaitu huruf @, RT, dan URL.
proses berikutnya melakukan proses labeling data. 2) Emoticon
Pada proses ini data akan dibagi menjadi kelas Merupakan bentuk ekspresi digambarkan dalam
negatif, positif. Hal ini lakukan untuk menentukan bentuk wajah yang digunakan penggunanya
tweet yang diambil apakah masuk kedalam kelas untuk mengekspersikan suasana hatinya [7,8].
negatif atau positif, berdasarkan data training dan Dalam hal ini dilakukan convert yang dimana
testing. Berikut adalah contoh pemberian label pada ekspresi tadi dalam bentuk kombinasi huruf
dataset twitter. diubah ke kalimat yang lebih jelas. Contohnya ada
Tabel 1. Labelling Data pada tabel 2.
Sebelum Sesudah Tabel 2. Convert Emoticon
:((((, :(((((, :-@, :-|, :-p, :s, :x Sedih Sentiment Text
(^.^), (^_^), :), :'), :-), :))))))), Senang Negatif Hawa ngantuk semakin kuat
:3, :9 dikuliah online
Negatif Asli dah capean kuliah online. Cape
Preprocessing Data mata cape otak
Setelah melakukan labeling data, langkah selanjutnya Positif Good morning~~ semangat kuliah
adalah melakukan pra-pemrosesan data. Dalam online nya <33
proses ini yang tadinya data sudah siap kemudian Positif Semangat buat kamu yang hari ini
akan dilakukan proses data yang lebih terstruktur [6]. sekolah daring,kuliah online,kerja
offline dan yg kerja online!??
3) Case Folding
Dalam tweet terdapat penulisan huruf yang
berbeda, oleh karena itu dilakukan proses
pengubahan huruf menjadi huruf besar maupun
Gambar 3. Operator dalam Subprocess huruf kecil [6,7,8]. Contoh “Mahasiswa Kesulitan
Jurnal JTIK (Jurnal Teknologi Informasi dan Komunikasi) 6 (1) 2022 23
Kemudian Recall merupakan prediksi rasio true Tabel 5. Hasil Confusion Matrix
positif dibandingkan perhitungan semua data yang Metode TP FP TN FN
true Positif [8]. Adapun cara menghitungnya dapat Naiive 160 185 210 112
menggunakan rumus dibawah ini [10]. Bayes
KNN 109 94 301 163
𝑇𝑃
Recall = (𝑇𝑃+𝐹𝑁) x 100% (6) Decision 31 13 382 241
Tree
3. Hasil dan Pembahasan
Tabel diatas menampilkan hasil proses Confusion
Tahap ini merupakan tahap hasil dari uji analisis Matrix dari setiap metode. Untuk hasil accuracy,
menggunakan software Rapid Miner. precision dan recall. Hasilnya dapat dilihat pada tabel 6.
Accuracy dari tiga metode tersebut adalah 55.49%, [6] Luqyana, W.A., Cholissodin, I. and Perdana,
61.47%, dan 61.92%. Hasil Precision dari tiga metode R.S., 2018. Analisis Sentimen Cyberbullying
tersebut adalah 46.45%, 53.90%, dan 73.63%. Dan pada Komentar Instagram dengan Metode
hasil Recall dari tiga metode tersebut adalah 58.91%, Klasifikasi Support Vector Machine. Jurnal
40.07%, dan 11.42%. Dapat disimpulkan dari hasil Pengembangan Teknologi Informasi dan Ilmu
tersebut bahwa metode Decision Tree memiliki Komputer e-ISSN, 2(11), pp.4704-4713.
tingkat accuracy yang paling tinggi dari kedua metode
lainnya sebesar 61.92% accuracy, 73.63% precision dan [7] Ruhyana, N., 2019. Analisis Sentimen Terhadap
11.42% recall. Penerapan Sistem Plat Nomor Ganjil/Genap
Pada Twitter Dengan Metode Klasifikasi Naive
5. Daftar Pustaka Bayes. IKRA-ITH INFORMATIKA: Jurnal
Komputer dan Informatika, 3(1), pp.94-99.
[1] Fauziyyah, A.K., 2020. Analisis Sentimen
Pandemi Covid19 Pada Streaming Twitter [8] Bayhaqy, A., Sfenrianto, S., Nainggolan, K. and
Dengan Text Mining Python. Jurnal Ilmiah Kaburuan, E.R., 2018, October. Sentiment
SINUS, 18(2), pp.31-42, doi: analysis about E-commerce from tweets using
10.30646/sinus.v18i2.491. decision tree, K-nearest neighbor, and naïve
bayes. In 2018 international conference on orange
[2] Riefky, M. and Anandyani, A.R., 2020. technologies (ICOT) (pp. 1-6). IEEE, doi:
Klasifikasi Persepsi Pengguna Twitter 10.1109/ICOT.2018.8705798.
Terhadap Tuntutan Keringanan Pembayaran
Uang Kuliah Tunggal (Ukt) Pada Masa [9] Puspita, R. and Widodo, A., 2021.
Pandemi Covid-19 Menggunakan K-Nearest Perbandingan Metode KNN, Decision Tree,
Neighbor. In Seminar Nasional Official dan Naïve Bayes Terhadap Analisis Sentimen
Statistics (Vol. 2020, No. 1, pp. 247-257), doi: Pengguna Layanan BPJS. Jurnal Informatika
10.34123/semnasoffstat.v2020i1.443. Universitas Pamulang, 5(4), pp.646-654, doi:
10.32493/informatika.v5i4.7622.
[3] Syarifuddinn, M., 2020. Analisis Sentimen
Opini Publik Mengenai Covid-19 Pada Twitter [10] A. Muhammad., 2018. A Comparative Analysis
Menggunakan Metode Naïve Bayes dan of Classification Algorithms on Diverse
KNN. INTI Nusa Mandiri, 15(1), pp.23-28. Datasets, Engineering. Technology & Appl. Sci.
Res., vol. 8, no. 2, pp. 2790-2795, 2018, doi:
[4] Romadloni, N.T., Santoso, I. and Budilaksono, 10.48084/etasr.1952.
S., 2019. Perbandingan Metode Naïve Bayes,
KNN dan Decision Tree Terhadap Analisis [11] Cynthia, E.P. and Ismanto, E., 2018. Metode
Sentimen Transportasi KRL Commuter Decision Tree Algoritma C. 45 Dalam
Line. IKRA-ITH INFORMATIKA: Jurnal Mengklasifikasi Data Penjualan Bisnis Gerai
Komputer dan Informatika, 3(2), pp.1-9. Makanan Cepat Saji. Jurasik (Jurnal Riset Sistem
Informasi dan Teknik Informatika), 3, pp.1-13, doi:
[5] Kurniawan, S., Gata, W., Puspitawati, D.A., 10.30645/jurasik.v3i0.60.
Tabrani, M. and Novel, K., 2019.
Perbandingan Metode Klasifikasi Analisis [12] Triayudi, A., Hidayatullah, D. and Rosalina, V.,
Sentimen Tokoh Politik Pada Komentar Media 2019. K-Nearest Neighbor Algorithm for
Berita Online. Jurnal RESTI (Rekayasa Sistem Determination of High School
dan Teknologi Informasi), 3(2), pp.176-183, doi: Programs. Journal Of Software Engineering &
10.29207/resti.v3i2.935. Intelligent Systems (JSEIS), 4.
26 Tobby Wiratama Putra, Agung Triayudi, Andrianingsih Andrianingsih / Jurnal JTIK (Jurnal Teknologi Informasi dan
Komunikasi) 6 (1) 2022, 20-26
[13] Tineges, R., Triayudi, A. and Sholihati, I.D., [15] Daeli, N.O.F. and Adiwijaya, A., 2020.
2020. Analisis Sentimen Terhadap Layanan Sentiment analysis on movie reviews using
Indihome Berdasarkan Twitter Dengan Information gain and K-nearest
Metode Klasifikasi Support Vector Machine neighbor. Journal of Data Science and Its
(SVM). JURNAL MEDIA INFORMATIKA Applications, 3(1), pp.1-7, doi:
BUDIDARMA, 4(3), pp.650-658, doi: 10.34818/JDSA.2020.3.22.
10.30865/mib.v4i3.2181.
[16] Dharmawan, L.R., Arwani, I. and Ratnawati,
[14] Samsir, S., Ambiyar, A., Verawardina, U., Edi, D.E., 2020. Analisis Sentimen pada Sosial
F. and Watrianthos, R., 2021. Analisis Media Twitter Terhadap Layanan Sistem
Sentimen Pembelajaran Daring Pada Twitter di Informasi Akademik Mahasiswa Universitas
Masa Pandemi COVID-19 Menggunakan Brawijaya dengan Metode K-Nearest
Metode Naïve Bayes. Jurnal Media Informatika Neighbor. Jurnal Pengembangan Teknologi Informasi
Budidarma, 5(1), pp.157-163, doi: dan Ilmu Komputer e-ISSN, 2548, p.964X.
10.30865/mib.v5i1.2604.