Unduh sebagai pdf atau txt
Unduh sebagai pdf atau txt
Anda di halaman 1dari 10

KESATRIA: Jurnal Penerapan Sistem Informasi (Komputer & Manajemen)

Terakreditasi Nomor 204/E/KPT/2022 | Vol. 5, No. 1, Januari (2024), pp. 326-335

Analisis Sentimen Penggunaan Aplikasi Transportasi Online Pada


Ulasan Google Play Store dengan Metode Naive Bayes Classifier
Dicki Nugraha1, Dudih Gustian2
1,2
Program Studi Sistem Informasi, Universitas Nusa Putra, Indonesia
E-mail: [email protected], [email protected]

Abstract
Public transportation is a necessity for some people to carry out their daily activities.
In the current digital era, public transportation can be accessed online using a
smartphone through applications available on the Google Play Store, for example online
transportation applications that are currently popular, namely Grab, Gojek, and Maxim.
Since the application's new features, such as food & shop services, online transportation
applications have experienced an increase in the number of downloads. On the Google
Play Store, usually before deciding to download an application, users often look at
ratings and read reviews first. Because it has almost the same number of downloads and
ratings, making the title the best application less relevant. To find out which online
transportation application has the best title, a sentiment analysis was carried out on
several online transportation applications on the Google Play Store. This user review
analysis uses the Naïve Bayes Classifier (NBC) algorithm, which in several studies that
have used this algorithm is considered to have a high enough level of accuracy so that it
can determine the best online transportation application based on review comments on
the Google Play Store. From the results of the analysis that has been carried out, it was
found that the Gojek application got an accuracy value of 86%, the Grab application
87%, and the Maxim application got the highest accuracy level with a value of 93%.

Keywords: Sentiment Analysis, Google Play Store, Naïve Bayes Classifier, Public
Transportation.

Abstrak
Transportasi umum merupakan kebutuhan dari sebagian masyarakat untuk melakukan
aktivitas sehari-hari. Di era digital saat ini transportasi umum sudah bisa di akses secara
online menggunakan smartphone melalui aplikasi yang tersedia di google play store,
contoh nya aplikasi transportasi online yang sedang populer yaitu Grab, Gojek, dan
Maxim. Semenjak adanya fitur-fitur baru pada aplikasi tersebut seperti layanan
food&shop, aplikasi transportasi online mengalami lonjakkan jumlah unduhan. Pada
google play store biasanya sebelum memutuskan untuk mengunduh aplikasi, pengguna
sering melihat rating dan membaca ulasan terlebih dahulu. Karena memiliki jumlah
unduhan dan rating yang hampir sama, sehingga membuat predikat sebagai aplikasi
terbaik menjadi kurang relevan. Untuk mengetahui aplikasi transpotasi online mana yang
memiliki predikat terbaik maka dilakukan analisis sentimen pada beberapa aplikasi
transportasi online di google play store. Analisis ulasan pengguna ini menggunakan
algoritma Naïve Bayes Classifier (NBC), dimana dalam beberapa penelitian yang sudah
menggunakan algoritma ini dinilai memiliki tingkat keakuratan yang cukup tinggi
sehingga dapat menentukan aplikasi transportasi online terbaik berdasarkan ulasan
komentar di google play store. Dari hasil analisis yang telah dilakukan ditemukan bahwa
aplikasi Gojek mendapatkan nilai akurasi 86%, aplikasi grab 87%, dan aplikasi Maxim
mendapatkan tingkat akurasi tertinggi dengan nilai 93%.

Kata Kunci: Analisis Sentimen, Google Play Store, Naïve Bayes Classifier (NBC),
Transportasi Online.

ISSN: 2720-992X
Copyright ⓒ KESATRIA: Jurnal Penerapan Sistem Informasi (Komputer & Manajemen)
KESATRIA: Jurnal Penerapan Sistem Informasi (Komputer & Manajemen)
Terakreditasi Nomor 204/E/KPT/2022 | Vol. 5, No. 1, Januari (2024), pp. 326-335

1. Pendahuluan
Transportasi umum merupakan fasilitas yang digunakan masyarakat dalam aktivitas
sehari-hari. Transportasi umum terbagi menjadi dua yaitu transportasi konvensional
(offline) dan transportasi online. Transportasi konvensional adalah transportasi umum
yang digunakan masyarakat yang tanpa perlu melakukan pemesanan menggunakan
aplikasi. Sedangkan transportasi online adalah transportasi umum berbasis aplikasi
sebagai media untuk melakukan pemesanan sebelm menggunakannya. Saat ini
masyarakat mulai terbiasa menggunakan jasa transportasi online karena kemudahan dan
efisiensinya yang membantu dalam beraktivitas [1]. Banyak perusahaan transportasi
online yang menawarkan berbagai layanan sehingga menciptakan persaingan yang ketat.
Perusahaan transportasi online yang saat ini sering digunakan oleh masyarakat antara lain
Gojek Maxim dan Grab. Gojek adalah sebuah perusahaan yang berasal dari Indonesia
yang mengandung konsep teknologi yang menyediakan layanan jasa transportasi berbasis
aplikasi Online. Gojek adalah sebagai pelopor transportasi online yang berdiri sejak tahun
2010 [2] Grab didirikan pada tahun 2012 di Singapura sebagai kantor pusatnya dan
beroperasi di Indonesia sejak tahun 2014 [3]. Maxim telah beroperasi di Indonesia sejak
tahun 2018 [4]. Menawarkan beberapa layanan seperti transportasi online (motor dan
mobil). Terjadinya persaingan pada ketiga perusahaan transportasi online tentu perlu
saran dan kritik dari pengguna untuk meninjau kekurangan dari setiap layanan kedua
transportasi online ini, sehingga dilakukan sentimen analisis untuk mengetahui tingkat
kepuasan pengguna transportasi online antara 3 (tiga) aplikasi tersebut.

2. Metodologi Penelitian
2.1. Sumber Data
Data yang digunakan dalam penelitian ini berasal dari kolom komentar aplikasi
Transportasi Online di Google Play Store. Google Play Store kadang disebut juga "Google
Play" merupakan marketplace digital perusahaan. Google Play secara default sudah diinstal
di ponsel dan tablet Android, TV Android dan perangkat Google TV. Google Play Store
juga dapat diakses secara online melalui browser web. Untuk pengguna Android bisa
mendapatkan aplikasi Transportasi Online dengan mengunduhnya dari Google Play Store.
Pada Google Play Store juga terdapat kolom ulasan yang berisi ulasan para pengguna
aplikasi Transportasi Online. Banyaknya dan beragam ulasan tersebut dapat dijadikan
sebagai bahan penelitian.

2.2. Populasi dan Sampel


Populasi pada penelitian ini merupakan seluruh pengguna platform google playstore.
Sampel penelitian ini merupakan pengguna aplikasi Transportasi online Grab, Maxim dan
Gojek pada platform google playstore.

2.3. Metode Pengumpulan Data dan Sampel


Data dikumpulkan menggunakan library google scrapper melalui google collab
untuk mendapatkan hasil berupa 3000 data komentar pengguna di platform google
playstore pada aplikasi transportasi online diantaranya Grab, Maxim dan Gojek.

2.4. Metode Riset


Metode penelitian adalah suatu cara ilmiah untuk mendapatkan data dengan tujuan
kegunaan tertentu. Cara ilmiah berarti kegiatan penelitian itu didasarkan pada ciri - ciri
keilmuan yaitu rasional, empiris, dan sistematis. Dari definisi diatas dapat disimpulkan
bahwa metode penelitian adalah suatu cara yang bersifat ilmiah dalam mendapatkan data
untuk kegunaan tertentu [5].
Dalam penelitian ini digunakan algoritma NBC (Naïve Bayes Classifier), sebelumnya
penulis telah melakukan penelitian aplikasi transportasi online yang sama dengan kasus

327
KESATRIA: Jurnal Penerapan Sistem Informasi (Komputer & Manajemen)
Terakreditasi Nomor 204/E/KPT/2022 | Vol. 5, No. 1, Januari (2024), pp. 326-335

ini menggunakan algoritma SVM (Support Vector Machine). Karena ketidakpuasan dari
hasil sebelumnya, penulis ingin melakukan penelitian kembali menggunakan algoritma
yang berbeda untuk menjadi pembanding dari hasil penelitian sebelumnya. Alur
penelitian yang akan dilakukan pada penelitian ini sebagaimana ditunjukan pada Gambar
1 dibawah ini:

Pengumpulan Data

Pre-processing Data

Klasifikasi Data

Cross Validation
NBC

Nilai Akurasi

Gambar 1. Alur Penelitian

Dalam penelitian ini melalui beberapa tahapan yang dilakukan. Dimulai dengan
identifikasi masalah, pencarian literatur yang sesuai, pengumpulan data. Sedangkan untuk
pengumpulan data ulasan komentar pengguna aplikasi menggunakan metode web
scraping (Data Miner), Tools yang digunakan dalam proses ini adalah Google Collab.

2.4.1. Naïve Bayes


Naïve Bayes merupakan salah satu algoritma data mining untuk mengklasifikasi suatu
objek menggunakan probabilitas dan statistik, serta dapat memprediksi peluang
berdasarkan dari pengalaman sebelumnya. Ciri dari algoritma Naïve Bayes ini adalah
independensi yang sangat kuat (naïve) dari masing-masing kondisi atau kejadian
(Nafalski & Wibawa, 2016). Algoritma ini termasuk dalam supervised learning karena
membutuhkan data training sebelum proses klasifikasi. Secara umum rumus dasar
persamaan teorema Bayes adalah:

(1)
Keterangan:
X = Data dengan kelas yang belum diketahui
H = Hipotesis X merupakan suatu kelas spesifik
P(H|X) = Probabilitas H berdasarkan kondisi X
P(H) = Probabilitas pada hipotesis H (prior)
P(X|H) = Probabilitas X berdasarkan hipotesis H
P(X) = Probabilitas X (data sampel yang diamati)
Berdasarkan rumus tersebut, maka peluang masuknya sampel tertentu ke dalam kelas
H adalah peluang munculnya kelas H (sebelum masuknya sampel tersebut), dikalikan
dengan peluang kemunculan karakteristik sampel pada kelas H, dibagi dengan peluang
kemunculan karakteristik sampel keseluruhan (Bustami, 2013).
Dalam penerapannya terdapat 3 varian Naive Bayes yang umum digunakan, yaitu
BernoulliNB, GaussianNB, dan MultinomialNB. Gaussian Naive Bayes digunakan untuk

328
KESATRIA: Jurnal Penerapan Sistem Informasi (Komputer & Manajemen)
Terakreditasi Nomor 204/E/KPT/2022 | Vol. 5, No. 1, Januari (2024), pp. 326-335

menghitung probabilitas dari suatu data kontinyu terhadap kelas tertentu. Perhitungannya
menggunakan rumus dari Densitas Gauss dan ditandai dengan dua buah parameter, yaitu
rata-rata dan standar deviasi
Bernoulli Naïve Bayes menggunakan angka biner dalam melakukan klasifikasi. Naïve
Bayes jenis ini menggunakan data diskrit dan menerima fitur hanya sebagai nilai biner,
seperti benar atau salah, ya atau tidak, berhasil atau gagal, 0 atau 1 dan seterusnya.
Multinomial Naïve Bayes mengasumsikan tentang independensi diantara kemunculan
kata-kata dalam dokumen, tanpa memperhitungkan urutan kata dan konteks informasi
yang ada. Selain itu, juga memperhitungkan jumlah kemunculan kata dalam dokumen.

3.Hasil dan Pembahasan


3.1. Pengumpulan Data
Pengumpulan data dalam penelitian ini menggunakan teknik web scraping
menggunakan tools Google Collab yang telah disediakan oleh pihak google. Data yang
diambil merupakan ulasan komentar dan rating bintang pada aplikasi Grab, Gojek, dan
Maxim di google play store.

Search Play Store Google Collab Write Excel

Gambar 2. Pengumpulan Data

Data ulasan komentar aplikasi transportasi online dikumpulkan melalui google Play
Store kemudian di scraping menggunakan tools Google Collab yang selanjutnya di
konversi ke dalam ms.Excel. Berikut ini merupakan gambar data ulasan komentar yang
sudah dikumpulkan. Data yang yang digunakan sebanyak 3000 data ulasan dari masing-
masing aplikasi.

Gambar 3. Hasil Pengumpulan Data Aplikasi Grab

329
KESATRIA: Jurnal Penerapan Sistem Informasi (Komputer & Manajemen)
Terakreditasi Nomor 204/E/KPT/2022 | Vol. 5, No. 1, Januari (2024), pp. 326-335

Gambar 4. Hasil Pengumpulan Data Aplikasi Maxim

Gambar 5. Hasil Pengumpulan Data Aplikasi Gojek

3.2. PreProcessing
Dalam tahapan ini data akan melalui beberapa preprocessing sebelum masuk ke tahap
validasi dengan algoritma NBC mulai dari Case Folding, Tokenize, Filtering dan
Stemming

Case Folding

Tokenize

Filtering

Stemming

Gambar 6. Pre-processing Data

Tahapan tersebut meliputi:


a) Case folding adalah tahapan untuk menyeragamkan seluruh teks yang akan
dimasukan kedalam model menjadi huruf kecil semua (lowercase).

330
KESATRIA: Jurnal Penerapan Sistem Informasi (Komputer & Manajemen)
Terakreditasi Nomor 204/E/KPT/2022 | Vol. 5, No. 1, Januari (2024), pp. 326-335

Gambar 7. Hasil Case Folding Aplikasi Grab

Gambar 8. Hasil Case Folding Maxim

Gambar 9. Hasil Case Folding Aplikasi Gojek

b) Tokenize yaitu proses pemecahan kata pada kalimat review, pemisahan kata dalam
kalimat umumnya menggunakan karakter spasi, maka karakter spasi diandalkan untuk
proses tokenisasi ini.

331
KESATRIA: Jurnal Penerapan Sistem Informasi (Komputer & Manajemen)
Terakreditasi Nomor 204/E/KPT/2022 | Vol. 5, No. 1, Januari (2024), pp. 326-335

Gambar 10. Hasil Tokenize Aplikasi


Grab
Gambar 12. Hasil Tokenize Aplikasi
Gojek

Gambar 11. Hasil Tokenize Aplikasi


Maxim

c) Filtering yaitu proses ini dilakukan untuk menghapus data yang salah, tidak lengkap
atau kesalahan tipografi.

Gambar 13. Hasil Filtering Aplikasi Gambar 15. Hasil Filtering Aplikasi
Grab Gojek

Gambar 14. Hasil Filtering Aplikasi


Maxim

332
KESATRIA: Jurnal Penerapan Sistem Informasi (Komputer & Manajemen)
Terakreditasi Nomor 204/E/KPT/2022 | Vol. 5, No. 1, Januari (2024), pp. 326-335

d) Stemming yaitu proses menemukan kata dasar dengan menghilangkan semua


imbuhan yang menempel pada kata [5].

Gambar 16. Hasil Stemming Aplikasi Grab

Gambar 17. Hasil Stemming Aplikasi Maxim

Gambar 18. Hasil Stemming Aplikasi Gojek

333
KESATRIA: Jurnal Penerapan Sistem Informasi (Komputer & Manajemen)
Terakreditasi Nomor 204/E/KPT/2022 | Vol. 5, No. 1, Januari (2024), pp. 326-335

3.3. Klasifikasi dan Analisa dengan Algoritma NBC (Naïve Bayes Classifier)
Selanjutnya adalah proses cross validation dengan algoritma Naïve Bayes Classifier
(NBC). Data akan melewati proses testing dan training, lalu dilakukan proses pemodelan
dengan menggunakan algoritma NBC untuk mendapatkan nilai accuracy, Precision, recall
dan f1 score berdasarkan performance algoritma dari Machine Learning (ML) dengan
menggunakan acuan Confusion Matrix. Berikut ini merupakan hasil nilai akurasi yang
didapatkan dengan algoritma NBC.

Gambar 19. Nilai Akurasi Aplikasi


Grab Gambar 21. Nilai Akurasi Aplikasi
Gojek

Gambar 20. Nilai Akurasi Aplikasi


Maxim

Dapat dilihat dari hasil perhitungan nilai akurasi tersebut untuk aplikasi transportasi
online Grab menghasilkan nilai akurasi sebesar 87%, nilai akurasi untuk aplikasi Maxim
sebesar 93%, dan nilai akurasi aplikasi Gojek sebesar 86%. Berdasarkan analisis dan
pengujian yang dilakukan, maka didapatkan hasil bahwa dari jumlah aplikasi
Transportasi Online yang ada pada Google Play Store, penulis mengambil tiga aplikasi
untuk diteliti yaitu: yang pertama Grab, kedua Maxim, dan ketiga Gojek.
Data yang didapatkan dari penerapan Web Scraping berupa data opini dari tiga aplikasi
Transportasi Online sebanyak 9000 ulasan komentar yang dikumpulkan, masing-masing
aplikasi yakni sebanyak 3000 ulasan komentar. Implementasi algoritma NBC aplikasi
Grab pada penelitian ini menghasilkan nilai accuracy 87%. Implementasi algoritma NBC
aplikasi Maxim pada penelitian ini menghasilkan nilai accuracy 93%. Implementasi
algoritma NBC aplikasi Gojek pada penelitian ini menghasilkan nilai accuracy 86%.

334
KESATRIA: Jurnal Penerapan Sistem Informasi (Komputer & Manajemen)
Terakreditasi Nomor 204/E/KPT/2022 | Vol. 5, No. 1, Januari (2024), pp. 326-335

4. Kesimpulan
Berdasarkan analisis dan pengujian yang dilakukan, maka kesimpulan yang dapat
diambil dari hasil implementasi algoritma NBC pada penelitian ini, data
menunjukan bahwa tingkat keakuratan tertinggi untuk aplikasi transportasi online
pertama yaitu Maxim dengan nilai 93%, kedua Grab sebesar 87%, dan ketiga Gojek
sebesar 86%. Penulis berasumsi bahwa aplikasi Maxim terdapat akurasi paling
tinggi karena lebih banyak ulasan positif dan memiliki ulasan negatif yang lebih
sedikit dibandingkan dengan aplikasi transportasi online lainnya.

Daftar Pustaka
[1] Wati, “Evaluasi Kebijakan Perizinan Transportasi Online Di Kota Yogyakarta,”
Research Repisitory, 2017.
[2] Berita Terkini, “Sejarah Gojek Dan Perkembangannya Dari Masa Ke Masa,”
Kumparan, 2022.
[3] Grab, “Grab Indonesia – Pertumbuhan Mitra Grab Driver Merata Hingga Ke
Seluruh Indonesia,” Grab Id, 2022.
[4] Wardani, “Maxim, Ojol Asal Rusia Penantang Gojek Dan Grab Di Indonesia,”
Liputan6, 2019.
[5] Satriawan, “Pengertian Metode Penelitian Dan Jenis-Jenis Metode Penelitian,”
Ranah Research, 2023.
[6] Muliadi, Syarif, S., Salim, A. (2019). Penerapan Algoritma Naive Bayes Pada
Penilaian Kinerja Pemerintah Desa Dalam Pengelolaan Dana Desa. Jurnal Riset
Informatika. Vol. 1, No. 2, Maret 2019, 71-80.
[7] Ratnawati, F. (2018). Implementasi Algoritma Naive Bayes Terhadap Analisis
Sentimen Opini Film Pada Twitter. Inovtek Polbeng - Seri Informatika, 3(1).
[8] Suyanto (2017), Data Mining Untuk Klasifikasi Dan Klasterisasi Data. Bandung:
Informatika.
[9] (2020). "Analisis Sentimen Gojek Pada Media Sosial Twitter Dengan Klasifikasi
Support Vector Machine (Svm)," Jurnal Gaussian, Vol. 9, No. 3, Pp. 376-390.
Https://Doi.Org/10.14710/J.Gauss.V9i3.2893 2.
[10] Berita Terkini. (2022). Sejarah Gojek Dan Perkembangannya Dari Masa Ke Masa.
Kumparan. Https://Kumparan.Com/Berita-Terkini/Sejarah-Gojek-Dan-
Perkembangannya-Dari-Masa-Ke-Masa-1zaykqsp4i8/Full.
[11] Grab. (2022). Grab Indonesia – Pertumbuhan Mitra Grab Driver Merata Hingga
Ke Seluruh Indonesia. Grab Id. Https://Www.Grab.Com/Id/Blog/Driver/Grab-
Indonesia-Pertumbuhan-Mitra-Grab-Driver-Merata-Hingga-Ke-Seluruh-Indonesia/.
[12] Wardani. (2019). Maxim, Ojol Asal Rusia Penantang Gojek Dan Grab Di
Indonesia. Liputan6. Https://Www.Liputan6.Com/Tekno/Read/4140565/Maxim-
Ojol-Asal-Rusia-Penantang-Gojek-Dan-Grab-Di-Indonesia?Page=2grab.
[13] Wati. (2017). Evaluasi Kebijakan Perizinan Transportasi Online Di Kota
Yogyakarta. Research Repisitory.
Http://Repository.Umy.Ac.Id/Handle/123456789/17337.
[14] Wahyudi, R., & Kusumawardana, G. (2021). Analisis Sentimen Pada Aplikasi
Grab Di Google Play Store Menggunakan Support Vector Machine. Jurnal
Informatika, 8(2), 200–207. Https://Doi.Org/10.31294/Ji.V8i2.9681.
[15] M. F. Al-Shufi And A. Erfina, “Sentimen Analisis Mengenai Aplikasi Streaming
Film Menggunakan Algoritma Support Vector Machine Di Play Store,” J. Sismatik,
Vol. 01, No. 01, 2021, Accessed: Apr. 14, 2023. [Online]. Available:
Https://Sismatik.Nusaputra.Ac.Id/Index.Php/Sismatik/Article/View/22.

335

Anda mungkin juga menyukai