4950-Article Text-17473-1-10-20220405
4950-Article Text-17473-1-10-20220405
php/jicom/
Abstract
There are many genres of anime such as drama, action, romance, comedy, and so on. However, because there are so many
anime genres, it is quite difficult for viewers to find anime whose genre they like, such as the drama genre which tells about
everyday human life which is quite light in nature. From these problems, a classification method is needed to classify anime
that belongs to the drama genre. Classification is a common method in data mining, an object whose class/label is unknown
can go through the classification method so that its class can be estimated [7]. Classification has several algorithms including
Support Vector Machine (SVM) and K-Nearest Neighbors (KNN). SVM and KNN algorithms have been widely used and have
a good level of accuracy. In this study, a comparative analysis will be carried out between the two algorithms, the dataset used
is 12,294 data and 2 genre classes, namely drama and non-drama, the attribute of the anime dataset is 7. The results obtained
in this study indicate that the K-Nearest Neighbors Algorithm (KNN) ) get a training accuracy value of 100% and a test
accuracy value of 84%. And also the Support Vector Machine (SVM) algorithm gets a training accuracy value of 83% and a
test accuracy value of 82%. The results of the accuracy values of the two algorithms indicate that the K-Nearest Neighbors
(KNN) algorithm has a better testing accuracy than the Support Vector Machine (SVM) with a fairly thin difference between
the two algorithms.
Keywords: Support Vector Machine, K-Nearest Neighbors, anime, data mining, classification.
Abstrak
Terdapat banyak genre anime seperti drama, aksi, romansa, komedi, dan lain sebagainya. Namun, dikarenakan genre anime itu
banyak, penonton cukup kesulitan untuk mencari anime yang genrenya mereka sukai seperti genre drama yang menceritakan
kehidupan manusia sehari-hari yang sifatnya cukup ringan. Dari permasalahan tersebut, maka dibutuhkan suatu metode
klasifikasi untuk mengklasifikasikan anime yang tergolong ke dalam genre drama. Klasifikasi dalam data mining merupakan
metode yang umum, suatu objek yang sebelumnya belum diketahui kelas/labelnya dapat melalui metode klasifikasi agar
kelasnya dapat diperkirakan [7]. Klasifikasi memiliki beberapa algoritma diantaranya Support Vector Machine (SVM) dan K-
Nearest Neighbors (KNN). Penggunaan algoritma SVM dan KNN telah banyak digunakan dan tingkat akurasinya yang baik.
Dalam penelitian ini akan menganalisa perbandingan diantara kedua algoritma tersebut pada dataset yang digunakan berjumlah
12.294 data dan 2 kelas genre yaitu drama dan non drama, atribut dataset anime berjumlah 7. Hasil penelitian ini, menunjukkan
bahwa algoritma dengan K-Nearest Neighbors (KNN) yang menghasilkan nilai akurasi training sebesar 100% dan nilai akurasi
testing sebesar 84%. Dan juga hasil dari algoritma Support Vector Machine (SVM)menghasilkan nilai akurasi training sebesar
83% dan nilai akurasi testing sebesar 82%. Hasil nilai akurasi kedua algoritma tersebut menunjukkan bahwa algoritma K-
Nearest Neighbors (KNN) memiliki akurasi testing yang lebih baik dari Support Vector Machine (SVM) dengan selisih
keduanya cukup tipis.
Kata kunci: Support Vector Machine, K-Nearest Neighbors, anime, data mining, klasifikasi.
Jurnal J-COM (Jurnal Informatika dan Teknologi Komputer) Vol. 03 No. 01 (2022) 49 – 55
50
Vika Vitaloka Pramansah1, Dadang Iskandar Mulyana 2 , Titi Silfia3
Jurnal J-COM (Jurnal Informatika dan Teknologi Komputer) Vol. 03 No. 01 (2022) 49 – 55
𝑚
2
𝑑 (𝑥, 𝑦) = √∑(𝑥𝑖 + 𝑦𝑖 )
𝑖=1
vektor pendukung. Semakin besar margin maka akan nilai atribut dari dua record.
dianggap baik, begitupun sebaliknya semakin kecil
margin maka akan dianggap buruk. 2.4 Sklearn Learn
2.3 K-Nearest Neighbors (KNN) Scikit-Learn adalah salah satu pustaka Machine
Learning yang bersifat open source berbasis Python
K-Nearest Neighbors (K-NN) termasuk kelompok yang dapat digunakan dalam Data Science. Kelebihan
instance-based learning yang merupakan salah satu Scikit Learn adalah penggunaannya yang cukup mudah
teknik lazy learning. KNN dilakukan dengan mencari serta memiliki kecepatan saat melakukan banyak
kelompok k objek dalam data training yang paling dekat pekerjaan berbeda dalam dataset. Pustaka ini dapat
(mirip) dengan objek pada data baru atau data testing. dijalankan dengan SciPy dan NumPy.
Jurnal J-COM (Jurnal Informatika dan Teknologi Komputer) Vol. 03 No. 01 (2022) 49 – 55
51
Vika Vitaloka Pramansah1, Dadang Iskandar Mulyana 2 , Titi Silfia3
Jurnal J-COM (Jurnal Informatika dan Teknologi Komputer) Vol. 03 No. 01 (2022) 49 – 55
2.5 Anime
anime_id Nominal
name Nominal
genre Biner
type Nominal
episodes Nominal
Jurnal J-COM (Jurnal Informatika dan Teknologi Komputer) Vol. 03 No. 01 (2022) 49 – 55
52
Vika Vitaloka Pramansah1, Dadang Iskandar Mulyana 2 , Titi Silfia3
Jurnal J-COM (Jurnal Informatika dan Teknologi Komputer) Vol. 03 No. 01 (2022) 49 – 55
𝑇𝑃
Recall = 𝑇𝑃+𝐹𝑁 𝑋 100%
Rumus 3. Recall
𝑇𝑃+𝑇𝑁
Accuracy = 𝑇𝑃+𝐹𝑁+𝑇𝑁+𝐹𝑃 𝑋 100%
Rumus 4. Accuracy
2𝑇𝑃
F1 Score = 𝑋 100%
2𝑇𝑃+𝐹𝑃+𝐹𝑁
Rumus 5. F1 Score
Jurnal J-COM (Jurnal Informatika dan Teknologi Komputer) Vol. 03 No. 01 (2022) 49 – 55
53
Vika Vitaloka Pramansah1, Dadang Iskandar Mulyana 2 , Titi Silfia3
Jurnal J-COM (Jurnal Informatika dan Teknologi Komputer) Vol. 03 No. 01 (2022) 49 – 55
2 78% 100%
3 81% 100%
Gambar 7. Grafik Bar.
4 81% 100%
Jurnal J-COM (Jurnal Informatika dan Teknologi Komputer) Vol. 03 No. 01 (2022) 49 – 55
54
Vika Vitaloka Pramansah1, Dadang Iskandar Mulyana 2 , Titi Silfia3
Jurnal J-COM (Jurnal Informatika dan Teknologi Komputer) Vol. 03 No. 01 (2022) 49 – 55
Jurnal J-COM (Jurnal Informatika dan Teknologi Komputer) Vol. 03 No. 01 (2022) 49 – 55
55