4950-Article Text-17473-1-10-20220405

Terbit online pada laman web jurnal: https://ejurnalunsam.id/index.
php/jicom/
Vol. 03 No. 01 (2022) 49 -55 E-ISSN :2774-7115 P-ISSN: 2775-2089
Analisis Perbandingan Algoritma SVM Dan KNN Untuk Klasifikasi

Anime Bergenre Drama
Vika Vitaloka Pramansah1, Dadang Iskandar Mulyana 2 , Titi Silfia3

1ProgramStudi Sistem Informasi, STIKOM CKI
2Program Studi Teknik Informatika, STIKOM CKI
3Program Studi Teknik Informatika, STIKOM CKI
1 [email protected] , 2 [email protected], [email protected]
Abstract
There are many genres of anime such as drama, action, romance, comedy, and so on. However, because there are so many
anime genres, it is quite difficult for viewers to find anime whose genre they like, such as the drama genre which tells about
everyday human life which is quite light in nature. From these problems, a classification method is needed to classify anime
that belongs to the drama genre. Classification is a common method in data mining, an object whose class/label is unknown
can go through the classification method so that its class can be estimated [7]. Classification has several algorithms including
Support Vector Machine (SVM) and K-Nearest Neighbors (KNN). SVM and KNN algorithms have been widely used and have
a good level of accuracy. In this study, a comparative analysis will be carried out between the two algorithms, the dataset used
is 12,294 data and 2 genre classes, namely drama and non-drama, the attribute of the anime dataset is 7. The results obtained
in this study indicate that the K-Nearest Neighbors Algorithm (KNN) ) get a training accuracy value of 100% and a test
accuracy value of 84%. And also the Support Vector Machine (SVM) algorithm gets a training accuracy value of 83% and a
test accuracy value of 82%. The results of the accuracy values of the two algorithms indicate that the K-Nearest Neighbors
(KNN) algorithm has a better testing accuracy than the Support Vector Machine (SVM) with a fairly thin difference between
the two algorithms.
Keywords: Support Vector Machine, K-Nearest Neighbors, anime, data mining, classification.
Abstrak
Terdapat banyak genre anime seperti drama, aksi, romansa, komedi, dan lain sebagainya. Namun, dikarenakan genre anime itu
banyak, penonton cukup kesulitan untuk mencari anime yang genrenya mereka sukai seperti genre drama yang menceritakan
kehidupan manusia sehari-hari yang sifatnya cukup ringan. Dari permasalahan tersebut, maka dibutuhkan suatu metode
klasifikasi untuk mengklasifikasikan anime yang tergolong ke dalam genre drama. Klasifikasi dalam data mining merupakan
metode yang umum, suatu objek yang sebelumnya belum diketahui kelas/labelnya dapat melalui metode klasifikasi agar
kelasnya dapat diperkirakan [7]. Klasifikasi memiliki beberapa algoritma diantaranya Support Vector Machine (SVM) dan K-
Nearest Neighbors (KNN). Penggunaan algoritma SVM dan KNN telah banyak digunakan dan tingkat akurasinya yang baik.
Dalam penelitian ini akan menganalisa perbandingan diantara kedua algoritma tersebut pada dataset yang digunakan berjumlah
12.294 data dan 2 kelas genre yaitu drama dan non drama, atribut dataset anime berjumlah 7. Hasil penelitian ini, menunjukkan
bahwa algoritma dengan K-Nearest Neighbors (KNN) yang menghasilkan nilai akurasi training sebesar 100% dan nilai akurasi
testing sebesar 84%. Dan juga hasil dari algoritma Support Vector Machine (SVM)menghasilkan nilai akurasi training sebesar
83% dan nilai akurasi testing sebesar 82%. Hasil nilai akurasi kedua algoritma tersebut menunjukkan bahwa algoritma K-
Nearest Neighbors (KNN) memiliki akurasi testing yang lebih baik dari Support Vector Machine (SVM) dengan selisih
keduanya cukup tipis.
Kata kunci: Support Vector Machine, K-Nearest Neighbors, anime, data mining, klasifikasi.
Diterima Redaksi : 28-01-2022 | Selesai Revisi : 04-04-2022 | Diterbitkan Online : 04-04-2022

49
Jurnal J-COM (Jurnal Informatika dan Teknologi Komputer) Vol. 03 No. 01 (2022) 49 – 55
1. Pendahuluan Yudo Devianto, dalam penelitian ini dataset yang

digunakan adalah dataset yang berasal dari website
Klasifikasi dalam data mining merupakan metode
resmi BNPB, BPS Kabupaten Bandung dan BMKG
yang umum, suatu objek yang sebelumnya belum
yang berkisar pada tahun 2016 - 2017 diwilayah
diketahui kelas/labelnya dapat melalui metode
Kabupaten Bandung. Penelitian ini menggunakan
klasifikasi agar kelasnya dapat diperkirakan [7].
algoritma Support Vector Machine (SVM) dengan nilai
Klasifikasi memiliki beberapa algoritma diantaranya
akurasi sebesar 85,71%, lalu tingkat akurasi yang
Support Vector Machine (SVM) dan K-Nearest
dihasilkan dengan menggunakan algoritma SVM
Neighbors (KNN). Penggunaan algoritma SVM dan
berbasis PSO adalah 97,62 [2]. Penelitian selanjutnya
KNN telah banyak digunakan dan tingkat akurasi yang
berjudul “Penerapan Metode Klasifikasi K-Nearest
dihasilkannya baik.
Neigbor pada Dataset Penderita Penyakit Diabetes” oleh
Dalam penelitian ini, akan menganalisa
Andi Maulida Argina A. M, dalam penelitian ini
perbandingan diantara kedua algoritma tersebut yaitu
menggunakan K-Nearest Neighbors (KNN) yang
algoritma SVM dan KNN yang akan dilatih dan diuji
mendapatkan hasil akurasi tertinggi yaitu 39% [3].
menggunakan dataset anime yang jumlahnya 12.294
Penelitian selanjutnya berjudul “Memprediksi
data dan ada 2 kelas genre yaitu drama dan non drama.
Pembayaran Biaya Kursus Siswa Enter (English Center)
Algoritma yang pertama yaitu KNN memiliki
Dengan Algoritma K-Nn” oleh Hadianti¹, Sri
beberapa keunggulan, seperti mudah dimengerti, mudah
Rahmawati, Eka Kurniawan, Ilham Gata dan Windu,
dipelajari, pelatihannya efisien, sederhana, cepat, serta
dalam penelitian ini menggunakan K-Nearest Neighbors
efektif bahkan jika ukuran data pelatihan cukup besar
(KNN) dimana evaluasi kinerja algoritma tersebut
[8]. Namun, K-Nearest Neighbors juga memiliki
menggunakan metode Cross Validation sebesar 84.69%,
kelemahan yaitu nilai kfold nya. Agar setiap data dapat
Confusion Matrix dan Kurva ROC k5, k10, k15, k20
dijadikan sebagai data training dan data testing maka
berturut-turut 84.69%, 83.93%, 83.36%, 83.36% serta
kita membutuhkan Cross Validation karena Cross
menghasilkan akurasi dan nilai AUC sebesar 0.962,
Validation merupakan salah satu metode yang
0.937, 0.922, 0.916 [5]. Penelitian selanjutnya berjudul
digunakan agar kita dapat mensimulasikan semua data
“Analisis Algorithms Support Vector Machine dengan
yang ada [9]. Pada penelitian ini, Cross Validation yang
Naive Bayes Kernel pada Klasifikasi Data” oleh Dhany,
digunakan adalah 10. Algoritma kedua yaitu Support
Hanna Willa Izhari, dan Fahmi, dalam penelitian ini
Vector Machine, suatu teknik baru untuk melakukan
menggunakan Naive Bayes dimana dataset pelatihan
prediksi, baik dalam kasus regresi maupun klasifikasi
yang digunakan sebanyak 170 dataset serta nilai presisi
yang sangat popular pada saat ini [10].
yang didapatkan Support Vector Machine yaitu 89.66%,
Penggunaan algoritma Support Vector Machine
Naïve bayes menghasilkan presisi sebesar 89.29%.
(SVM) dan K-Nearest Neighbors (KNN) dalam
Sedangkan Class Recall yang didapatkan yaitu Naïve
pengklasifikasian data menunjukkan hasil yang baik.
Bayes 89.29% dan Support Vector Machine 92.86% dan
Penggunaan data anime dipilih karena anime memiliki
perbedaan nilai akurasinya mencapai 3.22% [6].
beragam genre atau konsep ceritanya yang membuat
Tujuan penelitian ini untuk menganalisa
anime menarik untuk ditonton. Terdapat banyak genre
perbandingan pengklasifikasian anime bergenre drama
anime seperti drama, aksi, romansa, komedi, dan lain
menggunakan algoritma Support Vector Machine
sebagainya. Namun, dikarenakan genre anime itu
(SVM) dan algoritma K-Nearest Neighbors (KNN).
banyak, penonton cukup kesulitan untuk mencari anime
Dataset yang digunakan berjumlah 12.294 data dan 2
yang genrenya mereka sukai seperti genre drama yang
kelas genre yaitu drama dan non drama, atribut dataset
menceritakan kehidupan manusia sehari-hari yang
anime berjumlah 7.
sifatnya cukup ringan. Dari permasalahan tersebut, maka
dibutuhkan suatu metode klasifikasi untuk
2. Metode Penelitian
mengklasifikasikan anime yang tergolong ke dalam
genre drama. 2.1 Data Mining
Sebelumnya, penelitian pengklasifikasian dengan
metode Support Vector Machine (SVM) maupun K- Data mining merupakan pemisahan pola yang
Nearest Neighbors (KNN) telah dilakukan. Yaitu dengan menarik dari suatu data yang besar menggunakan
judul penelitian “Implementasi Algoritma Ant Tree matematika, statistik, machine learning maupun
Miner Untuk Klasifikasi Jenis Fauna” oleh Wilda Imama kecerdasan buatan. Berdasarkan fungsinya, data mining
Sabilla , Yunita Ardilla, dan Nurissaidah Ulinnuha, dikelompokkan menjadi klasifikasi, clustering,
penelitian ini menggunakan dataset sebanyak 101 data deskripsi, estimasi, asosiasi, dan prediksi. Persiapan data
dengan 16 atribut dan label kelas sebanyak 7. dalam data mining meliputi pemilihan data, dibersihkan,
Menggunakan Ant Tree Miner dan memiliki hasil nilai dikompresi, normalisasi dan integrasi dengan file untuk
akurasi sebesar 95,09% [1]. Penelitian selanjutnya menggali data yang terintegrasi yang memudahkan
berjudul “Optimasi Prediksi Bencana Banjir identifikasi informasi bernilai. Namun, semakin besar
menggunakan Algoritma SVM untuk penentuan Daerah data yang diolah maka akan semakin besar pula waktu
Rawan Bencana Banjir” oleh Saruni Dwiasnati dan prosesnya [4].
50
2.2 Support Vector Machine (SVM)
Support Vector Machine merupakan salah satu

metode unggulan dibidang klasifikasi, yang dirilis pada
tahun 1992, dengan berprinsipkan Structural Risk
Minimization (SRM), SVM berkembang pesat karena
dengan memisahkan 2 buah kelas pada suatu ruang
sehingga algoritma ini dapat menemukan hyperplane
terbaik untuk dapat diimplementasikan sebagai
klasifikator. Support Vector Machine memiliki prinsip
dasar yaitu linear classifier, yang selanjutnya
dikembangkan agar masalah non-linear dapat dikerjakan
oleh SVM [11]. Dimana konsep kernel trick dimasukkan
pada ruang kerja yang berdimensi tinggi.
Pada input space, SVM berusaha untuk menemukan
Gambar 2. Visualisasi KNN.
hyperplane yang dinilai paling baik [12]. Berbeda
dengan strategi jaringan saraf tiruan, dimana jaringan
saraf tiruan berusaha mencari hyperplane pemisah antar Algoritma yang pertama yaitu KNN memiliki beberapa
kelas yang ada. keunggulan, seperti mudah dimengerti, mudah
dipelajari, pelatihannya yang cukup sederhana, cepat,
serta efektif apabila ukuran data pelatihan cukup besar.
Namun, KNN juga memiliki kelemahan, yaitu nilai
kfold. Agar setiap data dapat berkesempatan menjadi
data training dan data testing maka dibutuhkan Cross
Validation karena Cross Validation adalah salah satu
metode yang digunakan untuk mengevaluasi kinerja
model. Pada penelitian ini, Cross Validation yang
digunakan adalah 10.
Dalam algoritma KNN dibutuhkan rumus untuk
menghitung jarak terdekat, nilai jarak pada metode K-
NN dapat di hitung dengan menggunakan rumus jarak
Euclidean [13], berikut rumus jarak Euclidean :
𝑚
2
𝑑 (𝑥, 𝑦) = √∑(𝑥𝑖 + 𝑦𝑖 )
𝑖=1
Gambar 1. Visualisasi SVM. Rumus 1. Jarak Eucliden

Diketahui:
Support Vectors yaitu datapoint yang paling dekat x = data 1
dengan hyperplane, hyperplane yaitu bidang keputusan y = data 2
atau ruang yang dibagi antara satu set objek yang d = jarak Euclidean
memiliki kelas yang berbeda, dan margin yaitu celah i = iterasi
antara dua garis pada titik data dari kelas yang berbeda
yang dihitung sebagai jarak tegak lurus dari garis ke Dimana x = x , x ,…x , dan y = y , y …,y . n mewakili
1 2 n 1 2 n
vektor pendukung. Semakin besar margin maka akan nilai atribut dari dua record.
dianggap baik, begitupun sebaliknya semakin kecil
margin maka akan dianggap buruk. 2.4 Sklearn Learn
2.3 K-Nearest Neighbors (KNN) Scikit-Learn adalah salah satu pustaka Machine
Learning yang bersifat open source berbasis Python
K-Nearest Neighbors (K-NN) termasuk kelompok yang dapat digunakan dalam Data Science. Kelebihan
instance-based learning yang merupakan salah satu Scikit Learn adalah penggunaannya yang cukup mudah
teknik lazy learning. KNN dilakukan dengan mencari serta memiliki kecepatan saat melakukan banyak
kelompok k objek dalam data training yang paling dekat pekerjaan berbeda dalam dataset. Pustaka ini dapat
(mirip) dengan objek pada data baru atau data testing. dijalankan dengan SciPy dan NumPy.
51
2.5 Anime
Anime merupakan animasi yang dibuat sedemikian

rupa yang ditayangkan di televisi, film, maupun platform
sejenis lainnya yang berasal dari negara Jepang. Anime
merupakan ciri khas seni dan hiburan dari negara
tersebut dan merupakan hiburang yang sangat unik
dimana banyak juga warga negara lain menonton Anime
ini untuk sekadar hiburan maupun membuat karya seni
lain tentang anime serta mempelajarinya untuk
kebutuhan pembelajaran seperti Machine Learning yang
terdapat dalam penelitian ini.
Gambar 3. Contoh Anime (Naruto).
2.6 Diagram Alir

Gambar 4. Diagram alir klasifikasi anime.
Pada penelitian ini, alur pengklasifikasian anime
bergenre drama adalah sebagai berikut : Dataset yang digunakan berjumlah 12.294 data dan
2 kelas genre yaitu drama dan non drama, atribut dataset
anime berjumlah 7. Dimana dataset akan
dinormalisasikan nilainya menggunakan Min-Max
Scalar agar mempercepat proses training dan testing.
2.7 Metode Pengumpulan Data
Teknik pengumpulan data dan informasi yang

digunakan dalam penelitian ini yaitu dengan melakukan
studi literatur yang akan menghasilkan data sekunder.
Dataset merupakan data publik yang dapat diambil dari
website Kaggle. Atribut yang digunakan dalam
penelitian ini dapat dilihat pada Tabel 1 berikut :
Nama Atribut Tipe Data
anime_id Nominal
name Nominal
genre Biner
type Nominal
episodes Nominal
52
rating Nominal Rumus Accuracy atau akurasi diatas yaitu perbandingan

members Nominal antara jumlah data yang benar dengan banyaknya
seluruh data.
Tabel 1. Atribut data.
Rumus F1 Score diatas yaitu harmoni rata-rata dari
2.8 Metode Pengujian precision dan recall.
Confusion matrix digunakan sebagai metode 3. Hasil dan Pembahasan

pengujian dalam penelitian klasifikasi anime
menggunakan algoritma SVM dan KNN ini. Metode ini 3.1 Dataset
merepresentasikan hasil klasifikasi yang menggunakan
matriks yang dapat dilihat pada Tabel 2. Dataset yang digunakan berjumlah 12.294 data
dan 2 kelas genre yaitu drama dan non drama, atribut
Diklasifikasikan sebagai dataset anime berjumlah 7 yang diambil dari Kaggle
sebagai data publik. Dataset dibagi menjadi dua bagian
Klasifikasi + -
yaitu untuk data training sebanyak 80% dan untuk data
benar + True False Negative
testing sebanyak 20% dari dataset yang ada.
Positive (FN).
(TP).
3.2 Klasifikasi Anime
- False True Negative
Positive (TN).
Dalam mengklasifikasi anime yang harus kita
(FP).
lakukan adalah load dataset yang kita butuhkan yaitu
Tabel 2. Confusion Matrix data anime. Kita dapat normalisasi dataset yang kita
miliki dengan Min-Max Scalar, Min-Max Scalar akan
menormalisasikan nilai jika nilai variabel yang kita
Penjelasan tabel diatas antara lain True Positive yaitu miliki rentangnya sama. Hal ini dilakukan agar tidak ada
jumlah record positif yang berhasil diklasifikasikan nilai yang terlalu besar maupun nilainya terlalu kecil.
sebagai positif. False positive yaitu record positif yang Hal ini dapat membuat analisis statistik menjadi efesien
salah diklasifikasikan menjadi negatif. False negative dan lebih mudah.
yaitu record negatif yang salah diklasifikasikan sebagai Kita juga harus melakukan pembersihan data,
positif. True negative yaitu record negatif yang berhasil dikarenakan tidak semua baris data memiliki nilai yang
diklasifikasikan sebagai record negatif. lengkap. Terkadang terdapat nilai null, nilai NaN atau
nilai yang tidak ditentukan, nilai negatif dan sebagainya.
Metode pengujian yang digunakan dalam penelitian ini Nilai-nilai tersebut akan menghambat pengklasifikasian
menghasilkan perhitungan sebagai berikut : dan membuat error.
Kita dapat memvisualisasikan dataset yang kita
𝑇𝑃 miliki seperti gambarsebagai berikut :
𝑃𝑟𝑒𝑐𝑖𝑠𝑖𝑜𝑛 = 𝑇𝑃+𝐹𝑃 𝑋 100%
Rumus 2. Precision
𝑇𝑃
Recall = 𝑇𝑃+𝐹𝑁 𝑋 100%
Rumus 3. Recall
𝑇𝑃+𝑇𝑁
Accuracy = 𝑇𝑃+𝐹𝑁+𝑇𝑁+𝐹𝑃 𝑋 100%
Rumus 4. Accuracy
2𝑇𝑃
F1 Score = 𝑋 100%
2𝑇𝑃+𝐹𝑃+𝐹𝑁
Rumus 5. F1 Score
Rumus Precision diatas merupakan perbandingan antara

Gambar 5. Visualisasi jumlah anime disetiap tipe kelas.
True Positive (TP) dengan banyaknya data yang
diprediksi positif. Dari grafik diatas berikut detail jumlah anime dari setiap
Rumus Recall diatas merupakan perbandingan antara kelas yang ada :
True Positive (TP) dengan banyaknya data yang
sebenarnya positif.
Tipe kelas Tipe kelas Jumlah anime
(angka) (huruf)
1 Drama 2.024
53
2 Non Drama 10.040 Algoritma K-Nearest Neighbors (KNN)

menghasilkan nilai akurasi training sebesar 100% dan
Tabel 3. Pesebaran anime berdasarkan kelas sebelum ditraining.
nilai akurasi testing sebesar 84%.
Kita juga bisa memvisualisasikan data kita sesuai Detail laporan klasifikasi anime menggunakan KNN
dengan korelasinya, dapat menggunakan Heat Map. adalah sebagai berikut :
Matriks korelasi merupakan suatu matriks yang di
dalamnya terdapat korelasi – korelasi dimana korelasi Precision Recall Accuracy F1 Score
yaitu pembelajaran yang membahas tentang hubungan 74% 57% 84% 58%
antara dua variabel atau lebih. Korelasi merupakan salah
satu teknik statistika yang banyak digunakan oleh Tabel 5. Laporan klasifikasi KNN
peneliti umumnya tertarik terhadap peristiwa-peristiwa
yang terjadi dan mencoba menghubungkanya. Dalam Berikut grafik akurasi testing dan training KNN dengan
penelitian ini menggunakan kfold = 10. Dalam melakukan training dan testing KNN,
Heatmap, yaitu Sebuah peta yang merepresentasikan digunakan GridSearchCV. Dimana
grafis dari data di mana nilai-nilai individu yang GridSearchCV adalah salah satu bagian dari modul
terkandung dalam matriks yang direpresentasikan scikit-learn yang berguna untuk melakukan validasi
sebagai warna . terhadap lebih dari hyperparameter dan satu model
masing-masing secara sistematis dan otomatis. Berikut
grafik akurasi testing dan training algoritma KNN :
Gambar 8. Grafik akurasi testing dan training Algoritma KKN
Gambar 6. Heatmap dataset.

Grafik diatas didapatkan dari iterasi k dimana
Berikut adalah grafik bar dari dataset anime nilai k yaitu 1-19. Berikut detail akurasi testing dan
berdasarkan atribut : training yang didapatkan :
k Akurasi testing Akurasi training

1 78% 100%
2 78% 100%
3 81% 100%
Gambar 7. Grafik Bar.
4 81% 100%
Setelah itu, dapat dilakukan pemodelan dengan

Support Vector Machine (SVM) dan K-Nearest 5 82% 100%
Neighbors (KNN). Pemodelan dengan Support Vector
Machine (SVM) menghasilkan nilai akurasi training 6 83% 100%
sebesar 83% dan akurasi testing sebesar 82%.
Detail laporan klasifikasi anime menggunakan SVM
7 83% 100%
adalah sebagai berikut :
Precision Recall Accuracy F1 Score 8 83% 100%

41% 50% 82% 45%
Tabel 4. Laporan klasifikasi SVM
9 83% 100%
54
10 83% 100% Daftar Rujukan

[1] Y. Ardilla, W. I. Sabilla, and N. Ulinnuha, “Implementasi
Algoritma Ant Tree Miner Untuk Klasifikasi Jenis Fauna,”
11 83% 100% Infotekmesin, vol. 12, no. 2, pp. 150–154, 2021, doi:
10.35970/infotekmesin.v12i2.616.
[2] S. Dwiasnati and Y. Devianto, “Optimasi Prediksi Bencana
12 83% 100% Banjir menggunakan Algoritma SVM untuk penentuan
Daerah Rawan Bencana Banjir,” Pros. SISFOTEK, pp. 202–
207, 2021, [Online]. Available:
13 83% 100% http://seminar.iaii.or.id/index.php/SISFOTEK/article/view/
283.
[3] A. M. Argina, “Penerapan Metode Klasifikasi K-Nearest
14 83% 100% Neigbors pada Dataset Penderita Penyakit Diabetes,”
Indones. J. Data Sci., vol. 1, no. 2, pp. 29–33, 2020, doi:
10.33096/ijodas.v1i2.11.
15 83% 100% [4] A. A. Karim, H. Azis, and Y. Salim, “Kinerja Metode C4.5
dalam Penyaluran Bantuan Dana Bencana,” Pros. Semin.
Nas. Ilmu Komput. dan Teknol. Inf., vol. 3, no. 2, pp. 84–87,
16 83% 100% 2018.
[5] S. Hadianti1, E. Rahmawati, I. Kurniawan, and W. Gata,
17 83% 100% “Memprediksi Pembayaran Biaya Kursus Siswa Enter
(English Center) Dengan Algoritma K-Nn,” Semin. Nas.
18 84% 100% Teknol. Inf. Univ. Ibn Khaldun Bogor, no. 18, p. 31908575,
2018, [Online]. Available: www.antaranews.com,2016.
[6] H. W. Dhany and F. Izhari, “Analisis Algorithms Support
19 84% 100%
Vector Machine Dengan Naive Bayes Kernel Pada
Klasifikasi Data,” J. Tek. Dan Inform. , vol. 6, no. 2, pp. 30–
35, 2019, [Online]. Available:
Tabel 6. Detail akurasi testing dan training KNN menggunakan k (1- http://jurnal.pancabudi.ac.id/index.php/Juti/article/view/675
19) .
[7] A. A. P. Henny Leidiyana, “Pemodelan Klasifikasi Dalam
Dari data tabel diatas, didapatkan akurasi training Meningkatkan Proses,” J. Tek. Inform. Univ.
terbaik KNN sebesar 100% dan akurasi testing terbaik Muhammadiyah Tangerang, vol. ISSN : 254, no. Januari
2020, pp. 7–14, 2020.
sebesar 84%. [8] B. Hardiyanto and F. Rozi, “Prediksi penjualan sepatu
menggunakan metode k- nearest neighbor,” vol. 04, pp. 13–
4. Kesimpulan 18, 2020.
[9] M. M. Baharuddin, H. Azis, and T. Hasanuddin, “Analisis
Klasifikasi dalam data mining merupakan salah Performa Metode K-Nearest Neighbor Untuk Identifikasi
satu penggunaan metode yang objek paling umum, suatu Jenis Kaca,” Ilk. J. Ilm., vol. 11, no. 3, pp. 269–274, 2019,
doi: 10.33096/ilkom.v11i3.489.269-274.
objek yang belum diketahui kelas/labelnya dapat melalui [10] N. I. Widiastuti, E. Rainarli, and K. E. Dewi, [1] R. Sistem,
metode klasifikasi agar kelasnya dapat diperkirakan. P. N. Andono, and E. H. Rachmawanto, “JURNAL RESTI
Klasifikasi memiliki beberapa algoritma diantaranya Evaluasi Ekstraksi Fitur GLCM dan LBP Menggunakan
Support Vector Machine (SVM) dan K-Nearest Multikernel SVM,” vol. 1, no. 10, pp. 1–9, 2021.
[11] T. E. Puspitawati, S. Basuki, V. Rahmayanti, and S. Nastiti,
Neighbors (KNN). Penggunaan algoritma SVM dan “Algoritma Support Vector Machine ( SVM ) Untuk
KNN telah banyak digunakan dan dan tingkat Identifikasi Komponen Abstrak Pada Jurnal Ilmiah Berbasis
akurasinya yang baik. Teknik Klasifikasi,” vol. 3, no. 5, pp. 441–448, 2021.
Dalam penelitian ini, akan menganalisa [12] H. Nalatissifa, W. Gata, S. Diantika, and K. Nisa,
“Perbandingan Kinerja Algoritma Klasifikasi Naive Bayes,
perbandingan diantara kedua algoritma tersebut yaitu Support Vector Machine (SVM), dan Random Forest untuk
algoritma SVM dan KNN yang akan dilatih dan diuji Prediksi Ketidakhadiran di Tempat Kerja,” J. Inform. Univ.
menggunakan dataset anime yang jumlahnya 12.294 Pamulang, vol. 5, no. 4, p. 578, 2021, doi:
data dan ada 2 kelas genre yaitu drama dan non drama. 10.32493/informatika.v5i4.7575.
[13] S. R. Raysyah, Veri Arinal, and Dadang Iskandar Mulyana,
Didapatkan hasil dari algoritma dengan K- “Klasifikasi Tingkat Kematangan Buah Kopi Berdasarkan
Nearest Neighbors (KNN) yang menghasilkan nilai Deteksi Warna Menggunakan Metode Knn Dan Pca,” JSiI
akurasi training sebesar 100% dan nilai akurasi testing (Jurnal Sist. Informasi), vol. 8, no. 2, pp. 88–95, 2021, doi:
sebesar 84%. Dan juga hasil dari algoritma Support 10.30656/jsii.v8i2.3638.
Vector Machine (SVM)menghasilkan nilai akurasi
training sebesar 83% dan nilai akurasi testing sebesar
82%.
Pada penelitian klasifikasi anime ini, algoritma
K-Nearest Neighbors (KNN) memiliki akurasi testing
yang lebih baik dari Support Vector Machine (SVM)
dengan selisih keduanya cukup tipis, diharapkan
kedepannya dilakukan optimasi model agar hasil yang
didapatkan lebih baik lagi.
55

4950-Article Text-17473-1-10-20220405

Diunggah oleh

Informasi Dokumen

Deskripsi Asli:

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

4950-Article Text-17473-1-10-20220405

Diunggah oleh

Hak Cipta:

Format Tersedia

Terbit online pada laman web jurnal: https://ejurnalunsam.id/index.

Vol. 03 No. 01 (2022) 49 -55 E-ISSN :2774-7115 P-ISSN: 2775-2089

Analisis Perbandingan Algoritma SVM Dan KNN Untuk Klasifikasi

Vika Vitaloka Pramansah1, Dadang Iskandar Mulyana 2 , Titi Silfia3

Diterima Redaksi : 28-01-2022 | Selesai Revisi : 04-04-2022 | Diterbitkan Online : 04-04-2022

1. Pendahuluan Yudo Devianto, dalam penelitian ini dataset yang

2.2 Support Vector Machine (SVM)

Support Vector Machine merupakan salah satu

Gambar 1. Visualisasi SVM. Rumus 1. Jarak Eucliden

Anime merupakan animasi yang dibuat sedemikian

Gambar 3. Contoh Anime (Naruto).

2.6 Diagram Alir

2.7 Metode Pengumpulan Data

Teknik pengumpulan data dan informasi yang

Nama Atribut Tipe Data

rating Nominal Rumus Accuracy atau akurasi diatas yaitu perbandingan

Confusion matrix digunakan sebagai metode 3. Hasil dan Pembahasan

Rumus Precision diatas merupakan perbandingan antara

2 Non Drama 10.040 Algoritma K-Nearest Neighbors (KNN)

Gambar 8. Grafik akurasi testing dan training Algoritma KKN

Gambar 6. Heatmap dataset.

k Akurasi testing Akurasi training

Setelah itu, dapat dilakukan pemodelan dengan

Precision Recall Accuracy F1 Score 8 83% 100%

10 83% 100% Daftar Rujukan

Anda mungkin juga menyukai