49-Article Text-361-2-10-20220803
49-Article Text-361-2-10-20220803
Herman Santoso Pakpahan 1)*, Joan Angelina Widians 2), Haga Daffa Aska Firmanda 3),
Yuniarta Basani 4)
Program Studi Informatika, Fakultas Teknik, Universitas Mulawarman
E-Mail : [email protected])*
*) Correspondenting Author
https://doi.org/10.30872/atasi.v1i1.49
2022 Adopsi Teknologi dan Sistem Informasi (ATASI) with CC BY SA license.
Adopsi Teknologi dan Sistem Informasi (ATASI) Vol. 1, Issue 1 Juni 2022 53
E-ISSN : 2962-7095 Pakpahan, et. al (2022) pp 52-60
1. PENDAHULUAN
Sektor perkebunan sangat berperan penting dalam mensukseskan pelaksanaan strategi transformasi ekonomi
di Indonesia, istilah komoditas perkebunan umunya merujuk kepada sekelompok tanaman atau komoditas tertentu.
Namun permasalahan yang timbul adalah aktor yang berperan di sini masih sangat minim, terutama dari masyarakat
lokalnya yang memiliki pengetahuan terbatas mengenai potensi lokal yang ada di daerahnya (Priatna, Y, 2014).
Tugas penulis adalah mengelompokkan potensi produksi komoditas perkebunan di daerah Kalimantan Timur.
karena dilihat dari banyaknya komoditas dan jumlah data yang banyak maka diperlukan suatu sistem
pengelompokkan untuk mempermudah instansi maupun pemerintah dalam mengelompokkan data dengan jumlah
yang banyak dan agar dapat memberikan informasi tentang potensi disuatu wilayah yang diperlukan oleh
masyarakat maupun petani dan lembaga-lembaga yang terkait dengan informasi tersebut. Era teknologi dan
globalisasi yang terjadi saat ini mendorong timbulnya kebutuhan manusia akan informasi. Kemajuan teknologi yang
begitu cepat mendorong manusia dalam memanfaatkan teknologi tersebut untuk melakukan pekerjaan yang dahulu
dikerjakan secara manual (Widians, J.A, Rachman,W & Masnawati, 2017).
Oleh karena masalah di atas, penelitian ini dibuat dengan mengembangkan informasi dengan memanfaatkan
tekonologi komputer terutama dalam bidang data mining. Salah satu jenis pengelompokkan dalam data mining
adalah Clustering. Clustering ini biasa dilakukan agar sebuah data yang tadinya masih dalam keadaan tidak terusun
dapat dikelompokkan menjadi satu kesatuan agar data tersebut menjadi lebih tertata. Penelitian ini dibuat untuk
mempermudah pengelompokkan potensi komoditas perkebunan khususnya di Kalimantan Timur.
2. TINJAUAN PUSAKA
A. Data Mining
Data Mining adalah proses yang menggunakan teknik statistik, matematika, kecerdasan buatan, dan machine
learning untuk mengekstraksi dan mengidentifikasi informasi yang bermanfaat dan pengetahuan yang terkait dari
berbagai database besar (Hermawan, T.N, Ugiarto, M, & Puspitasari, N, 2017). Data Mining adalah kenyataan
bahwa Data Mining mewarisi banyak aspek dan teknik dari bidang-bidang ilmu yang sudah mapan terlebih dahulu.
Berawal dari beberapa disiplin ilmu, Data Mining bertujuan untuk memperbaiki teknik tradisional sehingga bisa
menangani jumlah data yang sangat besar, dimensi data yang tinggi, data yang heterogen dan berbeda sifat
pengelompokan (Maulana, A, Fajrin, A, 2018)
B. Clustering
Clustering merupakan suatu metode untukmencari dan mengelompokkan data yang memiliki kemiripan
karakteriktik (similarity) antara satu data dengan data yang lain (Anggara, M., Sujiani, H, Helfi, 2016). Klasifikasi
adalah algoritma yang mampu mengklasifikasikan atau meng-cluster ¬objek berdasarkan pada karakteristik ciri-
ciri yang diberikan (Wati, M, Indrawan W, & Widians, 2017).
C. Website
Website adalah kumpulan dari halaman-halaman situs yang terangkum dalam sebuah domain atau subdomain,
yang tempatnya berada di dalam World Wide Web (WWW) di dalam internet ) (Widians, J, Wati, M, & Awaludin,
2107). Website sebagai salah satu contoh penerapan teknologi informasi yang merupakan suatu aplikasi yang dapat
memberikan kemudahan bagi setiap penggunanya untuk memperoleh informasi secara cepat. Saat ini website
bukan hal yang asing lagi, karena sebagai media atau sarana untuk memperoleh informasi maupun memberikan
informasi yang berguna bagi semua pihak yang berkepentingan (Dengen, N, Maulana, S, & Hairah, 2018).
D. Informasi
Informasi adalah data yang sudah diolah menjadi bentuk yang lebih berguna dan lebih berarti bagi yang
menerimanya. Informasi mengandung arti yang dihubungkan dengan kenyataan, simbol-simbol, gambar-gambar,
kata-kata, angka-angka, huruf-huruf atau simbol yang menunjukan ide, objek, kondisi dan situasi (Widians, J.A,
Rahman & Hairah, 2017).
3. METODE PENELITIAN
Tahapan-tahapan yang digunakan untuk mencapai tujuan penelitian meliputi eberapa langkah antara lain, (1)
Objek penelitian, (2) Studi literatur, (3) Wawancara, (4) Pengumpulan data, (5) Analisis, (6) Rumusan masalah, (7)
Tujuan, (8) Menghitung dan perhitungan data menggunakan algoritma K-Means, (9) Kesimpulan.
A. Metode K-Means
Metode K-Means adalah salah satu metode pengelompokkan bersifat partitional secara pembelajaran berciri
unsupervised. Secara prinsip, metode K-Means bekerja dengan memasukkan K sebagai konstanta jumlah cluster
yang diinginkan. Sedangkan, Means dalam hal ini berarti nilai satu rata-rata dari suatu grup data yang dalam hal ini
didefinisikan sebagai cluster (Puspitasari, N & Haviluddin, 2016). Algoritma ini didasarkan pada penentuan jarak
antara centroid dan data latih. Kemudian, jumlah cluster centroid berdasarkan jumlah yang diinginkan. Sementara
itu, centroid inisialisasi yang dihasilkan secara acak dengan mempertimbangkan pelatihan data. Dengan kata lain,
centroid harus berada dalam ruang data pelatihan (Haviluddin, Fanany, A, & Gafar, 2018). K-Means Clustering
sangat cocok untuk data dengan ukuran yang besar karena memiliki kecepatan yang lebih tinggi. K-Means
https://doi.org/10.30872/atasi.v1i1.49
2022 Adopsi Teknologi dan Sistem Informasi (ATASI) with CC BY SA license.
Adopsi Teknologi dan Sistem Informasi (ATASI) Vol. 1, Issue 1 Juni 2022 54
E-ISSN : 2962-7095 Pakpahan, et. al (2022) pp 52-60
Clustering merupakan salah satu metode pengelompokkan data nonhierarki (sekatan) yang berusaha mempartisi
data yang ada ke dalam bentuk dua atau lebih kelompok (Adhe, D, Rachman, C, & Goejantoro, 2020).
Pengukuran jarak dapat menggunakan rumus Euclidean Distance. Berikut pengukuran jarak menggunakan
rumus di bawah ini.
Rumus Euclidean Distance :
𝑑 = √(𝑥1 − 𝑥2 )2 + (𝑦1 − 𝑦2 )2 …………………… (1)
Keterangan :
d = jarak antara x dan y
x1 = data pada pusat klaster ke i
y1 = data pada setiap data ke i
x2 = data pada pusat klaster ke i
y2 = data pada setiap data ke i
Sedangkan untuk menentukan centroid baru dapat dilakukan dengan mengambil rata-rata dokumen yang masuk
pada cluster awal. Iterasi dilakukan terus hingga posisi grup tidak berubah. Berikut penentuan centroid
menggunakan rumus di bawah ini menurut (Praja, B, Kusuma, D, & Setianingsih, 2019).
𝑥1 +𝑥2 +𝑥… +𝑥…
Pusat cluster baru= ........................... (2)
jumlah 𝑥
Keterangan:
X1 = nilai data record ke-1
X2 = nilai data record ke-2
B. Akurasi Perhitungan K-Means
Algoritma K-Means merupakan salah satu algoritma pengelompokan (clustering) berbasiskan metode non-
hierarchy yang mempartisi data dan membentuk satu atau lebih kelompok yang memiliki kesamaan. Pengujian
model dilakukan untuk mengetahui seberapa dekat relasi antara objek dalam sebuah cluster dan seberapa jauh
sebuah cluster terpisah dengan cluster lain (Haviluddin, H, Pakpahan, 2021). Perhitungan SSE dapat dilihat pada
persamaan 3, menurut (Gustientiedina, G Adiya, 2019).
Keterangan :
K = Jumlah klaster
𝑋𝑖 = data ke-𝑖
𝐶𝑘 = nilai rata-rata cluster k
C. Flowchart K-Means
Alur dalam melakukan clustering menggunakan algoritma K-Means dapat dilihat pada Gambar 1 :
D. Nomalisasi
Normalisasi pada Data Mining merupakan proses penskalaan nilai atribut dari data sehingga bisa jatuh pada
range tertentu. Normalisasi ini sangat dibutuhkan agar tidak ada parameter yang mendominasi dalam perhitungan
jarak antar data. Rumus persamaan yang digunakan untuk menghitung normalisasi z-score yaitu, menurut
(Abdurrahman, D, Agus, F, & Putra, 2021):
𝑋𝑖 −𝑋̅
𝑍𝑖 = ( )...........................................................(4)
𝑆
Keterangan :
𝑋̅ = Nilai Rata-Rata
𝑋𝑖 = Data Mentah
Z𝑖 = Nilai Standar
𝑆 = Simpangan Baku
G. Class Diagram
Class diagram menggambarkan struktur statis dari kelas dalam sistem anda dan menggambarkan atribut,
operasi dan hubungan antara kelas. Class diagram membantu dalam memvisualisasikan struktur kelas-kelas dari
suatu sistem dan merupakan tipe diagram yang paling banyak dipakai (Haviluddin, 2011). Berikut ini
penggambaran struktur class dalam suatu class diagram yang akan digunakan untuk aplikasi potensi produksi
komoditas perkebunan di Kalimantan Timur.
134.507 - 63010.00
𝑍₁ˌ₁ =
50377540.69
= 0.001419224
1.406.913 - 63010.00
𝑍₁ˌ₂ =
50377540.69
= 0.02667663
https://doi.org/10.30872/atasi.v1i1.49
2022 Adopsi Teknologi dan Sistem Informasi (ATASI) with CC BY SA license.
Adopsi Teknologi dan Sistem Informasi (ATASI) Vol. 1, Issue 1 Juni 2022 56
E-ISSN : 2962-7095 Pakpahan, et. al (2022) pp 52-60
Setelah dilakukan perhitungan keseluruhan data, maka hasilnya dapat dilihat pada tabel yang tersaji dalam
Tabel 1.
…
7 Balikpapan Kemiri 2019 -0.001250101 -0.001250299
B. Penerapan Proses
a) Menentukan Pusat Cluster
Cluster yang ditentukan sebanyak 3 cluster, maka dari itu penulis memilih secara random dengan menghitung
rata-rata, nilai minimal, dan maksimal dari variabel tanaman menghasilkan dan produksi, data yang akan dijadikan
pusat cluster yaitu data ke-21, data ke-109, dan data ke-221 yang disajikan pada Tabel 2.
b) Menghitung Centroid
Pada tahap ini dilakukan perhitungan centroid/rata-rata dari data yang ada di masing-masing cluster dengan
menggunakan centroid awal yang telah ditentukan di Tabel 2, pada proses ini perhitungan jarak dilakukan
menggunakan Euclidean Distance dimana rumus merujuk pada persamaan (1).
(0.001419224 − (−0.001049714))2 +
=√
(0.02667663 − (−0.00098528))2
= 0.02777187
(0.001419224 − (−0.001203493))2 +
= √
(0.02667663 − (−0.001194798))2
= 0.027994556
(0.001419224 − (−0.00124056))2 +
= √
(0.02667663 − (−0.001247878))2
= 0.028051604
https://doi.org/10.30872/atasi.v1i1.49
2022 Adopsi Teknologi dan Sistem Informasi (ATASI) with CC BY SA license.
Adopsi Teknologi dan Sistem Informasi (ATASI) Vol. 1, Issue 1 Juni 2022 57
E-ISSN : 2962-7095 Pakpahan, et. al (2022) pp 52-60
Dalam menentukan titik centroid terdekat dapat dilakukan dengan mengambil nilai paling rendah berarti jarak
tersebut yang paling mendekati titik pusat. Pada iterasi pertama bentuk data dan hasil dapat dilihat pada Tabel 3.
…
400 0.000333009 7.32464E-05 3.94618E-06 3.94618E-06 C3
Nilai cluster 1
0.001419224 + 0.001970303 + (-0.000694536) + …
𝐶₁ˌ₁ =
45
= 0.000250232
Nilai cluster 2
-0.001239541 + (-0.001202977) + (-0.009137703) + ….
𝐶₂ˌ₁ =
48
= -0.001182972
Nilai cluster 3
-0.001250756 + (-0.001250557) + (-0.001250756) +…
𝐶₃ˌ₁ =
307
= -0.001246873
-0.001250756 + (-0.001249267) + (-0.001250756) +…
𝐶₃ˌ₂ =
307
= -001248327
Setelah perhitungan di atas dilakukan, maka hasil dari nilai cluster 1 sampai dengan cluster 3 akan menjadi
centroid baru. Berdasarkan hasil perhitungan di atas, maka didapati nilai centroid baru seperti pada Tabel 4.
Proses perhitungan nilai centroid dilakukan berulang-ulang hingga didapati anggota pada kelompok cluster
tersebut tidak berubah. Pada perhitungan yang dilakukan secara manual, perhitungan dilakukan sampai iterasi ke-
https://doi.org/10.30872/atasi.v1i1.49
2022 Adopsi Teknologi dan Sistem Informasi (ATASI) with CC BY SA license.
Adopsi Teknologi dan Sistem Informasi (ATASI) Vol. 1, Issue 1 Juni 2022 58
E-ISSN : 2962-7095 Pakpahan, et. al (2022) pp 52-60
9. Adapun hasil perhitungan titik centroid baru pada iterasi ke-9 yang tidak mengalami perubahan lagi ditampilkan
pada Tabel 5.
Adapun hasil perhitungan jarak tiap data ke titik centroid baru masing-masing cluster pada iterasi ke-9 dengan
menggunakan perhitungan jarak Euclidean ditampilkan pada Tabel 6.
…
400 0.042829881 0.016193258 5.63311E-05 5.63311E-05 C3
Setelah semua data tidak ada yang berpindah maka perhitungan akan berhenti di iterasi ke-9 dan jumlah data
disetiap cluster ditampilkan pada Tabel 7.
https://doi.org/10.30872/atasi.v1i1.49
2022 Adopsi Teknologi dan Sistem Informasi (ATASI) with CC BY SA license.
Adopsi Teknologi dan Sistem Informasi (ATASI) Vol. 1, Issue 1 Juni 2022 59
E-ISSN : 2962-7095 Pakpahan, et. al (2022) pp 52-60
Cluster 3
= (0.02800181 - 0.002362591)2
= 0.00065737
...
...
0.00000426209043451487 0.000000000567773910614598 0.000000003173192636267860
Selanjutnya masing-masing dari tiap cluster dijumlahkan keseluruhannya dan akan didapatkan hasil dari
perhitungan Sum of Squared Error (SSE) seperti pada tabel 10.
Dilihat dari tabel 9 di atas, hasil SSE dari tiap cluster kemudian dijumlahkan hingga didapati hasil yaitu
0.062470666 yang dimana jika kita jadikan kebentuk persentasi maka didapati tingkat error dari metode yang
digunakan adalah sebesar 6.25%
5. KESIMPULAN
Berdasarkan hasil penelitian yang telah dijelaskan di atas maka dapat disimpulkan Sistem pengelompokan
komoditi perkebunan daerah Kalimanta Timur berbasis web dengan menerapkan metode K-Means telah berhasil
dibangun. Penelitian ini menggunakan 3 cluster yaitu tingkat potensi produksi banyak (Cluster 1), tingkat potensi
produksi sedang (Cluster 2), dan tingkat potensi produksi sedikit (Cluster3). Dan mendapatkan hasil perhitungan
16 data yang berada pada kelompok 1 (Cluster 1), 14 data yang berada pada kelompok 2 (Cluster 2), dan 370 data
berada pada kelompok 3 (Cluster 3). Hasil perhitungan tingkat akurasi, bahwa metode pengukuran jarak Euclidean
Distance menunjukan tingkat akurasi sebesar 93,75% dan perhitungan Sum of Squared Error (SSE) menunjukan
tingkat error sebesar 6.25%. hal ini menunjukan bahwa metode pengukuran jarak Euclidean Distance cukup akurat
dalam pengelompokan komoditas perkebunan, karena nilai Sum of Squared Error (SSE) tidak melebihi 50%.
6. DAFTAR PUSTAKA
Abdurrahman, D., F. Agus, and G. M. Putra. (2021). Implementasi Algoritma Partitioning Around Medoids (PAM)
untuk Mengelompokkan Hasil Produksi Komoditi Perkebunan ( Studi Kasus : Dinas Perkebunan Provinsi
Kalimantan Timur),” vol. 16, no. 2.
Adhe, D., C. Rachman, R. Goejantoro, and D. Tisna. (2020). Implementation Of Text Mining For Grouping Thesis
Documents Using K-Means Clustering. J. EKSPONENSIAL, vol. 11, no. 2, pp. 167–174.
Anggara, M., Sujiani, H., Helfi, N. (2016). Pemilihan Distance Measure Pada K-Means Clustering Untuk
Pengelompokkan Member Di Alvaro Fitness. J. Sist. dan Teknol. Inf., vol. 1, no. 1, pp. 1–6.
Dengen, N., Maulana, S.A., Hairah, U. (2018). Sistem Informasi Penyewaan Dan Penjualan Pada Darmo Music
Studio. J. Rekayasa Teknol. Inf., vol. 2, no. 1, p. 72, doi: 10.30872/jurti.v2i1.1417.
Dengen, N., R. Subagyo, and indah fitri Astuti. (2018). Perancangan Sistem Informasi Geografis Wilayah Hutan
Lindung di Provinsi Kalimantan Timur,” vol. 3, no. 2, pp. 76–79.
Gustientiedina, G., M. H. Adiya, and Y. Desnelita. (2019). Penerapan Algoritma K-Means Untuk Clustering Data
Obat-Obatan,” J. Nas. Teknol. dan Sist. Inf., vol. 5, no. 1, pp. 17–24, doi: 10.25077/teknosi.v5i1.2019.17-
24.
Haviluddin, “Memahami Penggunaan UML ( Unified Modelling Language ). (2011). Memahami Pengguna. UML
(Unified Model. Lang., vol. 6, no. 1, pp. 1–15, 2011, [Online]. Available:
https://informatikamulawarman.files.wordpress.com/2011/10/01-jurnal-informatika-mulawarman-feb-
2011.pdf.
https://doi.org/10.30872/atasi.v1i1.49
2022 Adopsi Teknologi dan Sistem Informasi (ATASI) with CC BY SA license.
Adopsi Teknologi dan Sistem Informasi (ATASI) Vol. 1, Issue 1 Juni 2022 60
E-ISSN : 2962-7095 Pakpahan, et. al (2022) pp 52-60
Haviluddin, A. Fanany, and O. Gafar. (2018). Comparison Between K-Means and Fuzzy C-Means Clustering in
Network Traffic Activities,” Comp. Between K-Means Fuzzy C-Means Clust. Netw. Traffic Act., vol. 2, doi:
10.1007/978-3-319-59280-0.
Hermawan, T., M. Ugiarto, and N. Puspitasari. (2017). Sistem Evaluasi Kinerja Asisten Laboratorium
Menggunakan Metode K-Means. Pros. Semin. Nas. Ilmu Komput. dan Teknol. Inf., vol. 3, no. 2, pp. 3–6.
Maulana and A. A. Fajrin. (2018). Penerapan Data Mining Untuk Analisis Pola Pembelian Konsumen Dengan
Algoritma Fp-Growth Pada Data Transaksi Penjualan Spare Part Motor. Klik - Kumpul. J. Ilmu Komput.,
vol. 5, no. 1, p. 27, doi: 10.20527/klik.v5i1.100.
Priatna, Y (2014). Kemelekan Informasi Masyarakat Terhadap Potensi Daerah. Kemelekan Inf. Masy. Terhadap
Potensi Drh., pp. 1–16.
Praja, P. D. Kusuma, and C. Setianingsih. (2019). Penerapan Metode K-Means Clustering Dalam Pengelompokan
Data Penumpang Dan Kapal Angkutan Laut Di Indonesia,” e-Proceeding Eng., vol. 06, no. 1, p. 1442.
Puspitasari, N and Haviluddin. (2016). Penerapan Metode K-Means Dalam Pengelompokkan Curah Hujan. Semin.
Nas. Ris. Ilmu Komput. (SNRIK ), vol. 1, no. March 2017, pp. 2–7.
Ramadiani, P. P. Widagdo, and E. Junirianto. (2017). Tracer Study Menggunakan Framework Bootstrap,” vol. 1,
no. 1, 2017, doi: 10.31227/osf.io/pxgb7.
Rosa and M. Shalahuddin. (2015). Rekayasa Perangkat Lunak Menggunakan UML dan JAVA. Bandung Inform.
Bandung.
Wati, M., Indrawan, W., Widians, J.A., Puspitasari, N. (2017). Data mining for predicting students’ learning
result,” in 2017 4th International Conference on Computer Applications and Information Processing
Technology (CAIPT), pp. 1–4.
Widians, J.A., W. H. Rachman, and Masnawati. (2017). Sistem Pendukung Keputusan Pemilihan Bibit Cabai
Rawit Menggunakan Metode Simple Additive Weighting (SAW) Berbasis Web. Pros. Semin. Ilmu Komput.
dan Teknol. Inf., vol. 2, no. 1, pp. 175–181.
Widians, J.A., Masnawati, and Awalludin, M. (2017). Apl. Daft. Hadir Perkuliahan Mhs. FKTI Univ. Mulawarman
Berbas. Web, vol. 2, no. 1.
Widians, J.A., Rahman, A.A., Hairah, U. (2017). Negeri Samarinda Berbasis Web,” vol. 2, no. 2, pp. 180–185.
https://doi.org/10.30872/atasi.v1i1.49
2022 Adopsi Teknologi dan Sistem Informasi (ATASI) with CC BY SA license.