825-Article Text-2958-1-10-20230701
825-Article Text-2958-1-10-20230701
Abstract
Although Machine Learning and Deep Learning technologies have been widely used and have shown high accuracy in many
applications, including in the health field, their application in early detection of heart disease still has room for improvement.
Further research is needed to enhance the accuracy and efficiency of this process. This study aims to understand and improve
the process of ECG signal extraction and classification based on Machine Learning and Deep Learning. Essentially, this
research aims to evaluate and compare various models, focusing on the Random Forest and Convolutional Neural Networks
(CNN) models. The study reviews several related researches, especially those focusing on the process of extraction and
classification of ECG signals using Machine Learning and Deep Learning. After extraction and classification of data, an
evaluation and comparison process is conducted to determine the best performing model. From the research conducted, it
was found that Machine Learning methods generally show an accuracy rate between 97.02% - 99.66%, with the Random
Forest method having an accuracy of 97.02%. Meanwhile, the CNN method shows a higher accuracy rate, which is between
98.75% - 100%. Thus, this research confirms the superiority of CNN in this classification process, and shows potential for
further use in early detection of heart disease.
Keywords: Machine Learning, Deep Learning, Extraction, ECG, Classification
Abstrak
Meski teknologi Machine Learning dan Deep Learning sudah digunakan secara luas dan menunjukkan tingkat akurasi
yang tinggi dalam banyak aplikasi, termasuk di bidang kesehatan, aplikasi dalam deteksi dini penyakit jantung masih
memiliki ruang untuk peningkatan. Diperlukan penelitian lebih lanjut untuk meningkatkan akurasi dan efisiensi proses ini.
Penelitian ini bertujuan untuk memahami dan memperbaiki proses ekstraksi sinyal EKG dan klasifikasi berbasis Machine
Learning dan Deep Learning. Pada dasarnya, penelitian ini bertujuan untuk mengevaluasi dan membandingkan berbagai
model, dengan fokus pada model Random Forest dan Convolutional Neural Networks (CNN). Penelitian ini melakukan
tinjauan terhadap beberapa penelitian terkait, khususnya yang berfokus pada proses ekstraksi dan klasifikasi sinyal EKG
dengan menggunakan Machine Learning dan Deep Learning. Setelah ekstraksi dan klasifikasi data, proses evaluasi dan
komparasi dilakukan untuk menentukan model dengan performa terbaik. Dari penelitian yang telah dilakukan, ditemukan
bahwa metode Machine Learning pada umumnya menunjukkan tingkat akurasi antara 97.02% - 99.66%, dengan metode
Random Forest memiliki akurasi sebesar 97.02%. Sedangkan metode CNN menunjukkan tingkat akurasi yang lebih tinggi,
yaitu antara 98.75% - 100%. Dengan demikian, penelitian ini mengkonfirmasi keunggulan CNN dalam proses klasifikasi
ini, dan menunjukkan potensi untuk penggunaan lebih lanjut dalam pendeteksian dini penyakit jantung.
Keywords: Machine Learning, Deep Learning, Ekstraksi, EKG, Klasifikasi
This work is licensed under Creative Commons Attribution License 4.0 CC-BY International license
Jurnal Teknologi Dan Sistem Informasi Bisnis – JTEKSIS Vol.05 No.3 Juli 2023 190
E-ISSN : 2655-8238
Jurnal Teknologi Dan Sistem Informasi Bisnis
P-ISSN : 2964-2132
Vol. 5 No. 3 Juli 2023 Hal. 190-196
http://jurnal.unidha.ac.id/index.php/jteksis
Jurnal Teknologi Dan Sistem Informasi Bisnis – JTEKSIS Vol.05 No.3 Juli 2023 191
E-ISSN : 2655-8238
Jurnal Teknologi Dan Sistem Informasi Bisnis
P-ISSN : 2964-2132
Vol. 5 No. 3 Juli 2023 Hal. 190-196
http://jurnal.unidha.ac.id/index.php/jteksis
H.
Sleep
[7] Almutairi et Other 2021
Apnoea
al.
P. Kanani &
[8] Arrhythmia Other 2020
M. Padole
D. K. Atal
[9] Arrhythmia Other 2020
& M. Singh
S. Mandal Ventricular
[10] Other 2021
et al. Arrhythmia
R. K. Congestive
[11] Tripathy et Heart Other 2019
al. Failure
J. Rahul et
[12] Arrhythmia Other 2021
al. Gambar 2. Grafik Tahun Publikasi
S. Sowmya
[13] Arrhythmia Other 2022 Untuk lebih memahami paper-paper yang
& D. Jose
Y.-Y. Jo et
telah dikelompokan, peneliti akan memaparkan
[14] Arrhythmia Other 2021 variable yang digunakan pada penelitian terkait
al.
yaitu model dan hasil evaluasi model dari paper
L. Zheng et
[15] Arrhythmia Other 2021 penelitian terkait. Selain itu, peneliti juga mencari
al
tahu model mana yang memiliki hasil evaluasi
S. C.
[16] Mohonta et Arrhythmia Other 2022 terbaik diantara model lainnya pada penelitian
al. terkait. Peneliti telah merangkum detail dari
K. Prashant penelitian terkait beserta model dan hasil
[17] Arrhythmia Other 2022 evaluasinya pada Tabel 2.
et al.
Coronary
V.
Artery,
[18] Jahmunah et Other 2021
Myocardial
al.
Infarction &
Jurnal Teknologi Dan Sistem Informasi Bisnis – JTEKSIS Vol.05 No.3 Juli 2023 192
E-ISSN : 2655-8238
Jurnal Teknologi Dan Sistem Informasi Bisnis
P-ISSN : 2964-2132
Vol. 5 No. 3 Juli 2023 Hal. 190-196
http://jurnal.unidha.ac.id/index.php/jteksis
Time-Series &
[8] Hybrid 99.12%
DL
Machine
[10] RF 97.02%
Learning
Machine
[11] HCMM 98.78%
Learning
Machine
[12] SVM 99.51%
Learning
[13] CNN & LSTM Hybrid 99.7% Gambar 3. Grafik Variabel Penelitian
Jurnal Teknologi Dan Sistem Informasi Bisnis – JTEKSIS Vol.05 No.3 Juli 2023 193
E-ISSN : 2655-8238
Jurnal Teknologi Dan Sistem Informasi Bisnis
P-ISSN : 2964-2132
Vol. 5 No. 3 Juli 2023 Hal. 190-196
http://jurnal.unidha.ac.id/index.php/jteksis
dilakukannya suatu perbandingan antara metode menunjukkan kondisi jantung tertentu. Algoritma
tradisional atau Machine Learning menggunakan ini kemudian dapat digunakan untuk menganalisis
Random Forest dengan Convolutional Neural data EKG secara otomatis dan memberikan
Network (CNN) menggunakan arsitektur ResNet- rekomendasi diagnosis atau pengobatan. Algoritma
50 adalah sebagai berikut: pembelajaran mesin dapat dilatih untuk
mengklasifikasikan data EKG ke dalam kategori
3.1 MIT-BIH Arrhythmia Database yang berbeda, seperti normal atau abnormal, atau
MIT-BIH Arrhythmia Database adalah untuk mengidentifikasi kondisi jantung tertentu.
rangkaian uji standar yang umumnya tersedia untuk Biasanya, klasifikasi sinyal EKG memiliki
mengevaluasi aritmia deteksi. Sejak 1980, basis empat fase: preprocessing, segmentasi, ekstraksi
data ini telah digunakan untuk dasar penelitian fitur, dan klasifikasi. Fase preprocessing terutama
untuk dinamika jantung di sekitar 500 lokasi di ditujukan untuk mendeteksi dan melemahkan
seluruh dunia. Basis data ini sebagian besar frekuensi sinyal EKG yang terkait dengan artefak,
digunakan untuk tujuan medis dan penelitian dari yang juga biasanya melakukan normalisasi dan
deteksi dan analisis aritmia jantung yang berbeda. peningkatan sinyal. Setelah preprocessing,
Basis data ini mencoba menyediakan informasi segmentasi akan membagi sinyal menjadi segmen
yang tepat untuk mendeteksi aritmia ventrikel [24]. yang lebih kecil, yang dapat mengekspresikan
Aritmia adalah perubahan detak jantung yang aktivitas listrik jantung dengan lebih baik [27].
tidak normal karena detak jantung yang tidak tepat
yang menyebabkan kegagalan dalam pemompaan 3.3 Machine Learning
darah. Aritmia dapat menyebabkan kematian Pembelajaran Mesin atau Machine Learning
jantung mendadak. Gejala aritmia yang umum merupakan kemajuan teknologi yang penting
adalah denyut prematur, jantung berdebar, pusing, karena dapat membantu dalam mengambil
kelelahan, dan pingsan. Aritmia lebih sering terjadi keputusan dengan mekanisme prediksi dan
pada orang yang menderita tekanan darah tinggi, klasifikasi berdasarkan data yang ada [29].
diabetes dan arteri koroner penyakit [25]. Sinyal Berfokus pada performance yang tinggi, teknik
Elektrokardiogram yang akan digunakan pada pembelajaran mesin atau machine learning
penelitian ini diambil dari MIT-BIH Arrhythmia diterapkan pada bisnis dengan data yang
Database. berkembang pesat. Karena pendekatan desain
cocok untuk komunikasi komputasi paralel dan
3.2 Elektrokardiogram (EKG) terdistribusi yang berevolusi atau data bisnis yang
Elektrokardiogram (EKG) adalah tes medis dinamis dan berkembang kedalam model Machine
yang mengukur aktivitas listrik jantung. EKG Learning [30].
digunakan untuk mendiagnosis dan memantau Teknologi berbasis komputer modern banyak
berbagai kondisi jantung, seperti serangan jantung, yang telah menggunakan Pembelajaran Mesin atau
aritmia, dan gagal jantung. EKG akan merekam Machine Learning. Machine Learning merupakan
aktivitas listrik kecil yang dihasilkan oleh jantung cabang dari Kecerdasan Buatan atau Artificial
selama periode waktu tertentu dengan Intelligence yang luas dan sudah berkembang pesat
menempatkan elektroda pada tubuh pasien [26]. saat ini yang memungkinkan komputer untuk
Rekaman EKG berisi noise dan amplitudo yang belajar dan berkembang secara otomatis tanpa
bervariasi dari setiap orang sehingga sulit dalam harus diprogram secara eksplisit. Teknologi ini
proses mendiagnosis [27]. berasal dari mempelajari pengenalan pola dan teori
Elektrokardiogram (EKG) memberikan pembelajaran komputasi. Secara umum, metode
informasi penting tentang berbagai kondisi manusia pembelajaran yang umum digunakan oleh Machine
[28]. Untuk melakukan EKG, petugas kesehatan Learning dapat diklasifikasikan menjadi
akan menempelkan tambalan kecil dan lengket Supervised, Unsupervised, dan Reinforcement
yang disebut elektroda ke dada, lengan, dan kaki Learning [31].
pasien. Elektroda terhubung ke mesin EKG, yang
merekam sinyal listrik yang dihasilkan oleh jantung 3.3.1 Supervised Learning
saat bergerak ke seluruh tubuh. Mesin tersebut Supervised Learning merupakan metode
menghasilkan jejak aktivitas listrik jantung, yang Machine Learning untuk menyimpulkan fungsi dari
disebut strip EKG, yang kemudian data train. Algoritma Supervised Learning biasanya
diinterpretasikan oleh petugas kesehatan. berisi kumpulan sampel input (feature) dan label
Machine Learning dapat diterapkan pada yang berkaitan dengan kumpulan data tersebut.
analisis data EKG untuk meningkatkan akurasi dan Tujuan dari pengklasifikasian adalah untuk
efisiensi diagnosis dan pengobatan. Misalnya, menemukan batas yang sesuai yang dapat
algoritma pembelajaran mesin dapat dilatih untuk memprediksi label yang benar pada data test.
mengenali pola dalam data EKG yang Secara singkat, dalam Supervised Learning
Jurnal Teknologi Dan Sistem Informasi Bisnis – JTEKSIS Vol.05 No.3 Juli 2023 194
E-ISSN : 2655-8238
Jurnal Teknologi Dan Sistem Informasi Bisnis
P-ISSN : 2964-2132
Vol. 5 No. 3 Juli 2023 Hal. 190-196
http://jurnal.unidha.ac.id/index.php/jteksis
memiliki setiap contoh data yang berpasangan yang sinar-X, tulang rusuk tumpang tindih dengan paru-
terdiri dari objek masukan (input) dan objek paru dan jantung [36].
keluaran (output) yang diinginkan. Algoritma
Supervised Learning menganalisis data train dan SIMPULAN
menghasilkan fungsi (model) [32]. Salah satu Dari hasil pencarian keyword pada beberapa
contoh metode algoritma pada Supervised Learning platform atau website jurnal dan telah dibatasi
adalah Random Forest. sebanyak 100 paper dengan kriteria Inklusi dan
Eksklusi yang diterapkan sehingga mendapatkan
3.3.1.1 Random Forest 17 paper yang masuk kedalam kategori atau
Random Forest adalah metode Machine kriteria tersebut. Untuk menjawab pertanyaan
Learning yang diperkenalkan pada tahun 2001 oleh sebelumnya yaitu model yang memiliki hasil atau
Leo Breiman. Metode ini menggunakan akurasi terbaik serta stabil adalah Convolutional
serangkaian besar dari Decision Tree dengan Neural Network (CNN) dengan tingkat akurasi
korelasi timbal balik yang rendah dan fitur yang rata - rata 98.75% - 100%. Untuk teknik evaluasi
dipilih secara acak menggunakan metode bagging performa model dalam klasifikasi sinyal EKG
(Bootstrap AGGregatING) [33]. menggunakan confusion matrix yang terdiri dari
Random Forest merupakan salah satu metode Akurasi, Presisi, Recall, dan F1 Score.
pengklasifikasian terbaik dan banyak digunakan
untuk regresi dan juga klasifikasi. Random Forest DAFTAR PUSTAKA
memiliki algoritma yang sederhana sehingga [1] D. O. Eke, “Chatgpt and the rise of Generative AI: Threat
menjadi salah satu pilihan yang menarik untuk to academic integrity?,” Journal of Responsible
mengklasifikasi teks. Selain itu, Random Forest Technology, vol. 13, p. 100060, 2023.
juga memiliki kemampuan untuk mengolah data doi:10.1016/j.jrt.2023.100060
berdimensi tinggi dan memiliki performa yang [2] Pojon, M. (2017). Using machine learning to predict
student performance (Master's thesis).
tinggi walaupun menggunakan data yang banyak
sehingga menjadi salah satu keuntungan [3] I. M. Agus Oka Gunawan, I. D. Indah Saraswati, I. D.
Riswana Agung, and I. P. Eka Putra, “Klasifikasi Penyakit
menggunakan model ini dibandingkan dengan jantung menggunakan algoritma decision Tree Series
model Machine Learning lainnya [33]. C4.5 Dengan Rapidminer,” Jurnal Teknologi Dan Sistem
Pemilihan model ini didasarkan karena pada Informasi Bisnis, vol. 5, no. 2, pp. 73–83, 2023.
faktanya bahwa Random Forest secara luas doi:10.47233/jteksis.v5i2.775
dianggap sebagai salah satu metode Machine [4] J. Siswanto, A. A. Qalban, and S. N. Lahay, “Aplikasi
Sistem Pakar Klasifikasi Kesehatan Lingkungan
Learning yang paling sukses dan banyak digunakan Permukiman Dengan metode certainty factors,” Jurnal
hingga saat ini [34]. Teknologi Dan Sistem Informasi Bisnis, vol. 5, no. 2, pp.
103–112, 2023. doi:10.47233/jteksis.v5i2.787
3.4 Deep Learning [5] R. Ganeshkumar and Dr. YSKumaraswamy,
Deep Learning merupakan kemajuan terbaru “Investigating cardiac arrhythmia in ECG using Random
Forest Classification,” International Journal of Computer
dari kecerdasan buatan yang telah digunakan Applications, vol. 37, no. 4, pp. 31–34, 2012.
mengatasi banyak masalah yang melibatkan doi:10.5120/4599-6557
kumpulan data besar atau big data. Deep Learning [6] J. J. Kim, H. Jang, and S. Roh, “A systematic literature
juga muncul sebagai alat yang menjanjikan untuk review on humanitarian logistics using network analysis
analisis data scRNA-seq, karena memiliki kapasitas and Topic modeling,” The Asian Journal of Shipping and
Logistics, vol. 38, no. 4, pp. 263–278, 2022.
untuk mengekstrak fitur informatif dan ringkas data doi:10.1016/j.ajsl.2022.10.003
scRNA-seq yang berisik, heterogen, dan berdimensi
[7] H. Almutairi, G. M. Hassan, and A. Datta, “Classification
tinggi untuk meningkatkan analisis hilir [35]. of obstructive sleep apnoea from single-lead ECG signals
using convolutional neural and long short term memory
3.4.1 Convolutional Neural Network (CNN) networks,” Biomedical Signal Processing and Control,
vol. 69, p. 102906, 2021. doi:10.1016/j.bspc.2021.102906
Convolutional Neural Networks (CNNs), telah
berhasil digunakan untuk memproses dan [8] P. Kanani and M. Padole, “ECG Heartbeat arrhythmia
classification using time-series augmented signals and
menganalisa gambar digital, termasuk berbagai Deep Learning Approach,” Procedia Computer Science,
jenis gambar medis, termasuk CT. Meskipun vol. 171, pp. 524–531, 2020.
beberapa karya telah mempresentasikan hasil doi:10.1016/j.procs.2020.04.056
menggunakan gambar sinar-X, CT scan cenderung [9] D. K. Atal and M. Singh, “Arrhythmia classification with
lebih efisien karena dua alasan. Pertama, CT scan ECG signals based on the optimization-enabled deep
convolutional neural network,” Computer Methods and
memberikan tampilan 3 dimensi yang mendetail Programs in Biomedicine, vol. 196, p. 105607, 2020.
dari organ yang didiagnosis, sedangkan sinar-X doi:10.1016/j.cmpb.2020.105607
memberikan tampilan 2-D. Kedua, CT scan tidak [10] S. Mandal, P. Mondal, and A. H. Roy, “Detection of
tumpang tindih dengan organ, sedangkan pada ventricular arrhythmia by using heart rate variability
signal and ECG Beat Image,” Biomedical Signal
Processing and Control, vol. 68, p. 102692, 2021.
Jurnal Teknologi Dan Sistem Informasi Bisnis – JTEKSIS Vol.05 No.3 Juli 2023 195
E-ISSN : 2655-8238
Jurnal Teknologi Dan Sistem Informasi Bisnis
P-ISSN : 2964-2132
Vol. 5 No. 3 Juli 2023 Hal. 190-196
http://jurnal.unidha.ac.id/index.php/jteksis
Jurnal Teknologi Dan Sistem Informasi Bisnis – JTEKSIS Vol.05 No.3 Juli 2023 196