Unduh sebagai pdf atau txt
Unduh sebagai pdf atau txt
Anda di halaman 1dari 8

TIERS Information Technology Journal

Vol.2, No.1, Juni 2021, pp. 39~47


ISSN: 2723-4541 / E-ISSN: 2723-4533
DOI:  1

Implementasi ETL (Extract, Transform, Load) pada Data


warehouse Penjualan Menggunakan Tools Pentaho
I Putu Widia Prasetia1, I Nyoman Hary Kurniawan2
Program Studi Teknologi Informasi, Universitas Pendidikan Nasional
Denpasar, Bali, Indonesia,
E-Mail: [email protected], [email protected]

ABSTRACT
A company, which is a company engaged in the commercial sector, needs to analyze sales performance. By
analyzing sales performance, companies can improve their sales performance. One way of analyzing sales
performance is to collect historical data related to sales and then process the data so as to produce
information in the form of company sales performance results that can be used as a reference in decision
making within the company. The author here will try to analyze a data related to sales data that is in a
Superstore in the United States, the following data collected is related to sales such as product data, sales
segments, sales transactions, and others. After all the data needed to build a Data warehouse is collected,
the next process is ETL (Extract, Transform and Load) data. The tools used in the ETL process are Pentaho.
In this data extraction process includes one data source, namely sales data with excel file type. After
carrying out the extraction process, there is a data transformation process, namely making some changes to
the extracted data to make it more consistent and uniform according to the needs of the data warehouse.
After the transformation is carried out, the final result of the ETL process is in the form of a simple Data
warehouse containing Customer, Home Office and Corporate data, then the data is entered into the Data
warehouse and displayed into the MySql Database and Microsoft Excel files.
Keywords: Data warehouse, ETL (Extract, Transform, Load), Sales Data, pentahoo, ETL tools, MySql
ABSTRAK
Perusahaan yang bergerak dibidang komersil perlu melakukan analisis kinerja penjualan. Dengan
melakukan analisis kinerja penjualan, perusahaan dapat meningkatkan kinerja penjualannya. Salah satu cara
melakukan analisis kinerja penjualan adalah dengan mengumpulkan data historis yang berkaitan dengan
penjualan dan kemudian mengolah data tersebut sehingga menghasilkan informasi berupa hasil kinerja
penjualan perusahaan yang dapat digunakan sebagai acuan dalam pengambilan keputusan dalam
perusahaan. Penulis disini akan mencoba menganalisa sebuah data yang terkait dengan data penjualan yang
ada pada sebuah Superstore di Negara Amerika Serikat, data-data yang dikumpulkan berikut terkait dengan
penjualan seperti data produk, segment penjualan, transaksi penjualan, dan lain-lain. Setelah semua data
yang dibutuhkan untuk membangun Data warehouse terkumpul, proses selanjutnya adalah ETL (Extract,
Transform dan Load) data. Tools yang digunakan pada proses ETL ini yaitu Pentaho. Pada proses ekstraksi
data ini meliputi 1 sumber data yaitu data penjualan dengan jenis file excel. Setelah melakukan proses
ektraksi selanjutnya ada proses transformasi data yaitu melakukan beberapa perubahan terhadap data yang
sudah diekstraksi agar lebih konsisten dan seragam sesuai dengan kebutuhan data warehouse. Setelah
transformasi dilakukan, hasil akhir dari proses ETL tersebut berupa Data warehouse sederhana yang
berisikan data Customer, Home Office dan Corporate, kemudian data tersebut dimasukkan ke dalam Data
warehouse dan di tampilkan kedalam Database MySql dan file Microsoft Excel.
Kata kunci: Data warehouse, ETL (Extract, Transform, Load), data penjualan, pentaho, ETL tools, MySql

Info Artikel

Diterima Redaksi : 07-06-2021 This is an open access article under the CC BY-SA license.

Selesai Revisi : 14-06-2021


Diterbitkan Online : 30-06-2021

Journal homepage: https://journal.undiknas.ac.id/index.php/tiers


2  ISSN: 2723-4541 / E-ISSN: 2723-4533

Penulis Korespondensi:
I Putu Widia Prasetia
Prodi Teknologi Informasi,
Universitas Pendidikan Nasional,
Jl. Lg Gambir No.49, Medahan, Kec. Blahbatuh, Kabupaten Gianyar, Bali 80581
Email: [email protected]

1. PENDAHULUAN
Penggunaan suatu sistem komputer di bidang penjualan menghasilkan data yang sangat melimpah.
Pengambilan berbagai keputusan penting dalam sebuah perusahan penjualan, bergantung pada data yang
terkumpul saat ini. Masalahnya, data berukuran besar yang dihasilkan tersebut tersebar di mana-mana
sehingga menyulitkan perusahaan ketika akan mengolah maupun menganalisis datanya. Untuk mengatasinya,
diperlukan data warehouse alias gudang data, dan data disini mengacu pada data transaksi. Seperti namanya,
data warehouse ibarat gudang tempat penyimpanan informasi dan data umumnya transaksi yang
dikumpulkan dari berbagai sumber dan disimpan dalam skema terstruktur. Dengan demikian, keberadaan
data warehouse sangat strategis membantu dalam mengambil keputusan manajemen sebuah perusahaan
penjualan [1]. Kunci sukses bagi sebuah perusahaan untuk bertahan pada masa sekarang adalah kemampuan
untuk menganalisa, merencanakan dan bereaksi terhadap perubahan lingkungan bisnis secara cepat dan
akurat. Kemampuan ini hanya dapat dipenuhi dengan tersediannya informasi yang memadai bagi para
manajer, direktur dan para pengambilan keputusan lainnya. Informasi adalah pondasi dari setiap keputusan
bisnis penting yang dilakukan. Kebutuhan perusahaan untuk mengambil keputusan secara tepat dan cepat
berdasarkan fakta pasar menjadi lebih kritis agar dapat bertahan, hal ini didukung dengan Business
Intelligence (BI) di perusahaan [2]. Seperti kita ketahui Business Intelligence (BI) dianggap memiliki dampak
luar biasa pada bisnis [3]. Aktivitas penelitian telah berkembang dalam beberapa tahun terakhir. Bagian
penting dari sistem BI adalah Implementasi proses ETL (Extract, Transform, Load) yang berkinerja baik [4].

Pentaho merupakan nama suatu perusahaan dan juga nama produk. Pentaho mengkhususkan diri
sebagai perusahaan pembuat software untuk keperluan data warehouse dan business intelligence (BI).
Pentaho adalah sebuah software yang digunakan dalam proses ETL dalam penyusunan data warehouse [5].
Elemen utama dari Pentaho Data Integration (PDI) adalah Transformation dan Job. Transformation adalah
sekumpulan instruksi untuk merubah input menjadi output yang diinginkan (input- proses-output) [6].
Sedangkan Job adalah kumpulan instruksi untuk menjalankan transformasi [6]. Pentaho Community Edition
atau Pentaho BI Suite adalah produk dari Pentaho yang sudah terintegrasi dengan kemampuan reporting,
dashboard, data mining, workflow, dan ETL. ETL adalah sekumpulan proses untuk mengambil dan
memproses data dari satu atau banyak sumber data menjadi sumber baru[7]. ETL adalah proses inti dari
integrasi data dan biasanya terkait dengan data warehouse [8]. Tools ETL mengekstrak data dari sumber
yang dipilih, mengubahnya menjadi format baru sesuai dengan aturan bisnis, dan kemudian memuatnya ke
dalam struktur data target [9]. ETL merupakan proses yang sangat penting dalam data warehouse, dengan
ETL inilah data dari operasional dapat dimasukkan ke dalam data warehouse[10].

Penelitian ini bertujuan agar perusahan penjualan menyimpan data-data penjualan dengan baik dan
dapat dengan mudah mengelola dan menganalisis data yang ada melalui data warehouse.

2. METODE PENELITIAN
2.1. Alur Penelitian
Proses penelitian ini dikembangkan berdasarkan metodologi rekayasa dengan tahapan penelitian
seperti yang ditunjukkan pada gambar 1.Rumus ditulis secara jelas menggunakan equation dengan indeks
seperti rumus 1.

TIERS Information Technology Journal, Vol. 2, No. 1, Juni 2021:39-47


TIERS Information Technology Journal  3

Gambar 1. Tahapan Penelitian

Pada penilitian kali ini, Analisis kebutuhan dilakukan dengan teknik pengumpulan data berdasarkan
dengan kebutuhan akan laporan analisis kinerja penjualan dalam perusahaan. Analisis kinerja penjualan
memuat tentang segmentasi pembeli seperti Consumer, Home Office, dan Corporate. Proses pengambilan
sumber data adalah proses extract data yang diambil dari sebuah laporan data penjualan salah satu Superstore
di amerika serikat. Proses ETL merupakan proses mengubah data mentah menjadi laporan analisis kinerja
penjualan. Proses pengolahan output sistem adalah proses editing format dan style yang nanti hasilnya akan
berupa file excel dan sebuah database berbasis MySql. Proses pengujian nantinya akan dilakukan dengan
cara mengambil beberapa sampel data secara acak dan mencocokkan hasil antara pemrosesan data secara
manual dengan hasil pemrosesan data melalui proses ETL di Pentaho Data Integration.

2.2. Gambaran Umum Sistem


Gambaran umum sistem dalam artikel ini terdiri dari analisa kebutuhan sistem dan bagaimana
proses pengolahan data menjadi suatu analisis. Gambaran umum sistem yang akan dilakukan dalam analisis
ini adalah seperti yang ditunjukan pada gambar 2 dibawah ini.

Gambar 2. Gambaran Umum Sistem

2.3. Analisa Kebutuhan Sistem


2.3.1. Format Data Penjualan
Format data penjualan yang diambil dari sebuah Superstore di wilayah amerika serikat adalah
berbentuk file berupa Microsoft Excel sebagai berikut, seperti yang ditunjukkan pada gambar 3.

Gambar 3. Format Data Laporan Penjualan


Implementasi ETL (Extract, Transform, Load) pada Data warehouse Penjualan Menggunakan Tools
Pentaho (I Putu Widia Prasetia)
4  ISSN: 2723-4541 / E-ISSN: 2723-4533

2.3.2. Format Laporan penjualan


Laporan segmentasi berdasarkan kinerja penjualan sebagai output dari proses ETL terdiri dari
laporan-laporan berikut ini :
1. Laporan nama-nama Produk yang berhasil dijual
2. Laporan Kategori Produk
3. Laporan Nama Pembeli
4. Laporan Negara beserta Region dimana produk itu berhasil dijual
5. Laporan penjualan produk yang berhasil dijual banyak berdasarkan segmentasi pembeli.
2.4. Skema keseluruhan ETL
Proses ETL (Extract, Transform, Load) dilakukan menggunakan Tools Pentaho yang ditunjukkan
pada gambar 4 berikut ini. Proses input data dilakukan dengan memasukkan data laporan penjualan ke dalam
Pentaho, kemudian data difilter dan dibuatkan sebuah dimensi sesuai dengan kebutuhan laporan. Kemudian
dipilih values mana saja yang akan ditampilkan dalam output yang berupa file Microsoft Excel dan sebuah
database berbasis MySql.

Gambar 4. Skema Proses ETL

2.4.1 Proses Input Data


Dalam proses input data kita akan memasukkan data penjualan Superstore selama kurang lebih
tahun 2014-2017 dalam bentuk Excel, yang sebelumnya data ini sudah kita dapatkan melalui sumber internet.
Proses penginputan ini dilakukan dengan memilih terlebih dahulu dimana file yang akan diolah disimpan,
kemudian ditambahkan sehingga langsung ada dalam Selected Files seperti yang ditunjukkan pada gambar 5
berikut ini. Setelah menambahkan file, kemudian pilih sheet dari file Excel tersebut. Kemudian pada tab
Fields kita harus mengambil dan memastikan Fields atau kolom yang kita pilih sudah sesuai dengan yang
akan kita analisis dalam laporan penjualan.

Gambar 5. Proses Input Data

TIERS Information Technology Journal, Vol. 2, No. 1, Juni 2021:39-47


TIERS Information Technology Journal  5

2.4.2 Proses Filter Data


Proses Extract dilakukan dengan cara memfilter data sesuai dengan kebutuhan analisis, pada proses
kali ini kita akan menyaring data sesuai dengan segmentasi dari laporan penjualan. Segmentasi dari data
penjualan terdiri dari segment Consumer, Home Office, dan Corporate. Tujuan dari memfilter data ini adalah
agar mengetahui dari segment mana saja penjualan banyak terjadi sehingga bisa mempertimbangkan
keputusan dalam strategi penjualan produk perusahaan. Contoh filter data di tools Pentaho ditunjukkan pada
gambar 6 dibawah ini, dimana dalam kondisi tersebut kita memilih field atau kolom dari Segment. Kemudian
sebagai contoh, value dari field Segment tersebut kita isikan dengan Consumer yang bertipe datakan String.
Sama seperti proses sebelumnya, value selanjutnya yang akan difilter diisikan dengan value Home Office dan
Corporate. Tahap selanjutnya adalah penambahan sequence, karena pada Data warehouse kali ini akan
membuat 3 dimensi yaitu Consumer, Home Office dan Corporate. Seperti Gambar 6 yang ditunjukkan di
bawah ini.

Gambar 6. Proses Filter Data


Tahap selanjutnya adalah penambahan sequence, karena pada Data warehouse kali ini akan membuat 3
dimensi yaitu Consumer, Home Office dan Corporate. Seperti Gambar 7 yang ditunjukkan pada di bawah ini.

Gambar 7. Add Sequence


2.4.3 Proses Transform
Pada tahap transform akan menggunakan fitur Select values dari Pentaho untuk memilih fieldname
dari kolom data penjualan, pada tahap ini akan memilih kolom yang mana saja yang dianggap penting sesuai
kebutuhan dari Data Warehouse. Pemilihan kolom tersebut nantinya akan digunakan sebagai acuan data dari
field target pada proses load Data Warehouse yang nantinya akan menghasilkan output target berupa file
Microsoft Excel dan Database MySql. Pada Gambar 8 berikut bisa dilihat pada bagian gambar yang diwarnai
dengan kotak merah merupakan field name yang diambil dari data penjualan, kemudian nama dari kolom

Implementasi ETL (Extract, Transform, Load) pada Data warehouse Penjualan Menggunakan Tools
Pentaho (I Putu Widia Prasetia)
6  ISSN: 2723-4541 / E-ISSN: 2723-4533

tersebut diubah sesuai dengan keperluan. Nama kolom yang sudah diubah sebelumnya akan menjadi nama
kolom pada output file Data Warehouse nanti.

Gambar 8. Proses Transform (Select Values)

Kemudian pada Load ke Database MySql, hal pertama yang harus dilakukan adalah membuat
koneksi ke server database. Setelah membuat koneksi baru menentukan target tabel yang akan digunakan.
Kemudian terakhir kita harus mengklik menu Get Fields untuk membuat field pada Database secara otomatis
yang ditunjukkan pada kotak merah pada Gambar 9 berikut di bawah ini. Nama dari Table Field tersebut
akan otomatis sama dengan nama field yang sudah dibuat pada proses Transform sebelumnya.

Gambar 9. Proses Load ke Database MySql

3. HASIL DAN PEMBAHASAN


Hasil dari pengolahan data penjualan Superstore menggunakan tools Pentaho adalah dengan
dihasilkan dua buah file output berupa file Microsoft Excel dan Database MySql yang berisi data penjualan
berdasarkan segmentasi tipe pembeli. Laporan jumlah penjualan berdasarkan masing-masing Segment yaitu,
Consumer, Home Office, Corporate selama tahun 2014-2017.

TIERS Information Technology Journal, Vol. 2, No. 1, Juni 2021:39-47


TIERS Information Technology Journal  7

Gambar 10. Hasil Output Segment Consumer di Database MySql

Gambar 11. Hasil Output Segment Corporate di Microsoft Excel

4. KESIMPULAN DAN SARAN


4.1. Kesimpulan

Penulis mencoba untuk mengimplementasikan metode ETL (Extract, Transform, Load) pada sebuah
Data warehouse yang dibangun dengan tujuan menganalis setiap segment dari penjualan sebuah Superstore
dari beberapa tahun. Analisis pada Date Warehouse ini nantinya akan digunakan sebagai laporan dalam
kebutuhan manajemen perusahaan dalam menentukan strategi penjualan produk kedepannya. Hasil dari
analisis Data warehouse sangat berpengaruh terhadap keputusan-keputusan penting yang akan diambil oleh
perusahaan. Maka dari itu data yang sebelumnya acak, kemudian diolah dengan ditransformasikan menjadi
sebuah data yang lebih konsisten dan akurat sehingga menjadi informasi yang sangat berguna bagi
perusahaan. Informasi tersebut dituangkan ke dalam sebuah file sehingga mempermudah dalam membaca
dan mengerti apa isi dari informasi tersebut.

4.2. Saran

Implementasi ETL (Extract, Transform, Load) pada Data warehouse Penjualan Menggunakan Tools
Pentaho (I Putu Widia Prasetia)
8  ISSN: 2723-4541 / E-ISSN: 2723-4533

Pada penelitian analisis laporan ini dihasilkan file-file transformasi Pentaho yang mampu
menghasilkan laporan sesuai dengan kebutuhan manajemen perusahaan yang akan digunakan sebagai
pertimbangan dalam pengambilan keputusan perusahaan dalam menerapkan strategi penjualan yang tepat.
Laporan ini sebenarnya masih bisa dianalisis lebih detail dan mendalam lagi dengan analisis region dan
kategori produk, yang akan menghasilkan sebuah laporan seperti pada Region mana saja suatu kategori
produk tertentu terjual secara banyak dan paling diminati. Kemudian lebih spesifik lagi pada State/Negara
Bagian mana suatu produk terjual banyak dan paling diminati oleh konsumen.
UCAPAN TERIMAKASIH
Ucapan terima kasih disampaikan oleh penulis kepada Tuhan Yang Maha Esa yang telah memberi
semua anugerahnya sehingga dapat melancarkan semua proses demi proses dalam pembuatan artikel ini.
Tidak lupa penulis juga mengucapkan terima kasih banyak kepada bapak Ir. Adie Wahyudi Oktavia Gama,
S.T., M.T., I.P.M., ASEAN Eng selaku dosen pengampu dari mata kuliah Data warehouse yang sudah
bersedia membimbing dalam mata kuliah ini serta tidak lupa selalu memberi arahan sehingga ilmu yang
didapatkan dapat diimplementasikan melalui artikel ilmiah ini.

DAFTAR RUJUKAN
[1] Khotimah, Khusnul., Sriyanto. (2016). Perancangan dan Implementasi Data warehouse untuk
Mendukung Sistem Akademik (Studi Kasus pada STKIP Muhammadiyah Kota Sukabumi). Jurnal TIM
Darmajaya. Vol. 02 No. 01: 94-107
[2] Chandra Eko Wahyudi Utomo. (2019). Implementasi Business Intelligent dalam e-Tourism Berbasis Big
Data. Journal of Tourism and Creativity. Vol.3 No.2 Juli 2019: 163-178.
[3] Muchtar, YC., Qamariah, I. (2016). Persiapan Internasionalisasi UKM Melalui Intelijen Bisnis (Business
Intelligence) dan Inovasi yang Dimoderasi oleh Lingkungan Bisnis Eksternal. National Conference of
Applied Sciences, Engineering, Business and Information Technology.
[4] Hilman, M., Djamaludin. (2018). Analisis Faktor Optimalisasi Proses ETL Pada Data warehouse
Sebagai Pendukung Pengambilan Keputusan Management Dengan Business Intelligence. Faktor Exacta
11 (1): 24-34.
[5] Witjaksono, R Wahjoe., Wiyogo Mardiyanto., Wicaksono Prima Nanda. (2015) Perancangan Aplikasi
Business Intelligence Pada Sistem Informasi Distribusi PT Pertamina Lubricant Menggunakan Pentaho.
Jurnal Rekayasa Sistem & Industri. Volume 2 Nomor 2. 12-18.
[6] Saraswati Ni Wayan Sumartini., Martarini Ni Made Lisma. (2020). Extract Transform Loading Data
Absensi STMIK STIKOM Indonesia Menggunakan Pentaho. Jurnal MATRIK. Vol.19 No.2. 273-281.
[7] Putri, Pipit M., Gunawan, Syam., Shubuh, Darmawan. (2018). Perancangan Data warehouse dan
Penerapannya pada Sistem Informasi Penjualan Menggunakan Tools Pentahoo dan Tableau. Jurnal
Informatika & Komputasi. Vol. 12 - Nomor 1. 15-21.
[8] Andri., Marlindawati. (2015). Pengelompokkan Minat Belajar Mahasiswa Menggunakan Teknik Data
Mining Dengan Metode Clustering. Jurnal Ilmiah MATRIK. Vol.17 No.1 67-76.
[9] Hidayat, Luky., Permanasari, Adhistya Erna., Ardiyanto, Igi. (2017). Perancangan Data warehouse E-
Procurement Pada Instansi Pemerintahan. Seminar Nasional Inovasi Dan Aplikasi Teknologi Di Industri
2017. B37.1-B37.6
[10] Darudiato, Suparto. (2010). Perancangan Data warehouse Penjualan untuk Mendukung Kebutuhan
Informasi Eksekutif Cemerlang Skin Care. Seminar Nasional Informatika 2010 (semnasIF 2010). E-350
- E-359.

TIERS Information Technology Journal, Vol. 2, No. 1, Juni 2021:39-47

Anda mungkin juga menyukai