5 Jurnal Atau Proceeding Data Mining
5 ARTIKEL (JURNAL ATAU PROCEEDING) YANG
MEMBAHA HASIL YANG DIPEROLEH DARI MELAKUKAN DATA MINING
Tugas Konsep Data
Mining
Kelompok 5
Nama Kelompok :
Salsabila Putri
Mahdendra (15119863)
Wildan
Ramadhani (16119606)
Muhammad
Chaerul Juliyanuar (14119066)
Muhammad Rafli
Zuchrie (14119345)
Contoh 5 artikel (jurnal atau proceeding) yang
membaha hasil yang diperoleh dari melakukan data mining :
Sumber:https://ejournal.stipwunaraha.ac.id/index.php/router/article/download/316/282
1.
Penerapan Data Mining untuk
Mengklasifikasi Pola Nasabah Menggunakan Algoritma C4.5 pada Bank Bri Unit
Anduonohu Kendari
Data Yang Digunakan :

Preprosessing yang
digunakan :
Dalam klasifikasi, terdapat target variabel kategori.
Sebagai contoh, penggolongan pendapatan dapat dipisahkan dalam 3 kategori,
yaitu pendapatan tinggi, pendapatan sedang, pendapatan rendah.
Task Mining :
1.
Metode
Interview atau wawancara
Metode wawancara dilakukan dengan melakukan wawancara
terhadap pegawai Bank bagian kredit BRI Unit Anduonohu Kendari untuk
mendapatkan informasi seputar syarat kredit dan kriteria kredit.
Selain itu juga
untuk mendapatkan data nasabah kredit untuk dijadikan atribut pendukung.
2.
Metode
Studi Literatur
Pada metode studi literatur, mengumpulkan, membaca,
mempelajari, dan mencatat literatur dari jurnal maupun buku yang berkaitan
dengan algoritma C4.5. Dari metode studi literatur.
Hasil Yang Diperoleh :
Dari hasil pengujian
sistem menggunakan bahasa pemprograman java netbean dengan metode decision tree
C4.5 dengan jumlah data sebanyak 81 data record, maka menghasilkan 73 data
teridentifikasi benar dan 8 data teridentifikasi salah.
Tools :
Dari
hasil pengujian menggunakan
software rapidminer dengan metode decision tree C4.5 dengan jumlah data
sebanyak 81 data record, maka menghasilkan
72 data teridentifikasi benar dan 9
data teridentifikasi salah.
Sumber
: https://ejournal.gunadarma.ac.id/index.php/tekno/article/view/1671
2. PENERAPAN TEKNIK DATA MINING UNTUK MENENTUKAN
HASIL SELEKSI MASUK SMAN 99 JAKARTA UNTUK SISWA/SISWI SMPN 9 JAKARTA
MENGGUNAKAN DECISION TREE.
Data Yang Digunakan :
Noisy Data dan
Disorderly Data
Total
Nilai UN KeteraganDiterima
36.9 Diterima
35.1 TidakDiterima
37.2 Diterima
36.95 Diterima
36.2 Diterima
37.25 Diterima
35.25 Diterima
34.1 TidakDiterima
31.3 TidakDiterima
… …
Preprocessing :
Metode data mining
yang akan dipa- kai adalah decision tree. Algoritma deci- sion tree merupakan salah satu
algoritma klasifikasi di dalam data mining yang be- kerja berdasarkan teori
informasi (infor- mation theory).
Decision tree memiliki beberapa keunggulan yaitu mudah dalam pengembangan sebuah model, mudah dipahami oleh pengguna, dan mampu menangani noisy data
dan unknown data.
Tesk
Mining :
Dalam makalah ini penulis meng-
gunakan algoritma C4.5 untuk mem- bangun sebuah decision tree. Penulis
juga menggunakan metode cross validation untuk
menghitung estimasi kesalahan (error)
dari pohon yang telah dihasilkan (Bramer, 2007). Dengan kata lain, penulis
memecahkan data secara acak kedalam 10
bagian (folds) dan secara berulang, masing-masing
folds tersebut diperuntuk- kan sebagai training data dan sisanya sebagai
test data.
Hasil :
Dapat dilihat dari hasil pada tabel 5 perbandingan antara hasil WEKA dengan
hasil real sebesar 31,37 % bisa dikatakan bahwa
yang seharusnya siswa/siswi di SMPN
9 Jakarta yang seharusnya bisa diterima
di SMAN 99 Jakarta, tetapi ada sebagian
dari mereka tidak berniat untuk memilih
SMAN tersebut sehingga yang diterima di SMAN tersebut hanyalah 64
siswa/siswi.
Tools :
Tools yang digunakan pada
penilitian diatas adalah perangkat lunak WEKA yang bersifat opensource dengan
metode algoritma decision tree.
SUMBER :
3. DATA
MINING UNTUK MEMPREDIKSI PRESTASI SISWA BERDASARKAN
SOSIAL EKONOMI, MOTIVASI, KEDISIPLINAN DAN
PRESTASI MASA LALU.
Data yang digunakan :
|
TP Rate Class |
FP Rate |
Precision |
Recall |
F-Measure |
ROC |
Area |
|
0.933 |
0.004 |
0.99 |
0.933 |
0.961 |
0.984 |
C |
|
0.979 |
0.012 |
0.969 |
0.979 |
0.974 |
0.991 |
B |
|
1 |
0.043 |
0.917 |
1 |
0.957 |
0.984 |
D |
|
0.864 |
0.003 |
0.95 |
0.864 |
0.905 |
0.981 |
A |
|
0.727 |
0 |
1 |
0.727 |
0.842 |
0.997 |
E |
|
W.Avg.0.957 |
0.018 |
0.959 |
0.957 |
0.956 |
0.986 |
|
Preprocessing :
Penelitian ini menggunakan pendekatan kuantitatif. Tempat Penelitian ini adalah SMK Negeri
4 Surakarta yang beralamat di Jalan LU Adi
Sucipto No. 40 Surakarta. Waktu pene- litian
dan pengambilan data pada bulan Juni 2013 sampai
Desember 2013.
Target/subjek penelitian adalah siswa tingkat X SMK Negeri 4 Surakarta Tahun Pe- lajaran
2013/2014 sejumlah 416 siswa.
Tesk Mining :
Penelitian ini
mengunakan teknik Deci- sion Tree, CHAID dan regresi ganda
untuk melakukan prediksi
prestasi belajar siswa SMK Negeri 4 Surakarta
berdasarkan status ekonomi orang
tua, motivasi, kedisiplinan dan prestasi
masa lalu.
Hasil :
Hasil penelitian berdasarkan tahapan- tahapan proses dalam KDD (Knowledge Data Discovery) sebagai berikut:
(1) Data Selection, tahapan ini dilakukan untuk memilih data yang sesuai dengan variabel yang dibutuhkan
dalam penelitian. Caranya
adalah dengan memilih
atau menentukan atribut-atribut data mana yang akan digunakan
dalam penelitian dari sekelompok
data operasional yang ada. Salah satunya
adalah menentukan atribut-atribut un- tuk
variabel Sosial Ekonomi Orang Tua yang diambil
dari data operasional yaitu Data Priba- di
Siswa yang ada di BP/BK sekolah; (2) Pre- processing/Cleaning, proses cleaning tersebut dilakukan terhadap keseluruhan data yang diteliti yang berjumlah 416 siswa. Setelah
di- lakukan proses cleaning data sejumlah 416, di- hasilkan data bersih sebanyak 346 record
data yang digunakan untuk proses
analisis berikut- nya; (3) Transformation, tahap ini menghasil- kan satu recordset
data yang siap untuk analisis
data; (4) Analisis
data.
Tools :
Software yang digunakan adalah WEKA 3.6.9 Dan Software SPSS 16.0.
Sumber
:
4.
Penerapan data mining
dalam kemacetan di Jakarta.
·
Data Yang Digunakan
Dalam penelitian ini Dataset yang digunakan
adalah dataset “Prediksi Kemacetan.xls”, sebagai berikut:

Preprocessing
Penelitian ini bertujuan untuk Mendeteksi Kemacetan
Jakarta, Memberikan Solusi terbaik dalam mengurangi Kemacetan
Jakarta dengan menerapkan Konsep Business Intelligence. Strategi Bisnis
yang di implementasikan pada CRISP-DM
Task Mining
Artikel ini menawarkan modelpenerapan Angkot Sekolah
online berbasis Business Intelegenciedengan MetodeCRISP-DM dan
TSP. Datasetnya yaitu Rekap data Kemacetan jalan Jakarta setiap hari pada Google Maps2017 yang diakses secara
online, dataset ini
diuji keakuratannya
menggunakan Algoritma Decision Tree pada RapidMiner, kemudian dianalisis. Untuk
menunjang Penelitian Penulis
membuat Survey terhadap 50 Responden
tentang Lalu Lintas Jakarta.
Hasil
Hasil pengujian dilakukan untuk mengetahui Akurasi dari Pohon Keputusan Algoritma
klasifikasi Decision
Tree (C4.5) Kemacetan terparah berada di Daerah- daerah Jakarta. Hasil dibawah merupakan
hasil nilai akurasi yang telah dilakukan.
Sumber : https://journal.ubm.ac.id/index.php/jbase/article/download/2728/2031
5.
ANALISIS DATA MINING HOTEL BOOKING
MENGGUNAKAN MODEL ID3
Data yang digunakan:
Sumber
untuk data utama yang digunakan dalam penelitian ini adalah dataset
hotel booking pada sebuah format .xlsx. Dataset hotel terdiri
dari atribut hotel, is canceled, lead time, arrival date year, arrival date month, arrival date week number, arrival date day of month, stays in weekend night, stays in week nights, adults,
children, Babies, Meal, country, market segment, distribution channel, is repeated
guest, previous cancellations, previous
bookings not canceled,
reserved room type, assigned room
type, booking changes, deposit type, agent, company,
days in waiting list, customer
type, adr, required
car parking spaces,
total of special
requests, reservation status, dan reservation
status date. Lalu, jumlah data pada atribut
tersebut berjumlah 10.000 dan terdapat 31 attribute. Di data ini akan menggunakan special attribute yaitu customer type.
Preprocessing
Pohon Keputusan (Decision Tree), Pohon Keputusan
adalah salah satu metode klasifikasi dan prekdiksi yang paling popular.
Pohon Keputusan adalah sebuah flowchart
yang berbentuk seperti
struktur pohon yang digunakan untuk menentukan arah tindakan dan juga menunjukkan probabilitas statistik. Konsep dari pohon keputusan
adalah mengubah data menjadi sebuah pohon keputusan
dengan aturan-aturan keputusan. Data dalam pohon keputusan biasanya
dinyatakan dalam bentuk tabel yang berisi atribut dan
record.
Task Mining
Algoritma yang digunakan dalam penelitian ini adalah algoritma. Dengan menggunakan pemodelan
ID3
Hasil
Untuk mencari pengumpulan
data menjadi data mining, dengan cara
memasukan data ke Rapid Miner. Cara memasukanya dengan cara mengunakan Retrieve. Tujuan mengunakan Retrieve yaitu untuk blok mode yang digunakan
mengakses data.
Tools
Pada tahapan
penelitian ini mengikutin tahapan Pohon Keputusan
(Decision Tree). Dengan
mengunakan seluruh perangkat lunak Rapid Miner dan MS Excel 2008.

Comments
Post a Comment