5 Jurnal Atau Proceeding Data Mining

 

 5 ARTIKEL (JURNAL ATAU PROCEEDING) YANG MEMBAHA HASIL YANG DIPEROLEH DARI MELAKUKAN DATA MINING

 

 Tugas Konsep Data Mining



Kelompok 5

Nama Kelompok : 

Salsabila Putri Mahdendra (15119863)

Wildan Ramadhani (16119606)

Muhammad Chaerul Juliyanuar (14119066)

Muhammad Rafli Zuchrie (14119345)

 

 

 

Contoh 5 artikel (jurnal atau proceeding) yang membaha hasil yang diperoleh dari melakukan data mining :

 

 

 

 

Sumber:https://ejournal.stipwunaraha.ac.id/index.php/router/article/download/316/282

1.    Penerapan Data Mining untuk Mengklasifikasi Pola Nasabah Menggunakan Algoritma C4.5 pada Bank Bri Unit Anduonohu Kendari

 

Data Yang Digunakan :

 

 

 

 

 

 

 

 

 

 

 

Preprosessing yang digunakan :

Dalam klasifikasi, terdapat target variabel kategori. Sebagai contoh, penggolongan pendapatan dapat dipisahkan dalam 3 kategori, yaitu pendapatan tinggi, pendapatan sedang, pendapatan rendah.

Task Mining :

1.       Metode Interview atau wawancara

Metode wawancara dilakukan dengan melakukan wawancara terhadap pegawai Bank bagian kredit BRI Unit Anduonohu Kendari untuk mendapatkan informasi seputar syarat kredit dan kriteria  kredit.  Selain  itu  juga  untuk mendapatkan data nasabah kredit untuk dijadikan atribut pendukung.

 

2.       Metode Studi Literatur

Pada metode studi literatur, mengumpulkan, membaca, mempelajari, dan mencatat literatur dari jurnal maupun buku yang berkaitan dengan algoritma C4.5. Dari metode studi literatur.

Hasil Yang Diperoleh :

Dari hasil pengujian sistem menggunakan bahasa pemprograman java netbean dengan metode decision tree C4.5 dengan jumlah data sebanyak 81 data record, maka menghasilkan 73 data teridentifikasi benar dan 8 data teridentifikasi salah.

Tools :

Dari hasil  pengujian  menggunakan  software rapidminer dengan metode decision tree C4.5 dengan jumlah data sebanyak 81 data record, maka menghasilkan 72 data teridentifikasi benar dan 9 data  teridentifikasi salah.

 

 

Sumber : https://ejournal.gunadarma.ac.id/index.php/tekno/article/view/1671

 

2.    PENERAPAN TEKNIK DATA MINING UNTUK MENENTUKAN HASIL SELEKSI MASUK SMAN 99 JAKARTA UNTUK SISWA/SISWI SMPN 9 JAKARTA MENGGUNAKAN DECISION TREE.

Data Yang Digunakan :

Noisy Data dan Disorderly Data

Total Nilai UN              KeteraganDiterima

36.9                                Diterima

35.1                           TidakDiterima

37.2                                Diterima

36.95                               Diterima

36.2                                Diterima

37.25                               Diterima

35.25                               Diterima

34.1                           TidakDiterima

31.3                           TidakDiterima

                                        

 

 

Preprocessing :

Metode data mining yang akan dipa- kai adalah decision tree. Algoritma deci- sion tree merupakan salah satu algoritma klasifikasi di dalam data mining yang be- kerja berdasarkan teori informasi (infor- mation theory). Decision tree memiliki beberapa keunggulan yaitu mudah dalam pengembangan sebuah model, mudah dipahami oleh pengguna, dan mampu menangani noisy data dan unknown data.

 

Tesk Mining :

Dalam makalah ini penulis meng- gunakan algoritma C4.5 untuk mem- bangun      sebuah decision tree. Penulis juga menggunakan metode cross validation untuk menghitung estimasi kesalahan (error) dari pohon yang telah dihasilkan (Bramer, 2007). Dengan kata lain, penulis memecahkan data secara acak kedalam 10 bagian (folds) dan secara berulang, masing-masing folds tersebut diperuntuk- kan sebagai training data dan sisanya sebagai test data.

 

Hasil :

 

Dapat dilihat dari hasil pada tabel 5 perbandingan antara hasil WEKA dengan hasil real sebesar 31,37 % bisa dikatakan bahwa yang seharusnya siswa/siswi di SMPN 9 Jakarta yang seharusnya bisa diterima di SMAN 99 Jakarta, tetapi ada sebagian dari mereka tidak berniat untuk memilih SMAN tersebut sehingga yang diterima di SMAN tersebut hanyalah 64 siswa/siswi.

 

Tools :

 

Tools yang digunakan pada penilitian diatas adalah perangkat lunak WEKA yang bersifat opensource dengan metode algoritma decision tree.

 

 

 

 

 

SUMBER :

 

3.     DATA MINING UNTUK MEMPREDIKSI PRESTASI SISWA BERDASARKAN SOSIAL EKONOMI, MOTIVASI, KEDISIPLINAN DAN PRESTASI MASA LALU.

 

 

Data yang digunakan :

 

TP Rate Class

FP Rate

Precision

Recall

F-Measure

ROC

Area

0.933

0.004

0.99

0.933

0.961

0.984

C

0.979

0.012

0.969

0.979

0.974

0.991

B

1

0.043

0.917

1

0.957

0.984

D

0.864

0.003

0.95

0.864

0.905

0.981

A

0.727

0

1

0.727

0.842

0.997

E

W.Avg.0.957

0.018

0.959

0.957

0.956

0.986

 

 

 

Preprocessing :

Penelitian ini menggunakan pendekatan kuantitatif. Tempat Penelitian ini adalah SMK Negeri 4 Surakarta yang beralamat di Jalan LU Adi Sucipto No. 40 Surakarta. Waktu pene- litian dan pengambilan data pada bulan Juni 2013 sampai Desember 2013.

Target/subjek penelitian adalah siswa tingkat X SMK Negeri 4 Surakarta Tahun Pe- lajaran 2013/2014 sejumlah 416 siswa.

 

Tesk Mining :

Penelitian ini mengunakan teknik Deci- sion Tree, CHAID dan regresi ganda untuk melakukan prediksi prestasi belajar siswa SMK Negeri 4 Surakarta berdasarkan status ekonomi orang tua, motivasi, kedisiplinan dan prestasi masa lalu.

 

Hasil :

 

Hasil penelitian berdasarkan tahapan- tahapan proses dalam KDD (Knowledge Data Discovery) sebagai berikut: (1) Data Selection, tahapan ini dilakukan untuk memilih data yang sesuai dengan variabel yang dibutuhkan dalam penelitian. Caranya adalah dengan memilih atau menentukan atribut-atribut data mana yang akan digunakan dalam penelitian dari sekelompok data operasional yang ada. Salah satunya adalah menentukan atribut-atribut un- tuk variabel Sosial Ekonomi Orang Tua yang diambil dari data operasional yaitu Data Priba- di Siswa yang ada di BP/BK sekolah; (2) Pre- processing/Cleaning, proses cleaning tersebut dilakukan terhadap keseluruhan data yang diteliti yang berjumlah 416 siswa. Setelah di- lakukan proses cleaning data sejumlah 416, di- hasilkan data bersih sebanyak 346 record data yang digunakan untuk proses analisis berikut- nya; (3) Transformation, tahap ini menghasil- kan satu recordset data yang siap untuk analisis data; (4) Analisis data.

 

Tools :

Software yang digunakan adalah WEKA 3.6.9 Dan Software  SPSS 16.0.

 

 

 

Sumber :

 

4.    Penerapan data mining dalam kemacetan di Jakarta.

 

 

·         Data Yang Digunakan

Dalam penelitian ini Dataset yang digunakan adalah dataset “Prediksi Kemacetan.xls”, sebagai berikut:

 


 

 

Preprocessing

Penelitian ini bertujuan untuk Mendeteksi Kemacetan Jakarta, Memberikan Solusi terbaik dalam mengurangi Kemacetan Jakarta dengan menerapkan Konsep Business Intelligence. Strategi Bisnis yang di implementasikan pada CRISP-DM

 

Task Mining

Artikel ini menawarkan modelpenerapan Angkot Sekolah online berbasis Business Intelegenciedengan MetodeCRISP-DM dan TSP. Datasetnya yaitu Rekap data Kemacetan jalan Jakarta setiap hari pada Google Maps2017 yang diakses secara online, dataset ini diuji keakuratannya menggunakan Algoritma Decision Tree pada RapidMiner, kemudian dianalisis. Untuk menunjang Penelitian Penulis membuat Survey terhadap 50 Responden tentang Lalu Lintas Jakarta.

Hasil

Hasil pengujian dilakukan untuk mengetahui Akurasi dari Pohon Keputusan Algoritma klasifikasi Decision Tree (C4.5) Kemacetan terparah berada di Daerah- daerah Jakarta. Hasil dibawah merupakan hasil nilai akurasi yang telah dilakukan.

 

 

 

 

 

 

 

 

Sumber : https://journal.ubm.ac.id/index.php/jbase/article/download/2728/2031

 

5.    ANALISIS DATA MINING HOTEL BOOKING MENGGUNAKAN MODEL ID3

 

 

Data yang digunakan:

Sumber untuk data utama yang digunakan dalam penelitian ini adalah dataset hotel booking pada sebuah format .xlsx. Dataset hotel terdiri dari atribut hotel, is canceled, lead time, arrival date year, arrival date month, arrival date week number, arrival date day of month, stays in weekend night, stays in week nights, adults, children, Babies, Meal, country, market segment, distribution channel, is repeated guest, previous cancellations, previous bookings not canceled, reserved room type, assigned room type, booking changes, deposit type, agent, company, days in waiting list, customer type, adr, required car parking spaces, total of special requests, reservation status, dan reservation status date. Lalu, jumlah data pada atribut tersebut berjumlah 10.000 dan terdapat 31 attribute. Di data ini akan menggunakan special attribute yaitu customer type.

 

Preprocessing

Pohon Keputusan (Decision Tree), Pohon Keputusan adalah salah satu metode klasifikasi dan prekdiksi yang paling popular. Pohon Keputusan adalah sebuah flowchart yang berbentuk seperti struktur pohon yang digunakan untuk menentukan arah tindakan dan juga menunjukkan probabilitas statistik. Konsep dari pohon keputusan adalah mengubah data menjadi sebuah pohon keputusan dengan aturan-aturan keputusan. Data dalam pohon keputusan biasanya dinyatakan dalam bentuk tabel yang berisi atribut dan record.

 

 

Task Mining

 

Algoritma yang digunakan dalam penelitian ini adalah algoritma. Dengan menggunakan pemodelan ID3

 

Hasil

Untuk mencari pengumpulan data menjadi data mining, dengan cara memasukan data ke Rapid Miner. Cara memasukanya dengan cara mengunakan Retrieve. Tujuan mengunakan Retrieve yaitu untuk blok mode yang digunakan mengakses data.

 

Tools

Pada tahapan penelitian ini mengikutin tahapan Pohon Keputusan (Decision Tree). Dengan mengunakan seluruh perangkat lunak Rapid Miner dan MS Excel 2008.

 

 

 

 

 

 

 

 

 

Comments

Popular posts from this blog

Konsep Ilmu Budaya Dasar dalam kesastraan

Koefisien Jaccard