KONSEP DATA MINING

 

OUTLINE

▸ Pengertian Dasar 

▸ Arsitektur 

▸ Tugas Data Mining 

▸ Contoh Penggunaan Data Mining


LATAR BELAKANG

▸ Banyak data yang telah direkam dan disimpan 

▸ Transaksi penjualan di Supermarket 

▸ Transaksi perbankan dan Kartu Kredit 

▸ Log kunjungan WEB ▸ Akuisisi data dalam penelitian (sosial, kesehatan,…) 

▸ Sistem Komputer semakin cepat dan ekonomis (Moore’s Law) 

▸ Kebutuhan berkompetisi dengan strategi yang tepat semakin meningkat


TRANSFORMASI DIGITAL DATA MINING








LEDAKAN PERTUMBUHAN DATA







DEFINISI DATA MINING









PENGERTIAN YANG SALAH









ARSITEKTUR DATA MINING











ARSITEKTUR DATA MINING

A. Knowledge Base

      Domain Knowledge yang digunakan untuk memberi petunjuk pencarian atau mengevaluasi hasil pola.

B. Data Mining Engine

     Terdiri dari sekumpulan model fungsional seperti characterization, association, classification, cluster analysis, evaluation and deviation analysis.

C. Pattern Evaluation Module

     Komponen yang berinteraksi dengan modul data mining untuk pencarian pola.

D. GUI (Graphical User Interface)

     Modul yang mempermudah user berinteraksi dengan sistem data mining.


TUGAS DATA MINING









METODE DALAM DATA MINING








PREDICTIVE - CLASSIFICATION











METODE POHON KEPUTUSAN









PREDICTIVE – TIME SERIES ANALYSIS

▸ Time series data : sekuens data yang nilainya berubah setiap interval waktu tertentu. 

▸ Time series data dapat dipresentasikan dalam bentuk grafik atau kurva yang menunjukkan fungsi sebuah variabel data terhadap satuan waktu. 

▸ Metode : Neural Network (model Backpropagation, multi layer perceptron) 

▸ Aplikasi : memprediksikan indeks harga saham



PREDICTIVE - REGRESSION

A. Regression vs Classification :

▸ Regression diterapkan untuk mengklasifikasikan target data numerik 

▸ Classification untuk mengklasifikasikan target data kategorial 

B. Aplikasi : prediksi nilai penjualan yang akan datang berdasarkan trend data penjualan tahun sebelumnya.

C. Algoritma : Support Vector Machine (SVM), Generalized Linear Model (GLM)



DESCRIPTIVE - CLUSTERING

▸ Mengidentifikasi kelompok alami dari data berdasarkan kemiripan atribut : seringkali disebut juga Segmentation 

▸ Unsupervised Method : tidak satupun atribut yang digunakan untuk memandu proses pembelajaran (tidak ada label) 

▸ Algoritma : k-Means, k-Medoid, Fuzzy C-Means, Subtractive, Mountain, Hierarki


WEB DOCUMENT CLUSTERING

▸ Tujuannya mencari gugus dokumen WEB yang mirip berdasarkan kemunculan istilah penting

 ▸ Pendekatan: mengidentifikasi istilah yang sering muncul pada setiap dokumen, mengukur kemiripan berdasarkan frequensi kemunculan istilah pada dokumen lainnya 

▸ Hasil: WEB search engine memunculkan dokumen dokumen yang mirip (dalam 1 gugus) berdasarkan istilah yang dicari


SEGMENTASI PASAR

A. Tujuan: mencari gugus segmentasi pasar berdasarkan data transaksi untuk keperluan marketing

B.  Pendekatan: 

▸ mempersiapkan data transaksi beserta atribut data pelanggan berdasarkan geografi dan data pribadi lainnya 

▸ mencari gugus pelanggan yang mirip berdasarkan atribut atribut tersebut 

▸ melakukan observasi perilaku pasar berdasarkan gugusgugus pelanggan yang ditemukan

C. Hasil : Strategi marketing yang tepat sasaran


DESCRIPTIVE – ASSOCIATION RULE

▸ Disebut juga Market Basket Analysis. 

▸ Menganalisa tabel transaksi penjualan dan mengidentifikasi produk-produk yang seringkali dibeli bersamaan oleh customer 

▸ Untuk mengidentifikasi kelompok kesamaan dari produk dan kebiasaan apa yang terjadi guna kepentingan cross-selling 

    1. Untuk mencari produk apa yang biasanya terjual bersamaan 

    2. Untuk mencari tahu apa aturan yang menyebabkan kesamaan tersebut.



DESCRIPTIVE – SEQUENCE ANALYSIS

▸ Digunakan untuk mencari pola pada serangkaian kejadian yang disebut dengan Sequence.

 ▸ Contoh rangkaian klik pada sebuah website berisi rentetan URL. 

▸ Implementasi : memodelkan pembelian oleh pelanggan sebagai sebuah sequence (rangkaian) data : 

    1.  Pertama-tama seorang pelanggan membeli komputer 

    2. kemudian membeli speaker 

    3. dan akhirnya membeli sebuah webcam.


RANGKAIAN KLIK PADA SEBUAH WEBSITE BERITA


▸ Setiap node adalah sebuah kategori URL. 

▸ Garis melambangkan transisi antar kategori URL tersebut.

 ▸ Setiap transisi dikelompokan dengan sebuah bobot yang menggambarkan kemungkinan transisi antara satu URL dan URL yang lain.

0 Response to "KONSEP DATA MINING"

Posting Komentar