KONSEP DATA MINING
OUTLINE
▸ Pengertian Dasar
▸ Arsitektur
▸ Tugas Data Mining
▸ Contoh Penggunaan Data Mining
LATAR BELAKANG
▸ Banyak data yang telah direkam dan disimpan
▸ Transaksi penjualan di Supermarket
▸ Transaksi perbankan dan Kartu Kredit
▸ Log kunjungan WEB ▸ Akuisisi data dalam penelitian (sosial, kesehatan,…)
▸ Sistem Komputer semakin cepat dan ekonomis (Moore’s Law)
▸ Kebutuhan berkompetisi dengan strategi yang tepat semakin meningkat
TRANSFORMASI DIGITAL DATA MINING
LEDAKAN PERTUMBUHAN DATA
PENGERTIAN YANG SALAH
ARSITEKTUR DATA MINING
ARSITEKTUR DATA MINING
A. Knowledge Base
Domain Knowledge yang digunakan untuk memberi petunjuk pencarian atau mengevaluasi hasil pola.
B. Data Mining Engine
Terdiri dari sekumpulan model fungsional seperti characterization, association, classification, cluster analysis, evaluation and deviation analysis.
C. Pattern Evaluation Module
Komponen yang berinteraksi dengan modul data mining untuk pencarian pola.
D. GUI (Graphical User Interface)
Modul yang mempermudah user berinteraksi dengan sistem data mining.
TUGAS DATA MINING
METODE DALAM DATA MINING
PREDICTIVE - CLASSIFICATION
METODE POHON KEPUTUSAN
PREDICTIVE – TIME SERIES ANALYSIS
▸ Time series data : sekuens data yang nilainya berubah setiap interval waktu tertentu.
▸ Time series data dapat dipresentasikan dalam bentuk grafik atau kurva yang menunjukkan fungsi sebuah variabel data terhadap satuan waktu.
▸ Metode : Neural Network (model Backpropagation, multi layer perceptron)
▸ Aplikasi : memprediksikan indeks harga saham
PREDICTIVE - REGRESSION
A. Regression vs Classification :
▸ Regression diterapkan untuk mengklasifikasikan target data numerik
▸ Classification untuk mengklasifikasikan target data kategorial
B. Aplikasi : prediksi nilai penjualan yang akan datang berdasarkan trend data penjualan tahun sebelumnya.
C. Algoritma : Support Vector Machine (SVM), Generalized Linear Model (GLM)
DESCRIPTIVE - CLUSTERING
▸ Mengidentifikasi kelompok alami dari data berdasarkan kemiripan atribut : seringkali disebut juga Segmentation
▸ Unsupervised Method : tidak satupun atribut yang digunakan untuk memandu proses pembelajaran (tidak ada label)
▸ Algoritma : k-Means, k-Medoid, Fuzzy C-Means, Subtractive, Mountain, Hierarki
WEB DOCUMENT CLUSTERING
▸ Tujuannya mencari gugus dokumen WEB yang mirip berdasarkan kemunculan istilah penting
▸ Pendekatan: mengidentifikasi istilah yang sering muncul pada setiap dokumen, mengukur kemiripan berdasarkan frequensi kemunculan istilah pada dokumen lainnya
▸ Hasil: WEB search engine memunculkan dokumen dokumen yang mirip (dalam 1 gugus) berdasarkan istilah yang dicari
SEGMENTASI PASAR
A. Tujuan: mencari gugus segmentasi pasar berdasarkan data transaksi untuk keperluan marketing
B. Pendekatan:
▸ mempersiapkan data transaksi beserta atribut data pelanggan berdasarkan geografi dan data pribadi lainnya
▸ mencari gugus pelanggan yang mirip berdasarkan atribut atribut tersebut
▸ melakukan observasi perilaku pasar berdasarkan gugusgugus pelanggan yang ditemukan
C. Hasil : Strategi marketing yang tepat sasaran
DESCRIPTIVE – ASSOCIATION RULE
▸ Disebut juga Market Basket Analysis.
▸ Menganalisa tabel transaksi penjualan dan mengidentifikasi produk-produk yang seringkali dibeli bersamaan oleh customer
▸ Untuk mengidentifikasi kelompok kesamaan dari produk dan kebiasaan apa yang terjadi guna kepentingan cross-selling
1. Untuk mencari produk apa yang biasanya terjual bersamaan
2. Untuk mencari tahu apa aturan yang menyebabkan kesamaan tersebut.
DESCRIPTIVE – SEQUENCE ANALYSIS
▸ Digunakan untuk mencari pola pada serangkaian kejadian yang disebut dengan Sequence.
▸ Contoh rangkaian klik pada sebuah website berisi rentetan URL.
▸ Implementasi : memodelkan pembelian oleh pelanggan sebagai sebuah sequence (rangkaian) data :
1. Pertama-tama seorang pelanggan membeli komputer
2. kemudian membeli speaker
3. dan akhirnya membeli sebuah webcam.
RANGKAIAN KLIK PADA SEBUAH WEBSITE BERITA
▸ Garis melambangkan transisi antar kategori URL tersebut.
▸ Setiap transisi dikelompokan dengan sebuah bobot yang menggambarkan kemungkinan transisi antara satu URL dan URL yang lain.
0 Response to "KONSEP DATA MINING"
Posting Komentar