DATA MINING & MACHINE LEARNING
DATA MINING
‣ Perangkat lunak yang digunakan untuk menemukan polapola tersembunyi maupun hubungan-hubungan yang terdapat dalam basis data yang besar dan menghasilkan aturan-aturan yang digunakan untuk memperkirakan perilaku di masa medatang
‣ Data mining sering dikatakan berurusan dengan “penemuan pengetahuan” dalam basis data. Suatu aturan yang dihasilkan oleh data mining misalnya seperti berikut : “Kebanyakan pembeli mobil Forsa adalah wanita berusia di atas 30 tahun”
APLIKASI DATA MINING
TEKNOLOGI UNTUK DATA MINING
‣ Pada sistem seperti ini, pemakai akan dibantu untuk
menemukan sendiri pola dari sejumlah data berukuran
besar dengan didasarkan visualisasi oleh data mining
DATA MINING : VISUALISASI DATA
APA YANG KOMPUTER PELAJARI?
‣ Komputer tidak dapat mendengar dan pastinya tidak akan
dapat membedakan suar normal dan suara tidak normal.
‣ Suara, dapat direpresentasikan sebagai pola gelombang
seperti gambar dibawah ini, yang sebenarnya merupakan
sederetan bilangan real yang diproyeksikan kedalam bentuk
grafik.
‣ Komputer akan sangat memahami deretan angka tersebut!
‣ Sebagai contoh, sebuah komputer dapat dengan mudah
diprogram untuk dapat mencari pada sederetan string apakah
mengandung angka “3” didalamnya atau tidak.
‣ Pada permasalahan monitoring gearbox helicopter, diasumsikan
bahwa berfungsi atau tidaknya gearboxes akan menghasilkan suara
yg berbeda. Maka, deretan nilai yang merepresentasikan suara
tersebut akan mempunyai karakteristik yang berbeda.
‣ Pada kenyataanya nernagai karakteristik mempunyai kategori yg
berbeda, dan akan terlalu sulit untuk digambarkan.
‣ Oleh karena itu, hal tersebut tidak dapat diprogram, tapi perlu
dipelajari oleh komputer.
‣ Banyak cara komputer dapat mempelajari bagaimana mereka
menemukan perbedaa dari dua pola ( decision trees, neural networks,
bayesian networks, dll.) inilah yang dipelajari dalam Machine
Learning!
DEFINISI MACHINE LEARNING
Sebuah program komputer dikatakan belajar dari
pengalaman/experience [E] sehubungan dengan
beberapa tugas/task [T] dan mengukur kinerja/
performance [P], jika kinerjanya pada tugas-tugas [T], yang
diukur dengan [P,] meningkatkan dengan pengalaman [E].
MENGAPA MACHINE LEARNING DIPERLUKAN?
‣ Beberapa tasks tidak dapat didefinisikan dengan baik, kecuali dengan contoh
(mengenali orang).
‣ Relasi dan korelasi dapat tersembunyi dalam data dalam jumlah besar. Machine
Learning/Data Mining dapat menemukan relasi tersebut.
‣ Seorang designers seringkali menghasilkan mesin yang tidak dapat bekerja seperti
yang diharapkan untuk bekerja pada lingkungannya dimana mereka digunakan.
‣ Jumlah pengetahuan yang tersedia tentang tugas-tugas tertentu mungkin terlalu
besar untuk pengkodean eksplisit oleh manusia (misalnya, diagnostik medis)
‣ Lingkungan berubah seiring waktu
‣ Pengetahuan baru tentang tugas terus-menerus ditemukan oleh manusia. Mungkin
sulit untuk terus sistem re-desain “secara manual"
BIDANG ILMU YG BERKAITAN
‣ Statistik: Bagaimana cara terbaik menggunakan sample dari distribusi probabilitas
yang tidak diketahui untuk mengetahui dari distibusi mana sampel baru diambil.
‣ Brain Model: Unsur-unsur non-linear dengan input tertimbang (Artificial Neural
Networks) telah diusulkan sebagai model sederhana neuron biologis
‣ Adaptive Control Theory: Bagaimana menangani pengendalian proses yang
memiliki parameter yang tidak diketahui tetapi harus diestimasi selama operasi?
‣ Psychology: Bagaimana model kinerja manusia pada berbagai tugas learning?
‣ Arificial Intelligence: Bagaimana menulis algoritma yang mampu memperoleh
pengetahuan manusia, setidaknya, seperti manusia?
‣ Evolutionary Models: Bagaimana memodelkan aspek-aspek tertentu dari evolusi
biologi untuk meningkatkan kinerja program komputer?
CONTOH DESAIN LEARNING SYSTEM
1. Mendeskripsikan Problem
2. Memilih Training Experience
3. Memilih Target Function
4. Memilih Representasi Target Function
5. Memilih Function Approximation Algorithm
6. Design Akhir
ISSUE PADA MACHINE LEARNING
‣Algoritma apa yang tersedia untuk belajar konsep?
Seberapa baik mereka lakukan?
‣ Berapa banyak data pelatihan yang cukup untuk belajar
konsep dengan keyakinan yang tinggi?
‣ Kapan hal itu berguna terhadap pengetahuan
sebelumnya?
‣ Adalah beberapa pelatihan lebih berguna daripada yang
lain?
‣ Apa saja tugas terbaik bagi sistem untuk belajar?
‣ Apa cara terbaik bagi sistem untuk mewakili pengetahuan?
0 Response to "DATA MINING & MACHINE LEARNING"
Posting Komentar