Metode Data Mining

Dalam melakukan pengumpulan informasi tentunya terdapat metode, metode tersebut akan membantu dalam proses menemukan data. Data Mining in Indonesia akan menyediakan perencanaan dari ide hingga implementasi akhir.

 

1. Proses Pengambilan Data

Bagaimana proses pengambilan data? Tadi di atas sudah dijelaskan tentang KDD atau knowledge discovery (mining) in databases. Dengan KDD tersebut itulah kamu dapat melakukan proses pengambilan data.

Proses atau tahapan-tahapan tersebut dimulai dari data mentah dan berakhir dengan pengetahuan atau informasi yang telah diolah. Nah proses tersebut sebagai berikut :

  1. Data Cleansing, proses dimana data-data yang tidak lengkap, mengandung error dan tidak konsisten dibuang dari koleksi data. Ketahui juga data lifecycle management untuk mengetahui tentang pengolahan data.
  2. Data Integration, proses integrasi data dimana yang berulang akan dikombinasikan.
  3. Selection, proses seleksi atau pemilihan data yang relevan terhadap analisis untuk diterima dari koleksi data yang ada.
  4. Data Transformation, proses transformasi data yang sudah dipilih ke dalam bentuk mining procedure melalui cara dan agresi data.
  5. Data Mining, proses yang paling penting dimana akan dilakukan berbagai teknik yang diaplikasikan untuk mengekstrak berbagai pola-pola potensial untuk mendapatkan data yang berguna.
  6. Pattern Evolution, sebuah proses dimana pola-pola menarik yang sebelumnya sudah ditemukan dengan identifikasi berdasarkan measure yang telah diberikan.
  7. Knowledge Presentation, merupakan proses tahap terakhir, dalam hal ini digunakan teknik visualisasi yang bertujuan membantu user dalam mengerti dan menginterpretasikan hasil dari penambangan data.

2. Teknik dalam Proses Penambangan Data

Terdapat berbagai macam teknik yang digunakan dalam proses penambangan data, apa saja teknik yang bisa digunakan dalam proses Data Mining?

  1. Predictive Modeling, terdapat dua teknik yaitu Classification dan Value Prediction.
  2. Database Segmentation, melakukan partisi database menjadi sejumlah segmen, cluster, atau record yang sama.
  3. Link Analysis, sebuah teknik untuk membuat hubungan antara record yang individu atau sekumpulan record dalam database.
  4. Deviation detection, sebuah teknik untuk mengidentifikasi outlier yang mengekspresikan sebuah deviasi dari ekspektasi yang sudah diketahui sebelumnya.
  5. Nearest Neighbour, yaitu teknik yang memprediksi pengelompokan, teknik ini sendiri merupakan teknik yang tertua yang digunakan dalam data mining.
  6. Clustering, merupakan teknik untuk mengklasifikasikan data berdasarkan kriteria masing-masing data.
  7. Decision Tree, merupakan teknik generasi selanjutnya, dimana teknik ini adalah sebuah model prediktif yang dapat digambarkan seperti pohon. Setiap node yang terdapat dalam struktur pohon tersebut mewakili sebuah pertanyaan yang digunakan untuk menggolongkan data.