-->

Data Mining || Memahami dan Mengenali Data


DATA MINING. Halo sobat coding, pada kesempatan kali ini, kami akan memberikan edukasi untuk melanjutkan materi belajar Data Mining. kita akan belajar mengenali dan memahami data di Data Mining.

Data Mining akan diproses jika tersedia data. Data menjadi hal mutlak dalam proses data mining, Data akan disusun dari objek atau observasi. suatu observasi, contoh(example) pattern(pola) atau objek biasanya ditandai dengan beberapa atribut. 

Set data disusun dari objek , Objek mewakili suatu entitas, Kumpulan set data disebut dengan database.
Contoh:
  • Database Medis : Pasien, Obat, Perlakuan Medis
  • Database Marketing : Pelanggan, Penjual, Pelayan
  • Database Sekolah : Siswa, Guru, Mata Pelajaran
Setiap objek dalam suatu set data disebut contoh, samples, examples, instances, titik data, tuples. set data biasanya disusun dalam format baris kolom. 
Kualitas data diukur dalam berbagai aspek  antara lain

  • Kelengkapan ( tercatat, tidak tercatat, tidak tersedia, tersedia )
  • Akurasi ( Benar, Salah , Tepat, Tidak Tepat )
  • Konsistensi 
  • Terupdate
  • Bisa dipercaya
  • Bisa diinteprestasikana

Jenis Jenis Atribut Data pada Data Mining

1 Atribut Nominal
Atribut Nominal disebut juga kategorial karena nilainya menggambarkan kategori, kode, atau status yang tidak memiliki urutan, sebagai contoh ada variabel  cuaca  ada hujan  dan tidak hujan , atribut Kelamin  ada 1 laki-laki, 2 perempuan. 
lalu apakah atribut Nominal dapat berupa teks? bisakah bernilai numerik? tentu saja bisa

2 Atribut Biner
Atribut Biner disebut juga dengan atribut Boolean yang merupakan atribut nominal  yang hanya memiliki dua kategori nilai: 0 atau 1, yang biaasnya menyatakan tidak ( 0 ) dan menyatakan ya (1) 
didalam Data Mining atribut Biner dipandang secara khusus karena memili karakter yang unik dan dibedakan menjadi dua yaitu:
a. Atribut biner simetris,  merupakan atribut yang memberikan dampak yang setara misalnya, Jenis Kelamin yang bernilai Pria dan Wanita
b. Atribut biner asimetris, merupakan atribut yang memberikan dampak berbeda secara konvensi bernilai 1 untuk yang jarang terjadi dan bernilai 0 untuk yang umum seperti misalnya Atribut Hasil Test Buta Warna yang memiliki nilai 1 (buta warna) dann 0 (tidak buta warna)

3. Atribut Numerik
Atribut Numerik merupakan kuantitatif yang memiliki nilai berupa kuantitas yang terukur dan dinyatakan dalam nilai nilai bulat (integer) atau riil (real)  Atribut Numerik bisa diskala kan secara interval atau secara rasio, Sebagai Contoh Temperatur Udara dalam satuan Celcius. adalah atribut numerik yang bisa diskalakan interval namun tidak bisa diskalakan secara rasio. 

4. Atribut Ordinal
Atribut Ordinal merupakan atribut yang memiliki nilai yang menggambarkan urutan atau peringkat, namun ukuran perbedaan antara dua nilai yang berurutan tidak diketahui, contoh seperti atribut pelanggan bernilai ( Platinum, Gold, Silver ) pada urutan nilai tidak diketahui seberapa besar perbedaanya. 
Atribut ordinal ini digunakan dalam survei, yaitu untuk penilaian subjektif yang tidak dapat diukur secara objektif, Misalnya seperti survei kepuasan pelanggan untuk menghasilkan atribut berupa 0 (sangat tidak puas),1 (tidak puas),2(puas),3(lumayan puas)

Mengukur Kemiripan dan Ketidakmiripan Data pada Data Mining

Pada aplikasi data mining, terdapat teknik seperti  klastering, outlier, analysis,  dan klasifikasi nearest-neighbourst. kita memerlukan suatu cara untuk menilai seberapa mirip suatu objek dibandingkan dengan objek lainya. ukuran kesamaan (similarity) dan ketidaksamaan (disimilarity) yang disebut sebagai ukuran kedekatan (measure of proximity) 

Data merupakan ladang minyak diera digital saat ini 
LihatTutupKomentar

a