Definisi Data Mining
data mining
adalah teknik proses pencarian pola dangan memperkerjakan satu atau lebih
teknik(pola) pembelajaran komputer untuk menganalisis suatu dengan cara
otomatis. metode atau algoritma data mining sangat bervariasi. pemilihan metode
atau algoritma yang
tepat sangat bergantung pada
tujuan dan proses
knowledge discovery in
database (KDD). KDD sendiri
adalah sebuah penerapan metode saintifik pada data mining. dalam konteks ini
data mining adalah suatu langkah dari proses kdd. adapun teknik
yang digunakan pada
proses data mining
adalah dengan teknik decision tree. data mining juga mempunyai nama alternatif,
walaupun definisi eksaknya berbeda, sperti analisis pola, arkeologi data,
intelegensia bisnis, serta pemanenan informasi. data mining diperlukan pada
saat data tersedia terlalu banyak.
Definisi Decision Tree
Decision
Tree adalah metode prediksi yang sangat kuat. Metode ini mengubah fakta yang
besar menjadi pohon keputusan yang mempresentasikan aturan aturan yang mudah
dipahami. dan mereka juga dapat diekspresikan dalam bentuk basis data seperti
SQL untuk mencari record pada data terntentu.
Nama lain dari decision tree adalah CART (Classification and Regression
Tree). Dimana metode ini merupakan gabungan dari dua jenis pohon, yaitu
classification tree dan juga regression tree.
Decision tree adalah salah satu metode klasifikasi yang paling populer,
karena mudah untuk diinterpretasi oleh manusia. Decision tree adalah model
prediksi menggunakan struktur pohon atau struktur berhirarki. Konsep dari pohon
keputusan adalah mengubah data menjadi decision tree dan aturan-aturan
keputusan. Manfaat utama dari penggunaan decision tree adalah kemampuannya
untuk mem-break down proses pengambilan keputusan yang kompleks menjadi lebih
simple, sehingga pengambil keputusan akan lebih menginterpretasikan solusi dari
permasalahan.
Dalam penerapannya dalam bidang kesehatan data mining digunakan untuk
mencegah adanya kejadian medical error, yang terbagi menjadi 3 mekanisme besar
yaitu:
1. Pencegahan
2. Respon cepat
3. Umpan balik
Data mining pun sudah banyak diterapkan dalam bidang kesehatan,
contohnya sistem untuk memprediksi penyakit hipertensi pada kehamilan.
Hipertensi merupakan salah satu masalah yang paling sering muncul pada ibu
hamil, masalah kesehatan tersebut jika berlanjut maka dapat menyebabkan
kematian pada ibu dan janin.
Permasalahan tersebut dapat dicegah dengan memprediksi dengan
menggunakan data mining. Faktor pendukung yang dapat mempengaruhi penyakit
hipertensi pada ibu hamil yaitu berdasarkan usia, berat badan, riwayat
hipertensi, dan paritas.
Metode data mining yang digunakan adalah Knowledge Discovery in Database
(KDD) yang terdiri dari beberapa tahapan, yaitu Cleaning and Integration,
Selection and Transformation, Data mining, dan Evaluation and Interpretation.
Teknik yang digunakan adalah decision tree (pohon keputusan) yang menggunakan
algoritma C4.5 yang akan menghasilkan pola berupa rules untuk memprediksi
penyakit hipertensi pada ibu hamil.
Meski memiliki banyak kelebihan, namun bukan berarti metode ini tidak
memiliki kekurangan. Decision tree ini bisa terjadi overlap, terutama ketika
kelas dan kriteria yang digunakan sangat banyak tentu saja dapat meningkatkan
waktu pengambilan keputusan sesuai dengan jumlah memori yang dibutuhkan.Dalam
hal akumulasi, decision tree juga seringkali mengalami kendala eror terutama
dalam jumlah besar. Selain itu, terdapat pula kesulitan dalam mendesain
decision tree yang optimal. Apalagi mengingat kualitas keputusan yang
didapatkan dari metode decision tree sangat tergantung pada bagaimana pohon
tersebut didesain.
Terlepas dari kekurangan dan kelebihan dari decision tree, metode ini
banyak digunakan lebih lanjut dalam berbagai pengolahan data. Mulai dari data
mining dan juga machine learning. Dalam dunia kerja, decision tree sendiri
sangat berguna untuk penilaian credit scoring. Jika anda pernah mengajukan
kredit yang diproses secara instan, nah anda sudah mempunyai pengalaman dari
decision tree.
Opini
menurut
saya decision tree pada data mining sangatlah membantu di bidang kesehatan,
karena kecepatanya dalam memproses data dan umpan balik yang akurat , dengan ini
kita bisa mencegah medical error dengan sangat efektif.
tetapi
kelemahan pada decision tree ini adalah membutuhkan memori yang besar untuk
memproses data yang besar dan juga membutuhkan kecepatan processor yang cepat
untuk memproses data tersebut, jadi kemungkinan cuma beberapa rumah sakit yang
bisa mengimplementasikan teknologi tersebut dengan kata lain belum bisa merata.
Referensi
https://www.kompasiana.com/errily/5c8e460d3ba7f77e1f389a12/implementasi-data-mining-bidang-kesehatan