Tutorial Microsoft Decision Tree

Dita_lsastri8
5 min readJun 16, 2021

--

Data Mining

Berbicara Data mining tentulah yang terpikirkan pertama sekali ialah Data. Jadi, Data mining itu apa sebenarnya? mengutip dari investopedia Data mining adalah proses yang digunakan oleh perusahaan untuk mengubah data mentah menjadi informasi yang bermanfaat atau sering dikenal juga sebagai penambangan data. Penambangan data adalah proses menemukan masalah, memikirkan solusi, menguji model penambangan data pada kumpulan data uji dan menerapkan satu atau lebih model pengujian ini adalah proses melingkar yang terus meningkatkan analisis data seiring waktu. Membangun model penambangan adalah bagian dari proses yang lebih besar yang mencakup segala hal mulai dari mengajukan pertanyaan tentang data hingga membuat model penambangan untuk menjawab dari pertanyaan tersebut. Berikut langkah yang dapat dilakukan untuk melakukan penambangan data
mengutip dari microsoft Penambangan data dilakukan dengan enam langkah dasar:
1. Mendefenisikan masalah
Mendefenisikan masalah dengan jelas, mempertimbangkan cara cara bagaimana agar data tersebut dapat menjadi solusi dari permasalahan yang ditemukan. langkah ini termasuk dalam menganalisis kebutuhan bisnis, mendefenisikan ruang lingkup masalah.

sumber:https://docs.microsoft.com/

2. Menyiapkan data
Dalam perusahaan memuat banyak data-data sehingga diperlukan adanya pembersihan data-data yang kurang penting. Pembersihan data diartikan tidak hanya menghapus akan tetapi menemukan korelasi tersembunyi antar data atau mengidentifikasi data yang akurat.

sumber:https://docs.microsoft.com/

3. Menjelajahi data
Menjelajahi atau mengeksplor sumber data, teknik eksplorasi meliputi perhitungan nilai maksimum dan minimum, nilai mean, standar deviasi dan melihat penyebaran data.

sumber:https://docs.microsoft.com/

4. Model bangunan
Membangun model penambangan data dengan membuat struktur penambangan data yang kemudian ditautkan ke sumber data. analisi dari struktur penambangan akan menghasilkan agregat dan informasi statistik

sumber:https://docs.microsoft.com/

5. Menjelajahi dan memvalidasi model
Setelah dihasilkan model penambangan, maka sebelum menerapkannya terhadap lingkungan perlu adanya menguji seberapa baik kinerja model.

sumber: https://docs.microsoft.com/

6. Menyebarkan dan memperbaharui model.
Dengan adanya uji coba untuk mengetahui model mana yang memiliki kinerja yang lebih baik sehingga dapat dibawa kedalam lingkungan produksi untuk diterapkan, dan akan terjadi pembaharuan model setelah peninjauan dan analisis.

sumber:https://docs.microsoft.com/

Dengan langkah diatas maka dapat dilakukan penambangan data yang baik sehingga menghasilkan informasi yang lebih bermanfaat dan berkualitas.

Descriptive models Microsoft: Decision Tree
Dalam proses data mining yang telah dijelaskan di atas terdapat algoritma yang digunakan dalam mempermudah melakukan layanan analisis. Sebuah algoritma dalam data mining ialah satu set heuristik dan perhitungan yang menciptakan model dari data. Untuk menghasilkan model terlebih dahulu algoritma harus dapat menganalisis data.

Algoritma microsoft naive bayes adalah algoritma klasifikasi berdasarkan teorema bayes dan dapat digunakan dalam pemodelan eksplorasi dan prediksi. Algoritma tersebut menghitung probabilitas setiap status dari kolom input dengan mempertimbangkan setiap kemungkinan status dari kolom yang diprediksi.Microsoft Decision Tree adalah salah satu algoritma yang paling umum digunakan dalam pengambilan keputusan.

Decision Tree

sumber: glints.com

Decision tree adalah metode diagram alir yang berbentuk seperti struktur pohon yang mana setiap internal node menyatakan pengujian terhadap suatu atribut, setiap cabang menyatakan output dari pegujian tersebut dan leaf node menyatakan kelas–kelas atau distribusi kelas.Banyak algoritma yang diperbicangkan dalam penelitian akademis Microsoft menerapkan sembilan
dari algoritma penambangan data yang paling umum sebagai bagian dari produk SQL Server. Berikut ini adalah daftar algoritma penambangan data dan beberapa baris informasi tentang penggunaannya dalam memecahkan masalah dunia nyata

  1. Decision Tree
  2. Association Rule
  3. Clustering
  4. Naive bayes
  5. Linear regression dan banyak lagi

Bagaimana Melakukan Decision Tree?
Adapun langkah-langkah yang dapat diikuti untuk melakukan Decision Tree.Database AdventureWorksDW2014 berisi informasi tentang pembeli sepeda. Kami ingin menggunakan itu informasi sebagai variabel input ke algoritma pohon keputusan dan mencari tahu apa yang mendorong seseorang untuk membeli sebuah sepeda. pada SQL server
1. Buka SSDT dan buat proyek analisis dan Penambangan Data. Beri nama proyek modelnya
2. Pilih informasi peniruan identitas dengan akun yang memiliki hak istimewa yang cukup, lalu terima nama default sebagai database
3. Buatlah data source di desainer DSV, klik kanan pada tabel vTargetMail dan klik Jelajahi Data sesuai data source yang digunakan
4. Pilih metode defenisi dari database relational/gudang data yang ada dan pada struktur data klik tombol buat struktur penambangan dengan model penambangan dan pilih Microsoft dari daftar algoritme

create data mining structure

5. Pilih lah database pada saat memilih sumber datanya pilih CustomerKey sebagai kolom Key. Klik Deteksi untuk menyesuaikan tipe konten berdasarkan nilai yang ada untuk setiap kolom.

Content Data

6. Pada jendela buatlah set data masukkan 30% data untuk pengujian
7. Di jendela Create Testing Set, masukkan nama mining structure sebagai target mail mining structure dan ganti nama model Penambangan menjadi Struktur Penambangan Surat Target dan setelah menyelesaikan wizard dapat melihat jendela desainer Struktur Penambangan

Specity the Training Data

8. Pilih kolom Age di tab Mining Structure dan buka jendela Properties. Ubah jenis Konten dari continuous ke discretized, atur dan lakukan konfigurasi diskritisasi buka tab penampil model penambangan. Anda akan melihat microsoft tree viewer sebagai penampil default, yang menunjukkan bahwa struktur pohon keputusan diambil berdasarkan konfigurasi model penambangan dan database yang mendasarinya

9. Pada tab pohon keputusan, atur warna latar belakang ini berarti bahwa latar belakang simpul pohon warna akan diatur sedemikian rupa sehingga variabel BikeBuyer akan menjadi 1

Variabel bike buyer

10. Kita dapat mengubah level simpul pohon keputusan untuk dijelajahi
jalur keputusan yang mendefinisikan variabel input dengan nilai-nilainya yang memainkan peran paling penting untuk mengarahkan sebagian besar pelanggan untuk membeli produk tersebut.

pengimplementasian decision tree

Demikianlah artikel ini saya buat dengan melibatkan beberapa bacaan referensi online, modul dan pendapat yang sekiranya bermanfaat untuk saya tuliskan kembali pada flatform medium saya.
Terimakasih, salam

--

--

Dita_lsastri8

Aku senang berbaur dengan kata, itulah mengapa aku sering merangkai tulisan dengan apa yang kualami disetiap hariku. Aku senang membagikannya <3