Data Preparation: Pembersihan Data dari Missing dan Noise, serta Pemilihan Atribut yang Relevan

Sdílet
Vložit
  • čas přidán 29. 08. 2024
  • Data Preparation
    Hukum ke 3 dari 9 hukum data mining menurut Tom Khabaza (Tom Khabaza, Nine Laws of Data Mining, 2010 ): Data preparation is more than half of every data mining process. Kita akan menghabiskan 50% usaha dan energi kita untuk urusan data preparation atau preprocessing ketika mengolah data menjadi pengetahuan.
    Materi ini adalah lanjutan materi data mining, setelah konsep dijelaskan, 5 peran data mining diuraikan, kemudian praktek dilakukan dengan Rapidminer. Materi data prepraration akan menguraikan tentang apa yang harus dilakukan supaya kita bisa menyiapkan data, membersihkan data, dan mengurangi noise. Dan akhirnya kita bisa mendapatkan data yang relatif bersih dan rapi, yang kemudian siap diolah menggunakan algoritma data mining.
    Download slide dan dataset: romisatriawaho...
    Romi Satria Wahono Institute
    Blog: romisatriawahon...
    CZcams: / romisatriawahono
    Facebook: / romisatriawahono
    Instagram: / romisatriawahono
    Twitter: / romisw

Komentáře • 59

  • @muhammadrusdianto7697
    @muhammadrusdianto7697 Před 3 lety +3

    Mantaap.. ini nih yg saya tunggu2. Thanks prof. 🙏
    Ditunggu seri selanjutnya.

    • @RomiSatriaWahono
      @RomiSatriaWahono  Před 3 lety +1

      siap lanjut mas

    • @muhammadrusdianto7697
      @muhammadrusdianto7697 Před 3 lety +2

      @@RomiSatriaWahono Prof.. file data examination download dimana ya? (1:01:40) gak ada di file romi-dataset.zip dari web romisatriawahono.net/dm/.

  • @hasbifirmansyah10
    @hasbifirmansyah10 Před 10 měsíci

    Ketika kuliah gak mudeng mudeng, eh setelah lulus sekian lama dengan mengamati tiap detail penjelasannya dengan pelan pelan baru mudeng Pak 😂😂

  • @wiwieksuristiyanti7776

    Terima kasih, Pak Romi... Barokallah selalu buat Pak Romi...

  • @KebijaksanaanSejati
    @KebijaksanaanSejati Před 3 lety

    Alhamdulilah yg ditunggu sudah muncul mantap Pak Romi

  • @suyatnompd6369
    @suyatnompd6369 Před 3 lety

    Mantap Pak Romi ini yang saya tunggu-tunggu..

  • @denisutaji2094
    @denisutaji2094 Před 3 lety

    sangat mencaerahkan, terima kasih Prof.

  • @payobelajar
    @payobelajar Před 3 lety

    terima kasih ilmunya pak romi sangat bermanfaat, izin download materi ya

  • @SUPRIYANTO-od6gt
    @SUPRIYANTO-od6gt Před 3 lety

    ijin download materi bapak romi, terima kasih atas ilmunya

  • @nikomangrustini7553
    @nikomangrustini7553 Před rokem +1

    Ijin bertanya pak, apakah bisa dibuatkan tutorial preprocessing menggunakan google colabs pak?

    • @RomiSatriaWahono
      @RomiSatriaWahono  Před rokem +1

      googling saja mbak, banyak kok, konsep preprocessing itu sama, hanya praktiknya agak beda di tiap tools ..

  • @ydherdn
    @ydherdn Před 3 lety

    Terima kasih pa, ijin download Slide nya .. sukses selalu

  • @sukrisno-6331
    @sukrisno-6331 Před 3 lety

    Izin download ilmunya lagi Pak Romi

  • @ardiantanjung7246
    @ardiantanjung7246 Před 3 lety

    Terima kasih pak, semoga ada pembahasan text mining^^

    • @RomiSatriaWahono
      @RomiSatriaWahono  Před 3 lety

      saya bahas di ujung materi lain sepertinya ... coba ditelusuri saja

    • @ardiantanjung7246
      @ardiantanjung7246 Před 3 lety

      @@RomiSatriaWahono oh setelah saya liat definisi text mining, di wiki. ternyata sudah include (dijelaskan) dalam video ini. terima kasih pak ^^

    • @ardiantanjung7246
      @ardiantanjung7246 Před 3 lety

      @@RomiSatriaWahono saya mampu mengerjakan tugas 1 ^_^ dalam waktu 1 jam haha

  • @fandyfirmansyah6707
    @fandyfirmansyah6707 Před 6 měsíci

    Izin bertanya pak bagaimana cara Kita tentukan data yang kita punya ini harus kita Reduction baik itu feature selection atau ekstrasi

    • @RomiSatriaWahono
      @RomiSatriaWahono  Před 5 měsíci

      pahami konsep data preprocessing yg sudah aku jelaskan

  • @SekolahOtodidak
    @SekolahOtodidak Před 3 lety

    Terima kasih pak. Untuk buku belajar data mining berbahasa indonesia mulai dari pemula ke mahir, mohon rekomendasinya.

    • @RomiSatriaWahono
      @RomiSatriaWahono  Před 3 lety

      pakai buku textbooks bahasa inggris saja mqs ... lebih solid dan sistematis... dan juga diupdate terus setiap 3-4 tahun sekali

  • @efiddwiagustono1254
    @efiddwiagustono1254 Před 3 lety +1

    pak romi, apakah PCA hanya bisa digunakan untuk data numeric saja? saya coba dengan data nominal ada notif "regular attributes must be of type numeric"

  • @rionorman
    @rionorman Před 3 lety

    Pak Romi,
    Mau tanya lagi, kalo ada 10 feature/ciri apakah semuanya harus digunakan?
    Boleh dipilih beberapa saja?
    Metode apa yang digunakan untuk memilihnya?
    Terima kasih

  • @sitihotijah8129
    @sitihotijah8129 Před 2 lety

    Pak mau tanya, feature selection untuk cluster bisa menggunakan yg mana ya?
    Saya sdh coba pakai forward selection dengan kmeans dan menggunakan cluster distance performance tp eror
    Mohon pencerahannya

    • @RomiSatriaWahono
      @RomiSatriaWahono  Před 2 lety

      errornya apa dicek dan dipecahkan sesuai dengan pesan errornya

  • @dukun4310
    @dukun4310 Před 2 lety

    terima kasih pak Romi, apakah algoritma deep learning seperti ccn dan lstm bisa di impelmentasikan pada aplikasi rapidminer ini.?

  • @kautsarmuhammad6519
    @kautsarmuhammad6519 Před 3 lety

    Masih belum ngerti pak untuk istilah over fitting kenapa kurang direkomendasikan. Bisa kasih analogi gak pak?

    • @RomiSatriaWahono
      @RomiSatriaWahono  Před 3 lety

      dibaca lagi slideku ya mas ... dan didengarkan ulang youtubenya ....

  • @rionorman
    @rionorman Před 3 lety

    Pak Romi,
    Saya tanya, terkadang ada data yang memiliki ciri yang sama namun berbeda pada label.
    Misalkan
    No X Y Z Label
    ----------------------------------------
    1. a c e Y
    2. a c e N
    3. a c e N
    apa yang harus dilakukan terhadap data tersebut? Apakah yang nomor 1 dirubah labelnya jadi N karena dominan N pada ciri tersebut?
    Terima Kasih Pak

    • @RomiSatriaWahono
      @RomiSatriaWahono  Před 3 lety

      hmmmm harusnya dibiarkan saja ... nanri algoritma yg akan memfilter sendiri kondisi itu ....

    • @rionorman
      @rionorman Před 3 lety

      @@RomiSatriaWahono baik terima kasih Pak

  • @rizalpurnama3535
    @rizalpurnama3535 Před 3 lety

    Pak mau tanya, sy kan mau nyoba Asosiasi pake fp-grwoth.
    Data transaksi saya seperti ini :
    Nota01 || Sabun
    Nota01 || Handuk
    Nota02 || Handuk
    Nota02 || Sikat
    Saya mau rubah datanya jadi kyak contoh dataset transaksi dari pak Romi, jadi kyak gini .
    Nota. || Sabun || Handuk || Sikat
    Nota01 || 1 || 1 || 0
    Nota02 || 0 || 1 || 1
    Caranya gmn pak, pake operator apa?
    Soalnya sy coba cari d google dan CZcams kesulitan ga bisa Nemu.

    • @RomiSatriaWahono
      @RomiSatriaWahono  Před 3 lety

      lihat di youtubeku yg sebelumnya deh ... udah aku bahas .. itu tipe data dibuat binominal saja mas ...

  • @rizalpurnama3535
    @rizalpurnama3535 Před 3 lety

    Terimakasih pak Romi atas ilmunya..😊
    Mau tanya pak, itu Folder examination.nya bisa didownload dmn ya pak?
    Soalnya di folder romi-dataset.RAR yng sy download g ada.🙏🏻🙏🏻

  • @rizalpurnama3535
    @rizalpurnama3535 Před 3 lety

    Maap mau tanya lagi pak..
    Pak saya kan mau mining data transaksi untuk mencari hubungan antar barangnya dengan FP-GROWTH.
    Ada 1000 item barang atau ada 1000 kolom di dataset Saya.
    Masalahnya adalah pas kita import dataset, semua type atribut default.nya polynomial, dan Saya kan harus ngerubah ke binominal.
    Pertanyaanya sy ngerubah type atributnya itu emng satu" sesuai sama tutorial pak Romi atau ada cara yang lebih cepat ?
    Kalo ada, pake operator apa pak?
    Sy sudah cari operator Change type Polynomial to Binominal g ada .
    Berhubung ini kolomnya ada banyak bgt, dan butuh makan waktu klo ngerubah satu persatu.

    • @RomiSatriaWahono
      @RomiSatriaWahono  Před 3 lety

      lha datanya sebenarnya gimana bentuknya? dia bener2 polynominal?

    • @rizalpurnama3535
      @rizalpurnama3535 Před 3 lety

      @@RomiSatriaWahono datanya mentahnya emng polynomial Pak, contohnya ga cuma 0 dan 1 tapi ada juga 2, 3 dst..
      Klo untuk datanya itu bisa sy preprocessing dulu, tapi untuk penentuan tipe atributnya yng sy bingung,
      Gmn cara ganti ke binominal sekaligus.

    • @RomiSatriaWahono
      @RomiSatriaWahono  Před 3 lety

      data binominal itu 0 dan 1 atau beli dan tidak .... jangan2 salah data, fp growth itu data transaksi beli dan tidak lho ...

  • @freskarolansa9126
    @freskarolansa9126 Před 3 lety

    Pak ijin bertanya..Setelah model Kita hasilkan dengan menggunakan Rapidminer apakah bisa Kita deploy ke website atau ke mobile Pak? Mohon penjelasan Pak 🙏
    Terima kasih

    • @RomiSatriaWahono
      @RomiSatriaWahono  Před 2 lety

      search dengan rapidminer model deployment .. banyak library dan API yg bisa baca model yg dihasilkan rapidminer

  • @christofelgrant6798
    @christofelgrant6798 Před 3 lety

    halo pak romi, ijin bertanya? apakah ada jawaban dari ketiga soal ujian yang ada di slide?

    • @RomiSatriaWahono
      @RomiSatriaWahono  Před 3 lety

      coba dijawab dulu ... kirim ke aku via telegram saja hasilnya nanti kita diskusi ...

  • @awosono
    @awosono Před 3 lety

    Izin bertanya pak, untuk Data Analyst apakah pembelajarannya hampir sama seperti Data Scientinst kebetulan saya lulusan Ekonomi dan sangat tertarik untuk mempelajari Data Analyst. Terima Kasih

    • @RomiSatriaWahono
      @RomiSatriaWahono  Před 3 lety

      Banyak naming yg digunakan utk menyebut jobdesc yg dekat, monggi disimak yg 7 tren profesi computing