Tutorial Klasifikasi Algoritma Naive Bayes Classifier dengan Python - Google Colab

Sdílet
Vložit
  • čas přidán 29. 08. 2024
  • Tutorial Klasifikasi Algoritma Naive Bayes Classifier dengan Python - Google Colab
    Link dataset : github.com/feb...

Komentáře • 65

  • @moongoddessbaby
    @moongoddessbaby Před 2 měsíci +1

    Terimakasih banyak kak, sungguh sangat membantu 🙏🙏

  • @lacreativeproduction7544
    @lacreativeproduction7544 Před 3 měsíci +1

    penjelasannya bener bener mudah dipahami, sukses terus kak

  • @furqonfidal876
    @furqonfidal876 Před 6 měsíci +1

    penjelasannya mendalam dan mudah dipahami. sayang ga dilanjutin kak

  • @wintermlnv
    @wintermlnv Před měsícem +1

    cara menaikkan akurasi gimana kak? dataset saya cuma ada 1000 baris

    • @febbisenalestari
      @febbisenalestari  Před měsícem

      @@wintermlnv Menaikkan akurasi bisa dari preprocessing datanya, bisa dari penentuan atribut yg digunakan, bisa dari rasio splitting datanya, bahkan terkadang nilai random state yg digunakan utk splitting data juga berpengaruh

  • @intanuggrahintan7216
    @intanuggrahintan7216 Před měsícem +1

    Kak ditutorialnya ini ada evaluasi presisi dan recall juga?

    • @febbisenalestari
      @febbisenalestari  Před měsícem

      @@intanuggrahintan7216 Ada kak, di bagian classification report

    • @intanuggrahintan7216
      @intanuggrahintan7216 Před měsícem

      Oke kak, terimakasih tutorialnya sangat membantu 😁 sukses terus ya kak

    • @febbisenalestari
      @febbisenalestari  Před měsícem

      @@intanuggrahintan7216 Sama-sama ☺️

  • @user-mp2hv7xw8h
    @user-mp2hv7xw8h Před měsícem +1

    Ketika data set nya di runing muncul pesna error kenapa yah ka

  • @fadiaindahsari7756
    @fadiaindahsari7756 Před 3 měsíci +1

    kak, saya kan mengklasifikasikan potensi bencana menjadi rendah, sedang, tinggi. saya menggunakan salah satu atribut "total kerugian", nah apakah atribut ini harus jadikan bobot begitu kak? misalnya kerugian

    • @febbisenalestari
      @febbisenalestari  Před 3 měsíci

      Kalau total kerugiannya memang berupa kategorikal di-encode jadi 0, 1, 2, dst gitu bisa, tapi kalau pure numerik alias datanya sangat unik satu sama lain, diskalakan pake standardscaler

  • @bellaagustriana1669
    @bellaagustriana1669 Před 2 měsíci +1

    Kak, izin bertanya mengapa nilai akurasi kita itu tidak stabil pada random state nya, padahal percobaan pertama mendapatkan akurasi yang besar lalu percobaan kedua dengan random state yang sama akurasinya kecil

    • @bellaagustriana1669
      @bellaagustriana1669 Před 2 měsíci

      terimakasih kak, jdi menurut kak random state brp yg membuat nilai stabil

    • @febbisenalestari
      @febbisenalestari  Před 2 měsíci

      Sepengalamanku kalo yg digunakan algoritma machine learning sederhana seperti Naive Bayes, selama nilai random state-nya sama, maka akurasinya akan tetap sama meskipun kodenya di-run berulang kali. Sejauh yg kutahu, nggak ada ketentuan mengenai nilai random state yg stabil karena random state hanya berfungsi utk menjaga konsistensi hasil splitting data. Jadi bisa dilakukan eksperimen aja untuk menghasilkan model yg akurasinya tinggi.

    • @bellaagustriana1669
      @bellaagustriana1669 Před 2 měsíci

      @@febbisenalestariterimakasih kak atas penjelasannya, mungkin data masukan saya berubah jadi hasil akurasi nya itu turun kak

  • @stayhealthy21
    @stayhealthy21 Před 8 měsíci +2

    kak, mohon maaf untuk di githubnya kok ngga ada yg menggunakan algoritma naive bayes yah? saya klik link di deskripsi adanya menggunakan KNN🙏

  • @bellaagustriana1669
    @bellaagustriana1669 Před měsícem +1

    Malam kak, izin bertanya kenapa ya kak saya melakukan penelitian mengenai pengenalan pola sidik jari menggunakan naive bayes tetapi akurasi nya kecil, Kira-kira kakak ad solusinya tidak?
    Terimakasih kak

    • @bellaagustriana1669
      @bellaagustriana1669 Před měsícem

      Apakah naive bayes ini memerlukan data puluhan ribu atau dari proses preprocessing nya yg kurang hingga evaluasi nya?

    • @febbisenalestari
      @febbisenalestari  Před měsícem

      @@bellaagustriana1669 Pengenalan pola sidik jari berarti pake data citra ya. Pada umumnya, data yg lebih banyak akan menghasilkan model yg lebih bagus karena model mempelajari data yg lebih beragam. Selain itu, tahap preprocessing juga sangat memengaruhi kualitas model

    • @bellaagustriana1669
      @bellaagustriana1669 Před měsícem

      @@febbisenalestari betul kak data citra sidik jari, nah data yg saya gunakan msih 1000 data mendapatkan hasil naive bayes bru sebesar 40%, berarti hrus dinaikkan lagi datanya ya kak?, dan tahapan preprocessing sendiri sudah saya lakukan sesuai di video ini

    • @febbisenalestari
      @febbisenalestari  Před měsícem

      @@bellaagustriana1669 Tahapan preprocessing data citra & tabular itu beda loh ya. Data citra punya karakteristik tersendiri sehingga preprocessingnya tidak bisa disamakan dengan data tabular (seperti data yg digunakan pada video).

  • @ahmade1238
    @ahmade1238 Před 2 měsíci +1

    kak untuk datasetnya yang format csv bisa ngak pakai kode tersebut ?

    • @febbisenalestari
      @febbisenalestari  Před 2 měsíci

      Bisa. Kodenya tinggal diganti "read_csv", bukan read_excel lagi

  • @ashen7772
    @ashen7772 Před 23 dny +1

    Kak jika dataset saya berbentuk object apakah masih bisa untuk menggunakan code ini?

    • @febbisenalestari
      @febbisenalestari  Před 22 dny

      @@ashen7772 Berbentuk object itu yg bagaimana kak?

    • @ashen7772
      @ashen7772 Před 20 dny

      @@febbisenalestari jadi bukan bentuk numerik melainkan masih bentuk huruf kalimat

    • @febbisenalestari
      @febbisenalestari  Před 7 dny

      @@ashen7772 Kalau yg dimaksud berupa string yg merupakan kategorikal masih bisa. Tapi kalau datanya berupa kalimat misal seperti review/tweet pemrosesannya termasuk analisis sentimen. Lebih kompleks daripada yg di video

  • @irsaaprianti2767
    @irsaaprianti2767 Před 5 měsíci +1

    kak punya saya di bagian standardscaler nya eror, pesannya string tidak dapat dikonversi ke float solusinya gimana yaa kak

    • @febbisenalestari
      @febbisenalestari  Před 5 měsíci

      Yg bisa diskalakan pake standardscaler cuma data angka ya kak. Kalau string nggak bisa 😊🙏

  • @user-lc6po2im6b
    @user-lc6po2im6b Před 5 měsíci +1

    kk kan saya memprediksi tinggi rendahnya minat baca berdasarkan provinsi diindonesia dan hasil prediksinya 1 1 1 0 0 1 nah untuk mengetahui hasil prediksi untuk setiap provinsinya gimna kk? Sedangkan dstu cm angka kk?

    • @febbisenalestari
      @febbisenalestari  Před 5 měsíci

      1 & 0 itu hasil labelisasi/label encoder dari class dataset. Bisa dicek apakah 0 mewakili tinggi atau rendah, trus 1 mewakili apa

  • @uganisme
    @uganisme Před 8 měsíci +1

    kak, kalau ada data yang kosong pada dataset bagaimana? apa yang harus dilakukan?

    • @febbisenalestari
      @febbisenalestari  Před 8 měsíci

      Datasetnya di-preprocessing dulu. Kalau data kosong bisa dihapus atau diisi dengan nilai tertentu

  • @asyfamaulidina1197
    @asyfamaulidina1197 Před 8 měsíci +1

    kak untuk hasil probabilitasnya itu perolehannya dari hitungan mana aja ya?

  • @aimeenatya
    @aimeenatya Před 8 měsíci +1

    kak, kalau dataku ngga kebaca sama colab gimana ya? padahal sudah upload

    • @febbisenalestari
      @febbisenalestari  Před 8 měsíci

      Upload langsung ke colab/github/google drive? Pastikan nama file & codingnya sesuai, misal file csv berarti pake read_csv, file xls pake read_excel, dll

  • @aryasita7478
    @aryasita7478 Před 9 měsíci +1

    Kak mau nanya nih untuk labelencoder penyimpanan en itu bagaimana ya kak

    • @febbisenalestari
      @febbisenalestari  Před 9 měsíci

      Function LabelEncoder-nya disimpan dalam variabel "en" agar lebih ringkas dalam penggunaannya. Jadi tiap kali mau melakukan label encoding data tinggal panggil "en" aja

    • @aryasita7478
      @aryasita7478 Před 9 měsíci

      Untuk masuk di bagian standar scaler menit 11 eror kak

    • @febbisenalestari
      @febbisenalestari  Před 9 měsíci

      Pesan errornya apa kak?

    • @aryasita7478
      @aryasita7478 Před 9 měsíci

      @@febbisenalestari ValueError Traceback (most recent call last)
      in ()
      1 from sklearn.preprocessing import StandardScaler
      2 sc = StandardScaler()
      ----> 3 x_train = sc.fit_transform(x_train)
      4 # scaler_train=sc.fit(x_train)
      5 #x_train_sd=scaler_train.transform(x_train)

  • @user-xv5ni4ze9v
    @user-xv5ni4ze9v Před 8 měsíci +1

    Ka mau tanya, dataset nya harus di upload di github dulu yaa ka?

    • @febbisenalestari
      @febbisenalestari  Před 8 měsíci

      Nggak kak. Bisa diupload langsung ke colab, bisa juga di google drive

  • @yuliafatimah4656
    @yuliafatimah4656 Před 2 měsíci +1

    kak untuk metode random forest apakah bisa?

    • @febbisenalestari
      @febbisenalestari  Před 2 měsíci

      Bisa. Random forest juga algoritma klasifikasi, jadi secara umum codingannya sama. Tinggal ngubah bagian algoritma yg digunakan

  • @RAHMATIRWANDI-rn5th
    @RAHMATIRWANDI-rn5th Před 2 měsíci +1

    link kaggle nya ada ga kak

    • @febbisenalestari
      @febbisenalestari  Před 2 měsíci

      Ini kak
      www.kaggle.com/datasets/joshmcadams/oranges-vs-grapefruit

  • @hendaputririnabrginting0074
    @hendaputririnabrginting0074 Před 9 měsíci +1

    Kak mau nanyak aku di pengskalaannya error , gimana ya kak

  • @nyx32114
    @nyx32114 Před 9 měsíci +1

    ka untuk yang di mnt 9 kok gk jdiya yang untuk

    • @nyx32114
      @nyx32114 Před 9 měsíci

      x_train,x_test,y_train,y_test= train_test_split(x, y , test_size=0.2, ramdom_state=123)

    • @febbisenalestari
      @febbisenalestari  Před 9 měsíci

      Nggak jadinya gimana tuh kak? Muncul pesan error apa?

  • @rohadatulnaesa1647
    @rohadatulnaesa1647 Před 8 měsíci +1

    kak, bisa aku hubungi gak? butuh bantuan eheheh

  • @Trysno_Wara
    @Trysno_Wara Před 4 měsíci +1

    Hallo kk, bisa minta source codenya?

    • @febbisenalestari
      @febbisenalestari  Před 3 měsíci

      Maaf source code yg dipake di video udah nggak ada kak 🥲🙏 Tapi keseluruhan codenya aku tampilin di video kan ya, jadi bisa diikuti aja