Tutorial Klasifikasi K-Nearest Neighbor (K-NN) dengan Python | KMMI Data Mining with Python 2021

Sdílet
Vložit
  • čas přidán 29. 08. 2024
  • Tutorial Klasifikasi K-Nearest Neighbor (K-NN) dengan Python
    Web IDE : Google Colaboratory
    Link download dataset & file .py : github.com/feb...
    =====================================
    Tugas Khusus Keempat KMMI Data Mining with Python 2021 | Universitas Nurul Jadid Paiton Probolinggo
    Nama : Febbi Sena Lestari
    NIM : 1955201016
    Kelas : C
    Asal : Universitas Nahdlatul Ulama Blitar

Komentáře • 69

  • @febbisenalestari
    @febbisenalestari  Před 6 měsíci +1

    Maaf ada ralat ya temen-temen
    Menit ke 17:32 itu harusnya stop = x_set[:, 1].max()+1
    Mohon maaf atas kesalahannya & terima kasih bagi yg sudah mengoreksi ☺️🙏

  • @rafidimas578
    @rafidimas578 Před 2 lety +2

    Semangat kak👏👏👏

  • @BangunWatono
    @BangunWatono Před rokem +1

    Mantab sekali penjelasannya. Terima kasih. Sangat membantu kak

  • @dewianggraini7192
    @dewianggraini7192 Před 2 lety +1

    Mantap👍

  • @user-bl1vz2tm6d
    @user-bl1vz2tm6d Před rokem +3

    kak mau tanya dong kenapa di proses KNN ada yg mencari jarak ecuilden dan ada yg engga tapi di vidio kakaknya tidak terdapat jarak ecuilden terimakasih

    • @febbisenalestari
      @febbisenalestari  Před rokem

      Kalau ada bagian mencari jarak euclidean, berarti coding KNN-nya dilakukan secara manual. Kalau dalam video saya pakai function KNN yang sudah ada di library Sklearn, jadi tinggal panggil functionnya saja

  • @partoflife6963
    @partoflife6963 Před 9 měsíci +1

    Kak mau nanya, mohon dijawab, apa bisa tutor kakak ini diterapkan untuk melakukan klasifikasi objek pada sebuah gambar? Mohon infonya kak

    • @febbisenalestari
      @febbisenalestari  Před 9 měsíci

      Tutorial yang kubuat itu untuk dataset berbentuk tabel/dataframe, kalau untuk data gambar ada caranya sendiri karena beda karakteristik dataset.

    • @navessajulieth7878
      @navessajulieth7878 Před 6 měsíci

      kk dh dpt tutornya ?

  • @bestiadhelfiariani1924
    @bestiadhelfiariani1924 Před 10 měsíci +1

    Kak izin bertanya untuk codingan terakhir terkait plot.. Saya memiliki data beasiswa dengan 5 variabel kak.. Nah itu bagaimana caranya untuk membuat code nya kak apalgi ada plot utk x dan y dimana berarti memakai 2 variabel ya kak.. Jadi bagaimana dengan plot 5 variabel tersebut kak.. Terimakasih kak..

    • @febbisenalestari
      @febbisenalestari  Před 10 měsíci

      Visualisasi data/plot yang seperti itu memang bisanya hanya untuk 2 atribut kak, karena plot itu kan terdiri dari 2 dimensi aja (x dan y). Kalau tetap mau pakai plot seperti itu untuk dataset 5 atribut berarti dimensi/atributnya harus dikurangi. Kalau aku baca-baca referensi, pengurangan dimensi itu bisa pakai algoritma Principal Component Analysis (PCA). Aku belum pernah coba sih, tapi mungkin bisa dicari referensi terkait itu. Semoga membantu ya..

  • @Dihyo_
    @Dihyo_ Před 8 měsíci +1

    izin bertanya ka, kalau misal data pada kolom x nya lebih dari 2 bisa atau tidak? kalau misalkan bisa apa ada jumlah maksimalnya?

    • @febbisenalestari
      @febbisenalestari  Před 8 měsíci

      Bisa. Nggak ada jumlah maksimal pastinya sih, hanya saja kalau atributnya banyak, apakah keseluruhan atribut tersebut penting dan berpengaruh ke kelas/label. Kalau atributnya terlalu banyak tapi sebenarnya nggak penting, itu nanti malah bisa bikin performa model kurang bagus

    • @Dihyo_
      @Dihyo_ Před 8 měsíci

      @@febbisenalestari oke baik makasih infonya ka

  • @ekaramdani4658
    @ekaramdani4658 Před 4 měsíci +1

    kak izin bertanya kenapa pada visualisasi darta (grafik) saya error pada bagian 'x_set, y_set = x_train, y_train'

  • @alhumam90
    @alhumam90 Před rokem +1

    kk kok aku di kode yang terakhir ada attribute error line 5
    plt.contourf...
    AttributeError: module 'matplotlib' has no attribute 'contourf'

    • @febbisenalestari
      @febbisenalestari  Před rokem

      Pastikan import library-nya sudah lengkap ya, untuk matplotlib disertai pyplot juga
      import matplotlib.pyplot as plt

  • @lixaa3520
    @lixaa3520 Před 8 dny +1

    Kk itu kan kk x nya ada 2, misal yg x nya 4 gimana ya kk codingan untuk grafiknya

    • @febbisenalestari
      @febbisenalestari  Před 7 dny

      @@lixaa3520 Grafik untuk 4 atribut bisa pakai pair plot. Kalau mau tetap pakai scatter plot berarti harus dilakukan reduksi dimensi, salah satunya pakai algoritma PCA. Bisa coba dicari tau dulu tentang hal tersebut, disesuaikan dgn kebutuhan

  • @dhxx2905
    @dhxx2905 Před 7 měsíci +1

    Maaf mau nanya.. itu di awal kan sumbu y atau variabel dependennya kan pump ya? Tapi di grafik sumbu y nya kok temp ya?

    • @dhxx2905
      @dhxx2905 Před 7 měsíci

      Sama mau tanya lagi waktu meshgrid itu x set yg baris kedua yg stop bukan [ : , 1] ?

    • @febbisenalestari
      @febbisenalestari  Před 6 měsíci

      Sumbu Y grafik dan variabel Y (dependen) itu 2 hal yg berbeda. Di grafik sumbu X-nya Moisture & sumbu Y-nya Temp karena kita ingin tahu jika nilai dua variabel independen tsb ditarik garis lurus pada grafik akan bertemu di mana. Nah, titik temunya itu yg menjadi nilai Pump, nanti dia berada di area class 0 atau 1.
      Untuk stop x set baris kedua, iya yang benar [:, 1], ada typo di sana. Terima kasih koreksinya :)

    • @dhxx2905
      @dhxx2905 Před 6 měsíci

      @@febbisenalestari oh ya i see thanks kak

  • @kimroses14
    @kimroses14 Před rokem +1

    kak, kalo di scaling datanya error itu gimana kak? soalnya udah ngikutin rumus kakak, terima kasih kak btw videonya sangat membantu😊❤

  • @latifahayusafitri
    @latifahayusafitri Před 8 měsíci +1

    kak kl datanya gada missing itu gapapa kah?

    • @febbisenalestari
      @febbisenalestari  Před 8 měsíci

      Nggak ada missing gimana maksudnya? Nggak ada missing value kah? Dataset yang dipake untuk bikin model memang harus lengkap dan nggak ada yang missing kak. Kalau ada missing value harus di-preprocessing dulu

  • @yuanwararrasyid5178
    @yuanwararrasyid5178 Před rokem +1

    Kak kalo atributnya ada 3 ap bisa menggunakan metode KNN?

  • @syifafauziah7879
    @syifafauziah7879 Před 2 lety +1

    Ka mau tanya klasifikasi detailnya gak ada ya yg menjelaskan, yang terklasifikasi apa saja

    • @febbisenalestari
      @febbisenalestari  Před rokem

      Halo, maaf baru membalas 🙏
      Berdasarkan dataset yg digunakan, data terklasifikasi menjadi 2, yaitu 0 dan 1. Karena dataset tsb bermaksud utk menentukan apakah tumbuhan sudah perlu disiram berdasarkan moisture & temp-nya, maka dapat dikatakan bahwa label 0 berarti tanaman belum perlu disiram, sedangkan 1 berarti tanaman perlu disiram. Apakah seperti itu yg dimaksud? Semoga membantu 😊

    • @yourmine2922
      @yourmine2922 Před rokem

      @@febbisenalestari jadi kak kesimpulannya tanaman harus disiram atau belom kak

    • @febbisenalestari
      @febbisenalestari  Před rokem

      @@yourmine2922 Tergantung hasil prediksi, kalau 0 berarti belum waktunya disiram, kalau 1 berarti sudah waktunya disiram

  • @adisyahputra3801
    @adisyahputra3801 Před 2 lety +1

    assalamualaikum kak saya ada skripsi ini. saya mau nanya kak ini rumusahan maslah nya apa yah ?
    semoga fast respon terimakasih kak

    • @febbisenalestari
      @febbisenalestari  Před 2 lety

      Waalaikumsalam
      Utk tutorial di atas aku cuma download dataset random di Kaggle, jadi nggak mengusung masalah apa2. Tapi kalau diliat dari datasetnya ttg Intelligent Irrigation System, ini tuh data untuk menentukan kapan tanaman akan diairi/disiram secara otomatis berdasarkan moisture & temp-nya. Jadi, pengairan otomatis ini digunakan utk mengatasi masalah pengairan di lahan pertanian/perkebunan, bisa karena keterbatasan air di daerah tsb sehingga penggunaan air harus bener2 di-manage, atau karena menghindari gagal panen akibat tanaman yg kekurangan/kelebihan air. Bisa juga karena jumlah tanaman yg banyak sehingga bakal makan waktu & tenaga kalau harus disiram secara manual. Kalau ttg kenapa milih KNN, KNN itu simpel, bisa melatih data dgn cepat, & efektif utk data training yg banyak.
      Apakah seperti itu yg ditanyakan? Semoga membantu kak

  • @nama-my9ks
    @nama-my9ks Před 10 měsíci +1

    Izin bertanya kak, kalo mau input nilai baru gimana ya kak?

    • @febbisenalestari
      @febbisenalestari  Před 9 měsíci

      Maksudnya nilai baru itu nilai yang dimasukkan ke dataset atau nilai yang mau diprediksi kelasnya?

    • @nama-my9ks
      @nama-my9ks Před 9 měsíci

      @@febbisenalestari yang mau di prediksi kak

    • @febbisenalestari
      @febbisenalestari  Před 9 měsíci

      Pakai function predict() di modelnya. Misal data barunya 30 dan 50, secara umum prediksinya seperti ini:
      prediksi = classifier.predict([[30, 50]])
      print("Hasil Prediksi = ", prediksi)
      Tapi perlu diingat bahwa di video nilai atribut distandardisasi pakai StandardScaler, sehingga nilai barunya juga harus distandardisasi sebelum diprediksi. Caranya bisa seperti ini:
      databaru = sc.transform([[30, 50]])
      prediksi = classifier.predict(databaru)
      print("Hasil Prediksi = ", prediksi)

    • @nama-my9ks
      @nama-my9ks Před 9 měsíci

      @@febbisenalestari makasih banyak kak

  • @SA-ARIEFADEIRAWAN
    @SA-ARIEFADEIRAWAN Před 2 lety +1

    buat yang p=2 di memanggil function knn itu fungsinya p=2 buat apa ka?

    • @febbisenalestari
      @febbisenalestari  Před 2 lety

      p itu power parameter dari metric yg digunakan. p = 2 itu parameter dari metric minkowski atau euclidean

  • @sazilaaz
    @sazilaaz Před rokem +1

    kak kalau attribut class/labelnya sudah dicantumkan -1 tapi yg keluar malah atribut lain, dan y itu berisi dari atribut bukan class, maka harus di scalling atau tidak perlu?

    • @febbisenalestari
      @febbisenalestari  Před rokem

      -1 itu jika classnya berada di kolom paling kanan dataset. Kalau letak kolomnya tidak di situ tinggal disesuaikan saja. Yang pasti class tidak perlu di-scalling

  • @arismihadjami8764
    @arismihadjami8764 Před 2 lety +1

    kalau hitung presisi dan recallnya codingannya gimana ka

  • @afandikaputrasulistiya4328

    kak mau tanya dpt dataset nya dimana?

  • @muammarrezapahlawan8715
    @muammarrezapahlawan8715 Před 2 lety +1

    mbak coba dataset yg lain donk

  • @sadako1316
    @sadako1316 Před rokem +1

    Kak kok grafiknya error yah? Itu knp yah kak

    • @febbisenalestari
      @febbisenalestari  Před rokem

      Keterangan errornya apa kak?
      Biasanya karena ada typo pengetikan

    • @sadako1316
      @sadako1316 Před rokem

      @@febbisenalestari kak metode ini bisa digunakan untuk, penerapan algoritma knn untuk prediksi tingkat resiko penyebaran covid 19??? Tolong kak dibantu jawab :(

    • @febbisenalestari
      @febbisenalestari  Před rokem

      @@sadako1316 Secara konsep bisa kak, sama saja, tinggal menyesuaikan dengan bentuk data & jumlah kolom. Mungkin yang berbeda ada di bagian grafik karena dalam tutorial saya grafik tersebut untuk data dengan 2 atribut

  • @erlitasofhianti8041
    @erlitasofhianti8041 Před rokem +1

    Kak mau tanya dong, mohon di respon yaa🙏🏻

  • @rezimaharani6140
    @rezimaharani6140 Před 8 měsíci +1

    Mau tanya dong kak

    • @febbisenalestari
      @febbisenalestari  Před 8 měsíci

      Silakan kak

    • @rezimaharani6140
      @rezimaharani6140 Před 8 měsíci

      @@febbisenalestari kenapa saya waktu scalling data gak bisa yah katanya " tidak dapat mengubah string menjadi float: 'Kopi Durian Ukuran 200 g" kopi durian ini jenis produk yang saya upload kak gimana ya solusinya 🙏

    • @febbisenalestari
      @febbisenalestari  Před 8 měsíci

      Karena scaling data hanya bisa dilakukan pada data numerik. Data string (kata/kalimat) tidak bisa

  • @partoflife6963
    @partoflife6963 Před 9 měsíci +1

    Kak mau nanya, mohon dijawab, apa bisa tutor kakak ini diterapkan untuk melakukan klasifikasi objek pada sebuah gambar? Mohon infonya kak

    • @febbisenalestari
      @febbisenalestari  Před 9 měsíci

      Tutorial yang kubuat itu untuk dataset berbentuk tabel/dataframe, kalau untuk data gambar ada caranya sendiri karena beda karakteristik dataset.

    • @navessajulieth7878
      @navessajulieth7878 Před 5 měsíci

      ​@@febbisenalestari halo ka, bisa buat tutornya ngga ? makasi kaa