Rekayasa Atribut Dataset pada Rapidminer - Seri Perkuliahan Data Analytic & Data Mining #05

Sdílet
Vložit
  • čas přidán 21. 10. 2021
  • Pada video ini, kita akan belajar teknik dasar rekayasa atribut yang bertujuan untuk memodifikasi atribut yang ada pada suatu dataset. Beberapa operator Rapidminer yang akan dibahas pada video ini adalah: rename, rename by replacing, select attribute, dan operator konversi tipe data atribut (real to integer, date to nominal, nominal to date, dll.).
    Link unduh dataset: s.id/HOcdx

Komentáře • 19

  • @CimolOk-nz5yj
    @CimolOk-nz5yj Před 7 měsíci

    🎯 Key Takeaways for quick navigation:
    00:00 📚 *Introduction to Attribute Engineering*
    - Introduction to basic attribute engineering in datasets.
    - Focus on renaming, filtering, and converting data types.
    - Use of RapidMiner and golf dataset example.
    02:55 🔄 *Renaming Dataset Attributes*
    - Demonstration of attribute renaming in RapidMiner.
    - Translation of attribute names from English to Indonesian.
    - Detailed steps using the 'Rename' operator.
    07:02 🔢 *Removing Underscores in Attribute Names*
    - Techniques to remove underscores from attribute names.
    - Use of 'Replace' function in RapidMiner.
    - Practical example using sonar data.
    11:32 📐 *Shortening Attribute Names*
    - Shortening attribute names to first three letters.
    - Using Regular Expressions in RapidMiner.
    - Practical demonstration with sonar data attributes.
    14:05 📉 *Importing and Renaming CSV Data*
    - Importing CSV data and renaming attributes.
    - Adjusting attribute types from real to nominal.
    - Example with user ID data containing special symbols.
    17:03 ✂ *Removing Special Symbols from Attributes*
    - Eliminating non-alphanumeric characters from attributes.
    - Application of regular expressions in data cleansing.
    - Handling complex data sets with multiple attributes.
    20:04 🧹 *Cleaning Attributes with Multiple Symbols*
    - Cleaning attributes containing various symbols.
    - Using bracket notation in regular expressions.
    - Example with user ID attributes.
    22:04 🔗 *Data Merging and Attribute Selection*
    - Merging data from different sources.
    - Selecting specific attributes for display.
    - Practical use case with electronic product data.
    26:51 🔄 *Filtering Attributes*
    - Filtering and displaying selected attributes.
    - Inverting selection to display non-selected attributes.
    - Use of the 'Select Attributes' operator in RapidMiner.
    28:41 🔄 *Converting Data Types*
    - Converting attribute data types (real to integer).
    - Practical example with price data.
    - Techniques for data type conversion in RapidMiner.
    31:24 💲 *Formatting Numeric Data*
    - Adding currency symbols to numeric data.
    - Use of the 'FormatNumber' operator.
    - Example with price data in different currencies.
    33:41 📅 *Converting Date Formats*
    - Modifying date formats in datasets.
    - Converting nominal data back to date format.
    - Practical application with event time data.
    38:22 🔀 *Reordering Dataset Attributes*
    - Reordering attributes in a dataset for clarity.
    - Using the 'Reorder Attributes' operator.
    - Example with event time and price data.
    41:07 🏁 *Conclusion and Recap*
    - Recap of techniques learned: renaming, filtering, converting, and formatting data.
    - The importance of attribute engineering in data analytics.
    - Closing remarks and future learning objectives.

    ```

  • @sitishoofia3021
    @sitishoofia3021 Před 2 lety

    sangat membantu sekalii

  • @sauchadiwandari8401
    @sauchadiwandari8401 Před 2 lety

    Olid versi gede. Mantap pak

  • @adamlvandy
    @adamlvandy Před rokem

    Persimisi pak, kalau untuk menentukan contoh dataset supervised dan unsupervised bagaimana ya pak?

    • @KuliahInformatika
      @KuliahInformatika  Před rokem +1

      kita lihat saja, ada nggak kolom yang bisa jadi label atau nggak. Cirinya label itu, dia nilainya berupa penentu keputusan atau nilai yang sifatnya mengelompokkan.

  • @sitinurwahidaarif1087
    @sitinurwahidaarif1087 Před 2 lety

    Maaf pak, bisa bimbingan online sama bapak mengenai naive bayes?saya masih bingung dengan alur naive bayes untuk tugas akhir saya. Terima kasih sebelumnya

    • @KuliahInformatika
      @KuliahInformatika  Před 2 lety

      Silakan cek video ini: czcams.com/video/7TlVncuh5Lo/video.html

  • @agsa365
    @agsa365 Před 3 měsíci

    Tanya mas; bagaimana cara menambahkan attribut dengan operator matematika, misalnya; att "Diskon10%" dan harga barunya : Price - Diskon, Terima kasih.

    • @KuliahInformatika
      @KuliahInformatika  Před 3 měsíci +1

      kita bisa pakai operator "Generate Attribute", nanti di situ kita perlu memformulasikan rumus matematika untuk membuat atribut baru berdasarkan nilai-nilai pada atribut yang sudah ada.

  • @aisyahnovriani1990
    @aisyahnovriani1990 Před rokem

    saya ingin bertanya pak, kenapa ada dua atribut pada data yg saya gunakan itu ada tanda pentungnya ya pak? mohon bantuannya pak 🙏

    • @KuliahInformatika
      @KuliahInformatika  Před rokem

      Coba diabaikan saja dulu, jika dirunning tidak ada masalah/ error, gpp.

  • @sitinurwahidaarif1087
    @sitinurwahidaarif1087 Před 2 lety

    bisa bimbingan online sama bapak gak mengenai naive bayes?saya masih bingung dengan alur naive bayes untuk tugas akhir saya. Terima kasih sebelumnya

    • @KuliahInformatika
      @KuliahInformatika  Před 2 lety

      Silakan cek video ini: czcams.com/video/7TlVncuh5Lo/video.html, mudah-mudahan memberikan pencerahan ya

    • @sitinurwahidaarif1087
      @sitinurwahidaarif1087 Před 2 lety

      @@KuliahInformatika untuk ratio pembagian datanya bisa 50:50 kah pak?atau data training harus lebih banyak ?

    • @KuliahInformatika
      @KuliahInformatika  Před 2 lety

      @@sitinurwahidaarif1087 data training sebaiknya lebih banyak, 70:30 atau 80:20

  • @PremiumChannelMusic
    @PremiumChannelMusic Před rokem

    saya ada pertanyaan pak...bisa atau tidak...nambahin atribut didataset

    • @KuliahInformatika
      @KuliahInformatika  Před rokem

      Bisa. pakai operator "Generate Attribute". Biasanya penambahan atribut seperti ini berupa pengolahan dari atribut yang sudah ada. Misalnya ada atribut tahun lahir, maka kita bisa buat atribut tambahan yakni "Usia" dengan cara mengurangkan tahun sekarang dengan tahun lahirnya.