Rekayasa Atribut Dataset pada Rapidminer - Seri Perkuliahan Data Analytic & Data Mining #05
Vložit
- čas přidán 21. 10. 2021
- Pada video ini, kita akan belajar teknik dasar rekayasa atribut yang bertujuan untuk memodifikasi atribut yang ada pada suatu dataset. Beberapa operator Rapidminer yang akan dibahas pada video ini adalah: rename, rename by replacing, select attribute, dan operator konversi tipe data atribut (real to integer, date to nominal, nominal to date, dll.).
Link unduh dataset: s.id/HOcdx
🎯 Key Takeaways for quick navigation:
00:00 📚 *Introduction to Attribute Engineering*
- Introduction to basic attribute engineering in datasets.
- Focus on renaming, filtering, and converting data types.
- Use of RapidMiner and golf dataset example.
02:55 🔄 *Renaming Dataset Attributes*
- Demonstration of attribute renaming in RapidMiner.
- Translation of attribute names from English to Indonesian.
- Detailed steps using the 'Rename' operator.
07:02 🔢 *Removing Underscores in Attribute Names*
- Techniques to remove underscores from attribute names.
- Use of 'Replace' function in RapidMiner.
- Practical example using sonar data.
11:32 📐 *Shortening Attribute Names*
- Shortening attribute names to first three letters.
- Using Regular Expressions in RapidMiner.
- Practical demonstration with sonar data attributes.
14:05 📉 *Importing and Renaming CSV Data*
- Importing CSV data and renaming attributes.
- Adjusting attribute types from real to nominal.
- Example with user ID data containing special symbols.
17:03 ✂ *Removing Special Symbols from Attributes*
- Eliminating non-alphanumeric characters from attributes.
- Application of regular expressions in data cleansing.
- Handling complex data sets with multiple attributes.
20:04 🧹 *Cleaning Attributes with Multiple Symbols*
- Cleaning attributes containing various symbols.
- Using bracket notation in regular expressions.
- Example with user ID attributes.
22:04 🔗 *Data Merging and Attribute Selection*
- Merging data from different sources.
- Selecting specific attributes for display.
- Practical use case with electronic product data.
26:51 🔄 *Filtering Attributes*
- Filtering and displaying selected attributes.
- Inverting selection to display non-selected attributes.
- Use of the 'Select Attributes' operator in RapidMiner.
28:41 🔄 *Converting Data Types*
- Converting attribute data types (real to integer).
- Practical example with price data.
- Techniques for data type conversion in RapidMiner.
31:24 💲 *Formatting Numeric Data*
- Adding currency symbols to numeric data.
- Use of the 'FormatNumber' operator.
- Example with price data in different currencies.
33:41 📅 *Converting Date Formats*
- Modifying date formats in datasets.
- Converting nominal data back to date format.
- Practical application with event time data.
38:22 🔀 *Reordering Dataset Attributes*
- Reordering attributes in a dataset for clarity.
- Using the 'Reorder Attributes' operator.
- Example with event time and price data.
41:07 🏁 *Conclusion and Recap*
- Recap of techniques learned: renaming, filtering, converting, and formatting data.
- The importance of attribute engineering in data analytics.
- Closing remarks and future learning objectives.
```
sangat membantu sekalii
Terima kasih 🙂
Olid versi gede. Mantap pak
olid senior :D
Persimisi pak, kalau untuk menentukan contoh dataset supervised dan unsupervised bagaimana ya pak?
kita lihat saja, ada nggak kolom yang bisa jadi label atau nggak. Cirinya label itu, dia nilainya berupa penentu keputusan atau nilai yang sifatnya mengelompokkan.
Maaf pak, bisa bimbingan online sama bapak mengenai naive bayes?saya masih bingung dengan alur naive bayes untuk tugas akhir saya. Terima kasih sebelumnya
Silakan cek video ini: czcams.com/video/7TlVncuh5Lo/video.html
Tanya mas; bagaimana cara menambahkan attribut dengan operator matematika, misalnya; att "Diskon10%" dan harga barunya : Price - Diskon, Terima kasih.
kita bisa pakai operator "Generate Attribute", nanti di situ kita perlu memformulasikan rumus matematika untuk membuat atribut baru berdasarkan nilai-nilai pada atribut yang sudah ada.
saya ingin bertanya pak, kenapa ada dua atribut pada data yg saya gunakan itu ada tanda pentungnya ya pak? mohon bantuannya pak 🙏
Coba diabaikan saja dulu, jika dirunning tidak ada masalah/ error, gpp.
bisa bimbingan online sama bapak gak mengenai naive bayes?saya masih bingung dengan alur naive bayes untuk tugas akhir saya. Terima kasih sebelumnya
Silakan cek video ini: czcams.com/video/7TlVncuh5Lo/video.html, mudah-mudahan memberikan pencerahan ya
@@KuliahInformatika untuk ratio pembagian datanya bisa 50:50 kah pak?atau data training harus lebih banyak ?
@@sitinurwahidaarif1087 data training sebaiknya lebih banyak, 70:30 atau 80:20
saya ada pertanyaan pak...bisa atau tidak...nambahin atribut didataset
Bisa. pakai operator "Generate Attribute". Biasanya penambahan atribut seperti ini berupa pengolahan dari atribut yang sudah ada. Misalnya ada atribut tahun lahir, maka kita bisa buat atribut tambahan yakni "Usia" dengan cara mengurangkan tahun sekarang dengan tahun lahirnya.