1. دسته بندی انواع داده | پیش نیاز دیتاویژوال، دیتا آنالیز و ماشین لرنینگ
Vložit
- čas přidán 26. 06. 2023
- لینک مقاله: / f1ac7aa11c6c
لینک ریپو مربوط به فایل دست نوشت: github.com/rezashokrzad/Youtu...
یادگیری انواع داده در ابتدا یک ترتیب منطقی برای ورود به حوزه دیتاآنالیز و ماشین لرنینگ هست. در جلسات بعدی که خواستیم برای هر کدوم از انواع داده دیتاویژوالیزیشن پیشنهاد بدیم، اهمیت اینکه داده ها رو دسته بندی شده بشناسیم بیشتر میشه.
مطالبی که در این جلسه یاد میگریم:
Data types
Data categories
Qualitative data (categorical)
Quantitative data (numerical)
date and time date (time series)
این موارد رو با دیتاست تایتانیک روی پایتون بررسی کردیم.
آدرس کانالهای ارتباطی:
بلاگ مقالات به روز حوزه: ctdrs.ir/ds1111
وبسایت دپارتمان علم داده: cafetadris.com/datascience
کانال تلگرام تخصصی علم داده: @dslanders
id تلگرام من: @rezashokrzad
Down With That by Twin Musicom is licensed under a Creative Commons Attribution 4.0 license. creativecommons.org/licenses/...
Artist: www.twinmusicom.org/
تا حالا برای هیچ ویدئویی کامنت نزاشتم و فقط برای اونایی که جالب بودن تودلم گفتم دمش گرم ولی حیفم اومد برای این ویدئو نظر ندم از بس دقیق و ریشه ای همه ی مفاهیم رو توضیح میدین با یک دسته بندی مهندسی شده طوری که خواننده متوجه بشه هر مفهوم کدوم قطعه پازل دانش علم داده را پر میکنه.
امیدوارم که در این دوره مباحث پیش پردازش داده ، دیتاویژوالیزیشن و دیتا آنالسیس را پوشش بدین و مطمئنم که با تفکر الگوریتمی شما این دوره یکی از کاربردی ترین دوره های این حوزه میشود.
دمت گرم آقا رضا که وقت میزارین تا آموزش های باکیفیت تولید کنید🙏
بیصبرانه منتظر قسمت بعدی هستم..
یکی از بهترین آموزش هاس واقعا
خیلی ممنون بابت توضیحاتی که در رابطه با موارد اساسی و بنیادین ارائه ددادید. بسیار مفید و سودمند بود. لطفا بیشتر دررابطه بااین موارد پایه و اصلی ویدیو بگذارید. سپاس از شما
خیلی عالی بود ممنون از آموزش خوبتون.
cheghadre motefavet va khub
خیلی عالی...
عالی بود
perferct
We love Rezashokrzad❤
Nice lesson
سلام مهندس میشه بیوگرافی کوتاهی از خودت برام بفرستید بخصوص در مورد اموزش عالی که تو ریاضی ودانشگاهتون چقدر زحمت کشید تا بشه الگو برای بقیه بخصوص من وامثال من واقعا مچکرم البته این از خودستایی نیست ومنابع وزحماتتون بفرمایید .خیلییی زحمت میشه
استاد عزيز با سپاس از ويدئو هاي مفيد شما.
يک سوال برايم پيش آمد. اگر مدل داده هاي کلاس را عددي در نظر بگيرد، موقع محاسبات فاصله، فاصله 3 از 1 دو برابر فاصله 2 از 1 محاسبه مي شود در حالي که شايد کلاس 3 در کشتي به کلاس دو چسبيده باشد و مدل به اشتباه بيفتد. بهتر نيست همان کتگوريکال در نظر بگيريم؟ بعد از چت جي پي تي پرسيدم اينو ميگه:
You make a valid point. When it comes to calculating distances or performing numerical operations on class labels, using them as numerical values may lead to incorrect interpretations or misleading results. In scenarios where the classes represent distinct categories without any inherent numerical order or magnitude, it is generally better to treat them as categorical variables.
By treating the ship classes as categorical, you avoid the potential issues arising from assuming a numerical relationship between the classes. Categorical variables allow for proper handling of class relationships, such as determining if class 3 is more similar to class 2 than class 1, without introducing unintended biases or miscalculations.
Therefore, considering the ship classes as categorical data is a more appropriate approach in this context.
خیلی سوال خویی به ذهنت رسیده. دقیقا این یکی از چلنجهایی که مدل ماشین لرنینگ رو به اشتباه میندازه. راهکارش استفاده از روشهایی مثل onehotencoding توی پکیج sklearn یا getdummies توی پکیج pandas هست. راهش اینه که وان هات کنیم داده کتوریکال بیش از ۲ مقداری رو.