چرا این دوره برای شما مفیده؟
تمیز کردن داده ها بخش مهمی از علم داده است. چرا برخی از فیلدهای متنی شما دچار مشکل شده اند؟ در مورد مقادیر از دست رفته (Missing Values) چه باید کرد؟ چرا تاریخ های شما به درستی قالب بندی نشده اند؟ چگونه می توانید به سرعت داده های ناسازگار را پاک کنید؟ در این دوره ، خواهید آموخت که چرا با این مشکلات روبرو شده اید و مهم تر اینکه چگونه آنها را برطرف کنید!
در این دوره ، نحوه برخورد با برخی از رایج ترین مشکلات تمیز کردن داده ها را خواهید آموخت تا بتوانید سریعتر به تجزیه و تحلیل داده های خود بپردازید. شما می توانید پنج تمرین عملی را با داده های واقعی و به هم ریخته انجام دهید و به برخی از سوالات متداول خود در مورد پاکسازی داده ها پاسخ دهید.
سرفصلهای دوره
بخش اول : مدیریت مقادیر از دست رفته (Handling Missing Values)
نگاه اجمالی به داده ها
چه تعداد مقادیر از دست رفته در داده ها وجود دارد
بررسی دلایل از دست دادن داده ها
حذف موجودیت های که حاوی مقایر از دست رفته هستند
پرکردن مقادیر از دست رفته
تمرین های مربوط به هر بخش
بخش دوم : مقیاس گذاری و نرمال سازی (Scaling and Normalization)
تفاوت مقیاس گذاری و نرمال سازی با مثال
مقیاس گذاری با مثال
نرمال سازی با مثال
تمرین های مربوط به هر بخش
تمرین های مربوط به هر بخش
بخش سوم : تجزیه تاریخ (Parsing Dates)
چک کردن نوع داده مربوط به ستون حاوی تاریخ
تبدیل داده های مربوط به ستون تاریخ به نوع شئ داده ای datetime در پایتون
انتخاب داده ها به صورت روزانه
مصورسازی داده ها به صورت روزانه برای بررسی درستی آنها
تمرین های مربط به هر بخش
بخش چهارم : کدگذاری کاراکترها (Character Encodings)
کدگذاری داده ها چیست
انواع سیستم های کدگذاری داده ها
خواندن فایل هایی که مشکلات کدگذاری دارند
ذخیره سازی فایل ها با سیستم کدگذاری UTF-8
تمرین های مربوط به هر بخش
بخش پنجم : ورود داده های ناسازگار (Inconsistent Data Entry)
چند پیش پردازش اولیه روی متن ها را انجام میدهیم
ااز متد fuzzy matching برای اصلاح داده های ناسازگار استفاده می کنیم
تمرین های مربوط به هر بخش
توضیحات بیشتر
تمام کدهای لازم از قبل نوشته شده هستند و به این دلیل در زمان ویدیوها صرفه جویی شده و شما می تونید از اون ها در کارها و پروژه های خودتون استفاده کنید و همونجا آزمون و خطا انجام بدید روی کدهایی که وجود داره برای فهم بیشتر
ابزارهای مرتبط
برای دوره پیشنهادی کافی است وارد سایت Kaggle شوید. تمام ابزار های مورد نیاز داخل سایت به صورت آنلاین و رایگان در اختیار شما قرار داده شده است.
پیشنیازها
ردیف ها یا ستون های حاوی مقادیر از دست رفته را حذف کنید و یا به روش مناسب به صورت خودکار آنها را پر کنید
قسمت اول ویدئو
قسمت دوم ویدئو
متغیرهای عددی را با تغییر ماهیت آنها به ویژگی های مفیدی تبدیل کنید
قسمت اول: : تئوری نویززدایی سیگنالهای EEG ویدئو
قسمت دوم:پیش¬پردازش سیگنال¬های EEG با استفاده از EEGLAB ویدئو
به پایتون کمک کنید تا تاریخ را به عنوان ترکیبی از روز، ماه و سال تشخیص دهد
قسمت اول:پردازش سیگنال¬های ERP ویدئو
قسمت دوم: استخراج ویژگیهای آماری و طیفی از سیگنال EEG ویدئو
در مسیر حرفهای شدن
از دریافت فایل هایی که به درستی کدگذاری نشده اند اجتناب کنید
قسمت اول:پردازش سیگنال¬های ERP ویدئو
قسمت دوم: استخراج ویژگیهای آماری و طیفی از سیگنال EEG ویدئو
در مسیر حرفهای شدن
به صورت کارآمد مشکل ناسازگاری داده های خودتان را حل کنید
قسمت اول:پردازش سیگنال¬های ERP ویدئو
قسمت دوم: استخراج ویژگیهای آماری و طیفی از سیگنال EEG ویدئو
در مسیر حرفهای شدن
درخواست مشاوره
برای کسب اطلاعات بیشتر درباره این دوره درخواست مشاوره خود را ارسال کنید و یا با ما در تماس باشید.
درخواست مشاورهدوره های مرتبط
دوره آموزشی کار با کتابخانه Pandas در Kaggle با استفاده از زبان برنامه نویسی پایتون
داده های خودتان را به هرشکی که خواهید در بیاورید.
دوره آموزشی یادگیری زبان برنامه نویسی پایتون در Kaggle
این دوره کاملا کاربردی میباشد؛
دوره آموزشی پایتون برای علم داده ، دوره ترجمه شده ماکروسافت
چرا این دوره رو به شما پیشنهاد میکنیم؟ این دوره میتونه برای شما به عنوان یه قدم اولیه برای آشنایی…
chat_bubble_outlineنظرات
قوانین ثبت دیدگاه
- دیدگاههای فینگلیش تایید نخواهند شد.
- دیدگاههای نامرتبط به مطلب تایید نخواهد شد.
- از درج دیدگاههای تکراری پرهیز نمایید.
- امتیاز دادن به دوره فقط مخصوص دانشجویان دوره میباشد.
1,300,000 تومان 599,000 تومان
fattahy( دانشجوی دوره )
سلام؛
ویدئوی معرفی دوره پاکسازی دیتا، که در بالای صفحه محصول می باشد، نمایش داده نمی شود، لطفا بررسی نمایید.
مدیریت(مدیریت)
سلام دوست عزیز، نظر شما جهت بررسی به مدرس مربوط ارجاع شد. ممنون از اطلاعرسانیتون؛