machine learning class - 001
با توجه به دیتاست covid که در پوشه ی data موجود است عملیات زیر را روی این دیتاست انجام دهید:
- نرمالیزه کردن
- مرتب سازی داده
- حذف داده های یکسان و تکراری
- بدست آوردن 5 ویژگی که کمترین اهمیت را دارند
- اجرای الگوریتم های find-s و ce و بیز و knn و کلاسترینگ و درخت تصمیم یکبار به صورت تصادفی و یک بار با الگوریتم id3
- داده های زیر همگی به عنوان true برچسب گذاری خواهند شد و ترکیبات داده ای دیگر به عنوان false تمام ترکیبات داده ای که قابل کشف می باشد را بدست آورید.
- الگوریتم های اجرا شده را با rappid minner نیست اجرا کنید و نتیجه ی خود را با آن مقایسه کنید
- دیتاست در سایت kaggle ثبت شده است در صورتی که کد خود را در بخش notebook های kaggle ثبت کنید نمره ی اضافه دریافت خواهید کرد.
لینک kaggle :
https://www.kaggle.com/amirshnll/covid-patient-datasets
نکته :
دقت کنید تمام مواردی که در بالا ذکر شده باید با برنامه های پایتون یا متلب نوشته شود و تحت هیچ شرایط هیچکدام نباید دستی انجام شود.
مشابهت در انجام کار شما با سایر دوستان باعث نمره ی منفی می شود.
در صورت عدم وجود مستندات کامل نیمی از نمره برای شما لحاظ نخواهد شد؛ مستندات باید به صورت مارک داون باشند و مستندات فیزیکی قابل قبول نمی باشد.
در جدول نمره دهی پروژه 3 واحد نمره ای خواهد داشت و در صورتی که نمرات تمرین شما پایین باشد کمک زیادی به شما خواهد بود.