کاهش ابعاد و تشریح روشهای کاهش ابعاد داده
دوشنبه, ۱۰ خرداد ۱۳۹۵، ۱۱:۲۹ ب.ظ
کاهش ابعاد و تشریح روشهای کاهش ابعاد داده
تعداد متغیرهایی که برای هر مشاهده باید اندازه گیری شود ابعاد داده نامیده می شوددر این تحقیق کاهش ابعاد و روشهای کاهش ابعاد داده مورد بررسی قرار میگیرد |
![]() |
دسته بندی | هوش مصنوعی |
فرمت فایل | doc |
حجم فایل | 393 کیلو بایت |
تعداد صفحات فایل | 58 |
دانلود پروژه مطالعاتی درس یادگیری ماشین
کاهش ابعاد و تشریح روشهای کاهش ابعاد داده
*ضمیمه شدن کد متلب کاهش ابعاد بصورت رایگان:)-
مقدمه
پیشرفتهای بوجود آمده در جمع آوری داده و قابلیتهای ذخیره سازی در طی دهه های اخیر باعث شده در بسیاری از علوم با حجم بزرگی از اطلاعات روبرو شویم. محققان در زمینه های مختلف مانند مهندسی، ستاره شناسی، زیست شناسی و اقتصاد هر روز با مشاهدات بیشتر و بیشتری روبرو می شوند. در مقایسه با بسترهای داده ای قدیمی و کوچکتر، بسترهای داده ای امروزی چالشهای جدیدی در تحلیل داده ها بوجود آورده اند. روشهای آماری سنتی به دو دلیل امروزه کارائی خود را از دست داده اند. علت اول افزایش تعداد مشاهدات (observations) است، و علت دوم که از اهمیت بالاتری برخوردار است افزایش تعداد متغیرهای مربوط به یک مشاهده می باشد.
تعداد متغیرهایی که برای هر مشاهده باید اندازه گیری شود ابعاد داده نامیده می شود. عبارت "متغیر" (variable) بیشتر در آمار استفاده می شود در حالی که در علوم کامپیوتر و یادگیری ماشین بیشتر از عبارات "ویژگی" (feature) و یا "صفت" (attribute) استفاده می گردد.بسترهای داده ای که دارای ابعاد زیادی هستند علیرغم فرصتهایی که به وجود می آورند، چالشهای محاسباتی زیادی را ایجاد می کنند. یکی از مشکلات داده های با ابعاد زیاد اینست که در بیشتر مواقع تمام ویژگیهای داده ها برای یافتن دانشی که در داده ها نهفته است مهم و حیاتی نیستند. به همین دلیل در بسیاری از زمینه ها کاهش ابعاد داده یکی از مباحث قابل توجه باقی مانده است.
در تهیه این گزارش کمتر به اثباتهای ریاضی پرداخته شده و بیشتر به مفاهیم و کاربرد روشها توجه شده است. در فصل دوم از این گزارش، به مطالعه ی روشهای مبتنی بر استخراج ویژگی پرداخته ایم. در تهیه ی مطالب این فصل سعی کرده ایم با ارائه ی مثالهای مناسب، خواننده را در درک بهتر مفاهیم مربوطه یاری رسانیم. در این فصل، چهار روش ارائه شده است که همگی از نوع خطی هستند.در فصل سوم روشهای مبتنی بر انتخاب ویژگی ارائه شده است. می توان گفت در این فصل یک مطالعه اجمالی برروی تمامی روشهای انتخاب ویژگی انجام شده است.
کلمات کلیدی:
کاهش ابعاد
یادگیری ماشین
روشهای کاهش ابعاد داده
فهرست مطالب
Dimensionality Reduction
1- مقدمه
2- روشهای مبتنی بر استخراج ویژگی
2-1- Discrete Fourier Transform
2-2- Discrete Wavelet Transform
2-3- Principal Component Analysis
2-3-1- مفاهیم مقدماتی مورد نیاز در PCA
2-3-2- الگوریتم PCA
2-4- Factor Analysis
3- روشهای مبتنی بر انتخاب ویژگی
3-1- تعاریف
3-2- روشهای مختلف انتخاب ویژگی
3-2-1- توابع تولید کننده
3-2-2- تابع ارزیابی
3-2-3- دسته بندی و تشریح الگوریتم های مختلف انتخاب ویژگی
3-2-4- جمع بندی روشهای انتخاب ویژگی
4- فهرست منابع و مراجع
۹۵/۰۳/۱۰