توضیحات
انتخاب متغیر در رگرسیون چندکی
رگرسیون چندکی توسط Koenker و Bassett در سال ۱۹۷۸ معرفی شد. پس از آن، این روش به یک روش مهم و پرکاربرد برای مطالعه توزیع شرطی کامل متغیر پاسخ و همچنین ابزاری مهم در آمار کاربردی، تبدیل شده است.
انتخاب متغیر در مدلبندی آماری مدلهایی که دارای بعد بالا هستند، مسئلهی اساسی است. پرکاربردترین روشها، روشهای انتخاب گامبهگام است. این روشها از نظر محاسباتی پرهزینه هستند و همچنین خطای تصادفی در فرآیند انتخاب متغیر را در نظر نمیگیرند.
در این پایاننامه روی جنبهی انتخاب متغیر رگرسیون چندکی تاوانیده، متمرکز میشویم. تحت شرایطی، خواص پیشگویی رگرسیون چندکی SCAD تاوانیده و adaptive-LASSOتاوانیده را نشان میدهیم.
انتخاب متغیر در رگرسیون چندکی
کلید واژه : انتخاب متغیر، خواص پیشگویی، رگرسیون چندکی، adaptive-LASSO، SCAD
۶۵صفحه فایل ورد (Word) فونت ۱۴ منابع دارد
پس از پرداخت آنلاین میتوانید فایل کامل انتخاب متغیر در رگرسیون چندکی را دانلود کنید
فهرست مطالب انتخاب متغیر در رگرسیون چندکی
عنوان صفحه
فصل اول: مقدمه
۱-۱- تاریخچه………..……………………………………………………………………………………………………………… ۳
فصل دوم: رگرسیون چندکی
۲-۱- چندکها و چندکهای شرطی …………………………………………………………………………………… ۷
۲-۲- از رگرسیون میانگین تا رگرسیون چندکی …………………………………………………………………. ۸
۲-۳- از برآورد کمترین مربعات تا check function ………………………………………………………….. 12
۲-۴- از توزیعهای شرطی چوله تا رگرسیون چندکی ……………………………………………………….. ۱۳
۲-۵- روش برآوردیابی ………………………………………………………………………………………………………….. ۱۵
فصل سوم: رگرسیون چندکی خطی تاوانیده
۳-۱- رگرسیون چندکی خطی تاوانیده ……………………………………………………………………………….. ۱۸
۳-۲- رگرسیون چندکی خطی تاوانیده با تاوانLASSO…………………………………………………….. 20
۳-۳- رگرسیون چندکی خطی تاوانیده با تاوان LASSO انطباقی ……………………………………. ۲۰
۳-۴- رگرسیون چندکی خطی تاوانیده با تاوان SCAD ……………………………………………………. 21
عنوان صفحه
فصل چهارم: خواص مجانبی
۴-۱- خواص مجانبی ……………………………………………………………………………………………………………. ۲۴
۴-۲- خواص مجانبی تاوان SCAD …………………………………………………………………………………….. 25
۴-۳- خواص مجانبی تاوان LASSO انطباقی …………………………………………………………………….. ۲۶
۴-۴- خطاهای تصادفی مستقل و ناهمتوزیع ………………………………………………………………………. ۲۷
فصل پنجم: مثال کاربردی
مثال ……………………………………………………………………………………………………………………………………….. ۳۰
فهرست منابع ومآخذ ………………………………………………………………………………………………………………. ۳۵
پیوست
پیوست ۱ ……………………………………………………………………………………………………………………………….. ۴۰
پیوست ۲ ……………………………………………………………………………………………………………………………….. ۴۹
پیوست ۳ ……………………………………………………………………………………………………………………………….. ۵۴
پیوست ۴ ……………………………………………………………………………………………………………………………….. ۵۵
انتخاب متغیر در رگرسیون چندکی
فهرست جدول ها
عنوان صفحه
جدول-۱: نتایج شبیهسازی برای سه روش مورد نظر با ۱=λ و ۱=و ۱۰۰۰۰=n…………………. 31
جدول-۲: نتایج شبیهسازی برای سه روش مورد نظر با ۱=λ و ۳=و ۱۰۰۰۰=n…………………. 32
جدول-۳: نتایج شبیهسازی برای سه روش موردنظر با ۸=λو۱=و ۱۰۰۰۰=n…………………… 32
جدول-۴: نتایج شبیهسازی برای سه روش موردنظر با ۸=λو۳=و ۱۰۰۰۰=n…………………… 33
جدول-۵: نتایج شبیهسازی برای سه روش موردنظر با ۲۰=λو۱=و ۱۰۰۰۰=n………………… 33
جدول-۶: نتایج شبیهسازی برای سه روش موردنظر با ۲۰=λو۳=و ۱۰۰۰۰=n………………… 34
انتخاب متغیر در رگرسیون چندکی
فهرست نمودارها انتخاب متغیر در رگرسیون چندکی
عنوان صفحه
نمودار۱: ۴۵۹ داده مربوط به حقوق استادان آمار آمریکا به عنوان تابعی از
سالهای استادی، به همراه نمودار رگرسیونی درجه دوم برازش داده شده……………………………… ۱۰
نمودار ۲: ۴۵۹ داده مربوط به حقوق استادان آمار آمریکا به عنوان تابعی از
سالهای استادی، به همراه سه نمودار رگرسیونی چندکی………………………………………………………… ۱۱
نمودار ۳: وزن در برابر سن ۴۰۱۱ دختر آمریکایی…………………………………………………………………….. ۱۳
نمودار۴: وزن در برابر سن ۴۰۱۱ دختر آمریکایی به همراه هفت نمودار
رگرسیونی چندکی……………………………………………………………………………………………………………………….. ۱۴
نمودار ۵: نمونهای از نمودار تابع SCAD برای۷/۳= و ۲= ………………………………………………… ۲۲
نمودار ۶: نمودار تابع LASSO……………………………………………………………………………………………………. 22
انتخاب متغیر در رگرسیون چندکی
فصل اول
مقدمه انتخاب متغیر در رگرسیون چندکی
رگرسیون (regression) در قلب آمار جای دارد.رگرسیون کمترین مربعات عادی (ordinary least square regression) (OLSR)میانگین متغیر پاسخ (response) را به عنوان تابعی از متغیرهای پیشبینیکننده (predictors)، برآورد میکند. رگرسیون کمترین انحراف قدرمطلق (least absolute deviation
regression) (LADR)، تابع میانهی شرطی (به شرط متغیرهای پیشبینیکننده) را به عنوان تابعی از متغیرهای پیشبینیکننده، برآورد میکند. رگرسیون کمترین انحراف قدرمطلق، نسبت به مشاهدات پرت، پایاتر از رگرسیون کمترین مربعات است. Koenker و Bassett در سال ۱۹۷۸ ایدهی مربوط به
رگرسیون کمترین انحراف قدر مطلق را تعمیم دادند و رگرسیون چندکی (quantile regression) را مطرح کردند. رگرسیون چندکی، توابع چندکی شرطی (به شرط متغیرهای پیشبینیکننده) را به عنوان توابعی از متغیرهای پیشبینیکننده، برآورد میکند. رگرسیون چندکی اطلاعات بیشتری از توزیع شرطی متغیر پاسخ ارائه میدهد و رگرسیون کمترین انحراف قدر مطلق را به عنوان یک حالت خاص در بر میگیرد. رگرسیون چندکی پس از معرفی توجه زیادی را
به خود جلب کرده است و در زمینههای گوناگون به کار برده شده است از جمله: اقتصاد (Koenker و Hendricks (1992)، Koenker و Hallock (2001))، آنالیز بقاء (Yang (1999)، Koenker و Geling (2001)) مطالعات ریزآرایه (microarray)(Wang و He (2007))، نمودار رشد (Wei و همکاران (۲۰۰۶)، Wei و He (2006)).
انتخاب متغیر در رگرسیون چندکی
۱-۱- تاریخچه
انتخاب متغیر (variable selection) نقش اساسی در فرآیند ساختمان مدل ایفا میکند. در عمل، به طور معمول تعداد زیادی متغیر پیشبینیکنندهی کاندید وجود دارد. این متغیرها در مرحلهی ابتدائی مدلبندی، به حساب آورده میشوند. همان طور که Fanو Liدر سال ۲۰۰۱ مورد بررسی قرار دادند این کار به سبب جلوگیری از انحراف از مدل اصلی صورت میگیرد (اگر تعداد متغیرهای پیشبینیکنندهی کمتری از آنچه در واقعیت وجود دارد، در مدلبندی در نظر بگیریم، برآوردهای اریب حاصل میشوند). اما نگه داشتن متغیرهای بیربط در مدل نهایی، نامطلوب است. چون این کار تفسیر مدل نهایی را مشکل مینماید و ممکن است قدرت پیشبینی آن را کاهش دهد. به این دلیل آماردانان معمولأ از روش انتخاب بهترین زیرمجموعه (best-subset selection) برای
انتخاب متغیر استفاده میکنند. با این حال به روش انتخاب بهترین زیرمجموعه چند اشکال وارد است. شدیدترین آنها همانطور که Breimanدر سال ۱۹۹۶ مورد بررسی قرار داد، عدم پایایی(stability) است. منظور از پایایی در این زمینه، این است که با تغییر اندک در متغیرهای پیشبینیکننده، در انتخاب بهترین زیرمجموعه تغییر زیادی صورت نگیرد. دیگر اینکه زمانی که تعداد متغیرها زیاد است از نظر محاسباتی غیر عملی است. انتخاب گام به گام (stepwise-selection)جانشین محاسباتی برای انتخاب بهترین زیر مجموعه است. معذلک، انتخاب گام به گام بسیار متغیر است و اغلب اوقات به جواب بهینهی موضعی میانجامد. به علاوه همانطور که Fan و Liدرسال۲۰۰۱ و همچنین Shen و Ye در سال ۲۰۰۲ مورد بررسی قراردادند، این دستورالعملهای انتخاب، خطای تصادفی را در مرحلهی انتخاب متغیر در نظر نمیگیرند.
انتخاب متغیر در رگرسیون چندکی
برای انجام انتخاب متغیر، تاوانهای (penalties) گوناگونی معرفی شدهاند. تاوان که در LASSOمورد استفاده قرار میگیرد، توسط Tibshirani در سال ۱۹۹۰ برای رسیدن به انتخاب متغیر معرفی شد. Fan و Li در سال ۲۰۰۱ یک روش متحد از طریق رگرسیون کمترین مربعات غیر مقعر، پیشنهاد کردند که بهطور همزمان عمل انتخاب متغیر و برآورد پارامترها را انجام میدهد. این روش، جواب تنک (sparse) تولید میکند، پایایی انتخاب متغیر را تضمین میکند، و برآوردهای نااریب برای ضرائب بزرگ ارائه میدهد. منظور از جواب تنک، ارائه برآورد صفر برای ضرائبی است که در واقعیت، تأثیرگذار نیستند. این سه
خاصیت پسندیده یک تاوان خوب است که توسط Fan و Li در سال ۲۰۰۱ مورد بررسی قرار گرفت. یک نمونه از تاوان غیر محدب، تابع انحراف قدرمطلق به طور هموار بریده شده (smoothly clipped absolute deviation) (SCAD) است که اولین بار توسط Fan در سال ۱۹۹۷ معرفی شد، و سپس توسط Fan و Li در سال ۲۰۰۱ مورد مطالعه بیشتر قرار گرفت تا خواص پیشگویی (oracle properties) آن در زمینه درستنمایی تاوانیده (penalized likelihood) نشان داده شود. پس از آن، یک سری مقالات توسط Fan و Li در سال ۲۰۰۲ و ۲۰۰۴، Fan و Peng در سال ۲۰۰۴، Hunter و Li در سال ۲۰۰۵ نوشته شده و خواص دیگر آن مورد مطالعه قرار گرفته و الگوریتمهای جدیدی ارائه شده است.
Zou در سال ۲۰۰۶ با به کار بردن وزنهای انطباقی برای تاوانیدن ضرائب مختلف، در تاوان LASSO، تاوان LASSO انطباقی (adaptive-LASSO) را معرفی کرد و خواص پیشگویی آن را نشان داد. نتایج مشابه در مقالههایی که توسط Yuan و Lin در سال ۲۰۰۷، Zhao و Yu در سال ۲۰۰۶ نوشته شده است،
ساخته شد. Zhang و Lu در سال ۲۰۰۷ LASSO انطباقی را در مدلهای خطر متناسب (proportional hazard models) مورد مطالعه قرار دادند. Candes و Tao در سال ۲۰۰۷ همچنین Fan و Lv در سال ۲۰۰۶ انتخاب متغیر را در زمینههایی که از نظر بعدی بزرگتر از اندازه نمونه هستند، مورد مطالعه قرار دادند. Koenker در سال ۲۰۰۴ تاوان LASSO را برای مدل رگرسیون چندکی با اثرات آمیخته (mixed-effect quantile regression model) برای دادههای طولی به کار برد. Li و Zhu در سال ۲۰۰۵ راه حلی برای رگرسیون چندکی تاوانیده شده ( penalized quantile regression) ارائه کردند. Wang، Li و Jiang در سال ۲۰۰۷ رگرسیون کمترین انحراف قدر مطلق را با تاوان LASSO انطباقی در نظر گرفتند.
انتخاب متغیر در رگرسیون چندکی
در این پایاننامه به انتخاب متغیر در رگرسیون چندکی تاوانیده میپردازیم. توجه داشته باشید تابع زیانی که در رگرسیون چندکی مورد استفاده قرار میگیرد در مبدأ مشتقپذیر نیست، در نتیجه خواص پیشگویی کلی برای درستنمایی تاوانیده غیر مقعر که توسط Fan و Li در سال ۲۰۰۱ مورد مطالعه قرار گرفت، به طور مستقیم قابل اجرا نیست. در این پایاننامه خواص پیشگویی تاوانهای SCAD و LASSO انطباقی در زمینهی رگرسیون چندکی تاوانیده، که شامل رگرسیون کمترین انحراف قدرمطلق به عنوان یک حالت خاص میباشد، تعمیم داده میشود………………………….. انتخاب متغیر در رگرسیون چندکی
بلافاصله بعد از پرداخت موفق میتوانید فایل کامل این پروژه را با سرعت و امنیت دانلود کنید
انتخاب متغیر در رگرسیون چندکی
اولین نفر باشید که نقد و بررسی ارسال میکنید... “انتخاب متغیر در رگرسیون چندکی”
انتخاب متغیر در رگرسیون چندکی
انتخاب متغیر در رگرسیون چندکی دانلود پایان نامه کارشناسی ارشد ریاضیات موضوع جدید پروپوزال
قیمت : تومان9,500
نقد وبررسی
نقد بررسی یافت نشد...