سورنا فایل

مرجع دانلود فایل ,تحقیق , پروژه , پایان نامه , فایل فلش گوشی

سورنا فایل

مرجع دانلود فایل ,تحقیق , پروژه , پایان نامه , فایل فلش گوشی

محاسبه نقطه تعادل نش در روش های یادگیری تقویتی چند عاملی با فرمت ورد

اختصاصی از سورنا فایل محاسبه نقطه تعادل نش در روش های یادگیری تقویتی چند عاملی با فرمت ورد دانلود با لینک مستقیم و پر سرعت .

محاسبه نقطه تعادل نش در روش های یادگیری تقویتی چند عاملی با فرمت ورد


محاسبه نقطه تعادل نش در روش های یادگیری تقویتی چند عاملی با فرمت ورد

 

 

 

 

 

چکیده

مقدمه

1-کلیات

1-1-سئوالات کلیدی پروژه

1-2- مفروضات پروژه

1-3- روش کار و تحقیق

1-4- ساختاربندی پروژه

2-  تئوری بازی

2-1- رقابت در عامل‌ها

2-1-1- بازیهای بدیهی

2-1-2- بازیهای بدون رقابت

2-1-3- بازیهای کاملاً رقابتی

2-1-4-  بازیهای با تضاد جزئی

2-2-  ساختار بازیها

2-2-1- بازیهای نرمال

2-2-2- بازیهای پویا

2-3-  مفهوم غلبه

2-3-1- غلبه اکید در استراتژی محض

2-3-2- غلبه ضعیف

2-3-3- غلبه اکید در استراتژیهای مرکب

2-4-  نقطه تعادل نش

2-5- نقطه تعادل کامل زیربازی

2-6- بهینگی پارتو

2-7- مفاهیم بسط یافته تعادل نش

2-7-1-  نقطه تعادل هم بسته

2-7-2-  نقطه تعادل ε

2-7-3- نقطه تعادل کامل دست لرزان

2-7-4- نقطه تعادل صحیح

2-7-5- نقطه تعادل پاسخ دو جانبه‌ای (QRE)

2-7-6- نقطه تعادل شبه کامل

2-7-7- نقطه تعادل سلطه‌جو

2-7-8- نقطه تعادل متوالی

3- روشهای کلاسیک محاسبه نقطه تعادل نش

3-1- محاسبه نقطه تعادل نش در بازیهای نرمال

3-1-1-     Lamke-hawson method

3-1-2-     Simple search method

3-2-  محاسبه نقطه تعادل نش در بازیهای پویا

3-2-1- الگوریتم استقراء معکوس

4-  یادگیری تقویتی

4-1-  مبانی اولیه

4-2- خاصیت مارکوف

4-3-  فرآیند تصمیم گیری مارکوف

4-3-1-  تابع ارزش

4-3-2-  تابع ارزش بهینه

4-3-3-  روش‌های حل فرآیندهای تصمیم گیری مارکوف

4-3-4-  برنامه ریزی پویا

4-3-5- روش مونت کارلو

4-3-6-  روش تفاضل زمانی

4-4-  روش‌های یادگیری تک عاملی

4-4-1-  الگوریتم Sarsa

4-4-2-  الگوریتم Q-Learning

4-4-3-  الگوریتم Dyna_Q

5-  یادگیری تقویتی چندعاملی

5-1-  تاریخچه

5-1-1-  یادگیری Nash-Q

5-1-2-  یادگیری Friend or Foe

5-1-3-  یادگیری Asymmetric-Q

5-1-4-     Minimax

5-1-5-     Infinitesimal Gradient Ascent (IGA)

5-1-6-     Wolf-IGA

5-1-7-     (Policy dynamic wolf) PD-Wolf

5-2-   فرآیند بازی مارکوف

6-   محاسبه نقطه تعادل نش در یادگیری تقویتی n-عامله

6-1-  بازیهای مارکوف نرمال n-عامله

6-1-1-   استفاده از الگوریتم ژنتیک در محاسبه نقطه تعادل نش

6-2-   بازیهای مارکوف پویا n-عامله

6-2-1-     استفاده از روش استقراء معکوس تعمیم یافته در محاسبه نقطه تعادل نش

7-  شبیه سازی

7-1-  شبیه‌سازی در محیط مشبک

7-1-1-  استفاده از Q-Learning در محیط‌های چندعاملی

7-1-2-  مقایسه الگوریتم Nash-Q و Q-Learning

7-1-3-  محاسبه نقطه تعادل نش در یادگیری تقویتی چندعاملی

7-2-   شبیه سازی بازار برق

7-2-1- مطالعه موردی

8-  نتیجه‌گیری

مراجع

ABSTRACT

 


دانلود با لینک مستقیم


محاسبه نقطه تعادل نش در روش های یادگیری تقویتی چند عاملی با فرمت ورد
نظرات 0 + ارسال نظر
برای نمایش آواتار خود در این وبلاگ در سایت Gravatar.com ثبت نام کنید. (راهنما)
ایمیل شما بعد از ثبت نمایش داده نخواهد شد