مبانی یادگیری تقویتی

مدرس Martha White

انتشار 2022/12/12

مدت زمان 3h 51m

سطح مناسب همه

فایل تمرینی ندارد

آموزش Fundamentals of Reinforcement Learning

یادگیری تقویتی زیرشاخه یادگیری ماشینی است، اما یک فرمالیسم با هدف کلی برای تصمیم گیری خودکار و هوش مصنوعی نیز هست. این دوره شما را با تکنیک های یادگیری آماری آشنا می کند که در آن یک عامل به صراحت اقداماتی انجام می دهد و با جهان تعامل دارد. درک اهمیت و چالش های عوامل یادگیری که تصمیم گیری می کنند امروزه از اهمیت حیاتی برخوردار است، زیرا شرکت های بیشتری به عوامل تعاملی و تصمیم گیری هوشمند علاقه مند هستند. این دوره شما را با اصول یادگیری تقویتی آشنا می کند. پس از اتمام این دوره، شما می توانید: - مسائل را به عنوان فرآیندهای تصمیم گیری مارکوف رسمی کنید - روش های اکتشاف اولیه و معاوضه اکتشاف/ بهره برداری را درک کنید - توابع ارزش را به عنوان یک ابزار همه منظوره برای تصمیم گیری بهینه درک کنید - بدانید که چگونه برنامه نویسی پویا را پیاده سازی کنید. به عنوان یک رویکرد راه حل کارآمد برای یک مسئله کنترل صنعتی این دوره به شما مفاهیم کلیدی یادگیری تقویتی، زیربنای الگوریتم های کلاسیک و مدرن در RL را آموزش می دهد. پس از اتمام این دوره، می توانید از RL برای مشکلات واقعی استفاده کنید، جایی که MDP را دارید یا می توانید مشخص کنید. این اولین دوره تخصصی آموزش تقویتی است.

Artificial Intelligence (AI) Data Science تقریب تابع سیستم های هوشمند Machine Learning Reinforcement Learning

Welcome to the Course! -Course Introduction

Specialization Introduction ()

Course Introduction ()

Meet your instructors! ()

Your Specialization Roadmap ()

Reinforcement Learning Textbook

Read Me: Pre-requisites and Learning Objectives

An Introduction to Sequential Decision-Making-The K-Armed Bandit Problem

Module 1 Learning Objectives

Weekly Reading

Sequential Decision Making with Evaluative Feedback ()

An Introduction to Sequential Decision-Making-What to Learn? Estimating Action Values

Learning Action Values ()

Estimating Action Values Incrementally ()

An Introduction to Sequential Decision-Making-Exploration vs. Exploitation Tradeoff

What is the trade-off? ()

Optimistic Initial Values ()

Upper-Confidence Bound (UCB) Action Selection ()

Jonathan Langford: Contextual Bandits for Real World Reinforcement Learning ()

Week 1 Summary ()

Chapter Summary

Markov Decision Processes-Introduction to Markov Decision Processes

Module 2 Learning Objectives

Weekly Reading

Markov Decision Processes ()

Examples of MDPs ()

Markov Decision Processes-Goal of Reinforcement Learning

The Goal of Reinforcement Learning ()

Michael Littman: The Reward Hypothesis ()

Markov Decision Processes-Continuing Tasks

Continuing Tasks ()

Examples of Episodic and Continuing Tasks ()

Week 2 Summary ()

Value Functions & Bellman Equations -Policies and Value Functions

Module 3 Learning Objectives

Weekly Reading

Specifying Policies ()

Value Functions ()

Rich Sutton and Andy Barto: A brief History of RL ()

Value Functions & Bellman Equations -Bellman Equations

Bellman Equation Derivation ()

Why Bellman Equations? ()

Value Functions & Bellman Equations -Optimality (Optimal Policies & Value Functions)

Optimal Policies ()

Optimal Value Functions ()

Using Optimal Value Functions to Get Optimal Policies ()

Week 3 Summary ()

Chapter Summary

Dynamic Programming-Policy Evaluation (Prediction)

Module 4 Learning Objectives

Weekly Reading

Policy Evaluation vs. Control ()

Iterative Policy Evaluation ()

Dynamic Programming-Policy Iteration (Control)

Policy Improvement ()

Policy Iteration ()

Dynamic Programming-Generalized Policy Iteration

Flexibility of the Policy Iteration Framework ()

Efficiency of Dynamic Programming ()

Warren Powell: Approximate Dynamic Programming for Fleet Management (Short) ()

Warren Powell: Approximate Dynamic Programming for Fleet Management (Long) ()

Week 4 Summary ()

Chapter Summary

Dynamic Programming-Course Wrap-up

Congratulations! ()

دانلود فایل فشرده

با توجه به امکانات آموزش و همچنین امکانات بسته انتخاب شده لینک دانلود فایل فشرده آماده خواهد شد. با در نظر داشتن این شرایط لطفا بسته مورد نظر خود را انتخاب کرده و روی دکمه درخواست لینک دانلود کلیک کنید

در حال به روزرسانی اطلاعات

درخواست لینک دانلود

در حال به روزرسانی اطلاعات

لطفا قبل از فعالسازی لینک دانلود به موارد زیر توجه کنید:

پسورد فایل‌های فشرده است.
لینک‌های آماده شده تا 8 روز پس از فعالسازی منقضی خواهند شد.
حجم فایل‌ها تخمینی هستند.
در صورتی که لینک دانلود تا 15دقیقه پس از درخواست آماده نشد، از بخش پشتیبانی پیگیری نمایید.

محتواها

38 محتوای ویدئویی 13 محتوای Pdf

زیرنویس‌

فارسی-ماشین و انگلیسی

کیفیت ویدئوها‌

فقط 720p

فایل تمرینی‌

ندارد

آزمون‌

ندارد

دانلود مشاهده آنلاین

تلگرام توییتر واتساپ

آموزش مبانی یادگیری تقویتی

آموزش Fundamentals of Reinforcement Learning

دانلود فایل فشرده

درخواست لینک دانلود