چکيده
اين پايان نامه، طراحي و پياده سازي يك كنترل كننده تطبيقي 1تركيبي هوش مند به نام QMRACچند
عاملي 2را براي سيستم هاي دوخطي 3تحت عدم قطعيتهاي پارامتري ،4نويز و اغتشاشات خارجي، ارايه
ميدهد. اين رويكرد، يك چارچوب يادگيري تقويتي 5چندعاملي را در ساختار داخلي كنترل كننده
تطبيقي مادل مرجع 6ادغام ميكند. اين كنترل كننده از دو عامل Q-Learningبهره ميبرد: يك عامل
تاكتيكي براي تنظيم دقيق نرخ بهره هاي تطبيقي با استفاده از يادگيري Qهمراه با بازپخش تجربه
اولويت بندي شده 7و شكل دهي پاداش مبتني بر پتانسيل، و يك عامل استراتژيك براي تنظيم مدل مرجع
سطح بالاتر كه با فيلتر كالمن توسعه يافته 8براي تخمين حالت و پارامترهاي سيستم همراه است. اين
كنترل كننده، MRACرا براي پايداري فوري و سازگاري با تغيييرات پارامترها به كار ميگيرد، در حالي كه
Q-Learningرا براي بهبود دقت بلندمدت، استحكام و رد اغتشاش هدايت ميكند. كنترل كننده
پيشنهادي بر روي مدل موتور DCدوخطي اعمال شده و از طريق شبيه سازي هاي عددي در افق 40
ثانيه اي با سيگنال مرجع دورهاي، در معرض نويز و اغتشاشات ارزيابي گرديد. نتايج، دقت رديابي برتر، به
حداقل رساندن تلاش كنترلي، كاهش ميانگين مربعات خطا، و هزينه محاساباتي كمتر را در مقايسه با
كنترل كننده هاي IA-MPCو MRACمستقل نشان ميدهند. اين روش، پيشرفتي نوآورانه در ادغام كنترل
تطبيقي و يادگيري تقويتي براي سيستمهاي دوخطي فراهم ميآورد.
.
واژگان كليدي: سيستمهاي دوخطي، كنترل تطبيقي، يادگيري ماشين، يادگيري تقويتي ، ، Q-Learning
MRAC