Optimal control and reinforcement learning algorithms for inverse dynamic games
Promotie: | E.N. (Emin) Martirosyan, MSc |
Wanneer: | 13 december 2024 |
Aanvang: | 11:00 |
Promotors: | M. (Ming) Cao, Prof, prof. dr. ir. J.M.A. (Jacquelien) Scherpen |
Waar: | Academiegebouw RUG |
Faculteit: | Science and Engineering |
Optimale algoritmes voor lineair-kwadratische dynamische spellen
In zijn proefschrift behandelt Emin Martirosyan het inverse probleem in lineair-kwadratische dynamische spellen, met als doel de kostenfunctie te leren zodat de gegeven of waargenomen reeks feedbackwetten een Nash-evenwicht vormt. Martirosyan onderzocht verschillende gevallen van lineair-kwadratische dynamische spellen. Voor continue-tijd-spellen ontwikkelde hij algoritmen gebaseerd op gradiëntmethoden, terwijl hij voor discrete-tijd-spellen een iteratief algoritme voorstelt om het inverse probleem op te lossen met behulp van aangepaste algebraïsche Riccati-vergelijkingen.
In zijn onderzoek neemt Martirosyan verschillende payoff- en informatiestructuren in overweging. De ontwikkelde algoritmen worden geïmplementeerd in zowel modelgebaseerde als modelvrije benaderingen. Om potentiële karakteriseringen van oplossingen voor de inverse problemen verder te illustreren, demonstreert Martirosyan een methode om een oneindig aantal equivalente spellen te genereren zonder de algoritmen telkens volledig opnieuw te moeten uitvoeren.