Skip to the content.

Az órákon elhangzott fontosabb fogalmak (Tételjegyzék)

A Corvinus egyetem Matematika Tanszékének Dinamikus Programozás előadásai a 2024-2025 tanév tavaszi félévében.

Az órák:

Jegyzetek

Az előadások anyaga: Mértékelmélet és Dinamikus Programozás (v1.5-33). Itt javítom a megjelenés óta talált hibákat elírásokat, ezért ajánlom a fenti jegyzet letöltését. Kötelességem feltüntetni a kiadói jogok tulajdonosát az eredeti változat megjelölésével: Mértékelmélet és Dinamikus Programozás, TypoTeX 2014.

Ajánlott olvasmányok:

Számonkérés

Szóbeli vizsga a szemeszter végén

Az órákon elhangzott legfontosabb fogalmak egyben tételjegyzék

  1. Szuprémum probléma és a Bellman-egyenlet
    • Állapot tér, hozadék függvény, rákövetkező függvény, diszkont tényező
    • Megengedett út, vagy terv; út hasznossága
    • Alapfeltevések, speciálisan korlátos hozadék függvény, és \(0\leq \beta<1\) esetben
    • Szupremum feladat (SP) formalizációja
    • Érték függvény és optimális út
    • Bellman-egyenlet
    • Indukciós lemma
    • Optimális út jellemzése
    • (SP) értékfüggvénye egyben a Bellman-egyenlet megoldása
    • A Bellman-egyenlet megoldása egyben (SP) értékfüggvénye
    • Policy leképezés, Optimal policy leképezés
    • Korlátos pillanatnyi hasznosság függvény és \(\beta<1\) diszkont tényező mellett, egy pálya pontosan akkor optimális, ha azt az op-leképezés generálja
  2. Az (SP) feladat és a Bellmann-egyenlet illusztrációja Három modell arra szolgál, hogy szokjuk a fogalmakat és lássuk a fent bizonyított állítások mellékfeltételeinek p(f)ontosságát:
    • Fő a változatosság
    • Befektés-megtakarítás-modell
    • Megtakarítás-modell
  3. A Bellman-egyenlet megoldása mint fixpont
    • Korlátos hozam függvény és \(\beta<1\) mellett
    • Blackwell-lemma
    • Bellman-operátor
    • Bellman-operátor monotonitása és konkavitása
    • Berge-tétel alkalmazása
    • Bellman-egyenlet egyetlen megoldásának folytonossága
    • Bellman-egyenlet egyetlen megoldásának monotonitása és folytonossága
    • Bellman-egyenlet egyetlen megoldásának szigorú konkavitása
    • Az optimális policy függvény folytonossága és egyértékűsége
  4. A Bellman-egyenlet megoldásának közelítése
    • Berge-tétel értékfüggvényének pontonkénti és egyenletes közelítése
    • A Bellman-egyenlet megoldásának pontonkénti és egyenletes közelítése, kompaktsági feltétel mellett
  5. Differenciálhatósági feltételek
    • Lemma a grafikon konvexitásáról
    • Konvex függvény szubderiváltja
    • Lemma a konvex függvény differenciálhatóságáról
    • Lemma a konkáv halmazértékű leképezés belső pontjáról
    • A programozás értékfüggvényének deriváltja a Bellman-egyenlet konkáv megoldásának esetében
    • A (SP) feladat belső optimális megoldásának fogalma
    • Az Euler-egyenlet szükségessége
    • Transzverzalitási feltétel
    • A transzverzalitási feltétel és az Euler-egyenlet elegendősége
    • A transzverzalitási feltétel szükségessége
  6. Stabilitás
    • Globális stabilitás fogalma
    • Ljapunov-függvény
    • A Ljapunov-függvény létezése a globális stabilitás elegendő feltétele
    • Egy Ljapunov–függvény jelölt
    • Lineáris rendszer stabilitása
  7. Markov-transzformáció
    • Meta-Dynkin-tétel
    • Sztochasztikus mag fogalma
    • Markov-transzformáció fogalma
    • Markov-transzformáció tulajdonságai, a monton konvergencia tétel alapján
    • Mérhető függvény Markov-transzformáltja is mérhető
  8. Sztochasztikus magok szorzata
    • A szorzat fogalma
    • Fubini-tétel sztochasztikus magokra
  9. Átmenet függvények magszorzata
    • Átmenet függvény fogalma
    • Fubini-tétel alkalmazása átmenet függvényekre
    • Az átmenet függvényeknek mint sztochasztikus magoknak szorzata
  10. Markov-operátor
    • Az átmenet függvény szorzat fogalma
    • Markov-operátor fogalma
    • Adjungált Markov-operátor fogalma
    • Asszociatív szabály
    • Kiterjesztett asszociatív szabály
    • Chapmann-Kolmogorov-azonosság
    • Markov-operátor hatványa is Markov-operátor
  11. Sztochasztikus programozási feladat
    • A feladat definiálása
    • Állapot tér
    • Sokk-tér
    • Átmenet függvény
    • Transzformációs függvény
    • Profit függvény
    • diszkont tényező
    • Megengedett út fogalma
    • Az út létezése
    • Az út folytatása
  12. Optimal policy leképezés által generált út
    • Sztochasztikus supremum feladat
    • Az SP feladat megfogalmazásai
    • A feladathoz értelmezéséhez szükséges feltételek
    • Bellman-egyenlet
    • Optimal policy leképezés
    • Optimal policy leképezés által generált út fogalma és létezése
    • Optimal policy leképezés által generált út, optmális út is
    • Bellman-egyenlet megoldása SP feladat értékfüggvénye
  13. Optimális út
    • Indukciós lemma
    • Optimális terv folytatása is optimális terv
    • SP értékfüggvényére is fennál az indukciós lemma
    • Optimális út egyben az optimal policy leképezás által generált út is.
  14. A sztochasztikus Bellman-egyenlet megoldása mint fixpont
    • Markov operátorok Feller-feltétele
    • Sokk-feltétel
    • Blackwell-lemma
    • Bellman-operátor
    • Bellman-operátor monotonitása és konkavitása
    • Berge-tétel alkalmazása
    • Bellman-egyenlet egyetlen megoldásának folytonossága
    • Bellman-egyenlet egyetlen megoldásának monotonitása és folytonossága
    • Bellman-egyenlet egyetlen megoldásának szigorú konkavitása
    • Az optimális policy függvény folytonossága és egyértékűsége