Termania - Rezultati iskanja

epizoda

pri spodbujevanem učenju zaporedje izkušenj agenta pri interakciji z okoljem, ki se zaključi s prehodom v končno stanje okolja ali po izvedbi vnaprej določenega števila akcij
en episode

Več ... umetna inteligenca sl

predpis, ki pri spodbujevanem učenju za vsako stanje okolja določa pričakovano vrednost skupne nagrade, ki jo agent pridobi, če začne v danem stanju in akcije izvaja glede na svojo trenutno strategijo
en state-value function

Več ... umetna inteligenca sl

igra s popolno informacijo

igra, pri kateri je stanje okolja agentom v celoti poznano, zaradi česar lahko predvidijo vse možne poteze ostalih agentov, npr. šah ali dama
en perfect information game

Več ... umetna inteligenca sl

igra z nepopolno informacijo

igra, pri kateri agentom stanje okolja ni poznano v celoti, zaradi česar ne morejo predvideti vseh možnih potez ostalih agentov, npr. igra s kartami ali domino
en imperfect information game

Več ... umetna inteligenca sl

strategija

predpis, ki ga uporablja agent pri spodbujevanem učenju za izbiro naslednje akcije glede na trenutno stanje okolja
en policy

Iskani niz je bil najden v DRUGI VSEBINI:

epizoda

funkcija vrednosti stanja

igra s popolno informacijo

igra z nepopolno informacijo

strategija