Iskani niz je bil najden v DRUGI VSEBINI:
epizoda
pri spodbujevanem učenju zaporedje izkušenj agenta pri interakciji z okoljem, ki se zaključi s prehodom v končno stanje okolja ali po izvedbi vnaprej določenega števila akcij
en episode
funkcija vrednosti stanja
predpis, ki pri spodbujevanem učenju za vsako stanje okolja določa pričakovano vrednost skupne nagrade, ki jo agent pridobi, če začne v danem stanju in akcije izvaja glede na svojo trenutno strategijo
en state-value function
igra s popolno informacijo
igra, pri kateri je stanje okolja agentom v celoti poznano, zaradi česar lahko predvidijo vse možne poteze ostalih agentov, npr. šah ali dama
en perfect information game