Iskani niz je bil najden v DRUGI VSEBINI:
Več ...
umetna inteligenca
sl
funkcija vrednosti akcije
predpis, ki pri spodbujevanem učenju za vsak par stanja okolja in akcije agenta določa pričakovano vrednost skupne nagrade, ki jo agent pridobi, če začne v danem stanju in izvede dano akcijo, v nadaljevanju pa akcije izvaja glede na svojo trenutno strategijo
en action-value function; Q-function