funkcija vrednosti stanja
DEFINICIJA: predpis, ki pri spodbujevanem učenju za vsako stanje okolja določa pričakovano vrednost skupne nagrade, ki jo agent pridobi, če začne v danem stanju in akcije izvaja glede na svojo trenutno strategijo
ANGLEŠČINA
TERMIN: state-value function