funkcija vrednosti akcije
DEFINICIJA: predpis, ki pri spodbujevanem učenju za vsak par stanja okolja in akcije agenta določa pričakovano vrednost skupne nagrade, ki jo agent pridobi, če začne v danem stanju in izvede dano akcijo, v nadaljevanju pa akcije izvaja glede na svojo trenutno strategijo
SINONIM: funkcija Q
ANGLEŠČINA
TERMIN: action-value function, Q-function