funkcija vrednosti stanja
DEFINICIJA:
predpis, ki pri spodbujevanem učenju za vsako stanje okolja določa pričakovano vrednost skupne nagrade, ki jo agent pridobi, če začne v danem stanju in akcije izvaja glede na svojo trenutno strategijo


ANGLEŠČINA
TERMIN:
state-value function



Vir: Terminološki slovar s področja umetne inteligence - Skupina avtorjev

Komentiraj slovarski sestavek