Tipkovnice
strategija, ki jo agent pri učenju mimo strategije uporablja za izbiro akcij in ni enaka tisti, ki jo dejansko optimiziraen behavior policy
Obvestilo o uporabi piškotkov
Trenutno imate izkljopljeno uporabo ne-nujnih piškotkov.
Ta stran uporablja piškotke. Z nadaljevanjem uporabe te strani soglašate z uporabo nujnih piškotkov. Za ne-nujne piškotke podajte izrecno soglasje.
Več o piškotkih
Dostopnost