Iskani niz je bil najden v DRUGI VSEBINI:
agent
sistem, ki v navideznem ali resničnem okolju zaznava njegovo stanje in z avtonomnim izvajanjem akcij rešuje določeno nalogo
en agent
epizoda
pri spodbujevanem učenju zaporedje izkušenj agenta pri interakciji z okoljem, ki se zaključi s prehodom v končno stanje okolja ali po izvedbi vnaprej določenega števila akcij
en episode
kompromis raziskovanje-izkoriščanje
pri spodbujevanem učenju uravnoteževanje izbire med izvajanjem še nepreizkušenih akcij in najboljših doslej preizkušenih akcij agenta
en exploration-exploitation trade-off
model
formalizirana predstavitev, npr. pojavov, objektov, dokumentov, akcij ali relacij med njimi, ki vsebuje abstrahirane informacije, potrebne za izvajanje določene naloge, npr. klasifikacijo slik ali dokumentov v strojnem učenju
en model
planiranje
področje umetne inteligence, ki se ukvarja z razvojem algoritmov za avtomatsko določanje strategij delovanja ali zaporedij akcij, ki naj bi avtonomnega agenta, npr. mobilnega robota, spoznavnega robota, privedle do izpolnitve podanega cilja
en planning
skupna nagrada
pri spodbujevanem učenju vrednost vseh uteženih nagrad, ki jih agent pridobi z izvajanjem zaporedja akcij iz trenutnega stanja okolja
en cumulative reward; return
spodbujevano učenje
strojno učenje, pri katerem se model gradi v interakciji z okoljem, pri čemer je cilj učečega se agenta maksimizirati skupno nagrado, ki jo dobi kot posledico izvedenih akcij
en reinforcement learning
učenje mimo strategije
spodbujevano učenje, pri katerem agent optimizira drugo strategijo od tiste, ki jo uporablja za izbiro akcij
en off-policy learning