Answers for "policy reinforcement learning"

policy reinforcement learning

a policy π is a function that takes as input a state s and returns an action a.
That is: π(s) → a
a policy π is a probability distribution over actions given states.

Posted by: Guest on October-10-2021

policy reinforcement learning

state----action----probability/'goodness' of taking the action
1         1                     0.6 
1         2                     0.4 
2         1                     0.3
2         2                     0.7

Posted by: Guest on October-10-2021

Code answers related to "policy reinforcement learning"

Code answers related to "Whatever"

Browse Popular Code Answers by Language

Answers for "policy reinforcement learning"

Code answers related to "policy reinforcement learning"

Code answers related to "Whatever"

Browse Popular Code Answers by Language

Answers for "policy reinforcement learning"

Code answers related to "policy reinforcement learning"

Code answers related to "Whatever"

Browse Popular Code Answers by Language

Popular Programming Languages

Advertisements

Company

Compilers

Help

Connect with us