Sistemas Inteligentes Clase 4-Ejercicios
Sistemas Inteligentes Clase 4-Ejercicios
Sistemas Inteligentes Clase 4-Ejercicios
Sea Ri ahora la recompensa recibida después de la i-ésima selección de esta acción, y sea Qn la
estimación del valor de su acción después de haber sido seleccionada n - 1 veces, que ahora
podemos escribir simplemente como