deeplearningbook.com.br
Capítulo 67 - Algoritmo de Agente Baseado em IA com Reinforcement Learning – Parte 2 - Deep Learning Book
Model-free v.s. Model-based, On-policy v.s. Off-policy, Baseado em Valor, Baseado em Políticas, Processo de Decisão de Markov, Q-Learning, Deep Q Network (DQN) e Deep Deterministic Policy Gradient (DDPG).
Equipe DSA