Reinforcement Læring (RL) er en specifik læringsmetode indenfor maskinlæring, hvor algoritmen lærer ved at forsøge og fejle. Målet er at maksimere en specifik belønning, eksempelvis at gå efter maksimale point i et spil.