Reinforcement Learning (RL) får et system med belønninger og straffe. Forstærkende læring er bredere end overvåget eller uovervåget læring for at nå et mål eller blot få gavn af incitamenter og sanktioner fra miljøkontakt.
I hvilken type belønninger og straf gives som feedback?
Den første er evaluerende feedback som forstærkning, hvor belønninger og straffe bruges til at forme elevernes adfærd gennem forstærkende læringsmekanismer.
Hvilke former for belønning og straf er der?
Lad os nu kombinere disse fire udtryk: positiv forstærkning, negativ forstærkning, positiv straf og negativ straf (tabel 1). Noget tilføjes for at øge sandsynligheden for en adfærd. Noget er tilføjet for at mindske sandsynligheden for en adfærd.
Hvilken type læring er baseret på belønning og straf?
Underforstået, uden bevidst bearbejdning, lærer individer om belønnings- og strafværdien af hver kontekst og aktivitet. Disse associative læring-processer påvirker til gengæld sandsynligheden for, at individer igen vil engagere sig i sådanne aktiviteter eller opsøge den kontekst.
Hvordan påvirker belønning og straf læring?
Samlet set så vi en lille effekt af belønning på enten indlæring eller fastholdelse. Straf havde ingen effekt på fastholdelse af færdigheder, men havde betydelige,opgaveafhængige effekter på læring. I SRTT-straffen forbedret hastighed med minimal indvirkning på nøjagtigheden. I modsætning hertil svækkede straf præstationen på FTT.