Reinforcement Learning (RL) otrzymuje system nagród i kar. Uczenie się przez wzmacnianie jest szersze niż uczenie monitorowane lub nienadzorowane, aby osiągnąć cel lub po prostu skorzystać z zachęt i kar za kontakt ze środowiskiem.
Jakie rodzaje nagród i kar są przyznawane jako informacja zwrotna?
Pierwszy to ocena opinii jako wzmocnienie, gdzie nagrody i kary są wykorzystywane do kształtowania zachowania ucznia poprzez mechanizmy wzmacniającego uczenia się.
Jakie są rodzaje nagród i kar?
Teraz połączmy te cztery terminy: wzmocnienie pozytywne, wzmocnienie negatywne, kara pozytywna i kara negatywna (Tabela 1). Dodaje się coś, co zwiększa prawdopodobieństwo zachowania. Dodano coś, aby zmniejszyć prawdopodobieństwo zachowania.
Który rodzaj uczenia się opiera się na podejściu do nagradzania i karania?
W sposób dorozumiany, bez świadomego przetwarzania, ludzie dowiadują się o wartości nagrody i kary w każdym kontekście i czynności. Te procesy uczenia się asocjacyjnego z kolei wpływają na prawdopodobieństwo, że poszczególne osoby ponownie zaangażują się w takie działania lub będą szukać tego kontekstu.
Jak nagroda i kara wpływają na naukę?
Ogólnie rzecz biorąc, zauważyliśmy niewielki wpływ nagrody na naukę lub retencję. Kara nie miała wpływu na utrzymanie umiejętności, ale miała znaczący,zależny od zadania wpływ na uczenie się. W karze SRTT poprawiona prędkość z minimalnym wpływem na dokładność. W przeciwieństwie do tego, kara osłabiła wydajność w FTT.