Kako funkcioniraju rasporedi pojačanja

Kondicioniranje operanta je proces učenja u kojem se nova ponašanja stječu i mijenjaju udruživanjem s posljedicama. Pojačanje ponašanja povećava vjerojatnost da će se ono ponoviti u budućnosti, dok kažnjavanje ponašanja smanjuje vjerojatnost da će se ono ponoviti.

U operantnoj kondiciji, rasporedi pojačanja važna su komponenta procesa učenja. Kada i koliko često pojačavamo ponašanje, može imati dramatičan utjecaj na snagu i brzinu odgovora.

Raspored pojačanja

Raspored pojačanja u osnovi je pravilo koje navodi koji će se slučajevi ponašanja pojačati. U nekim se slučajevima ponašanje može pojačati svaki put kad se dogodi. Ponekad se ponašanje možda uopće ne ojača.

Pozitivna ili negativna armatura mogu se koristiti kao dio kondicioniranja operanta. U oba slučaja, cilj pojačanja je ojačati ponašanje kako bi se ono vjerojatno ponovilo.

Rasporedi pojačanja odvijaju se i u prirodnim situacijama učenja, kao i u strukturiranijim situacijama treninga. U stvarnim uvjetima ponašanje se vjerojatno neće pojačati svaki put kad se dogodi. U situacijama kada namjerno pokušavate pojačati određenu akciju (poput škole, sporta ili treninga životinja), slijedili biste određeni raspored pojačanja.

Neki su rasporedi prikladniji za određene vrste treninga. U nekim slučajevima trening može zahtijevati jedan raspored, a zatim se prebaciti na drugi nakon što se nauči željeno ponašanje.

Vrste rasporeda pojačanja

Dva temeljna oblika rasporeda armiranja nazivaju se kontinuirana armatura i djelomična armatura.

Kontinuirano pojačanje

U kontinuiranom pojačavanju, željeno ponašanje se pojačava svaki put kad se dogodi. Ovaj se raspored najbolje koristi tijekom početnih faza učenja kako bi se stvorila snažna povezanost između ponašanja i odgovora.

Zamislite, na primjer, da pokušavate naučiti psa da se rukuje s vama. Tijekom početnih faza učenja držali biste se kontinuiranog rasporeda pojačavanja kako biste podučavali i uspostavljali ponašanje. To bi moglo uključivati hvatanje pseće šape, protresanje, izgovaranje "promućkanje", a zatim nuđenje nagrade svaki put kad izvršite ove korake. Na kraju će pas početi sam izvoditi akciju.

Rasporedi kontinuiranog pojačanja najučinkovitiji su kada se pokušava naučiti novom ponašanju. Označava obrazac na koji svaki usko definirani odgovor slijedi usko definirana posljedica.

Djelomično pojačanje

Jednom kad se odgovor čvrsto utvrdi, kontinuirani raspored pojačanja obično se prebacuje na djelomični raspored pojačanja, a kod djelomičnog (ili povremenog) pojačanja odgovor se pojačava samo dio vremena. Naučena ponašanja sporije se stječu djelomičnim pojačavanjem, ali odgovor je otporniji na izumiranje.

Sjetite se ranijeg primjera u kojem ste trenirali psa da se trese i. Iako ste u početku koristili kontinuirano pojačanje, pojačavanje ponašanja svaki put je jednostavno nerealno. S vremenom biste se prebacili na djelomični raspored kako biste osigurali dodatno pojačanje kad se ponašanje uspostavi ili nakon što prođe znatno vrijeme.

Postoje četiri rasporeda djelomične armature:

Rasporedi s fiksnim omjerom

Rasporedi s fiksnim omjerima su oni kod kojih je odgovor pojačan tek nakon određenog broja odgovora. Ovaj raspored daje visoku, stabilnu brzinu reagiranja s samo kratkom pauzom nakon isporuke pojačala. Primjer rasporeda s fiksnim omjerom bio bi dostava peleta hrane štakoru nakon što pet puta pritisne šipku.

Rasporedi promjenjivog omjera

Rasporedi promjenjivog omjera nastaju kada je odgovor pojačan nakon nepredvidivog broja odgovora. Ovaj raspored stvara visoku stabilnu stopu reagiranja. Kockanje i igre na sreću dobri su primjeri nagrade temeljene na rasporedu promjenjivih omjera. U laboratorijskim uvjetima to bi moglo uključivati isporuku peleta s hranom pacovima nakon jednog prešanja, opet nakon četiri preše, i opet nakon dva presa.

Rasporedi s fiksnim intervalima

Rasporedi s fiksnim intervalima su oni kod kojih se prvi odgovor nagrađuje tek nakon što protekne određeno vrijeme. Ovaj raspored uzrokuje velike količine reagiranja pri kraju intervala, ali sporije reagiranje odmah nakon isporuke pojačala. Primjer za to u laboratorijskom okruženju bio bi pojačanje štakora laboratorijskim peletom za prvu prešu nakon što prođe interval od 30 sekundi.

Raspored varijabilnih intervala

Rasporedi s promjenjivim intervalima javljaju se kada se odgovor nagradi nakon što je prošlo nepredvidivo vrijeme. Ovaj raspored proizvodi polaganu, stabilnu brzinu odgovora.

Primjer toga bio bi dostava peleta s hranom štakora nakon prvog pritiska šipke nakon intervala od jedne minute; druga kuglica za prvi odgovor nakon petominutnog intervala; i treća kuglica za prvi odgovor nakon trominutnog intervala.

Korištenje odgovarajućeg rasporeda

Odluka kada pojačati ponašanje može ovisiti o brojnim čimbenicima. U slučajevima kada posebno pokušavate naučiti novo ponašanje, kontinuirani raspored često je dobar izbor. Jednom kada se ponašanje nauči, prelazak na djelomični raspored često je poželjniji.

U svakodnevnom životu djelomični rasporedi armature javljaju se mnogo češće nego kontinuirani. Na primjer, zamislite jeste li dobivali nagradu svaki put kad ste se pojavili da radite na vrijeme. S vremenom, umjesto da nagrada bude pozitivno pojačanje, odbijanje nagrade moglo bi se smatrati negativnim pojačanjem.

Umjesto toga, nagrade poput ovih obično se dijele na puno manje predvidljivom rasporedu djelomičnog pojačanja. Ne samo da su puno realističniji, već imaju tendenciju proizvesti i veće stope odgovora, dok su manje podložni izumiranju.

Djelomični rasporedi smanjuju rizik od zasićenja nakon što se utvrdi ponašanje. Ako se nagrada daje bez kraja, subjekt može prestati izvoditi ponašanje ako nagrada više nije potrebna ili potrebna.

Na primjer, zamislite da psa pokušavate naučiti sjediti. Ako hranu koristite kao nagradu svaki put, pas bi mogao prestati nastupati kad se napuni. U takvim slučajevima nešto poput pohvale ili pažnje može biti učinkovitije u jačanju već ustaljenog ponašanja.

Riječ iz vrlo dobrog

Kondicioniranje operanta može biti moćan alat za učenje. Raspored pojačanja koji se koristi tijekom procesa obuke i održavanja može imati glavni utjecaj na to koliko se brzo postiže neko ponašanje, na snagu reakcije i na to koliko se često ponašanje prikazuje.

Da biste utvrdili koji raspored je poželjniji, morate uzeti u obzir različite aspekte situacije, uključujući vrstu ponašanja koje se podučava i vrstu željenog odgovora.