- Антецеденты оперантного обусловливания
- Основные концепции оперантного обусловливания
- - Армирование
- Положительное подкрепление
- Отрицательное подкрепление
- Первичные подкрепления
- Вторичные арматуры
- - Трехсрочное непредвиденное обстоятельство
- - Наказание
- Положительное наказание
- Отрицательное наказание
- - Вымирание
- - Обобщение
- - Дискриминация
- Программы подкрепления
- Программы непрерывного подкрепления
- Программы периодического подкрепления
- Программы с фиксированным соотношением
- Программы с переменным соотношением
- Программы с фиксированным интервалом
- Программы с переменным интервалом
- Изменение поведения
- Последовательные подходы или формирование
- Цепной
- Ссылки
Оперантного кондиционирования или инструментальное кондиционирования является тип обучения , где поведение контролируется с последствиями. Он основан на идее, что поведение, которое подкрепляется, проявляется чаще, а наказуемое поведение исключается.
В чем разница между оперантным обусловливанием и классическим обусловливанием? При оперантном обусловливании за произвольной реакцией следует подкрепление. Таким образом, добровольный ответ (например, подготовка к экзамену) с большей вероятностью будет иметь место в будущем.
Коробка Скиннера
Напротив, в классическом кондиционировании стимул автоматически вызывает непроизвольную реакцию. Например, еда, которую видит собака, вызывает выделение слюны.
Оперантное обусловливание можно описать как процесс, который пытается изменить поведение с помощью положительного и отрицательного подкрепления. Посредством оперантного обусловливания человек устанавливает связь между определенным поведением и последствиями. Примеры:
- Родители награждают ребенка конфетами или другой наградой за хорошие оценки.
- Учитель награждает спокойных и вежливых учеников. Студенты обнаруживают, что, ведя себя таким образом, они получают больше баллов.
- При каждом нажатии на рычаг животному дают пищу.
Б. Ф. Скиннер (1938) ввел термин оперантное обусловливание. Скиннер выделил три типа ответов или оперантов:
- Нейтральные операторы : реакции окружающей среды, которые не увеличивают и не уменьшают вероятность повторения поведения.
- Подкрепления : реакции окружающей среды, которые увеличивают вероятность повторения поведения. Подкрепления могут быть положительными или отрицательными.
- Наказания : реакции окружения, снижающие вероятность повторения поведения. Наказание ослабляет поведение.
Антецеденты оперантного обусловливания
Торндайк был первым, кто осознал, что обусловленность включает в себя больше, чем просто реакцию и поощрение. Ответ происходит при наличии определенных стимулов, учитывая три события: стимул, ответ и последствия ответа или подкрепления.
Эдвард Торндайк. Автор: Popular Science Monthly Volume 80
Эта структура облегчает связь между стимулом и ответом. В своем законе действия Торндайк заявил, что реакции, за которыми следуют усиливающие последствия, будут иметь более высокую вероятность возникновения, когда стимул появится снова.
Напротив, те ответы, которые сопровождаются негативными последствиями, будут иметь меньшую вероятность возникновения при повторном появлении стимула. Закон следствия является предшественником оперантного или инструментального обусловливания, как его назвал Торндайк.
Для Скиннера, поведенческого психолога, обусловливание - это усиление поведения в соответствии с ранее полученными последствиями.
кожевник
Таким образом, существует две формы обусловленности:
- Классический или Павловский: он основан на ассоциации безусловных и условных раздражителей, причем ответы контролируются предшествующими раздражителями.
- Оперантное обусловливание: последующие или подкрепляющие стимулы вызывают определенное поведение. Скиннер объясняет, что если за поведением последует положительное подкрепление, это увеличит вероятность проявления указанного поведения в будущем. Напротив, если за ответом не последует подкрепление или это подкрепление отрицательное, вероятность проявления указанного поведения в будущем будет ниже.
Крыса Скиннера в коробке
Основные концепции оперантного обусловливания
- Армирование
Он отвечает за выдачу ответов, то есть вероятность того, что они произойдут, будь она выше или ниже в будущем. Это подкрепляющий и последующий стимул, поскольку он возникает после того, как возникла реакция.
Невозможно узнать, влияет ли конкретное подкрепление на поведение, до тех пор, пока оно не станет зависимым от реакции, и пока не будет показано, что поведение изменяется как следствие подкрепления.
Есть два типа подкрепления: положительное и отрицательное. Оба имеют одну и ту же цель - увеличить вероятность того, что ответ будет дан в будущих ситуациях. Кроме того, для Скиннера подкрепления определяются поведением, которое можно наблюдать и измерить.
Положительное подкрепление
Позитивное подкрепление усиливает поведение, обеспечивая последствия, которые человек находит вознаграждением. Например, кормить собаку после того, как она сядет. В этом случае будет усилено сидячее поведение.
Отрицательное подкрепление
Удаление неприятного поощрения также может укрепить поведение. Это называется отрицательным подкреплением, потому что именно устранение неблагоприятного стимула для животного или человека приводит к тому, что поведение становится обусловленным.
Отрицательное подкрепление усиливает поведение, останавливая или устраняя неприятный опыт.
Например, если ребенок подвергается насилию дома и когда он выходит на улицу, он не подвергается жестокому обращению, поведение выхода на улицу будет усилено.
Первичные подкрепления
Они будут всеми теми основными подкрепляющими элементами, которые не нуждаются в какой-либо предшествующей обусловленности, чтобы функционировать как таковые. Некоторыми примерами могут быть вода, еда и секс.
Вторичные арматуры
Вторичные подкрепления будут основаны на предыдущих историях обусловливания благодаря ассоциации с безусловными стимулами. Некоторыми примерами могут быть деньги и квалификация.
- Трехсрочное непредвиденное обстоятельство
Источник: Джошуа Сон / Verywell
Это базовая модель оперантного обусловливания, состоящая из трех компонентов: различительного стимула, реакции и подкрепляющего стимула.
Различительным стимулом будет тот, который укажет субъекту, что подкрепление доступно, указывая на то, что если он будет выполнять определенное поведение, он сможет получить указанное подкрепление. Напротив, у нас есть дельта-стимул или стимулы, которые указывают на то, что поведение не приведет к получению какого-либо подкрепления.
Ответом будет поведение, которое будет выполнять субъект, выполнение которого приведет к получению подкрепляющего стимула или нет.
Подкрепляющий стимул отвечает за излучение поведения, поскольку благодаря его появлению вероятность выброса ответа в будущем будет увеличиваться или уменьшаться.
- Наказание
Наказание также измеряется по его влиянию на поведение субъекта. Вместо этого, в отличие от подкрепления, подразумевается уменьшение или подавление определенного поведения.
Наказание снижает вероятность проявления поведения в последующих ситуациях. Однако это не устраняет реакцию, потому что, если угроза наказания уменьшается, поведение может появиться снова.
В наказании также есть два различных типа или процедуры: положительное наказание и отрицательное наказание.
Положительное наказание
Это подразумевает предъявление аверсивного стимула после выполнения определенного поведения. Он дается в зависимости от ответа, данного испытуемым.
Например, при нанесении жидкости на ногти детям для предотвращения онихофагии. Ребенок ощущает неприятный вкус жидкости (положительное наказание), и вероятность того, что он снова грызет ногти, снижается.
Отрицательное наказание
Он заключается в устранении стимула как следствие определенного поведения, то есть в изъятии положительного стимула после выполнения определенного поведения.
Например, если ребенка отстраняют от использования игровой консоли после того, как он провалил экзамен.
- Вымирание
В случае вымирания ответ прекращается, потому что больше не появляется подкрепление. Этот процесс основан на неспособности предоставить соответствующее подкрепление, которое, как ожидается, будет достигнуто, и которое привело к сохранению такого поведения с течением времени.
Когда реакция угасает, различительный стимул становится стимулом угасания. Этот процесс не следует путать с забыванием, которое происходит, когда сила поведения снижается из-за того, что оно не проявлялось в течение определенного периода времени.
Например, если ребенку не дадут денег, несмотря на постоянные жалобы, его поведение погаснет.
- Обобщение
Столкнувшись с данной ситуацией или стимулом, возникает условная реакция, которая может появиться раньше других стимулов или подобных ситуаций.
- Дискриминация
Этот процесс противоположен обобщению, он реагирует по-разному в зависимости от стимула и контекста.
Программы подкрепления
Скиннер также установил различные программы подкрепления посредством своих исследований, в том числе программы непрерывного подкрепления и программы периодического подкрепления.
Программы непрерывного подкрепления
Они основаны на постоянном усилении реакции каждый раз, когда она возникает, то есть каждый раз, когда субъект выполняет желаемое поведение, он получает подкрепляющий или положительный стимул.
Программы периодического подкрепления
С другой стороны, здесь субъект не всегда получает подкрепление, выполняя желаемое поведение. Они определяются на основе количества полученных ответов или временного интервала между ответами, что приводит к различным процедурам.
Программы с фиксированным соотношением
В этих программах поощрение предоставляется, когда субъект генерирует фиксированные и постоянные ответы. Например, в программе соотношения 10 человек получает подкрепление после того, как сделал десять ответов при предъявлении стимула.
Программы с переменным соотношением
Он построен так же, как и предыдущий, но в этом случае количество ответов, которые субъект должен дать, чтобы получить подкрепление, варьируется.
Подкрепление по-прежнему будет зависеть от количества ответов, испускаемых субъектом, но с переменным соотношением, благодаря которому субъект не может предсказать, когда будет получено подкрепление.
Программы с фиксированным интервалом
В интервальных программах получение поощрения не зависит от количества ответов, которые дает испытуемый, а определяется затраченным временем. Следовательно, первая реакция, возникающая по прошествии определенного периода времени, усиливается.
В программах с фиксированным интервалом время между энхансером и энхансером всегда одинаково.
Программы с переменным интервалом
В этих программах поощрение получается через некоторое время, хотя время разное для каждого полученного подкрепления.
Изменение поведения
Последовательные подходы или формирование
Формирование заключается в изменении поведения посредством моделирования поведения или дифференцированного подкрепления последовательных подходов.
Для формирования определенного поведения выполняется ряд шагов. Во-первых, идентифицируется исходное поведение, которое должно быть сформировано, чтобы знать, чего вы хотите достичь.
Впоследствии возможные подкрепления, которые будут использоваться, разграничиваются, и процесс достижения окончательного поведения разделяется на шаги или стадии, усиливая каждую последующую стадию или подход до достижения последней.
С помощью этой динамической процедуры трансформируются как поведение, так и его последствия. В этом смысле усиливаются последовательные подходы к объективному поведению.
Однако, чтобы это можно было осуществить, необходимо начать с предыдущего поведения, которое субъект уже выполняет, чтобы постепенно укреплять свое поведение, пока он не достигнет цели.
Цепной
С его помощью новое поведение формируется из разложения на более простые шаги или последовательности, усиливая каждый ответ, данный на каждом из шагов, чтобы привести к установлению более сложной реакции в поведенческом репертуаре субъекта.
Длинные цепочки ответов могут быть сформированы с использованием условных подкреплений, принятие функциональной единицы и установление которой приводит к приобретению и определению определенного навыка.
Ссылки
- Оперантного кондиционирования. Восстановлено с wikipedia.org
- Оперантного кондиционирования. Восстановлено с e-torredebabel.com.
- Восстановлено с biblio3.url.
- Закон действия. Восстановлено с wikipedia.org.
- Вымирание. Восстановлено с wikipedio.org.
- Домьян М. Принципы обучения и поведения. Актовый зал. 5-е издание.