Конспект книги Карен Прайор: Не рычите на собаку! в 3 частях.
- Что такое подкрепление
- Выработка нужного поведения
- Управление с помощью стимулов
Что такое подкрепление
Подкрепление – это стимул, который происходит одновременно с определенным действием и вызывает конкретный результат в дальнейшем поведении. Подкрепление бывает положительным и отрицательным. При положительном подкреплении стимулом служит что-либо желанное для субъекта тренировки: например, еда или одобрение. При отрицательном подкреплении используются нежелательные действия: громкие звуки, шлепки, неодобрительное выражение лица.
Положительное подкрепление
Если во время действия использовать положительное подкрепление, с большой вероятностью человек или животное повторит это действие и в дальнейшем будет повторять его чаще и усерднее.
Подкрепление применяется только к поведению, которое происходит как минимум однажды или время от времени. Нельзя подкрепить действия, которые никогда не встречаются. К примеру, вы хотите с помощью положительного подкрепления стимулировать другого человека звонить вам по телефону. Но если он не сделает ни одного звонка, у вас не получится воздействовать на него.
Если человек сделает хотя бы один звонок, вы можете использовать методику подкрепления. Положительным подкреплением в этом случае будет позитивная реакция на звонок: одобрение или похвала.
Отрицательное подкрепление в этом случае не сработает. Если вы пожалуетесь на редкие звонки и потребуете звонить чаще, человек будет раздражен. В следующий раз он не захочет этого делать, чтобы избежать неприятностей. Получается, что отрицательным подкреплением вы обучили его звонить реже.
Универсальных реакций для положительного подкрепления не существует: на людей и животных в различных ситуациях действуют разные стимулы. Каждое подкрепление относительно. Если животное сыто, то лакомство на него не подействует. Если человек хочет вас разозлить, то похвала и улыбки не дадут результата. Поэтому нужно выбирать такое подкрепление, в котором субъект нуждается в данный момент. Перед тренировкой или обучением полезно продумать несколько вариантов на всякий случай.
Положительное подкрепление эффективно не только для обучения. Оно используется и во взаимоотношениях между людьми. Традиция дарить подарки основана на положительном подкреплении. Даритель угадывает, что понравится получателю подарка. Если выбор сделан правильно, подарок играет роль положительного подкрепления для обоих.
Отрицательное подкрепление
Отрицательное подкрепление заставляет избегать нежелательного поведения. Неприятные стимулы бывают различной интенсивности: от небольшого сквозняка от кондиционера до удара электрическим током.
Отрицательное подкрепление и наказание – разные вещи. Наказание назначают, когда действие уже закончено и его нельзя исправить. Оно не поможет переписать сочинение, за которое ребенок получил двойку. А отрицательное подкрепление используют в любой период действия. Оно помогает вовремя остановить нежелательное поведение.
Положительное и отрицательное подкрепление работают по одним и тем же правилам. Важно правильно выбирать время подачи и величину подкрепления.
Время подачи
Подкрепление показывает субъекту, какое именно поведение вы одобряете, а какое нет. Эту информацию нужно давать вовремя: не заранее и не поздно, когда уже нет возможности исправить действие.
Например, на тренировке спортсменам важнее во время правильного движения услышать восклицание тренера «Хорошо!», чем после тренировки получить детальный разбор.
Когда родители хотят подбодрить ребенка, который старается сделать что-то сам, они часто хвалят его слишком рано. Если ребенок еще не закончил или допустил ошибку, не успев исправить, не нужно говорить: «Почти все правильно!» или «Молодец, почти закончил». Этим вы подкрепляете не действие, а попытку. В следующий раз ребенок остановится на попытке, не добившись нужного результата.
Величина подкрепления
Подкрепление должно быть маленьким. Лучше использовать много небольших стимулов во время обучения, чем одно большое подкрепление. Это экономит время и дает больший эффект.
Большие подкрепления эффективны, если их использовать периодически и неожиданно. Такая награда должна быть в несколько раз больше обычного стимула. Ее можно давать случайно или после особенно крупной победы. Она придает энергии и повышает мотивацию.
Большие подкрепления хорошо действуют, если испуганный или непокорный субъект обучения не проявляет нужного поведения.
Условное подкрепление
Не всегда подкрепление получается использовать непосредственно во время действия. Когда дрессировщик учит дельфина прыгать, он не может дать животному рыбу в момент правильного или высокого прыжка. Если дать лакомство после прыжка, дельфин не поймет, чем именно он его заслужил – правильным прогибом или высотой. Возможно, он решит прыгать чаще, чтобы каждый раз получать подкрепление.
Чтобы субъект обучения понимал критерии, за которые его поощряют, используется условное подкрепление. Это сигнал, который специально подбирают для связи с действием, например звук, свет или движение.
Дрессировщики дельфинов пользуются полицейским свистком, чтобы руки были свободны, а животное слышало сигнал даже под водой. Собаки и лошади реагируют на похвалу: «хорошая лошадка» или «хорошая собака». Школьные учителя тоже пользуются условным подкреплением, когда говорят «молодец» ученикам, правильно выполняющим задание.
Чтобы условное подкрепление было эффективным, его нужно специально выработать до обучения. Для этого звук или другой сигнал производят одновременно с истинным подкреплением: лакомством или поглаживанием. Когда выработается прочная связь между ними, условное подкрепление становится ценным без истинного. Теперь им можно пользоваться во время тренировки.
Условное подкрепление может быть и отрицательным, что тоже эффективно для воспитания. Например, вы хотите научить кошку реагировать на слово «нет» и знаете, что она боится громких звуков. Уроните на пол тяжелый металлический поднос, одновременно произнося «нет». Кошка запомнит эту связь, и это слово станет отрицательным условным подкреплением.
Режимы подкрепления
Есть три режима подкрепления: постоянный, вариабельный и фиксированный. Постоянное подкрепление необходимо только во время обучения навыку. Когда действие выработано, не нужно его регулярно поддерживать стимулами. Например, когда родитель учит ребенка кататься на велосипеде, он постоянно пользуется подкреплениями: направляет, подсказывает и хвалит. Когда ребенок уже умеет кататься, нет необходимости каждый раз повторять «молодец».
Не подкрепляйте постоянно уже сформированное поведение. Достаточно периодически поддерживать правильные действия. Это называется вариабельное подкрепление.
Еще один режим подкрепления – фиксированный. В таком случае вы тоже используете стимулы периодически, но у вас есть определенный график. Например, вы даете подкрепление за каждые пять повторов правильного действия.
У этого режима есть ограничения. Первые действия не подкрепляются, поэтому субъект сразу начинает снижать усилия. Наглядным примером фиксированного подкрепления служит зарплата по пятницам, из-за которой сотрудникам сложно приняться за работу в понедельник.
Если интервал между подкреплениями большой, то возникает еще одна проблема – замедленный старт: когда сложно начать дело. Мы придумываем тысячи отговорок, чтобы не браться за уборку гаража, если решили наградить себя после уборки. Чтобы преодолеть эту трудность, нужно ввести подкрепление за старт.
Случайные подкрепления
Случайное подкрепление – это непродуманное стечение обстоятельств, которое повлияло на поведение человека или животного. Такие подкрепления часто встречаются в жизни.
Случайные подкрепления далеко не всегда формируют правильное поведение. Иногда человек или животное принимают стечение обстоятельств за закономерность и верят, что в следующий раз такое же действие приведет к подобному результату. Это называется суеверное подкрепление. Часто оно не только не приносит пользы, но и заставляет прикладывать ненужные усилия и даже вредит.
Чтобы во время обучения не сформировались случайные подкрепления, нужно разнообразить все неважные условия: например, заниматься в разных местах или в разное время. Следите, чтобы у обучаемого не образовывались случайные связи, так как они будут мешать формированию правильного поведения.
Самоподкрепление
Некоторые люди относятся к себе строже, чем к остальным. Они работают без выходных, берут на себя много задач, отказываются от отпусков и развлечений. В результате образуются депрессии, неврозы и другие проблемы со здоровьем.
Себя тоже нужно поощрять. Для этого можно использовать положительные подкрепления. Выбирайте подходящий для себя способ: поход в кино, встречу с друзьями, прогулку. Не используйте в качестве подкрепления вредные привычки: фастфуд, алкоголь, сигареты.
Источники
Комментарии в Telegram-группе!