Научение. Виды языков-посредников. Эксперименты по обучению животных языкам-посредника. Некоторые принципы подкрепления

Процессы научения подразделяются на два больших класса: неассоциативное и ассоциативное.

Ассоциативное научение основывается на формировании связи между двумя стимулами. При классическом обусловливании образуется временная ассоциация между нейтральным условным стимулом и безусловным стимулом, вызывающим безусловный рефлекторный ответ . Пример классического обусловливания - поведение собак в опытах И.П.Павлова с условными рефлексами . Вид пищи вызывает у голодной собаки безусловный рефлекс слюноотделения. Если предъявлению пищи предшествует звонок, собака усваивает связь между этим звуком и едой. В результате звонок начинает сам по себе вызывать слюноотделение. Если сочетание безусловного (пища) и условного (звонок) раздражителей повторяется с сохранением временного соотношения между ними, мозг научается ассоциировать эти два стимула, и тогда предъявление только одного условного стимула станет вызывать безусловную реакцию - слюноотделение. Конечно, если пища перестает регулярно появляться в сочетании со звонком, условная реакция затухает: происходит угасание рефлекса.

Следующая разновидность ассоциативного научения - инструментальное (оперантное) обусловливание. Его механизм основан на том, что при подкреплении реакции изменяется ее вероятность. Подкрепление может быть положительным (вознаграждение) или отрицательным (наказание). Пример положительного подкрепления: дельфин, выпрыгнув из воды через обруч, получает рыбу. Пример отрицательного: ребенок за плохое поведение отослан в детскую. При положительном подкреплении вероятность реакции повышается, а при отрицательном - снижается.

  • 1. Сущность научения заключается в освоении особью новых биологических значимых свойств вещей и явлений окружающего мира.
  • 2. Содержание научения заключается в образовании связи между сигналами о свойствах вещей и явлений, поступающими в мозг одновременно или с небольшим интервалом (не более 3--4 минут). Точнее -- связи между отражениями этих сигналов, закрепленными в мозгу.
  • 3. Необходимыми условиями образования такой связи являются:
    • а) Подкрепление - один из сигналов должен иметь биологическое значение, т. е. врожденную связь с определенными полезными реакциями организма.

Этим обеспечивается то, что при научении будут выделяться связи вещей, существенные для организма, т. е. такие, которые ему полезны, ведут к удовлетворению его потребностей.

б) Повторение -- совпадение условного сигнала и безусловного должно происходить в опыте животного несколько раз за достаточной короткий промежуток времени.

Этим обеспечивается отсеивание случайных единичных совпадений и выделение устойчивых повторяющихся, т. е. закономерных связей вещей и их свойств.

4. Наконец, основой научения являются генерализация и дифференцировка стимулов, а также их угасание при неподкреплении. Эти особенности механизма научения обеспечивают, как мы видели, синтез, анализ и оценку информации, поступающей из внешнего мира, с точки зрения ее биологического значения для организма.

В основе павловской модели научения лежат три главных предположения.

Первое - что научение заключается в образовании новых связей между различными элементами чувственного опыта организма. Связь по? латински - «ассоциация». Поэтому павловскую модель научения можно назвать ассоциативной.

Второе -- что научение выражается в улучшающейся дифференцировке этих элементов чувственного опыта с точки зрения их биологического значения. Чувство - по-латински «сенсус». Поэтому процесс, который описывает павловская модель можно назвать сенсорным научением.

Третье -- что механизмы поведения имеют рефлекторный характер. Поэтому можно сказать, что павловская модель описывает научение на рефлекторном уровне.

Объединяя все эти черты, павловскую теорию научения можно охарактеризовать как ассоциативную модель сенсорного научения на рефлекторном уровне.

Многочисленные исследования показали, что описываемый ею механизм в той или иной мере обнаруживается почти у всех многоклеточных животных. Когда мы говорили о наличии фактов обучения у большинства живых существ--от гидры до высших млекопитающих, то речь шла именно о их способности к образованию условных рефлексов. И во всех случаях обнаруживаются те же условия их формирования (подкрепление, повторение) и те же закономерности их изменений (генерализация, дифференцировка, угасание при неподкреплении).

Это самая сложная и самая совершенная форма научения, при котором живое существо научается вначале проводить действия над умственной моделью действительности, а затем переносить полученные результаты на реальную действительность.

Представим себе лабиринт, ведущий к кормушке; этот лабиринт сначала раздваивается на левое и правое ответвления, а затем оба ответвления сходятся. Если крысу приучить бежать к кормушке по левому ответвлению а затем его перекрыть, то крыса, наткнувшись на перегородку, внезапно поворачивает и бежит по правому ответвлению, без предварительных проб и ошибок. Иными словами, в процессе обучения у нее в мозге под действием потока осознаваемых и неосознаваемых раздражителей формируется «карта местности» -- так называемая когнитивная карта. В широком смысле слова под когнитивной картой можно понимать не только чисто топографическую схему местности, но любую модель действительности, над которой совершаются умственные действия. Классический пример -- обезьяна, у которой в клетке лежат узкая и широкая метровые трубки, а на отдалении полутора метров от клетки лежит банан; обезьяна безуспешно пытается достать его сначала рукой, потом отдельными трубками, затем на какое-то время замирает («задумывается») и вдруг неожиданно вставляет одну трубку в другую и достает банан -- причем ранее она этого никогда не делала.

У человека когнитивное научение достигло высшего уровня развития, превратившись в научение путем рассуждений.

Неассоциативное обучение

Неассоциативное обучение заключается в ослаблении реакции на раздражитель при его повторных предъявлениях. Любой незнакомый объект при первой встрече вызывает у животного ориентировочную реакцию, которая со временем угасает. Это происходит за счет наиболее примитивной формы обучения – привыкания.

Привыканием называется самая элементарная индивидуально вырабатываемая реакция снижения возбудимости. Она возникает при многократном повторении определенного раздражителя, не грозящего организму существенными последствиями, и заключается в постепенном достаточно устойчивом ослаблении самой реакции или уменьшении частоты ее появления вплоть до полного исчезновения. Иными словами, животное обучается не реагировать на раздражитель, не причиняющий ему вреда или не приносящий пользы. Так, например, человек, живущий в непосредственной близости от железной дороги, вскоре совершенно перестает реагировать на шум проходящих поездов, хотя вначале они его заметно раздражают и мешают спать. Мы привыкаем к тиканью часов, к шуму текущей воды, к рекламным щитам и вывескам. Эти раздражители перестают доходить до нашего сознания. Для нас привыкание означает возникновение такого состояния, когда мы легко узнаем раздражители, с которыми постоянно приходится сталкиваться; воспринимая эти раздражители как вполне обыденное явление, мы игнорируем их.

Привыкание существует практически у всех живых существ: от простейших до человека включительно. Оно обеспечивает адекватность реакций организма, устраняя все лишние, необязательные, не приносящие ощутимой пользы реакции, не затрагивая лишь самые необходимые, что позволяет экономить массу энергии. Животное способно притерпеться практически к любым воздействиям, с которыми ежедневно встречается на своей территории, и не откликаться на них ни ориентировочной, ни оборонительной реакциями, адаптироваться к товарищам по стаду и ограничить свои реакции, возникающие в их присутствии, лишь действительно необходимыми. Благодаря привыканию происходит стандартизация общественного поведения любого сообщества животных, что одновременно приводит к обострению восприятия важнейших ключевых стимулов.

Ассоциативное обучение

При ассоциативном обучении в ЦНС формируется временная связь между двумя стимулами, один из которых изначально был для животного безразличен, а другой выполнял роль вознаграждения или наказания, т.е. происходит образование условного рефлекса. В психологии этот процесс называют обусловливанием.

Условные рефлексы существенно отличаются от описанных выше индивидуально вырабатываемых приспособительных реакций привыкания. У большинства животных они могут быть образованы на любой раздражитель, для восприятия которого организм имеет соответствующие рецепторы. Выработка условных рефлексов происходит при сочетании индифферентного и безусловного раздражителей при обязательном предшествовании первого (подробнее об условиях выработки условных рефлексов см. гл. 3). Очень важной особенностью условных рефлексов является их способность к угасанию при отсутствии подкрепления. Именно поэтому физиологи часто называют их "временными связями".

Биологическое значение способности забывать очень велико – живому организму совершенно ни к чему постоянно удерживать в памяти события и явления, с которыми он не сталкивается в настоящий момент, и таким образом перегружать ЦНС. В то же время, выработанные однажды условные рефлексы легко вспоминаются животными при восстановлении ситуации, которая привела к их возникновению. Таким образом, они обладают высокой стабильностью, а у высших животных способны сохраняться всю жизнь, если, конечно, не возникнет серьезных причин для их полного устранения.

Условные рефлексы являются обширным классом реакций. Существует множество принципов их классификации:

  • по модальности условного раздражителя (зрительные, звуковые, обонятельные, кожные и т.д.);
  • по характеру ответной реакции животного (двигательные или секреторные);
  • по биологическому смыслу (пищевые, оборонительные, половые);
  • по способу образования (условные рефлексы первого, второго, третьего и высших порядков, имитационные условные рефлексы и др.);
  • по временны́м характеристикам образуемых условных рефлексов (наличные и следовые).

Кроме того, имеются условные рефлексы, вырабатываемые на простые раздражители и на различные виды комплексных раздражителей, натуральные – на естественные признаки предметов (например, на запах пищи) и искусственные – на случайные признаки (например, бренчание миски), классические, инструментальные и др.

Поведение: эволюционный подход Курчанов Николай Анатольевич

5.3. Ассоциативное научение

5.3. Ассоциативное научение

Ассоциативное научение (обусловливание) – это процесс образования условных рефлексов. Для некоторых авторов оно стало синонимом научения вообще, являясь основой всего многообразия этого явления. Лежит ли процесс образования условных рефлексов в основе всех форм научения (кроме неассоциативного)? Вопрос этот далеко не простой, и мы не можем дать на него убедительный ответ. А сейчас рассмотрим историю этого вопроса.

К началу XX в. в науке была четко выражена тенденция найти простые способы объяснения сложного поведения. Именно в это время разрабатывает свои подходы выдающийся русский ученый, лауреат Нобелевской премии 1904 г. И. П. Павлов (1849–1936). В 1903 г. он предложил термин условный рефлекс, назвав так приспособительную реакцию организма к среде, вырабатываемую в ходе научения. Условные рефлексы И. П. Павлов рассматривал как элементарные единицы поведения. Это понятие надолго стало одним из ключевых в нейрофизиологии.

Свое учение об условных рефлексах И. П. Павлов назвал высшей нервной деятельностью (ВНД), понимая ее как синоним поведения. Это учение в нашей стране было во многом абсолютизировано и идеологизировано, что нисколько не умаляет общепризнанных заслуг самого И. П. Павлова.

В 1906 г. другой Нобелевский лауреат, английский физиолог Ч. Шеррингтон (1857–1952) публикует работу «Интегративная деятельность нервной системы», в которой он показал, что простые рефлексы, сочетаясь, могут приводить к координированному поведению. Такой факт послужил чрезвычайно веским основанием считать условные рефлексы основой самых сложных форм поведения.

В физиологии обычно выделяют два вида условных рефлексов.

Классические условные рефлексы. В опытах И. П. Павлова, которые вошли во все школьные учебники, собаке неоднократно давалась пища в сочетании с внешним стимулом – звонком. Через некоторое время четко обнаруживалось возрастание слюноотделения в ответ на звонок, который был ранее безразличным стимулом. Собака научилась связывать звонок с пищей.

И. П. Павлов назвал звонок условным стимулом, а пищу – безусловным стимулом. Согласно взглядам И. П. Павлова, в ЦНС происходит формирование временной связи между двумя очагами возбуждения, вызванными этими стимулами. К безусловным стимулам стали относить все стимулы, вызывающие врожденные видоспецифичные реакции – безусловные рефлексы. В экспериментах И. П. Павлова безусловные стимулы играли роль подкрепления. Таким стимулом чаще всего выступала пища, а в роли условных стимулов мог выступать любой сигнал.

Работы И. П. Павлова дали надежную теоретическую платформу для формирующегося направления бихевиоризма в психологии. Но основным методом у бихевиористов стал метод инструментальных условных рефлексов.

Инструментальные условные рефлексы образуются путем подкрепления только определенных действий. Основополагающие разработки в этой области выполнены американским психологом Э. Торндайком (1874–1949), которым в 1898 г. были проведены первые экспериментальные исследования поведения животных. Его знаменитые «проблемные ящики» положили начало широкому применению метода «проб и ошибок» в исследовании поведения. В ящиках животные должны были прийти к «правильному» решению, совершив определенные действия, в результате чего их ждала «награда». Решением могло быть нажатие на рычаг, клевание кнопки, выбор маршрута и т. п.

Американский психолог Б. Скиннер (1904–1990), который стал наиболее знаменитым среди бихевиористов, выработку инструментальных условных рефлексов назвал оперантным научением. Оперантное научение – это спонтанные действия, не вызванные каким-либо очевидным стимулом. Выработка классических условных рефлексов получила название респондентного научения, как поведения, совершаемого в ответ на определенный стимул. Такая терминология закрепилась в нейрофизиологии. С экспериментами Б. Скиннера мы еще познакомимся в дальнейшем.

Поскольку условные рефлексы (как инструментальные, так и классические) имеют много общего и образуются за счет ассоциации нового стимула с вознаграждением, процесс их формирования получил название ассоциативного научения или обусловливания. В формировании обоих типов условных рефлексов мы можем выделить две стадии:

1-я стадия – генерализация. Это начальная стадия выработки условных рефлексов, когда животные реагируют не только на конкретный стимул, но и на близкие по значению стимулы.

2-я стадия – дифференциация. Прогрессивное дифференциальное подкрепление только конкретного стимула учит животных отличать его от других, близких по значению стимулов. Звуковые раздражители начинают дифференцироваться по частоте, световые – по цвету, форме и т. п.

С помощью механизма дифференциации животные способны различать схожие стимулы, что лежит в основе лабораторных исследований. Но в живой природе не меньшее значение имеет процесс генерализации, позволяющий животному адекватно реагировать на схожие раздражители. В природе (в отличие от лаборатории) раздражители не бывают строго постоянны. Важно научиться опасаться не конкретного хищника, а всех представителей его вида.

Обе школы (и ВНД, и бихевиоризм) придавали большое значение разработке понятия торможения. В школе И. П. Павлова стали выделять внутреннее торможение, которое подразумевает неоднократный «обман» животного, и внешнее торможение как действие другого, более сильного безусловного раздражителя. В бихевиоризме была разработана идея реактивного торможения, согласно которой, каждая осуществленная животным реакция уменьшает вероятность своего повторения в отсутствие подкрепления, а подкрепленная реакция увеличивает эту вероятность. Неизвестно почему, но угасание инструментальных условных рефлексов происходит медленнее, чем классических.

Система формирования поведения методом оперантного научения на Западе получила название shaping . Система стала популярной, поскольку появилась, как говорилось выше, в «нужное время». Первые же успехи, достигнутые бихевиористами, подтолкнули их к идее провозглашения безграничных возможностей научения. Слепая вера в возможности «своего» метода не позволяла видеть его пределы как западным бихевиористам, так и сторонникам учения ВНД в Советском Союзе. Однако в действительности все наиболее впечатляющие успехи в научении достигались именно тогда, когда выученные действия были частью репертуара инстинктивного поведения животных. И, наоборот, научение не достигало успеха, если явно противоречило этому поведению.

В 1960-е гг. в этологии был разработан принцип инстинктивного смещения, декларирующий смещение выученного поведения в сторону инстинктивного (Резникова Ж. И., 2005). Многочисленные случаи воспитания животных особями другого вида показывают, что волчонок или лисенок, воспитанные собакой, все равно станут волком или лисицей, хотя их поведение и претерпит некоторые изменения. Диапазон изменений инстинктивного поведения характеризует «жесткость» инстинкта и определяет рамки научения. К важнейшему вопросу «жесткости» инстинкта мы вернемся в следующей главе.

Вследствие научного тупика, к которому пришли бихевиористы в 1960-е гг., обострился интерес к нейрофизиологическим механизмам научения. Большие усилия были приложены к поиску материальных носителей условных рефлексов. Плодотворные подходы к изучению нейрофизиологических механизмов поведения были разработаны в нейроэтологии (Ewert J., 1980).

Развитие теории мотивации позволило пересмотреть интерпретацию слишком жестких экспериментов И. П. Павлова и бихевиористов. Подход к животным как к автоматам, зажатым в станок или заброшенным в лабиринт с двумя альтернативами, не способствовал пониманию природы поведения. Современные подходы к феномену ассоциативного научения изменили взгляды, сформировавшиеся в русле ВНД и бихевиоризма, однако многие моменты остаются непонятными.

Объясняется ли все многообразие условных рефлексов единым механизмом? Отличаются ли условные рефлексы дождевого червя и человека по своей природе? Лежат ли условные рефлексы в основе всех форм научения? Эти вопросы еще не закрыты, но многие ученые убеждены, что основополагающие законы научения едины для всех представителей животного мира (Мак-Фарленд Д., 1988).

Нейрофизиологические механизмы условных рефлексов неразрывно связаны с процессами памяти и будут рассмотрены далее. Пока отметим, что даже в самых простых процессах участвуют сотни различных нейронов. Мы сразу сталкиваемся с проблемой вычленения задействованных нейронов из сложного ансамбля единичных рефлексов. Поскольку в любой реакции в той или иной степени участвует весь организм, то сама концепция рефлекса давно стала выглядеть просто удобной абстракцией (Kuo Z., 1967). Такой взгляд разделяют практически все нейрофизиологи, но термин «рефлекс» слишком прижился в научном лексиконе. Этот вопрос мы также рассмотрим дополнительно.

А сейчас рассмотрим неоднозначную природу явлений подражания и импринтинга, представления о которых неоднократно менялись в истории науки.

Из книги Теоретические основания дрессировки автора Гриценко Владимир Васильевич

НЕГАТИВНОЕ НАУЧЕНИЕ Негативным научением или привыканием называют снижение выраженности или отсутствие поведенческих реакций при повторяемых или продолжительно действующих раздражителях, которые не имеют серьезных последствий и не несут в данный момент

Из книги Основы зоопсихологии автора Фабри Курт Эрнестович

ЛАТЕНТНОЕ НАУЧЕНИЕ Впервые феномен латентного (скрытого, неявного) научения был обнаружен в лабораторных условиях на крысах, которые обследовали лабиринт без всякого подкрепления. Оказалось, что в дальнейшем крыса с таким опытом обучается проходить лабиринт быстрее и с

Из книги Мозг, разум и поведение автора Блум Флойд Э

НАУЧЕНИЕ НА ОСНОВЕ ОБРАЗОВАНИЯ ИНСТРУМЕНТАЛЬНЫХ УСЛОВНЫХ РЕФЛЕКСОВ (ОПЕРАНТНОЕ НАУЧЕНИЕ) Отцом инструментальной формы научения считается Э. Торндайк, который еще в конце прошлого века назвал такую форму научения обучением «методом проб, ошибок и случайного успеха».

Из книги Проблемы этологии автора Акимушкин Игорь Иванович

ИМИТАЦИОННОЕ НАУЧЕНИЕ Имитационным научением или подражанием называют особую форму научения у животных в условиях общения, когда одно животное следует примеру другого.Различают инстинктивное подражание у животных (взаимную стимуляцию), например, присоединение

Из книги Поведение: эволюционный подход автора Курчанов Николай Анатольевич

КОГНИТИВНОЕ НАУЧЕНИЕ Когнитивное научение объединяет высшие формы обучения, свойственные в большей степени взрослым животным с высокоразвитой нервной системой и основанные на ее свойстве формировать целостный образ окружающей среды. При когнитивных формах научения

Из книги автора

Глава 3 НАУЧЕНИЕ

Из книги автора

Эмбриональное научение и созревание В указанной связи приобретает особый вопрос об «эмбриональном научении», считавшемся некоторыми исследователями преимущественным, если не единственным фактором всего сложного процесса первоначального формирования

Из книги автора

Облигатное научение Приведенные выше примеры постнатального научения относятся к упомянутому ранее облигатному научению. Сюда относятся все формы научения, которые в естественных условиях совершенно необходимы для выполнения важнейших жизненных функций, т. е.

Из книги автора

Раннее факультативное научение Как самостоятельная категория приобретения индивидуального опыта факультативное научение играет в раннем онтогенезе еще значительно меньшую роль, чем на последующих этапах онтогенеза. Это объясняется тем, что оно первоначально лишь

Из книги автора

Облигатное научение и ориентация Рассмотрим сначала некоторые процессы, связанные с начальной ориентацией у детеныша. У всех животных здесь первостепенное значение имеют таксисы, которые, как уже было показано, у высших животных дополняются и обогащаются элементами

Из книги автора

Эмоции и научение Если мы больше говорили об отрицательных эмоциях, чем о положительных, то только потому, что последние были меньше изучены как на физиологическом, так и на психологическом уровне. К тому же представления о «вознаграждении» и о механизмах его достижения

Из книги автора

7. Научение и память Мы воспринимаем окружающее начиная с самого момента рождения, а может быть, даже и несколько раньше. Мы видим очертания и цвета, слышим разнообразные звуки, осязаем фактуру предметов, улавливаем запахи, распространяющиеся в воздухе, чувствуем

Из книги автора

Научение и инсайт Релизеры Релизеры - это сигналы, которые вызывают инстинктивные реакции у животных. Релизеров великое множество. Рассмотрим некоторые из них.Классический объект лабораторных исследований этологов - колюшка.Когда приходит пора размножения, самец

Из книги автора

Глава 5. Научение Мы не в силах придумать человеку лучшую похвалу, чем сказать, что он одарен от природы. М. Монтень (1533–1592), французский философ Индивидуальная приспособительная деятельность животных реализуется в ходе онтогенеза в процессах научения. Эта область

Из книги автора

5.2. Неассоциативное научение Если научение обусловлено действием средовых факторов и не требует совпадения (ассоциации) внешних сигналов с определенной деятельностью организма, его можно назвать неассоциативным. Считается, что это наиболее примитивная форма научения,

Из книги автора

5.7. Когнитивное научение Когнитивное научение представляет собой, пожалуй, самый неопределенный раздел с самыми размытыми границами. В общем виде оно может быть определено как способность экстренного создания поведенческих программ путем определения закономерностей

Ассоциативное научение.

Со времен Аристотеля до наших дней основной принцип научения – ассоциация по смежности – формулируется сходным образом. Когда два события повторяются с небольшим интервалом (временнáя смежность), они ассоциируются друг с другом таким образом, что возникновение одного вызывает в памяти другое. Русский физиолог Иван Петрович Павлов (1849–1936) первым занялся исследованием в лабораторных условиях свойств ассоциативного научения. Павлов обнаружил, что, хотя звук колокольчика первоначально никак не отражался на поведении собаки, однако, если он регулярно звонил в момент кормежки, через некоторое время у собаки вырабатывался условный рефлекс: звонок сам по себе начинал вызывать у нее слюноотделение. Павлов измерял степень научения количеством слюны, выделившейся при звонке, не сопровождавшемся кормежкой (см . УСЛОВНЫЙ РЕФЛЕКС). Метод выработки условных рефлексов основан на использовании уже существующей связи между специфической формой поведения (слюноотделением) и неким событием (появлением еды), которое вызывает эту форму поведения. При формировании условного рефлекса в эту цепочку включается нейтральное событие (звонок), которое ассоциируется с событием «естественным» (появлением еды) настолько, что выполняет его функцию.

Психологи подробно исследовали ассоциативное научение методом т.н. парных ассоциаций: вербальные единицы (слова или слоги) заучиваются парами; предъявление впоследствии одного члена пары вызывает вспоминание о другом. Этот тип научения имеет место при овладении иностранным языком: незнакомое слово образует пару со своим эквивалентом на родном языке, и эта пара заучивается до тех пор, пока при предъявлении иностранного слова не будет восприниматься тот смысл, который передает слово на родном языке.

Инструментальное научение.

Второй тип научения, тоже относящийся к основным, осуществляется методом проб и ошибок. Впервые он был систематически изучен американским ученым Э.Торндайком (1874–1949), одним из основателей психологии образования. Торндайк помещал кошку в ящик, из которого она могла выйти, только потянув за шнур, свешивавшийся с крышки. После ряда случайных движений кошка рано или поздно тянула за шнур, обычно совершенно случайно. Однако, когда ее снова помещали в ящик, она уже тратила меньше времени на то, чтобы снова потянуть за шнур, и при повторении ситуации освобождалась из ящика мгновенно. Научение измерялось в секундах, которые требовались кошке для того, чтобы совершить правильное действие. Другой пример инструментального обучения – метод, предложенный американским психологом Б.Скиннером (1904–1990). «Ящик Скиннера» представляет собой тесную клетку с рычагом в одной из стенок; цель эксперимента – научить животное, обычно крысу или голубя, нажимать на этот рычаг. Животное до начала обучения лишают пищи, а рычаг соединяют с механизмом подачи еды в клетку. Хотя сначала животное не обращает внимания на рычаг, рано или поздно оно нажимает на него и получает пищу. Со временем интервал между нажатиями на рычаг уменьшается: животное научается использовать зависимость между желательной реакцией и кормлением.

Иногда научение определенному поведению оказывается таким долгим или сложным, что животное никогда не смогло бы прийти к нему случайно. Тогда применяется метод «последовательных приближений». Не ожидая выполнения всей требуемой последовательности действий, дрессировщик выдает поощрение за что-то похожее на желательный поведенческий акт. Например, если собаку нужно научить перекатываться, ей сначала дают лакомство просто за то, что она ложится по команде. После того, как первая часть освоена, собака получает поощрение лишь при случайном выполнении нужного движения: например, после того, как ляжет, она перекатится на бок. Шаг за шагом дрессировщик добивается все более близкого соответствия желаемому поведению, по принципу детской игры «холодно – теплее – горячо». В целом, инструментальное научение очень похоже на эту игру, но роль спрятанного предмета выполняет определенный вид поведения, а роль слова «горячо» – поощрение.

Последовательные приближения к желаемому поведению применяются и при лечении тяжелых форм шизофрении, когда единственная цель – побудить пациента двигаться и разговаривать вместо того, чтобы уйти в себя и хранить молчание. Как всегда при инструментальном научении, для успешности метода необходимо найти что-то, чего пациент хочет (например, сладости, жевательную резинку или интересные фотографии). После того как обнаружена хоть какая-то реакция, следует определить, какие аспекты поведения наиболее желательны, и сделать их условием получения вознаграждения. Отметим, что к способам инструментального научения относится и наказание, но здесь зависимость возникает между нежелательным поведением и неприятным воздействием.

Последовательное научение.

Некоторые виды научения требуют выполнения отдельных поведенческих актов, каждый из которых по отдельности осваивается легко, но затем они объединяются в определенную последовательность. Исследования одного из видов последовательного научения, т.н. серийного вербального научения, были начаты немецким философом и психологом Г.Эббингаузом (1850–1909). Эксперименты Эббингауза предполагали запоминание списков слов или слогов в определенном порядке и впервые продемонстрировали несколько хорошо известных законов, в частности закон, определяющий способность к запоминанию элементов последовательности. Этот закон «места в серии» гласит, что в любой последовательности легче всего запоминается ее начало, затем конец, а наиболее трудно – часть, следующая непосредственно за серединой. Эффект места в серии проявляется при выполнении любого задания такого рода – от запоминания телефонного номера до заучивания стихотворения.

Овладение навыком представляет собой другой вид последовательного научения, отличающийся от вербального тем, что заучивается последовательность не вербальных, а двигательных реакций. К какой бы области ни относился навык – спорту, игре на музыкальном инструменте или завязыванию шнурков, – овладение им почти всегда предполагает три стадии: 1) инструктирование, цель которого – определить стоящую перед исполнителем задачу и дать рекомендации по способам ее выполнения; 2) тренировка, при которой требуемые действия выполняются под контролем сознания, сначала медленно и с ошибками, потом быстрее и правильнее; 3) автоматическая стадия, когда поведенческие акты протекают гладко и требуют все меньше и меньше осознанного контроля (примерами автоматического навыка служат завязывание шнурков, переключение передач в автомобиле, ведение мяча опытным игроком в баскетбол).

НЕКОТОРЫЕ ПРИНЦИПЫ ПОДКРЕПЛЕНИЯ

Ряд видов научения требует подкрепления. При инструментальном научении подкреплением служат награда или наказание. В отдельных видах научения человека подкреплением является просто информация о том, правильны или нет его действия. В силу того, что в таких областях, как воспитание ребенка и психотерапия, роль подкрепления весьма велика, ряд аспектов подкрепления будет рассмотрен более подробно.

Вторичное подкрепление.

В ходе ассоциативного научения некоторые сигналы, которые изначально не имели никакой ценности или не говорили об опасности, соединяются в сознании с событиями, обладающими ценностью или связанными с опасностью. Если это происходит, сигналы или события, ранее носившие нейтральный характер, начинают сами действовать как поощрение или наказание; такой процесс носит название вторичного подкрепления. Классический пример вторичного подкрепления – деньги. Животные в ящике Скиннера готовы нажимать на рычаг, чтобы завладеть специальными жетонами, обмениваемыми на пищу, или добиться того, что начнет звонить звонок, со звуком которого они приучены отождествлять появление еды. Научение, приводящее к избеганию, иллюстрирует вариант вторичного подкрепления через наказание. Животное выполняет определенные действия при появлении сигнала, который, хотя сам и не является неприятным, постоянно сопровождает какое-то неприятное событие. Например, собака, которую часто бьют, съеживается и обращается в бегство, стоит ее хозяину поднять руку, хотя в самой по себе поднятой руке ничего опасного нет. При использовании для контроля за поведением положительного и отрицательного вторичного подкрепления нет необходимости в частом фактическом поощрении или наказании. Так, когда животных дрессируют по методу последовательных приближений, подкреплением при каждой попытке обычно служит лишь щелкающий звук, который до этого регулярно сопровождал появление пищи.

Поощрение или наказание.

Одна из проблем научения – не только добиться нового, желательного поведения, но и избавиться от проявлений нежелательного. Главная цель наказания – устранить имеющее место поведение, а не заменить его новым. Часто, например при воспитании детей или их обучении, возникает вопрос, что лучше: наказать за проступок или дождаться желательного поведения и поощрить ребенка. Наибольших результатов удается достичь, когда наказание сопровождает старое поведение, а награда – новое. Хотя это всего лишь общее правило, которое не может использоваться во всех случаях жизни, оно подчеркивает важный принцип: следует обращать внимание не только на само поведение – нежелательное, устраняемое при помощи наказания, и желательное, поощряемое наградой, – но и на наличие альтернативы данному типу поведения. Если требуется отучить ребенка дергать кошку за хвост, то, согласно этому принципу, необходимо не только наказать малыша, но и предложить ему другое занятие (например, игру с игрушечной машинкой) и наградить его за переключение. Если человек осваивает работу с каким-либо механизмом, инструктор должен не просто терпеливо ждать, когда тот все сделает правильно, а показать ему его ошибки.

Частичное подкрепление.

Инструментальное научение с использованием поощрения – например, приучение крысы в ящике Скиннера нажимать на рычаг ради получения пищи или похвала ребенку, когда он говорит «спасибо» и «пожалуйста», – предполагает несколько видов зависимости между поведением и поощрением. Самый обычный вид зависимости – постоянное подкрепление, при котором награда выдается за каждую правильную реакцию. Другой вариант – частичное подкрепление, предлагающее поощрение только при некоторых правильных реакциях, скажем в каждом третьем случае желаемого поведения, или в каждом десятом, или при его первом проявлении каждый час или каждый день. Воздействие частичного подкрепления важно и представляет большой интерес. При частичном подкреплении для освоения желаемого поведения требуется больше времени, но результаты оказываются гораздо более стойкими. Сохранение эффекта особенно заметно, когда поощрение прекращается; такая процедура называется «угасанием». Поведение, освоенное при частичном подкреплении, сохраняется надолго, а освоенное при постоянном подкреплении быстро прекращается.

ПЕРЕНОС И ИНТЕРФЕРЕНЦИЯ

Научение определенному типу поведения редко происходит изолированно. Чаще имеет место сходство между теми ситуациями, в которых осваиваются разные типы поведения, или сходство между самими типами поведения. Когда, например, сходны между собой два последовательных учебных задания, выполнение первого из них облегчает выполнение второго; такой эффект называют «переносом». Положительный перенос возникает в том случае, если освоение первого умения помогает в освоении второго; например, научившись играть в теннис, человек легче научится играть в бадминтон, а ребенок, умеющий писать на доске, легче освоит письмо ручкой на бумаге. Отрицательный перенос происходит в противоположных ситуациях, т.е. когда освоение первой задачи мешает научиться выполнять вторую: например, неправильно запомнив имя нового знакомого, труднее выучить правильное имя; умение переключать передачи в автомобиле одной марки может затруднить пользование автомобилем другой марки, где все рычаги расположены иначе. Общий принцип заключается в следующем: положительный перенос возможен между двумя видами деятельности, если второй из них требует такого же поведения, как и первый, но в иной ситуации; отрицательный перенос возникает при освоении нового способа поведения взамен прежнего в той же ситуации.

Отрицательный перенос представляет особый интерес. При его экспериментальном изучении используют «угасание», т.е. процедуру, когда поощрение прекращается. Хотя такие опыты обычно проводятся для того, чтобы проследить за исчезновением ранее подкрепляемого поведения, они позволяют придти к выводу, что последнее всегда замещается новым поведением – пусть даже всего лишь бездействием. Широко исследовалась также т.н. вербальная интерференция, суть которой в том, что новый словесный материал хуже запоминается из-за наложения другого, уже известного материала того же рода; в таких случаях задача ассоциативного научения – сформировать новую ассоциацию к слову или предмету, уже с чем-то ассоциирующемуся (например, когда от испытуемого требуется запомнить, что по-французски его любимец называется chien, а не собака). Наконец, в психотерапии существует метод противообусловливания, в соответствии с которым пациентов, страдающих навязчивым страхом (фобией), обучают расслабляться при виде предмета, вызывающего страх, или чего-то, что его символизирует. Так, пациент, боящийся змей, сначала обучается методу глубокой релаксации, а затем его постепенно приучают во время расслабления думать о змеях, заменяя существовавший ранее страх спокойным поведением. Во всех таких ситуациях, когда возникают две интерферирующие реакции, выраженность конфликтующих типов поведения отчетливо зависит от времени, истекшего с момента их освоения. Если оценивать успех немедленно после того, как было освоено новое задание – либо в серии экспериментов без поощрения, либо путем неоднократного называния собаки словом chien или повторяющегося сочетания релаксации с представлением о змее, – второй тип поведения оказывается доминирующим. Однако, если возникает перерыв в тренировках, вновь проявляется первый тип поведения. Например, если человек, старательно упражняясь, научился наконец переключать передачи в новом автомобиле, где рукоятки расположены иначе, чем в старом, то недельный перерыв приведет к восстановлению прежней привычки и ошибкам в применении нового навыка. Периодические тренировки поведения нового типа раз от раза уменьшают вероятность рецидивов, но, поскольку прежние действия ни при каких условиях не искореняются совсем, некоторые специалисты склонны считать, что изначальное научение никогда полностью не стирается, и новые реакции лишь доминируют над старыми.

ПРИНЦИПЫ ЭФФЕКТИВНОГО НАУЧЕНИЯ

Хотя некоторые принципы научения, такие, как зависимость его успеха от практики, никого не могут удивить, были найдены и менее очевидные закономерности, весьма полезные во многих случаях.

Кодирование информации в памяти.

Многие виды обучения включают три важнейших элемента: звук, смысл и зрительный образ. Например, необходимо образовать ассоциацию между словами «собака» и «стол». Обучение путем кодирования звука требует все новых и новых повторений этих слов, вслушивания в то, как они звучат вместе, и запоминания ощущений, возникающих при их повторении. Этот акустический метод, называемый механическим запоминанием, иногда необходим, но значительно уступает кодированию по смыслу. Осмысленное усвоение ассоциации между словами «собака» и «стол» включает мысль о собаке, мысль о столе и установление какой-то связи между ними, например утверждения, что собака никогда не работает за столом. Смысловое кодирование – наиболее важный фактор успешного школьного образования. Длительная усердная работа, использующая механическое запоминание, не дает тех результатов, какие достигаются в ходе намного меньшего числа занятий, в которых основное внимание уделяется смыслу урока. Иногда же наиболее результативным оказывается третий метод – метод формирования зрительных образов. В случае с «собакой» и «столом» процедура должна заключаться в создании реалистического мысленного образа, в котором важную роль играют и собака, и стол, например образа старинного письменного стола, на котором стоит пресс-папье с ручкой в виде охотничьей собаки. Чем более живым окажется образ, тем легче впоследствии вспомнить связь между этими двумя объектами. Конечно, в некоторых случаях, особенно если дело касается абстрактных понятий типа «несчастье» и «энергия», нет простого способа визуального представления и приходится полагаться только на смысловое кодирование. Таким образом, эффективное обучение обеспечивают не только время и усилия, затраченные на практику; большое значение имеет также сам характер практики.

Организация практики.

При освоении навыка, как и во многих других ситуациях, полезно делать частые перерывы для отдыха, а не практиковаться непрерывно. То же количество занятий приведет к более эффективному научению, если они распределены во времени, а не сконцентрированы в единый блок, как это делается при т.н. массированном обучении. Занятия, проводимые частично утром и частично вечером, обеспечивают большее различие в условиях обучения, чем занятия только утром или только вечером. Однако часть процесса обучения заключается в том, чтобы обучаемый мог вспомнить сохраненную памятью информацию, и такому вспоминанию способствует воссоздание ситуации, в которой что-то было выучено. Например, результаты тестирования оказываются лучше, если оно проводится не в специальном экзаменационном классе, а в том же помещении, где происходило обучение. См. также