Глава 7 Научение
Адаптация и научение
Жизнь любого организма - это прежде всего непрерывная адаптация к условиям столь же непрерывно меняющейся среды.
Из предыдущих глав мы уже знаем, что существование живых организмов сводится к постоянной выработке форм поведения, направ-ленных на восстановление какого-то нарушенного равновесия или на достижение определенных целей.
Это универсальный закон, которому подчиняется все существующее - от атома до Вселенной. Для Вселенной прийти в равновесие, т. е. перестать расширяться, означало бы тепловую смерть. Для нас же -«частиц мироздания» - равновесие может означать лишь биологическую смерть или по меньшей мере психическую смерть. Только такая судьба может ожидать тех, кто перестанет приспосабливаться к окружающей среде.У животных эта непрерывная адаптация осуществляется благодаря. все более и более сложным процессам -от рефлексов до мышления.
В первой главе мы уже убедились в том, что по мере продвижения вверх по ступеням иерархии живых существ стереотипные, предопределенные или запрограммированные формы поведения (у примитивных животных) постепенно уступают место более гибкому и пластичному поведению, позволяющему организмам адаптироваться к тем разнообразным ситуациям, с которыми они ежедневно сталкиваются.
Если рефлекторные и инстинктивные типы поведения не могут претерпевать значительных изменений, то, напротив, приобретенные поведенческие реакции могут изменяться, иногда очень существенно и притом необратимо. Эти изменения происходят в результате того опыта, который в то или иное время приобретает индивидуум.
Именно необратимость или хотя бы стойкость изменений служит отличительной чертой приобретенных форм поведения. Поведенческие реакции порой изменяются и при болезнях, утомлении или сотрясении мозга. Однако изменения в этих случаях -в отличие от научения -бывают лишь временными.
Виды научения
Научение может осуществляться на разных уровнях в зависимости от того, каков его нервный механизм и насколько важны или сложны те структуры, которые в нем участвуют.
Некоторые виды научения могутНаучение 303
происходить уже на уровне рецепторов или спинного мозга; для других же необходимо участие подкорковых структур или даже миллиардов нервных цепей коры головного мозга.
Одни формы научения осуществляются автоматически и непроизвольно. Другие требуют такого программирования, на которое может быть способен лишь развитый мозг высших млекопитающих и в особенности человека.
Мы можем выделить три категории научения, различающиеся по степени участия в них организма как целого. Речь идет соответственно о выработке 1) реактивного поведения, 2) оперантного поведения и 3) такого поведения, которое требует участия мыслительных процессов в обработке информации (когнитивное научение).
Когда создаются новые формы реактивного поведения, организм пассивно реагирует на какие-то внешние факторы и в нервной системе как бы незаметно и более или менее непроизвольно возникают изменения нейронных цепей и формируются новые следы памяти. К таким типам научения относятся следующие (перечислены в порядке усложнения): привыкание (габитуация) и сенсибилизация, импринтинг и условные рефлексы.
Оперантное поведение -это действия, для выработки которых нужно, чтобы организм активно «экспериментировал» с окружающей средой и таким образом устанавливал связи между различными ситуациями. Такие формы поведения возникают при научении путем проб и ошибок, методом формирования реакций и путем наблюдения.
Во всех этих случаях организм изменяет поведение в результате взаимодействия со средой. Именно от того, какие сигналы поступают извне, зависит, какая именно реакция организма будет закрепляться. «Выбор» реакции при этом определяется тем, каковы ее последствия в отношении удовлетворения потребностей или избегания нежелательной ситуации.
К третьей группе относятся формы поведения, обусловленные когнитивным научением. Здесь уже речь идет не просто об ассоциативной связи между какими-то двумя ситуациями или между ситуацией и ответом организма, а об оценке данной ситуации с учетом прошлого опыта и возможных ее последствий.
В результате этой оценки принимается наиболее подходящее решение. К такому типу научения можно отнести латентное научение, выработку психомоторных навыков, инсайт и в особенности научение путем рассуждений.В последующих разделах мы рассмотрим каждый из этих типов научения с тем, чтобы подробнее описать их и оценить их значение для поведения организма.
304 Глава 7 Научение 305
Научение реактивным формам поведения
Реактивное поведение можно определить как реакцию организма на тот или иной раздражитель (или ситуацию-раздражитель) (Malcuit, Pomerlau, 1977). Именно поэтому мы можем отнести к этим формам научения не только классическое обусловливание, но и такие более примитивные явления, как привыкание и сенсибилизация.
Привыкание и сенсибилизация
Это чрезвычайно примитивные виды научения, при которых у организма вырабатывается относительно устойчивая и постоянная реакция на повторные стимулы. Эти две зачаточные формы научения проявляются в изменении степени активации организма данным стимулом: в случае привыкания активация уменьшается, а в случае сенсибилизации увеличивается.
Как уже говорилось в главе 4, привыкание (габитуация) наступает, когда организм -в результате изменений на уровне рецепторов или ретикулярной формации - «научается» игнорировать какой-то повторный или постоянный раздражитель, «убедившись», что он не имеет особого значения для той деятельности, которая в данный момент осуществляется. В отличие от этого при утомлении снижается внимание ко всем действующим раздражителям.
Сенсибилизация -это процесс, противоположный привыканию. При сенсибилизации повторение стимула ведет к более сильной активации организма, и последний становится все более и более чувствительным к данному стимулу; в результате раздражитель, не вызывавший при однократном воздействии никакой реакции, повторяясь, начинает про-воцировать то или иное поведение. Представим себе, например, что в комнате, где мы работаем, жужжит назойливая муха или же из плохо завернутого крана в раковину мерно падают капли воды.
Эти раздражители становятся для нас постепенно все труднее переносимыми. Можно привести и другие примеры - царапину на музыкальной пластинке, вызывающую при каждом прослушивании треск, который мы уже заранее ожидаем, или слова-паразиты вроде «так сказать», «значит» и т. п. в лекциях некоторых преподавателей; иногда такие слова повторяются настолько часто, что могут полностью отвлекать внимание студентов от содержания лекции.Импринтинг
У низших позвоночных животных к реактивным типам научения можно отнести также импринтинг. Об этом явлении мы уже говорили в первой главе и поэтому здесь на нем останавливаться не будем. Напомним только, что речь идет о наследственно запрограммированном и необратимом формировании привязанности новорожденного животного к первому движущемуся объекту, который попадает в поле его зрения в первые часы жизни.
Условные рефлексы
Условные рефлексы возникают в результате формирования связи между специфическим стимулом, вызывающим тот или иной врожденный рефлекс, и каким-либо индифферентным стимулом. В результате индифферентный раздражитель сам по себе начинает вызывать данный рефлекс.
У всех нас к моменту появления на свет уже имеется ряд врожденных рефлексов, таких как выделение слюны при попадании в рот пищи или моргание в ответ на громкий звук. К врожденным рефлексам относятся также отдергивание руки при воздействии болевого раздражителя или коленный рефлекс-разгибание ноги при ударе по коленному сухожилию. Для проявления таких рефлексов не нужно никакого предварительного опыта и никаких других условий, кроме специфического стимула. Иными словами, это безусловные рефлексы -они автоматически включаются в ответ на определенные раздражители, тоже называемые безусловными. Например, когда раздается громкий звонок, мы можем вздрогнуть, но слюноотделение у нас не начнется; электрический удар, полученный конечностью, заставит нас отдернуть эту конечность. но не моргнуть; и т. д.
Бывает, однако, что одновременно со специфическим раздражителем,
306
вызывающим какой-либо безусловный рефлекс, действует другой раздражитель, не имеющий с ним ничего общего.
Если такая связь между двумя раздражителями достаточно ясна или часто повторяется, то индифферентный раздражитель сам по себе начинает вызывать тот же рефлекс.Это явление было открыто русским физиологом И. П. Павловым в 1903 году. В ходе своих опытов Павлов обратил внимание на то, что звон миски, в которую накладывали пищу, вскоре начинал сам по себе вызывать у собаки слюноотделение. Таким образом, индифферентный звуковой стимул, если он просто сочетается во времени с безусловным пищевым раздражителем, может приобрести способность вызывать тот же рефлекс. В связи с этим Павлов назвал такие раздражители условными, а вызываемое ими рефлекторное слюноотделение – условным рефлексом (рис. 7.1).
Достаточно быстро было доказано, что при формировании таких рефлексов действительно происходит образование условной связи с безусловным раздражителем. Павлов показал, что достаточно было прекратить предъявление безусловного стимула, чтобы и условный сигнал быстро переставал действовать. Например, если после подачи звукового сигнала животному не выдавалась пища, то этот сигнал вскоре уже не вызывал слюноотделения. Далее мы еще вернемся к этому феномену угасания, характерному для большинства видов научения путем обусловливания.
С физиологической точки зрения обусловливание можно объяснить тем, что к уже существующей прямой связи между специфическим сенсорным сигналом и безусловным рефлексом как бы пристраивается новый сигнал. В результате этот новый сигнал приобретает возможность сам по себе вызывать тот же рефлекс.
Итак, мы уже знаем, что звонок, подаваемый одновременно с пищей, может в дальнейшем сам по себе вызывать слюноотделение. Точно так же можно добиться того, чтобы электрический удар, наносимый одновременно с сильным звуком, вызывал моргание или, наоборот, чтобы сильный звук в сочетании с ударом тока приводил к одергиванию конечности, и т. п.
По мнению Павлова, таким ассоциативным обусловливанием можно объяснить большинство приобретенных форм поведения.
Такой же точки зрения придерживался и бихевиорист Уотсон, который через несколько лет после Павлова показал, как могли бы развиваться некоторые эмоциональные реакции, не включенные от рождения в естественный репертуар индивидуума (см. документ 7.1).Научение в результате оперантного обусловливания
Как мы видели, реактивные формы поведения возникают в результате таких событий, при которых организм в основном пассивно
307
испытывает внешние воздействия на какие-то его врожденные структуры.
Между тем для животных организмов особенно характерна активность: в любое время организм должен взаимодействовать со средой, стремясь удовлетворять свои потребности или избегать опасных ситуаций. Поэтому обстоятельства, в которые попадает организм и к которым он вынужден приспосабливаться, выбирая те или иные действия, способствуют формированию многих новых форм поведения.
Бихевиористы назвали такие формы поведения оперантными (от лат. operatic - действие), поскольку в этом случае все начинается с действия, совершаемого над окружающей средой; оно вызывает какие-то последствия, от которых и зависит, будет ли организм повторять это действие или, наоборот, избегать его. Таким образом, выработка подобных форм поведения осуществляется в результате закрепления тех действий, последствия которых для организма желательны, и отказа от действий, приводящих к нежелательным последствиям.
К оперантному научению можно отнести три разновидности: научение методом проб и ошибок, путем формирования реакции и путем наблюдения.
Научение методом проб и ошибок
При научении методом проб и ошибок индивидуум, встретившись с каким-либо препятствием, совершает попытки преодолеть его и при этом, постепенно отказываясь от неэффективных действий, находит в конце концов решение задачи.
Такой тип научения был открыт Торндайком (Thorndike, 1890)-одним из первых ученых, заинтересовавшихся процессами научения (рис. 7.2). В своих опытах Торндайк использовал так называемые проблемные клетки, в которые он помещал голодных кошек (рис. 7.3). Некоторые клетки открывались в том случае, если животное тянуло за веревку, а в других нужно было приподнять запорный крючок. Торндайк подсчитывал, сколько попыток и сколько времени требовалось кошке
Рис. 7.2. Эдуард Торндайк, американский психолог (1874-1949). Он впервые стал изучать решение животными задач в лабораторных условиях. Работы Торндайка привели его к теории научения методом проб и ошибок и к закону эффекта, на котором основана эта теория.
308
Рис. 7.3. «Проблемная клетка», разработанная Торндайком в 1911 году. Кошка, помещенная в такую клетку, должна была методом проб и ошибок научиться нажимать на деревянную педаль, что благодаря системе блоков и веревок позволяло открывать дверцу.
для того, чтобы решить стоящую перед ней задачу -выйти из клетки и получить пищу, помещенную снаружи.
Наблюдая за животными, Торндайк заметил, что сначала их действия были чисто случайными, но в конце концов кошка «нечаянно»
Ошибки Ошибки Ошибки
8 12 16 20 24 8 12 16 20 24 8 12 16 20 24
Пробы Пробы Пробы
Рис. 7.4. Кривые научения методом проб и ошибок. Сходные кривые получал Торндайк по данным своих опытов на кошках. Видно, что чем больше проб совершает животное, тем меньше становится число ошибок.
309
задевала веревку или крючок, освобождалась и получала вознаграждение. Однако по мере увеличения числа попыток действия животных все больше сосредоточивались вокруг «ключевого» участка клетки, и число ошибок, а также и время, проведенное в клетке, быстро сокращалось. Торндайк представил эти результаты в виде кривых (рис. 7.4) и вывел закономерности, позволяющие объяснить эффективность такого метода «проб и ошибок». Согласно важнейшей из этих закономерностей - закону эффекта,- в случае, если какое-то действие приводит к желательным результатам, вероятность его повторения возрастает, а если к нежелательным последствиям -снижается (см. документ 7.2).
Однако научение методом проб и ошибок само по себе не очень эффективно. Если бы новые формы поведения удавалось «изобрести» лишь случайным образом, было бы трудно объяснить быстрое приобретение новых навыков людьми и домашними животными. Без сомнения, вполне вероятно, что на протяжении миллионов лет именно такой процесс приводил к выработке различных навыков у наших предков. Но не менее очевидно, что по мере совершенствования этих навыков и упрочения власти человека над окружающей средой постепенно складывались новые способы формирования и передачи новых типов поведения.
Скиннер - признанный вождь американских бихевиористов в последние 30 лет -систематизировал теорию Торндайка, пытаясь объяснить, каким образом в структурированной среде формируется множество различных типов поведения. При этом Скиннер вскрыл принципы оперантного обусловливания и формирования реакций путем последовательных приближений.
Формирование реакций
С точки зрения Скиннера, поведение не всегда возникает чисто случайным образом -нередко оно формируется в результате отбора под действием подкрепляющего фактора. Таким фактором может быть любой стимул, появляющийся или исчезающий после той или иной поведенческой реакции и повышающий вероятность того, что эта реакция будет повторена с целью получить подкрепление. Это позволяет объяснить формирование очень сложных поведенческих реакций поэтапно, каждый этап при этом будет подкрепляться.
Исходя из этих соображений, Скиннер разработал способ формирования поведения путем последовательных приближений, составляющий основу оперантного обусловливания. Этот способ состоит в том, что весь путь от исходного поведения (еще до начала обучения) до конечной реакции, которую исследователь стремится выработать у животного, разбивается на несколько этапов. В дальнейшем остается лишь последовательно и систематически подкреплять каждый из этих этапов и таким образом подводить животное к нужной форме поведения. При таком способе обучения животное вознаграждают за каждое действие, приближающее его к конечной цели, и у него постепенно вырабатывается заданное поведение.
310
Рис. 7.5. Голубь в клетке Скиннера реагирует на световой сигнал, появляющийся перед ним на стенке при освещении пластмассового диска с другой стороны. В ответ на такой сигнал голубь ударяет по диску клювом, чтобы в кормушке появилось зерно.
Допустим, что нам нужно обучить голубя ударять клювом по маленькому светящемуся кружку, когда он захочет получить вознаграждение в виде зернышка (рис. 7.5). Вначале мы будем давать ему зернышко каждый раз, когда он зайдет в ту половину клетки, где находится светящийся кружок. Далее мы будем вознаграждать его лишь в том случае, если он не только зашел в эту половину клетки, но еще и повернулся головой к стенке, на которой находится кружок. На третьем этапе можно, например, давать зернышко при сочетании этих двух условий, если вдобавок еще клюв животного направлен в сторону кружка. Затем постепенно можно заставить голубя касаться клювом кружка и, наконец, ударять по нему с целью получить вознаграждение. Как мы видим, при таком методе обучения к очередному этапу переходят лишь тогда, когда уже сформировалась поведенческая реакция, необходимая на предыдущем этапе (рис. 7.6).
По мнению Скиннера и других бихевиористов, именно так происходит выработка большинства поведенческих реакций у человека. Действительно, можно привести множество примеров, как будто бы частично подтверждающих это.
С позиций Скиннера можно объяснить очень быстрое обучение ребенка первым словам (не распространяя, однако, эту концепцию на освоение языка в целом). Вначале, когда ребенок еще только начинает произносить какие-то членораздельные звуки, лепет «ме-ме-ме» уже вызывает восторг окружающих, и особенно счастливой мамы, которой уже кажется, что дитя зовет именно ее. Однако вскоре энтузиазм родителей по поводу таких звуков остывает до тех пор, пока младенец ко всеобщей радости не выговорит «мо... мо». Потом и эти звуки перестают для новорожденного подкрепляться, пока не появится сравнительно членораздельное «мо-мо». В свою очередь это слово по тем же причинам вскоре сменится сочетанием «мома», и наконец ребенок отчетливо выговорит свое первое слово-«мама». Все же остальные звуки будут восприниматься окружающими лишь как «детский лепет» в буквальном смысле слова, и они постепенно исчезнут из «лексикона» новорожденного.
311
Рис. 7.6. Крыса, помещенная в клетку Скиннера, должна при появлении определенного стимула нажать на рычаг, за что получает пищевое вознаграждение.
Таким образом, в результате избирательного поощрения со стороны членов семьи младенец отбрасывает те неправильные реакции, за которые он не получает социального подкрепления, и сохраняет лишь те, которые наиболее близки к ожидаемому результату.
Формирование реакции играет роль не только в воспитании ребенка, но также в отношениях между супругами и в различных аспектах социальной жизни. Каждый раз, когда индивидуум или социальный институт хочет добиться той или иной поведенческой реакции от партнера или от группы населения, он вполне может запланировать и реализовать такие подкрепляющие факторы, которые повышали бы вероятность желательного поведения. Однако ясно, что подобные методы часто находятся на грани манипулирования личностью и не всегда практикуются исключительно для ее блага.
Кроме того, как мы уже знаем из главы 6, сторонники когнитивного подхода к мотивации полагают, что внешняя мотивация, создаваемая подкреплением, чаще всего приводит к исчезновению внутренней мотивации, присутствующей на первых этапах во многих видах поведения у человека (см. документ 7.3).
Для того чтобы лучше разобраться в приведенных примерах, нам нужно теперь вернуться к некоторым аспектам подкрепления.
Различные стороны процесса подкрепления
Подкрепление - это такое воздействие, при котором появление или исчезновение какого-то стимула в результате той или иной поведенческой реакции повышает вероятность повторения этой реакции. Например, если голодное животное каждый раз будет находить в определенном углу помещения пищу, то оно будет все чаще направляться в этот угол (хорошим примером могут служить эксперименты Олдса, в которых были открыты центры удовольствия; см. документ 6.4). И напротив, если после зажигания красной лампочки животное будет
312
получать удар током, а избежать его можно будет только перепрыгнув из одной половины клетки в другую, то вероятность такой реакции на красную лампочку будет возрастать. В первом случае потребление пищи или удовольствие, получаемое при электростимуляции мозга, играет роль положительного подкрепления. Во втором случае речь идет об отрицательном подкреплении1 - предотвращении электрического удара.
Часто смешивают отрицательное подкрепление с наказанием. Однако, как мы уже знаем, подкрепление всегда увеличивает вероятность повторения данной поведенческой реакции, а наказание, наоборот, приводит к исчезновению такой реакции, которая сочтена нежелательной. Значит, в отличие от подкрепления при наказании стремятся либо подать аверсивный раздражитель (например, нанести животному удар током или отшлепать ребенка), либо лишить вознаграждения (вкусной еды или ласки) каждый раз, когда проявляется такая форма поведения, которую нужно устранить.
Скиннер и многие психологи принципиально отрицают наказание как средство воспитания, предпочитая в основном использование положи-тельных подкрепляющих факторов, которые способствуют выработке у ребенка социально адекватного поведения, а не подавлению социально неадекватного. По их мнению, нежелательные формы поведения легко могли бы исчезнуть, если бы те, кому доверен процесс воспитания, осуществляли его правильно и не были вынуждены наказывать за то, что они сами вначале непроизвольно поощряли.
Кроме того, бихевиористы различают первичное и вторичное подкрепление. Первичное подкрепление - это удовлетворение физиологических потребностей, таких как голод, жажда, сон и т. п. Что касается вторичного подкрепления, то здесь речь идет об удовлетворении, как-то связанном с другими подкрепляющими факторами (первичными или вторичными). Когда мы получаем гонорар или диплом за выполненную работу, когда ребенка награждают игрушкой или военного - орденом2, когда человек получает престижную должность -во всех этих случаях действует вторичное подкрепление, удовлетворение социальных потреб-
1Надо сказать, что этот термин несколько неудачен, так как всякое подкрепление по определению должно способствовать выработке какой-то формы поведения, т. е. оказывать положительное действие. Видимо, правильнее было бы в обоих случаях говорить о подкреплении, но не о положительном и отрицательном, а о положительном и аверсивном (в зависимости от его значения для организма). Однако условности и общепринятые правила, особенно в науке, довольно живучи, и поэтому многие студенты еще долго будут недоумевать по поводу того, почему организм может столь активно стремиться к отрицательному подкреплению.
2Такое подкрепление широко практиковалось Наполеоном -основателем ордена Почетного легиона и ярко выраженным лидером. Его приемы поощрения вошли в историю: всем известно, что он мог потрепать за ухо гвардейца, который, возможно, вскоре будет убит в сражении, или присвоить дворянский титул первому подвернувшемуся вояке в награду за какие-то услуги.
Научение 313
ностей, повышающее самоуважение у лиц, у которых оно высоко развито или, наоборот, поколеблено.
Угасание, дифференцировка и генерализация
Мы уже видели, что как при реактивном, так и при оперантном научении приобретенная реакция сохраняется лишь до тех пор, пока ее поддерживают безусловным раздражителем (в первом случае) или специальным подкреплением (во втором случае). Если же эти подкреп-ляющие факторы перестают действовать, то выработанное на их основе поведение быстро угасает и после нескольких попыток прекращается вовсе. Например, если сразу после звонка не следует подача пищи, у собаки вскоре перестает в ответ на этот стимул выделяться слюна. Точно так же, если в семье новорожденного ребенка вдруг перестанут интересоваться звуками, которые он произносит, его словарный запас, скорее всего, не будет развиваться быстро и адекватным образом. Все это проявления процесса угасания.
Важно отметить, что речь здесь идет именно об угасании, а не об исчезновении или «стирании следов». Дело в том, что если снова начать предъявлять безусловный раздражитель или подкрепляющий фактор, то исчезнувшее было поведение почти сразу же восстанавливается.
С угасанием тесно связана так называемая дифференцировка. При дифференцировке те поведенческие реакции, которые перестают сопро-вождаться безусловным раздражителем или подкреплением, исчезают, и сохраняются лишь такие реакции, при которых эти факторы продолжают действовать. Например, если внезапно прекратить подачу пищи после звука колокольчика, но продолжать давать ее в сочетании со звуком зуммера, то слюноотделение на первый из этих звуковых раздражителей прекратится, а на второй сохранится. Точно так же и наш младенец в приведенном выше примере постепенно перестанет издавать неподкрепляемые звуки, и будет повторять лишь те, за которыми следует социальное поощрение.
Важнейшую роль в научении путем выработки условных связей играет процесс генерализации1. Именно благодаря этому явлению вновь образованная связь распространяется на все то, что похоже на безусловный раздражитель или на ситуацию, в которой происходило подкрепление. Например, в опытах Уотсона и Рейнер у маленького Альберта (см. документ 7.1) быстро выработался страх перед всеми белыми пушистыми предметами - от бороды деда Мороза до мехового воротника на пальто матери. Все мы знаем, как быстро наступает генерализация у плаксивых детей - сначала они хнычут, требуя конфету, а потом-уже всегда, как только им чего-нибудь захочется, будь то игрушка в магазине или телевизионная передача, идущая по параллельному каналу одновременно с любимой передачей родителей (табл. 7.1).
Схемы Реактивное обусловливание Оперантное обусловливание Синонимы Павловское, классическое
Скиннеровское, инструментальное Способ научения Путем ассоциации между специфическим стимулом (вызывающим естественный рефлекс) и нейтральным стимулом (2а)
Путем ассоциации между поведением и его последствиями (2б)
Соответствующие типы поведения Рефлекторные и эмоциональные реакции Произвольное поведение
Степень участия организма в целом Связь между безусловным (БС) и условным (УС) стимулами формируется при пассивном участии организма в целом (2а)
Для формирования связи между реакцией и подкреплением необходимы активные действия организма над объектами окружающей среды (2б)
Временные отношения Индифферентный стимул (ИС) в большинстве случаев должен предшествовать безусловному (БС) (3а) Реакция всегда должна предшествовать подкреплению (3б)
Временные отношения Физиологическая связь между УС и безусловным рефлексом (БР) (1а)
Связь между реакцией и естественным поведенческим репертуаром организма (16) Типы связей Никакой физиологической связи между индифферентным стимулом (ИС) и условным рефлексом (УР) (2а) Никакой физиологической связи между реакцией и подкреплением (26)
Угасание В результате отмены БС (4а) В результате отмены подкрепления (46) Генерализация
УР вызывается всеми стимулами, сходными с УС
Реакция возникает во всех ситуациях, сходных с той, в которой происходило подкрепление
Дифференцировка УР остается только на те сходные с УС стимулы, после которых следует БС Остаются только те реакции, за которыми следует подкрепление
Павлов называл этот процесс «иррадиацией».- Прим. перев.
(1а) [БС]——
Физиологич
(2а) [БС]—
[ИС]
Ассоциации (индиффер стимулами
(За)
[ее] + —•[БР еская с
—-[БР
ч между ентным ) ] вязь между БС
]
/ ИСи БС и безусловны!»
^ш и БР
VI 1 ИС = УС
ИС в резуг может пре способны
(4а)
а пьтате а вратит и вызы ссоциации с БС ься в УС, вать УР
^ Угасание УР
Ei
Отмена Б С вызь вает угасание ) /Р
{•\б)
-^ еакцио А>\
\ Ситуация Х 'S,
-.IP еакция В|
Реакции н (26) а с ит уацик о Х случай ны
Подкр.
—— F 'еакция А
У
Ситуацир =«Х ^
^1 Еакция В
Подкрепг в ситуаци
(36) пен и ие Х связ ано с реак цией А
Реакция / !\-
Подкр.
условная
у
Ситуаци я> Подкреп обуслов Другие F
(46) ля
ПИЕ
зеа юн зан кц пая с ие ре ии уг итуация вь 'акции. асают 13ЫЕ эает
Угасани е
^ f реакци иА
Ситуац ля Х ^
Отмена угасани по еу ДК
ел репле овно ения вызы и реакции вает
316 Глава 7
Бихевиористы предложили множество различных сфер применения методов обусловливания в различных областях человеческой деятельности. Чаще всего реактивное и оперантное научение используется в психотерапии, когда врач пытается применить соответствующие принципы для помощи определенным больным. Подобные примеры приведены в документах 3.1 и 3.2. Подробнее мы рассмотрим этот вопрос в главе 12.
В области образования Скиннер выдвинул, в частности, концепцию программированного обучения. По его мысли такое обучение может освободить ученика и преподавателя от скучного процесса простой передачи знаний: учащийся будет постепенно продвигаться в освоении той или иной темы в собственном ритме и маленькими шажками, каждый из которых подкрепляется1; из этих шажков и состоит процесс последовательного приближения (Skinner, 1969). Однако очень скоро обнаружилось, что такое обучение быстро достигает своего «потолка», и это связано именно с тем, что от учащегося требуются лишь минимальные усилия и поэтому подкрепление вскоре становится неэффективным. В результате учащемуся такое обучение быстро надоедает. Кроме того, для постоянного поддержания мотивации у учащегося и упорядоченной передачи знаний, видимо, необходим личный контакт с учителем. Все это, вероятно, можно объяснить с помощью принципов, лежащих в основе социального научения, и в частности научения путем наблюдения. Но еще ближе к истине, наверное, те ученые, которые стоят на позициях когнитивного научения. К этому вопросу мы вернемся в последующих разделах.
Научение путем наблюдения (подражания модели)
Итак, многие виды поведения, иногда довольно сложные, могут быть объяснены в свете принципов оперантного обусловливания и метода формирования реакций. Вместе с тем множество форм социальной активности индивидуума основано на наблюдении над другими особями из его ближайшего окружения, которые служат моделью для подражания. При этом может иметь место как чистое подражание, так и викарное научение.
Подражание -это способ научения, при котором организм воспроизводит действия модели, не всегда понимая их значение. Оно свойственно в основном приматам. Японские этологи наблюдали над стадами обезьян в их естественной среде. Когда ученые смогли подходить близко к самым молодым животным, они стали в их присутствии мыть в воде бататы перед едой. Исследователи быстро убедились в том, что молодые обезьянки начали подражать такому поведению, а через некоторое время оно появилось и у их матерей. Вскоре этот навык усвоили все особи стада, за исключением самых старых, которые были
1Подкреплением служит лампочка, загорающаяся в ответ на каждый правильный ответ, слово «Молодец!», появляющееся на экране, сумма баллов и т. п.
Научение 317
Рис. 7.7. Альберт Бандура, американский психолог, один из наиболее известных современных бихевиористов. В своих исследованиях он пытается проверить теорию «научения путем наблюдения», которую называют также теорией социального научения.
к этому совершенно неспособны. Речь в данном случае идет именно о чистом подражании, так как животные не могут оценить то значение, которое подобный навык имеет для человека.
Что касается викарного научения, то здесь индивидуум полностью усваивает ту или иную форму поведения другой особи, включая понимание последствий этого поведения для модели. Бандура и его коллеги (рис. 7.7) в лабораторных экспериментах показали, что такое научение зависит от многих факторов. Например, люди подражают главным образом каким-то знаменитостям или тем, перед кем они преклоняются. В то же время усвоение поведения модели облегчается, если предмет подражания «доступен» - как с точки зрения возможности контактирования с ним, так и в отношении степени сложности его поведения. Кроме того, если модель за свой поступок (даже агрессивный) получила поощрение, то ей подражают охотнее, чем в том случае, если она была наказана. Известно также, что живым моделям всегда подражают чаще, чем героям фильмов, в том числе мультипликационных (рис. 7.8).
Здесь уместно напомнить, что сторонники теории социального обучения все же признают большую роль телевидения и героев телефильмов в развитии агрессивных наклонностей у молодежи (см. досье 6.1).
Поскольку субъект в данном случае наблюдает за поведением модели и оценивает последствия, к которым оно приводит для самой модели, здесь должны участвовать когнитивные процессы, так что этот вид научения можно было бы отнести к следующей, третьей группе. Однако он встречается лишь в особых ситуациях, и его часто только с большим трудом можно обнаружить в нашей повседневной жизни. В самом деле, имеется мало свидетельств в пользу того, что подражание, наблюдаемое в искусственных лабораторных условиях или в каких-то специфических жизненных ситуациях, будет повторяться во всех случаях при сходных обстоятельствах.
Как отмечал сам Бандура (Bandura, 1977), модель «учит» какому-то
318 Глава 7
Рис. 7.8. Научение путем наблюдения. Понаблюдав за моделью-человеком, «избивающим» резиновую куклу (вверху), маленький мальчик (в середине) или девочка (внизу) в соответствующей ситуации воспроизводят это поведение.
поведению, однако использование результатов такого обучения в большой мере зависит от уровня эмоциональной активации субъекта в данный момент и от ее оценки ситуации. Иными словами, при викарном научении в мозгу создаются какие-то связи, но только когнитивные процессы-процессы анализа конкретных обстоятельств -будут в дальнейшем определять, станет ли человек в том или ином случае прибегать к этим связям. Поэтому мы и отнесли такое научение к выработке оперантных форм поведения: при викарном научении просто воспроизводится то или иное поведение в зависимости от его последствий, но не происходит, как при истинно когнитивных формах научения, переработки информации с целью формирования новой поведенческой программы.
Когнитивные формы научения
Исходя из принципов научения путем формирования реакций или путем наблюдения, легко можно объяснить усвоение каких-то эмо-циональных или социальных поведенческих реакций или выработку навыков. Если, однако, мы хотим понять, как человек учится, например, печатать на машинке или играть на музыкальном инструменте (гитаре, кларнете и т. п.), наша задача становится более трудной. Еще сложнее объяснить, как человек может научиться ездить по столичному городу,
Научение 319
и уже совсем невозможно понять на основе упомянутых принципов, каким образом мы описываем структуру окружающей среды с помощью понятий или научаемся мыслить и выражать наши мысли словами.
В этом разделе мы попытаемся с позиций когнитивного подхода описать и даже понять, как формируются различные виды поведения на основе выработки «когнитивных карт» (при латентном научении), «когнитивных стратегий» (главным образом при выработке двигательных навыков) и, наконец, на основе интуиции и мышления.
Латентное научение
Из главы 5 мы уже знаем, что в организм все время поступает поток сигналов от окружающей среды, на которые он должен реагировать. Некоторые из этих сигналов ясно осознаются, другие воспринимаются менее четко, а третьи, вероятно, вообще не доходят до сознания, хотя и сохраняются в памяти на уровне низших нервных центров.
Согласно представлениям Толмена (Tolman, 1948) (рис. 7.9)-одного из пионеров когнитивного подхода в теории научения -все эти сигналы обрабатываются и преобразуются мозгом. При этом в мозгу создаются своего рода карты окружающей среды, или когнитивные карты, с помощью которых организм определяет, какие реакции будут наиболее адекватными в какой-либо новой ситуации или при внезапном изменении привычных обстоятельств.
Толмен пришел к этому выводу, когда установил, что обучение крыс в лабиринте не происходит чисто механически, как считали в те времена бихевиористы (Hull, 1943). Если бы речь шла о простом механическом усвоении, то в случае перекрытия обычного пути в лабиринте или изменения каких-то условий крысе пришлось бы отыскивать новый маршрут, ведущий к цели. Толмен же, напротив, обнаружил, что если крыса уже научилась находить пищу по кратчайшему пути, то после закрытия этого пути она спонтанно меняет свой маршрут и без какого бы то ни было нового научения и новых ошибок находит пищу, но идет теперь по другому, более длинному пути. В других экспериментах он
Рис. 7.9. Эдуард Толмен, американский психолог (1886-1961). Он был представителем бихевиоризма и обогатил его представлением о «промежуточных переменных» в цепи стимул-реакция. Согласно Толмену, существуют внутримозговые процессы, детерминированные генетически или приобретенные в результате предшествующего опыта, которые могут изменять реакцию на тот или иной стимул. К промежуточным переменным относятся и так называемые когнитивные карты.
320 Глава 7
показал, что если залить коридоры лабиринта водой, то крыса все равно находит правильный путь, но уже вплавь. При этом, разумеется, используются уже совершенно иные двигательные реакции.
Таким образом, по мнению Толмена, животные усваивают не связь между стимулом и реакцией, а значение стимула как своего рода «дорожного указателя». По формулировке Толмена, они узнают, «что к чему ведет». При обучении в лабиринте в единое целое интегрируются запахи, особенности того или иного угла или стенки и связи между различными элементами. Животное как бы располагает эти элементы в пространстве, преобразуя совокупность относительно разнородных стимулов в единое структурированное целое.
В случае когда речь идет о сложных формах научения, подкрепление становится необходимым не столько в самом процессе усвоения новой информации, сколько при ее использовании. Это в особенности касается выработки сложных психомоторных навыков.
Обучение сложным психомоторным навыкам
Всякий, кто пытался научиться играть на музыкальном инструменте, например на фортепиано или гитаре, знает, какими вдохновляющими бывают первые успехи в управлении пальцами и в их правильном расположении на инструменте (достигаются ли они путем формирования реакции или путем наблюдения). К сожалению, картина становится совершенно иной, когда начинается настоящее обучение. Большинство тех, кто бросает занятия, оставляют их именно на этой критической стадии, где должны сформироваться когнитивные стратегии, направленные на выработку строгих последовательностей движений и на их программирование в зависимости от желаемого результата (Fitts, Rosner, 1967). Это когнитивная стадия, на которой все внимание учащегося сосредоточивается на расшифровке нотного текста, аппликатуре, ритме и мелодическом рисунке.
По мере того как налаживаются связи между всеми этими элементами навыков, стратегия постепенно меняется. Забота о том, какие элементы и в какой последовательности должны быть соединены, становится все меньше, а вместе с ней постепенно снижается и сопутствующая познавательная активность. Это ассоциативная стадия, для которой характерно постоянное улучшение координации и интеграции различных элементов навыка (рис. 7.10).
Если обучающийся проявляет должное упорство, то -он достигает следующей, автономной, стадии, соответствующей высокому уровню умения. Навык при этом становится автоматическим, ошибки -все более редкими, а сосредоточенность на технической стороне -все меньшей, и главное место теперь занимает союз ума и чувства. При этом рука (или рот) и музыкальный инструмент сливаются в единое целое и образуют ту основу, на которой только и возможны фантазия, вдохновение и творческий полет.
Все сказанное относится, конечно, и к таким навыкам, как катание на
Научение 321
Рис. 7.10. Овладение навыком игры на музыкальном инструменте, как и любым другим навыком, требует создания «когнитивных стратегий», необходимых для координации и интеграции отдельных элементов навыка.
лыжах, плавание, езда на велосипеде или работа на пишущей машинке. Из главы 2 мы знаем, что в начале нашего века функционалисты уже описали такого рода научение, пытаясь вскрыть ту роль, которую в нем играет «сознание». Затем, однако, волна бихевиоризма, прокатившаяся по психологическим наукам, смела все менталистские концепции, и они были надолго забыты, пока снова не возродились в когнитивистской психологии.
Научение путем инсайта
Этот вид научения занимает промежуточное положение между латентным научением и творчеством (к последнему мы вернемся в главе 9). С латентным научением оно сходно в том, что при инсайте определенная информация, разбросанная в памяти, как бы объединяется и используется в новой ситуации. С творчеством инсайт сходен в том отношении, что задача, возникшая в такой ситуации, решается оригинально и решение приходит спонтанно.
Научение путем инсайта было открыто Кёлером (Kohler, 1925) в результате наблюдений над обезьянами (см. гл. 1 и рис. 1.11), проведенных в 1917 году. В те времена школа Кёлера, или гештальт-психология, вела непримиримую борьбу с бихевиористскими концепциями.
Согласно взглядам Кёлера, у высших животных научение в большинстве случаев обусловлено не созданием механических ассоциаций между какими-либо стимулами или стимулом и реакцией, а скорее объединением опыта, накопленного в памяти, с той информацией, которой располагает индивидуум при решении проблемы.
Одна из обезьян Кёлера (рис. 7.11) в эксперименте с недосягаемым для нее бананом сначала пыталась достать плод одной палкой, потом другой, но палки были слишком коротки. Тогда она прекратила свои попытки, стала разглядывать находившиеся около нее предметы и вдруг
322 Глава 7
Рис. 7.11. Султан -одна из обезьян Кёлера (1917)-интуитивно находит способ, позволяющий достать далеко расположенный банан с помощью вставленных друг в друга палок.
быстро проделала логичную последовательность действий: схватила обе палки, вставила их одну в другую, просунула между прутьев клетки и достала банан.
В англоязычной литературе такое внутреннее связывание элементов, из которых складывается решение, получило название инсайт (insight-проникновение внутрь, постижение). На французский язык этот термин переводят иногда как intuition (интуиция).
Уже сами по себе эти слова в какой-то мере отражают то, что решение проблемы приходит внезапно, без каких-либо проб и ошибок, формирования реакций или логических рассуждений. Инсайт -это озарение, это вспышка, осветившая сознание Архимеда, когда он, выскочив из ванны, внезапно закричал «Эврика!»...
В отличие от чистого творчества инсайт возможен только в том случае, если субъект уже решал какие-то задачи с помощью сходных элементов или встречался ранее с аналогичными ситуациями (см. гл. 9).
Научение путем рассуждений
Рассуждение -это мыслительный процесс, к которому мы будем возвращаться в последующих главах. Рассуждение используют в тех случаях, когда какая-либо задача не может быть решена привычным способом или для нее нет приемлемого типового решения, которое можно применить «с ходу».
К рассуждению мы прибегаем в большинстве наших жизненных ситуаций. Оно необходимо, когда мы решаем, например, будем ли мы обедать дома или в столовой в зависимости от имеющихся денег и времени; стоит ли нам занимать крупную сумму денег; что делать, если в три часа утра в ненаселенной местности у нас сломалась машина; как лучше ставить опыты в научной лаборатории (см. гл. 3); или, наконец, как найти решение задачи по математике, на которую учитель дал всего полчаса.
Когда использовать примитивный метод проб и ошибок рискованно или же он не дал желаемых результатов, а искра инсайта никак не вспыхивает, приходится решать задачу путем рассуждения. Как правило, такое решение осуществляется в два этапа:
1) сначала рассматриваются имеющиеся данные и между ними устанавливаются связи;
2) затем строятся гипотезы: «Что если я сделаю то-то?» или «Я мог бы начать с этого, а затем...». Эти гипотезы более или менее систематично проверяются «в уме». В следующей главе мы рассмотрим различные способы такого рода перебора вариантов. Гипотезы, которые строит индивидуум, чаще всего бывают связаны с его уже имеющимся опытом. Чем этот опыт богаче, тем разнообразнее гипотезы и тем больше шансов найти среди них верную.
Как и при любых других формах научения, результаты, полученные путем рассуждения, как правило, используются в дальнейшем во всех сходных жизненных ситуациях. Однако они могут пригодиться и в тех случаях, если ситуация или составные элементы проблемы несколько видоизменились. Кроме того, результаты рассуждений могут также послужить основой для построения новых гипотез.
Из всех форм научения путем рассуждений мы выделим, две, служащие фундаментом для мышления: перцептивное научение и концептуальное научение.
Перцептивное научение
В главе 5 подробно говорилось о том, как и с помощью каких механизмов мы воспринимаем окружающий мир. При этом восприятие (перцепция) рассматривалось главным образом как средство для осознания реальности и особенно как фактор, способствующий активации организма.
Тем не менее совершенно ясно, что становление восприятия -это не что иное, как самое настоящее научение. Хебб (Hebb, 1974) определил перцептивное научение как «долговременное изменение восприятия какого-либо объекта или события в результате предшествующих восприятии этого же объекта или связанных с ним вещей». Восприятие у новорожденного ребенка или детеныша определяется такими примитивными формами научения, как сенсибилизация или классическое обусловливание; по-видимому, именно так грудной ребенок научается узнавать лицо матери. Однако по мере накопления опыта и новой информации ребенок, по мнению Грегори (см. гл. 5), постепенно начинает выдвигать гипотезы на основании того, что он уже знает; при этом он пытается определить, какая из этих гипотез позволяет с наибольшей достоверностью отнести воспринимаемое к той или иной категории. В этом смысле любая форма восприятия предполагает какого-то рода рассуждение, и поэтому мы можем рассматривать перцептивное научение как когнитивное.
Концептуальное научение
Формирование понятий -это процесс, при котором индивидуум, исходя из переработанных им восприятии, выделяет сходство между предметами, живыми существами, ситуациями или идеями и объединяет их в какие-то абстрактные категории.
Сензитивные периоды, во время которых организм наиболее «чувствителен» к воздействиям окружающей среды и легче всего воспринимает их, формируя свой индивидуальный опыт. Поэтому именно в такие периоды научение наиболее эффективно: до критического периода любая тренировка мало что дает, а после него соответствующий орган или функция уже постепенно утрачивают пластичность, и чем больше времени прошло после критического периода, тем более затруднительным становится научение.
В документе 7.4 мы еще раз коротко рассмотрим различные виды научения, о которых здесь шла речь, и укажем, какой именно период является для каждого из них критическим.
324 Глава 7
Такие понятия, как «собака», «дерево», «несчастный случай» или «справедливость»,-это категории, которые позволяют упорядочивать наш опыт и восприятие мира, объединяя множество явлений одной мыслью. Тем самым понятия дают нам возможность группировать получаемую нами информацию о качествах и родстве столь разных предметов или явлений, как, например, немецкая овчарка и чихуахуа, пальма и дуб, лобовое столкновение двух автомобилей и падение с лестницы, у которой сломалась ступенька, или честный раздел конфет между братьями и сестрами и приговор к пожизненному заключению за убийство. Как подчеркивает Мунн (Munn, 1966), здесь имеет место научение, в котором участвуют два процесса: абстрагирование и обобщение.
При абстрагировании мы находим черты общности или сходства между двумя явлениями или событиями и определяем эту общую черту одним словом -понятием.
При обобщении мы подводим под это понятие все новые предметы или события, имеющие черты сходства или какое-то общее свойство с предметами и явлениями, послужившее для выработки данного понятия.
Механизмы, лежащие в основе этих проявлений мысли, будут более подробно рассмотрены в следующей главе, где мы перейдем к изучению мышления.
Научение и созревание
Уже около полувека назад было установлено, что никакое научение не может быть эффективным, если организм не достиг определенного уровня развития -как в плане формирования опорно-двигательного аппарата, так и в отношении организации нервных структур и сенсомоторных связей.
Такое развитие происходит в процессе созревания, запрограммированного у каждого представителя данного вида в генах. Все особи каждого вида, пройдя ряд сходных последовательных этапов, достигают стадии зрелости, причем эта стадия различна для каждого отдельного органа или отдельной функции организма.
С процессом созревания тесно связаны так называемые критические точки.
Научение 325
Научение и его результаты
Перед тем как закончить эту главу, полезно будет обсудить вопрос об оценке эффективности процесса научения. Очевидно, что сам этот процесс как таковой нельзя оценить непосредственно. Мерой его успешности может быть лишь деятельность индивидуума после специфического обучения.
Надо сказать, что такая оценка часто оказывается весьма зыбкой и зависит от многих факторов, относящихся к перцептивной, мотивационной или аффективной сфере, или же от состояния сознания индивидуума. Все эти факторы влияют на реализацию приобретенных навыков.
Выработанная способность и ее реализация. Необходимо прежде всего помнить о том, что некоторые виды поведения, приобретенные в каком-то особом состоянии сознания (см. гл. 4), могут не проявляться в состоянии активного бодрствования. Однако, как мы уже знаем, стоит организму прийти в прежнее специфическое состояние, как такое поведение сможет полностью проявиться. Наоборот, если научение протекало при нормальном уровне сознания, то приобретенный навык может быть нарушен при каких-то особых эмоциональных состояниях или, например, в результате приема какого-то вещества (лекарственного или иного). В этих случаях способность, выработанная в результате научения, сохраняется, но реализация ее при соответствующем поведении может измениться, и это, разумеется, делает бессмысленной попытку оценить эффективность научения.
Известно, что стресс, связанный с экзаменами, буквально парализует умственную деятельность некоторых студентов. И хотя они знают предмет, они порой просто не могут применить эти знания. К сожалению, именно по результатам, получаемым в этих искусственных условиях, традиционно оценивают достигнутый студентом уровень. Отметим, что в аналогичных условиях выявлялись «способные» крысы в опытах Триона, описанных в главе 3.
Встречается и обратная ситуация -часто в состоянии эйфории или высокого уровня мотивации субъект может действовать с максимальной эффективностью. Именно это явление лежит в основе эффекта аудиторы, обнаруженного Зайонцом (см. документ 3.6).
Перенос. На эффективности обучения очень сильно сказывается опыт знания, приобретенные субъектом раньше. Психологи называют это явление эффектом переноса, и оно может проявляться как в облегчении, так и в затруднении последующих процессов приобретения новых знаний или навыков.
Положительный перенос обычно имеет место тогда, когда задачи обучения прежде и теперь в чем-то сходны. Так, человеку, говорящему по-французски, легче выучить второй язык романской группы (например, итальянский или испанский), чем англичанину. Однако (подробнее мы рассмотрим этот вопрос в главе 8) уже накопленная информация
326 Глава 7
может затруднять приобретение слишком похожей информации, и тогда возникает отрицательный перенос. Он появляется также в тех случаях когда в двух сходных ситуациях требуются различные или даже противоположные формы поведения. Вспомним, как трудно бывает начинающим автолюбителям завести задним ходом прицеп в гараж-дело в том, что движения руля при этом должны быть обратными по сравнению с обычным вождением. Это лишь один из возможных примеров того, как накопленный опыт может влиять на выработку новых форм поведения.
Таким образом, невозможно говорить о научении (тем более когнитивном) без учета информации, уже имеющейся в памяти. Память лежит в основе любых процессов адаптации. Без памяти существование живых организмов невозможно. Генетическая память служит фундаментом всех жизненных процессов, и корни этой памяти у каждого живущего на нашей планете уходят в истоки жизни на Земле. Что касается индивидуальной памяти, то в ней на протяжении всей жизни организма откладываются следы всех восприятии, всех процессов научения и всех «идей», которые непрерывно формируются у индивидуума. Извлечение из памяти таких следов имеет подчас первостепенное значение для выживания и адаптации организма.
Поэтому, для того чтобы возникла та или иная мысль или форма поведения, недостаточно, чтобы появилась и была воспринята соответствующая ситуация. Для обработки внешней информации и особенно для извлечения из памяти накопленного опыта необходимы также достаточные уровни эмоциональной и мотивационной активации и адекватного состояния сознания.
В связи с этим часть следующей главы будет посвящена памяти. Там мы затронем также проблему речи. Память и речь одновременно служат основой и продолжением мысли - психического феномена, характерного в наибольшей степени для.высших животных и особенно для человека.
Документ 7.1. Павлов, Уотсон и классическое обусловливание
Казалось, что вначале ничто не предвещало в И. П. Павлове одного из крупнейших деятелей в западной психологии. Когда в 1890 году Павлов основал в Петербурге Институт экспериментальной медицины, он как физиолог интересовался механизмами пищеварения. В те времена он ставил опыты на собаках, которых помещал в специальный станок, фиксируя ремнями. Предварительно Павлов через разрезы в различных органах пищеварительного тракта вставлял в них канюли, а затем собирал с их помощью соки различных желез, функционирующих во время переваривания пищи. Таким способом Павлов хотел оценить количество и качество соков желудочно-кишечного тракта, а также раскрыть связь между рецепторами рта и желудка, с одной стороны, и слюнными и желудочными железами -с другой (рис. 7.12). За эти работы в 1904 году он был удостоен Нобелевской премии.
Научение
Рис. 7.12. Экспериментальная установка Павлова, с помощью которой он изучал выработку условных рефлексов (классическое обусловливание). Собаку фиксируют в станке, и через разрез в щеке вводят канюлю, с помощью которой можно собирать слюну. Условным сигналом, предшествующим подаче пищи (безусловному раздражителю), служит звонок или зажигание лампочки (на рисунке не показаны). Количество слюны, выделяемой в ответ на этот сигнал, регистрируется кимографом.
Однако в ходе этих исследований выяснилось одно неожиданное обстоятельство. Когда Павлов со своими помощниками изучал слюноотделение, он заметил, что спустя несколько дней после начала опытов у собак начинала выделяться слюна еще до того, как пищу клали им в миску. Оказалось, что слюноотделение запускается самим фактом появления служителя с едой и сопутствующими звуками. Такое «психическое раздражение», как назвал его Павлов, не было предусмотрено в его работе, однако вместо того, чтобы игнорировать это явление, Павлов начал его тщательно изучать. Это было в 1901 году.
Вначале Павлов вместо звона миски, который был случайным и не поддавался точному воспроизведению, стал использовать колокольчик, звук которого раздавался каждый раз перед подачей пищи. Результат не заставил себя ждать: вскоре у собаки слюна начинала выделяться уже в ответ на такой опережающий раздражитель. Таким образом, простой звук колокольчика вопреки всякой логике начинал вызывать слюноотделение у собаки при условии, что он сочетался с безусловным раздражителем - пищей.
Так Павлов вскрыл принципы выработки условных рефлексов, или классического обусловливания1.
1Последний термин был введен позже для того, чтобы отличать этот процесс от других форм обусловливания.
328 Глава 7
Рис. 7.13. Уотсон выработал у малыша по имени Альберт страх перед крысой, сочетая предъявление этого животного с громким звуком (вверху). Этот «условный страх» в результате генерализации вскоре распространился на все предметы с белым мехом, включая Деда Мороза (внизу).
Спустя некоторое время Бехтерев показал, что можно выработать условный рефлекс и с помощью аверсивного безусловного раздражения. В его опытах собаки начинали отдергивать лапу при вспышке света, если та сочеталась с электрическим ударом.
Все эти работы легли в основу советской рефлексологии, в соответствии с которой любое приобретенное поведение можно объяснить образованием связей между безусловными раздражителями и другими стимулами, которые вначале не имели к данному рефлексу никакого отношения.
В это же время в США набрал силу бихевиоризм, и сторонники этого течения искали аргументы в пользу своей точки зрения. В 1920 году Уотсон и его сотрудница Розали Рейнер, ознакомившись с результатами русской школы, показали, как путем обусловливания могут формироваться такие эмоции, как, например, страх. Уотсон исходил из того, что в нервной системе существуют прямые связи между реакцией испуга и некоторыми специфическими стимулами вроде внезапного резкого звука или потерей опоры. Возник вопрос: что произойдет в том случае, если сформируется связь между нейтральным раздражителем и одним из таких стимулов? Уотсон и Рейнер провели опыты на шестимесячном младенце по имени Альберт. Как и все дети, он совершенно не боялся пушистых зверьков. Напротив, когда ему показывали белую лабораторную крысу, он был просто в восторге. Тогда исследователи начали сочетать предъявление крысы с резким звуком, что вызывало у ребенка плач и крики (в те времена проблемы этики никого особенно не волновали). Как и ожидалось, после нескольких опытов уже сам вид крысы стал вызывать у малыша плач. Иными словами, был сформирован условный рефлекс страха (рис. 7.13). Если вы хорошо поняли все
329
сказанное выше, то вы, конечно, сможете сразу определить, какой раздражитель в этих опытах был условным (как вы уже знаете, подобные раздражители начинают вызывать то или иное поведение при условии что они сочетаются с безусловными).
Документ 7.2. Законы обусловливания
Реактивные и оперантные формы поведения подчиняются определенным закономерностям, характерным для тех и других. В общем случае обусловливание подчиняется закону ассоциации между двумя стимулами или между поведением и его результатом.
Закон эффекта применим главным образом к научению методом проб и ошибок, а также к оперантному обусловливанию. Однако в последнем случае предпочитают говорить о принципе подкрепления, так как он носит более объективный характер.
Закон ассоциации (или сочетания). Если на нервную систему воздействуют одновременно два раздражителя, то весьма вероятно, что между ними в нервных структурах установится связь. В случае классического обусловливания один из раздражителей вызывает рефлекс естественным образом, и тогда при сочетании с ним второй, казалось бы не имеющий к данному рефлексу никакого отношения, тоже может приобрести способность вызывать его.
Закон эффекта (по Торндаику). Из всех возможных реакций индиви-дуума в той или иной ситуации при повторении сходной ситуации более вероятны будут те из них, которые ранее приводили к желательному для индивидуума результату.
Говоря более строго, связь между действием и его результатом будет для индивидуума тем сильнее, чем большее удовлетворение будет доставлять этот результат. И напротив, связь будет ослабевать, если результат окажется нежелательным или безразличным.
Принцип подкрепления (по Скиннеру). В законе эффекта используются такие необъективные понятия, как удовлетворение и неудовлетворение. Необихевиористы предпочитают говорить о принципе подкрепления. Этот принцип опирается исключительно на тот факт, что то или иное поведение чаще повторяется, если приводит к определенным последствиям -к ситуации, играющей роль подкрепления. Таким образом, можно сказать, что подкрепление -это событие, которое повышает вероятность, повторения какой-то поведенческой реакции в будущем.
Документ 7.3. Управление обществом по Скиннеру
В одной из своих работ под названием «По ту сторону свободы и достоинства» (1973) Скиннер излагает свои представления о факторах, управляющих людьми.
По мнению Скиннера, всякая мысль о свободе или автономии личности -не более чем иллюзия. Мы полностью зависим от окружа-
330 Глава 7
ющей среды, влияющей на наше поведение через совокупность подкрепляющих факторов. Представление о подкрепляющих факторах имеет для Скиннера ключевое значение. Согласно этому представлению выработка какого-либо поведения невозможна, если оно сразу не подкрепляется.
Таким образом, по Скиннеру, представление о «самостоятельном субъекте», наделенном свободной волей и решающим свою судьбу, - это лишь иллюзия, проистекающая от нашего незнания истинных причин поведения. От нашего сознания ничего не зависит -только окружающая среда ответственна за все.
Из этого следует, что влияние окружения должно быть разумным. По мнению Скиннера, лучше всего смогут планировать гармоничное и оптимальное развитие личности в обществе специалисты по поведению человека. Такие «планификаторы» должны отбирать те формы поведения, которые обеспечивают выживание и развитие человеческих сообществ, и создавать условия, необходимые для появления таких форм поведения и для их поддержания.
Согласно Скиннеру, следует прежде всего отказаться от всех методов наказания, разработанных различными общественными институтами, и заменить их положительными поощряющими факторами. Средства, идущие на изготовление и использование оружия, надо отдать на разработку структур, которые позволяют развить «планирование пове-дения» и выработать ко всеобщему благу наиболее эффективные методы его формирования.
Такое представление о человеке зиждется в основном на концепции о том, что в основе всех наших поступков лежат внешние мотивации. Без таких мотиваций человек не может успешно осуществлять творческую деятельность. Разумеется, такая точка зрения прямо противоположна идеям когнитивистов, которые убеждены в приоритете внутренних мотиваций (см. документ 6.2); еще дальше она от концепций гуманистического направления, согласно которым социальное окружение своим ограничительным «планированием», напротив, подавляет потенциаль-ные возможности личности.
Как бы то ни было, Скиннер, очевидно, проявляет некоторую наивность, делая ставку на объективность и нейтралитет «планификаторов». Любая человеческая деятельность подчинена какой-либо идеологии, жизненной позиции, мировоззрению и представлению об обществе. Например, американский политик-республиканец не может трактовать культурные и экономические потребности своих сограждан так же, как демократ, а тем более - как негритянский лидер, будь то член республиканской или демократической партии. Такие различия взглядов буквально пронизывают все общество, и даже самые «объективные» ученые не могут составлять исключение.
Кому из «планификаторов», например, следует отдать предпочтение -тому, кто верит в наследование интеллекта, или тому, кто делает ставку на ключевую роль полной демократизации условий обучения.
Научение 331
Следует ли остановить выбор на ученом, считающем, что социальное неравенство неискоренимо и поэтому лучшее, что можно дать дворнику, - это сделать его счастливым дворником? Или, напротив, на том, кто пытается создать условия, при которых любой человек с самого молодого возраста независимо от социального происхождения сможет избрать деятельность по своему вкусу и в соответствии с его реальными способностями?
Все эти вопросы мы уже ставили в первой главе. Скиннер же в своей книге, а также в последующих выступлениях выдвигал лишь общие положения, но так и не дал убедительных ответов на вопросы, возникавшие в связи с его проектом общества.
Как бы то ни было, своеобразные коммуны, созданные в начале 70-х годов по скиннеровской модели, потерпели столь же полный крах, как и прочие попытки построить человеческое сообщество на базе какой-то теории. По-видимому (об этом свидетельствуют показания участников таких экспериментов; Kinkade, 1974), «свободная воля» отдельных людей очень скоро вступала в конфликт с программированием образа жизни и условий образования, которое проводили «планификаторы».
Документ 7.4. Созревание, научение и критические периоды
Не так давно на ребенка смотрели как на взрослого в миниатюре, которого можно научить чему угодно, лишь бы объем передаваемых знаний был ему под силу. В современной педагогике от таких представлений уже полностью (или почти полностью) отказались.
Изучение процесса созревания и свойственных ему критических периодов показало, что никакая форма поведения не может развиваться (или вырабатывается с большим трудом), если организм не прошел этапы, необходимые для соответствующего научения.
Ясно, что в зависимости от сложности этого научения критические периоды могут существенно различаться. Например, привыкание, сенсибилизация и даже классическое обусловливание возможны уже у утробного плода. При повторяющихся резких звуках через какое-то время ребенок перестает «вздрагивать» в утробе матери; наоборот, если вызывать классическое обусловливание, сочетая резкий шум со звуком зуммера, то вскоре зуммер сам по себе будет вызывать реакцию вздрагивания.
Мы знаем, что у выводковых птиц критический период для импринтинга соответствует первым часам после вылупления из яйца. Недавно педиатры выдвинули предположение о том, что у новорожденного ребенка в первые минуты и первые часы тоже имеет место соответствующий критический период. По их мнению, для ребенка в это время чрезвычайно важен контакт с родителями: этот контакт, в котором участвуют осязание, зрение и слух, имеет ключевое значение для того, чтобы сформировалась взаимная привязанность, необходимая для гармоничного развития личности (Ainsworth, 1979).
332
Рис. 7.14. Уже в первые недели жизни младенец способен подражать выражению лица взрослого.
Что же касается оперантных форм поведения, то они могут формироваться, разумеется, только после того, как сенсомоторные системы станут достаточно развитыми, чтобы обеспечить должную координацию движений. Некоторые виды научения путем проб и ошибок, формирования реакций и подражания возможны уже в первые дни жизни. Так, двухдневный ребенок сосет соску охотнее, если в качестве подкрепления он одновременно слышит музыку (Butterfield, Siperstein, 1972). Показано также (Moore, Meltzoff, 1975), что двухнедельный ребенок способен подражать взрослому человеку, когда тот высовывает язык, выпячивает губы или шевелит пальцами (рис. 7.14). Если же говорить о викарном научении, то для него необходимо осознание своего «Я»-лишь при этом условии субъект может отличить себя от модели, поведение которой (в зависимости от его результатов) он усваивает. Становление такого самосознания завершается лишь к двум-трем годам. Значит, мало вероятно, чтобы в более раннем возрасте осуществлялось не простое подражание, а истинное викарное научение.
Когнитивные способы научения формируются лишь очень медленно, по мере того как созревание нервной системы делает возможным такое восприятие мира, которое позволяет устанавливать связи между его отдельными элементами. По мнению швейцарского психолога Пиаже,
333
Рис. 7.15. «С глаз долой -из сердца вон». Эту поговорку, согласно Пиаже, можно применить по отношению к ребенку в возрасте до 5 месяцев; он моментально забывает о предмете, который от него отгораживают.
подобное представление о мире в форме идей или образов начинает складываться у ребенка лишь к 5 годам: только в этом возрасте ребенок уже запоминает игрушку, которую загородили от него экраном так, чтобы он ее не видел. С точки зрения Пиаже это говорит о том, что у ребенка появилось представление о постоянстве объектов.
Первые разумные (в собственном смысле слова) действия ребенка, как утверждает Пиаже, заключаются в том, что дети в возрасте полутора-двух лет начинают изобретать новые способы манипулирования предметами. В качестве примера он приводит ребенка, который сначала безуспешно пытался затолкать в спичечную коробку довольно тяжелую цепочку, причем начинал то с одного, то с другого конца; затем он вдруг прекратил свои попытки, посмотрел на цепочку и коробку, после чего сразу собрал цепочку в комок и без труда уложил в коробочку. Таким
334 Глава 7
образом, здесь произошло первое интериоризованное научение -очевидно, путем инсайта,- увенчавшее ряд подготовительных этапов, сменявших друг друга на протяжении первых двух лет жизни. В главе 10 мы еще вернемся к особенности этой стадии развития сенсомоторной сферы.
Что касается обучения языку, то к концу первого года жизни ребенок может уже не только различать звуки родного языка, но и произносить первые слова, с помощью которых он пытается выразить законченные мысли. Критический период для освоения родного языка соответствует возрасту от полутора до трех лет. Критический же период для обучения иностранным языкам (если, разумеется, родной язык усвоен) продолжается от трех до пяти-шести лет. В дальнейшем мозг постепенно теряет пластичность, и все те языковые познания, которые приобретаются позже, выглядят скорее мозаичными, чем интегрированными.
Наконец, рассуждения (опять-таки по мнению Пиаже) становятся возможными лишь к 12 годам: только тогда человек начинает приобретать способность подходить к проблемам абстрактно, систематически проверяя гипотезы и выводы, которые из них следуют (см. документ 8.6).
Резюме
1. В отличие от рефлексов и инстинктивных форм поведения, мало подверженных изменению, приобретенные формы поведения могут порой существенно и надолго изменяться.
2. Можно различить три основных типа научения: выработку реактивных форм поведения, выработку оперантного поведения и когнитивное научение.
3. Выработка реактивных форм поведения сводится к тому, что мозг пассивно воспринимает внешние воздействия и это приводит к изменению существующих и формированию новых нервных связей.
4. Привыкание и сенсибилизация приводят к изменению реакции «настораживания»: в случае привыкания она уменьшается, а при сенсибилизации усиливается. При импринтинге, характерном для некоторых видов животных, в мозгу детеныша формируется постоянный след, когда он воспринимает первый движущийся объект. Что касается условных рефлексов, то они вырабатываются тогда, когда безусловный стимул (раздражитель) связывается с индифферентным стимулом; в этом случае последний начинает сам по себе вызывать рефлекторную реакцию, и его называют теперь условным стимулом.
5. Научение оперантным формам поведения происходит тогда, когда индивидуум осуществляет какие-то воздействия на окружающую среду, и в зависимости от результатов таких действий данное поведение закрепляется или отбрасывается.
6. Научение методом проб и ошибок состоит в том, что индивидуум повторяет действия, результаты которых доставляют ему удовлетворение, и отбрасывает остальные поведенческие реакции. Обучение путем
Научение 335
формирования реакций -это как бы систематическое применение метода проб и ошибок; индивидуума подводят к формированию окончательной поведенческой реакции, подкрепляя каждое действие, приближающее к желаемому конечному результату.
7. Подкреплением называется такой раздражитель (или такое событие), предъявление или устранение которого повышает вероятность повторения данной поведенческой реакции. Подкрепление называют положительным или отрицательным в зависимости от того, состоит ли оно в предъявлении или, наоборот, в устранении определенного стимула. При первичном подкреплении непосредственно удовлетворяется какая-то физиологическая потребность, а вторичные подкрепляющие факторы доставляют удовлетворение потому, что они ассоциируются с первичными (или другими вторичными).
8. Подкрепление (положительное или отрицательное) повышает вероятность повторения поведенческой реакции; напротив, наказание -это неприятное событие, всякий раз вызываемое данным поведением, и поэтому оно приводит к исчезновению такого поведения. Угасание состоит в постепенном прекращении поведенческой реакции в том случае, если за ней не следует безусловный раздражитель или под-крепляющий фактор.
9. При дифференцировке затормаживаются реакции на те стимулы, которые не сопровождаются безусловным раздражителем, или неподкрепляемые реакции, а сохраняются лишь те, которые подкрепляются; напротив, при генерализации поведенческую реакцию вызывает любой стимул, сходный с условным (или реакция возникает в любых ситуациях, сходных с той, в которой происходило подкрепление).
10. Научение путем наблюдения может сводиться к простому подражанию, а может быть и викарным научением; в последнем случае поведение модели воспроизводится в зависимости от тех последствий, которые оно для нее имело.
11. При когнитивных формах научения происходит оценка ситуации, в которой участвуют высшие психические процессы; при этом используется как прошлый опыт, так и анализ имеющихся возможностей, и в результате формируется оптимальное решение.
12. Латентное научение -это разновидность когнитивного научения, при которой в мозгу формируются когнитивные карты, отражающие значение различных стимулов и существующих между ними связей. При освоении сложных психомоторных навыков вырабатываются когнитивные стратегии, позволяющие программировать действия.
13. При научении путем инсайта решение проблемы приходит внезапно благодаря объединению опыта, накопленного памятью, и информации, поступающей извне. Научение путем рассуждений включает два этапа: на первом из них учитываются имеющиеся данные и связи между ними, а на втором формируются гипотезы, которые в дальнейшем проверяются, и в результате находится решение. При научении путем выработки понятий субъект вскрывает сходство между различ-
336 Глава 7
ными предметами, живыми существами, ситуациями или идеями и формирует абстрактное понятие, которое может распространяться на другие объекты со сходными чертами.
14. Научение тесно связано с созреванием организма. Созревание -это процесс, запрограммированный в генах, при котором все особи данного вида, пройдя ряд сходных последовательных этапов, достигают определенного уровня зрелости. Уровень этот может быть различным для разных органов и функций. Критические периоды - это такие периоды в развитии индивидуума, в которые легче осуществляются определенные виды научения.
15. При оценке эффективности научения следует в каждом конкретном случае учитывать целый ряд перцептивных и эмоциональных факторов, а также состояние сознания субъекта. Поэтому такая оценка редко отражает его фактические возможности. Кроме того, качество научения и его результаты тесно связаны с предшествующим опытом субъекта; перенос этого опыта может либо облегчить, либо замедлить выработку новых знаний или навыков.
Досье 7.1. Роль врожденного и приобретенного в научении
Важнейшая концепция бихевиоризма, выдвинутая еще Уотсоном, заключается в том, что организм может выработать любую форму поведения, если только для этого будут созданы благоприятные внешние условия. Между тем факты свидетельствуют о том, что способность к выработке поведенческих реакций имеет свои пределы. Действительно, ряд биологических факторов препятствует включению многих реакций в поведенческий репертуар того или иного вида. Это, несомненно, может быть связано с чисто физической конституцией животного, с особенностями его биоритмов и инстинктов, а также с влиянием предшествующего опыта на данную особь.
Физическая конституция
У представителей того или иного вида не могут вырабатываться любые заданные формы поведения: их формирование ограничено как строением тела, так и уровнем развития мозга. В крайних случаях это очевидно: нельзя, например, рыбу обучить нажимать в аквариуме на рычаг с помощью плавника, а дождевого червя -безошибочно находить дорогу в сложном лабиринте (достаточно вспомнить, с какими трудностями столкнулся Йеркс, пытаясь обучить червя поворачивать направо даже в простейшем Т-образном лабиринте).
Существуют и не столь очевидные ограничивающие факторы. Всякий, кто пытался обучить крысу нажимать на рычаг с целью предотвращения удара током, знает, насколько это трудно. Причина этого проста: при опасности крыса либо готовится к борьбе или бегству, либо начинает беспорядочно метаться, либо просто застывает в какой-то
Научение 337
позе, но никогда не направляется к рычагу с целью устранить неприятное воздействие. Такое поведение не входит в репертуар ее реакций.
Так же обстоит дело с голубями. При ударе током эти животные откидывают голову назад, и поэтому, разумеется, движение клюва по направлению к рычагу не может быть естественной реакцией голубя для устранения неприятного раздражителя (Smith et al., 1972).
Биологические ритмы
Ранее мы уже говорили о биологических ритмах, синхронизирующих различные функции организма (см. документ 4.2). Эти ритмы влияют и на процессы научения.
Крыса-ночное животное, поэтому она наиболее активна именно ночью; лабораторные же исследования, напротив, проводятся почти всегда в дневное время. Даже если попытаться десинхронизировать ритмы организма, совсем не выключая свет в виварии или изменив режим освещения на противоположный по сравнению с обычным, никогда нельзя с уверенностью сказать, в какой фазе циркадианного ритма будет находиться крыса во время опыта.1 Связь между активностью и циркадианным ритмом изучалась на протяжении ряда лет, в частности у хомяков и североамериканских бурундуков (Godefroid, 1968, 1979). Оценивалась, в частности, характерная для этих животных деятельность по сбору пищи. Для этого в распоряжение животных круглые сутки предоставлялся рычаг, связанный с кормушкой. Оказалось, что хомяк -ночное животное -днем пищу не собирает, а активность его проявляется в виде пиков только в начале и середине ночи, тогда как у бурундука -дневного животного-активность начинается лишь с восходом солнца, достигая максимума к середине утра.
Если проследить за этой активностью в течение года у бурундуков в виварии (где они тоже всегда могут пользоваться рычагом, связанным с кормушкой), то можно будет убедиться в том, что весной за сутки животные нажимают на рычаг около 50 раз, а летом больше ста раз, перед зимней спячкой-2000 раз. В течение же нескольких месяцев спячки животное не проявляет никакой активности. Очевидно, что начинающий исследователь, планируя проводить кратковременные эксперименты на таких животных, столкнется с существенными различиями в их активности, и ему будет трудно объяснить их, если он не будет учитывать биологические ритмы1.
1На изучаемую деятельность животных могут влиять и другие ритмы, например эстральный цикл у самок грызунов. С этим циклом, имеющим период 45 суток, могут быть связаны значительные изменения в поведении.
338 Глава 7
Инстинктивные склонности
Многочисленные примеры свидетельствуют о том, что если различных животных обучать формам поведения, входящим в конфликт с их инстинктами, то последние быстро берут верх над приобретенными поведенческими реакциями.
Преобладание инстинктов. В 50-х годах двое исследователей (Breland, Breland, 1961) вырабатывали у ряда животных -енотов-полоскунов, свиней, кур и др. -различные формы поведения с помощью оперантного обусловливания. Вначале работа шла легко. Еноты подбирали монетку и переносили ее в металлическую коробку. Свиньи рылом подталкивали деревянную монетку к большой копилке в виде поросенка. Куры дергали за резиновое кольцо и высвобождали таким образом капсулу, которую они клювом выталкивали из клетки. Разумеется, каждая такая поведенческая реакция сопровождалась подкреплением.
Однако по прошествии некоторого времени еноты уже не так охотно опускали свои монетки, а предпочитали оставлять их у себя, манипулируя ими, потирая их передними лапами, а если и опускали их в коробку, то затем снова вынимали обратно. Свиньи уже не так спешили подтолкнуть монету к кормушке, для того чтобы получить себе пищу, а по дороге подбрасывали ее в воздух или пытались зарыть в землю, а затем снова выкопать. Куры же стали поклевывать свои капсулы, вместо того чтобы выталкивать их из клетки.
Из этого видно, что все исследуемые животные в этих искусственных условиях поступали с различными предметами так, как в естественной среде со своей пищей: енот-полоскун «моет» пищу перед едой, свинья, как и дикий кабан, роет землю рылом в поисках кореньев, а курица обычно с помощью клюва подбирает пищу с земли, а не выталкивает предметы из клетки.
Примером преобладания инстинктов над приобретенными формами поведения могут быть и описанные выше опыты с хомяками и бурундуками. Эти животные никогда не будут нажимать на рычаг исключительно для того, чтобы поесть: в зависимости от времени года они обязательно будут более или менее часто наполнять защечные мешки и переносить пищу в клетку.
Сходное поведение было обнаружено и у лабораторных крыс, которые должны были добыть пищу, помещенную в конце удаленного от клетки коридора. В этом случае животные тоже приносили пищу в клетку, а не ели ее на месте; однако такую реакцию следует связывать скорее со стремлением к надежному укрытию, чем с накоплением запасов (Godefroid, 1979).
Самоформирование реакций. Здесь мы столкнемся с другим не менее удивительным примером тех жестких рамок, которые накладывают инстинкты на поведение.
Если через определенные промежутки времени подавать голубю в кормушку зерна, предваряя это световым сигналом, то вскоре голубь будет все чаще и чаще поклевывать пластинку, на которой появляется
Научение 339
сигнал, хотя такая реакция нисколько не влияет на получение пищи (Brown, Jenkins, 1968). Сначала такое самоформирование реакции приписывали классическому обусловливанию, при котором создается связь между световым сигналом и пищей. При этом рефлекторное поклевывание пластинки рассматривали как условный рефлекс. Но если бы это было так, то в случае неподкрепления сигнала пищей реакция стала бы угасать; на самом же деле этого не происходит, голубь начинает все активнее клевать «пластинку», даже если в ответ на каждый удар клювом подача пищи задерживается. По Дженкинсу (Jenkins, 1973), реакция голубя тесно связана с его текущей потребностью. Например, если он голоден, то он ответит поклевыванием пластинки. Напротив, если ему хочется пить, а «подкрепление» состоит в подаче воды, то движения голубя будут больше походить на процесс питья. Если же после светового сигнала в клетку голубя помещать рецептивную самку, то он вскоре начинает «ухаживать» за лампочкой (ворковать и т.п.).
Таким образом, реакция животного отнюдь не произвольна, а непосредственно связана с природой подкрепляющего агента. Это означает, что в основе самоформирования реакции может лежать связь между классическим и оперантным обусловливанием: световой сигнал может при этом играть роль условного раздражителя, вызывающего условную реакцию, связанную с видом подкрепления1.
Влияние предшествующего опыта
Если исследователь не знает, какой опыт уже имеется у индивидуума, то он порой не может правильно интерпретировать некоторые виды поведения.
Хорошей иллюстрацией этого служат два следующих примера.
Вкусовая аверсия. Гарсия с сотрудниками (Garcia et al., 1966) подвергали только что поевших крыс облучению, вызывавшему у животных болезнь. При этом они обнаружили, что у крыс вырабатывается неприятие данной пищи, которое может сохраняться неделями. Гарсия отметил также, что подобная картина наблюдается и после употребления отравленной пищи.
Это явление тесно связано с целым рядом инстинктов. Известно, например, что если дать крысе совершенно новую для нее пищу, то она сначала съест лишь небольшую ее порцию, затем какое-то время переждет, «проверяя» тем самым действие этой пищи на организм, и только после этого продолжит еду. Гарсия показал также, что при вкусовой аверсии классическое обусловливание проявляется весьма ограниченно. Он отметил, что если звуковые или слуховые индифферентные раздражители (свет, зуммер, метроном), подаваемые вместе с отравленной пищей, не вызывают аверсию, то, напротив, стоит
1 Дженкинс, кстати, отмечает, что в том случае, если пища выдается не только при появлении светового сигнала, но и без него, то реакция голубя исчезает.
340 Глава 7
предъявить вместе с такой пищей какой-либо запах, и он сам по себе начинает вызывать отказ от еды.
«Приобретенная беспомощность». Если собаку поместить в клетку с двумя отсеками и в одном из этих отсеков наносить ей удары током, то она быстро научается перепрыгивать во второй отсек. Это реакция имеющаяся в естественном поведенческом репертуаре животного, и ее легко сделать условнорефлекторной. Однако выяснилось (Seligman, 1975), что если собак запирать в одном из отсеков клетки и наносить им несильные электрические удары, то очень многих из них уже не удается научить перепрыгивать во второй отсек, если отпереть ведущую в него дверцу и вновь подавать ток. Собаки при этом остаются в первом отсеке - они буквально не могут сдвинуться с места и покорно переносят электрические удары. Даже если при этом положить во второй отсек вкусную пищу или попытаться перетащить туда животное на поводке, то это становится возможным лишь после многих попыток. Иными словами, у животных формируется беспомощность в ответ на предъявление аверсивного раздражителя, и этот раздражитель уже не может вызвать никакого научения.
Все эти примеры заставляют задуматься над тем, в какой степени наша биологическая наследственность, скрытая под напластованиями культуры и социальной жизни, может обусловливать многие трудности, с которыми мы сталкиваемся в повседневной жизни.
Человек смог решить многие проблемы, обусловленные его физической конституцией, путем изобретения и усовершенствования орудий. В то же время биологические ритмы все еще продолжают оказывать сильнейшее влияние на нашу деятельность, осуществляемую в различное время суток или в разные сезоны. Известно, что работа в ночную смену может оказывать порой разрушительное влияние на физическое и психическое состояние человека. И вообще, достаточно лишь немножко «прислушаться» к собственному организму, чтобы убедиться в том, что его активность тесно связана с временами года.
Для удовлетворения инстинктов собирательства, охоты и рыбной ловли человек с удовольствием предается таким занятиям, которые кажутся атавистическими и совершенно ненужными для его выживания. По-видимому, радость охотника, способная порой достигать размеров настоящей страсти или ярости, и терпение рыбака имеют те же глубинные основы, что и поиски удовольствий завсегдатаями пансионатов, жаждущих обрести свой «потерянный рай»1.
За примером самоформирования реакций не придется ходить слишком далеко. Высокая популярность различного рода лотерей показывает, что и у человека существует множество форм поведения, тесно
Рис. 7.16. Терпение рыболова вполне можно сопоставить со страстью охотника или с поисками приятного отдыха любителями пансионатов.
связанных с раздражителями, имеющими лишь весьма гипотетическое отношение к ожидаемому подкреплению1.
Нетрудно отыскать у человека и примеры вкусовых аверсий. Случаев таких множество, особенно у детей. Всем известно, как случайное внешнее сходство пищи с чем-либо другим, внезапное заболевание, не имеющее никакого отношения к употреблению данного продукта, или семейный конфликт во время еды может быть причиной отказа от какой-то пищи и даже отвращения к ней. Попутно стоит отметить, что аверсия чаще вырабатывается на горькую пищу или продукты с непривычным запахом (поэтому гораздо эффективнее наказывать детей, лишая их сладкого, а не шпината).
Что касается «приобретенной беспомощности», то здесь можно привести больше, чем хотелось бы, примеров тому, как забитые дети привязываются к своим несправедливым родителям или как жены либо мужья, подвергающиеся побоям со стороны супруга, упорно не желают как-то на это отреагировать-подать в суд или попытаться изменить условия жизни. Еще проще объяснить «приобретенной беспомощностью» чувство постоянной неудачи или депрессии, возникающее у лиц, попадавших в прошлом в тяжелые ситуации и пришедших из-за этого к мыслям о бесполезности всякой борьбы (Seligman, 1975).
1Надо отметить, что подобный «возврат к предкам» в виде различных способов проведения досуга перестал быть необходимым лишь для таких людей, для которых работа превратилась в страсть и стала своего рода «второй природой».
2Действительно, трудно объяснить подобное поведение связью с подкрепляющим агентом, так как всем известно, что в большинстве случаев вероятность главного выигрыша при покупке одного билета -всего лишь один шанс на несколько миллиардов.
342 Глава 7
Литература
Общие работы
Breland К., Breland M. (1961). "The misbehavior of organisms", American Psychologist n° 61, p. 681-684.
Brown P. L., Jenkins H.M. (1968). "Auto-shaping of the pigeons keypeck", Journal of the Experimental Analysis of Behavior, n° 11, p. 1-8.
Garcia J., Erwin F.E., Koeliing R.A. (1966). "Learning with prolonged delay of reinfor-cement", Psychonomic Science, n° 5, p. 121-122.
Godefroid J., 1979. L'amassage de nourriture che: les rongeurs. These de doctoral Liege (roneo).
Jenkins H.M., 1973. "Effects of the stimulus reinforcer relation on selected and unselected responses", in: R.A. Hinde et J. Stevenson Hinde (Eds.), Constraints on learning: Limitations and predispositions, London, Academic Press.
Seligman M. E. P., 1975. Helplessness: On depression, development and death, San Francisco, Freeman.
Smith R.F., Gustavson C.R., Gregor G.L. (1972). "Incompatibility between the pigeon's unconditioned response to shock and the conditioned keypeck response", Journal of the Experimental analysis of Behavior, n° 18, p. 147-153.
Цитированная литература
Ainsworth M.D.S. (1979). "Infant-mother attachment", American Psychologist,
n° 34 (10), p. 932-937.
Butterfield E., Siperstein G., 1972. "Influence of contingent auditory stimulation upon non-nutritional suckle", Oral sensation and perception - the mounth of the infant, Springfield. Illinois, C.C. Thomas.
Fitts P.M., Posner M.I., 1967. Human performance, Belmont, California, Brooks-Cole.
Hull C.L., 1953. Principles of behavior, New York, Appleton - Century-Crofts. Kinkade K. (1974). "J'ai vecu cinq ans dans une communaute", adaptation francaice
par M.-R. Delorme, Psychologie, n° 43, p. 29-35. Kohler W., 1925. The mentality of apes, New York, Harcourt, Brace and World. Le Ny J.F., 1969. Le conditionnement, Paris, PUF. Malcuit G., Pomerleau A., 1977. Terminologie en conditionnement et apprentissage,
Montreal, Les Presses de 1'Universite du Quebec. Moore K., Meltzoff A., 1975. "Neonate imitation: A test of existence and mechanism",
Society for Research in Child Development, Denver. Mum N.L., 1966. Traite de Psychologie, Paris, Payot. Pavlov I. P., 1927. Conditioned Reflexes (traduction G.V. Anrep), New York, Oxford
University Press.
Richelle M., 1972. Le conditionnement operant, Neufchatel, Paris, Delachaux et Niestle. Skinner B. F., 1969. La revolution scientifique de 1'enseignement, Bruxelles, Dessart et
Mardaga.
Skinner B.F., 1973. Par-dela la liberte et la dignite, Bruxelles, Dessart. Thorndike E. L., 1911. Animal intelligence. New York, Macmillan. To/man E.C. (1948). "Cognitive maps in cats and men", Psychological Review, n° 55,
p. 189-208.
Watson J. В., Rayner R. (1920). "Conditioned emotional reactions". Journal of Experimental Psychology, n° 3, p. 1-14.
Научение 343
Материал для самопроверки
Заполнить пробелы
1. Можно выделить три главные разновидности научения: выработку..... поведения, выработку ..... поведения и ..... научение.
2. При выработке ..... форм поведения организм реагирует на внешние стимулы.
3. При выработке ..... форм повеления выбор той реакции, которая будет закрепляться, зависит от того будет ли она приводить к удовлетворению потребностей организма.
4. ..... виды научения требуют ..... ситуации с учетом ..... опыта и имеющихся .....; в результате такой оценки принимается наиболее ..... решение.
5. ..... и .... .-это примитивные формы научения, при которых организм
относительно однотипно реагирует на ..... стимулы.
6. В основе классического обусловливания лежат врожденные реакции, имеющиеся в поведенческом ..... животного, так как для их проявления нет ничего кроме воздействия определенного стимула.
???????7. Врожденные рефлексы называют также ….. нужны никакие ….. другие специфические......??????
8. Условным называют раздражитель, который вначале был ... а затем постепенно стал вызывать рефлекс в результате многократного … с безусловным стимулом.
9. Оперантные формы поведения - это такие ...... которые животное совершает
над окружающими объектами, чтобы получить желаемый ......
10. Научение методом ..... и ..... состоит в том, что поведение, приводящее к ..... результату, закрепляется, а бесполезные формы поведения ......
11. ..... -это любое событие или раздражитель, который ..... вероятность того,
что данное поведение будет повторяться.
12. ..... более сложных реакций осуществляется путем последовательных ......
13. Избегание ..... ситуации -это отрицательное ...... повышающее вероятность того, что соответствующее поведение будет ......
14. Наказание приводит к ..... определенной формы поведения, так как это поведение каждый раз влечет за собой ..... последствия.
15. Первичное подкрепление сводится к подкреплению ..... потребности.
16. ..... происходит в том случае, если перестает подаваться ..... раздражитель
или подкрепление.
17. При ..... те поведенческие реакции, которые перестают сопровождаться
..... стимулом или подкреплением, ...... и сохраняются только реакции на
подкрепляемые стимулы.
18. Генерализация - это распространение ..... рефлекса на иные стимулы, сход-ные с первоначальным, или на ситуации, сходные с той, в которой ранее давалось подкрепление.
19. ..... научение - это научение путем наблюдения, при котором индивидуум
воспроизводит поведение ..... в зависимости от того, каковы для нее .....
этого поведения.
20. При ..... научении в мозгу формируются ..... карты, основанные в большей степени на значении стимулов, чем на ..... между стимулом и реакцией.
21. При научении сложным ..... навыкам на когнитивной стадии вырабаты-ваются когнитивные ......
22. Внутреннее упорядочивание элементов задачи, в результате которого приходит решение этой задачи, называется ......
23. Решение задачи путем ..... обычно осуществляется в два этапа: на первом систематизируются данные, имеющие отношение к задаче, а во втором выдвигаются и проверяются различные ......
24. В формировании понятий участвуют два процесса: ..... и ......
25. ......это специфический для каждого данного вида процесс развития, при
котором организм, пройдя ряд последовательных этапов, достигает стадии ...... причем эта стадия различна для каждого органа или отдельной функции.
26. ..... периоды -это такие периоды, во время которых организм наиболее .....
к определенным влияниям окружающей среды.
27. Если сознание изменено под действием психотропного препарата, то ......
выработанная в процессе научения, сохраняется, а ..... выполнения задачи
может измениться.
28. ..... уже имеющегося опыта при обучении новой форме поведения может
либо ...... либо ..... освоение новой задачи.
29. В случае, если прежний опыт и новая информация относительно сходны, чаще всего имеет место ..... перенос.
Верно или неверно?
1. Приобретенное поведение—это поведение, в котором наступили относительно стойкие изменения.
2. Реактивные формы поведения -это такие акты, для научения которым необходимы активные действия над окружающими объектами.
3. Сенсибилизация возникает в том случае, когда повторное или непрерывное раздражение перестает приводить к активации организма.
4. Импринтинг можно рассматривать как оперантную форму поведения.
5. Безусловные рефлексы всегда входят в поведенческий репертуар организма.
6. Безусловный раздражитель - это индифферентный раздражитель, который начинает вызывать реакцию при сочетании с условным раздражителем.
7. В соответствии с законом эффекта вероятность повторения реакции зависит от того, приводит ли она к желательным или нежелательным для индивидуума последствиям.
8. Подкрепляющий фактор -это любое событие, повышающее вероятность повторения поведенческой реакции.
9. Метод формирования реакций состоит в том, что заставляют несколько раз повторять ту реакцию, которую необходимо выработать.
10. Отрицательное подкрепление приводит к исчезновению нежелательной пове-денческой реакции.
11. Угасание поведенческой реакции происходит в том случае, если безусловный раздражитель или подкрепляющий фактор перестают предъявляться.
12. Дифференцировка - это процесс, при котором угасают неподкрепляемые поведенческие реакции, но сохраняются подкрепляемые.
13. Викарное научение-это усвоение какой-либо формы поведения в зависимости от тех последствий, к которому она приводит для самого обучающегося индивидуума.
14. При латентном научении формируются когнитивные стратегии, программирующие будущую деятельность.
15. При инсайте происходит интеграция сведений, имеющихся в памяти и поступающих из внешней среды, и в результате формируются гипотезы.
16. Чем богаче опыт, уже имеющийся у субъекта, тем разнообразнее будут гипотезы и тем больше вероятность того, что одна из них сможет дать решение задачи.
17. Понятия -это категории, позволяющие упорядочивать наш опыт и восприя-тие мира, объединяя их в абстрактную концепцию.
18. Созревание - это уровень зрелости, которого достигает организм в процессе развития, проходя ряд последовательных этапов, сходных у всех особей данного вида.
19. Критический период -это тот период развития, во время которого научение крайне затруднено.
20. Отрицательный перенос возможен в том случае, когда новая информация слишком сходна с имеющейся, хотя и отлична от нее.
Выбрать правильный ответ
1. Какая из перечисленных форм научения относится к реактивным типам поведения:
а) метод проб и ошибок;
б) латентное научение;
в) сенсибилизация;
г) все перечисленные формы.
2. Световой сигнал, вызывающий отдергивание лапы, если за ним следует электрический удар, - это
а) условный раздражитель;
б) безусловный раздражитель;
в) безусловный рефлекс;
г) индифферентный раздражитель.
3. Представим себе, что ребенок как-то приласкал собаку, а та на него внезапно залаяла, и в результате он стал бояться всех собак вообще. Что является в данном случае безусловным раздражителем:
а) боязнь собак;
б) собака;
в) лай;
г) ласка.
4. При выработке оперантных форм поведения
а) организм относительно пассивен;
б) индивидуум вырабатывает когнитивные стратегии;
в) после условного раздражителя должен следовать безусловный.
г) Ни один из этих ответов не верен.
5. Научение методом проб и ошибок
а) основано на законе эффекта;
б) осуществляется благодаря случайным поведенческим реакциям;
в) состоит в том, что число ошибок по мере увеличения числа проб снижается.
г) Все ответы верны.
6. Формирование реакций всегда осуществляется
а) путем ассоциаций между индифферентным и безусловным раздражителями;
б) путем последовательных приближений;
в) благодаря случаю:
г) путем наблюдения за моделью.
7. Если животное хочет пить и получает воду в поилку после нажатия на рычаг
то эта вода служит для него
а) подкрепляющим агентом;
б) подкреплением;
в) условным рефлексом;
г) фактором формирования реакции.
8. Отрицательное подкрепление -это такое подкрепление, которое приводит
а) к быстрому угасанию реакции;
б) к ее формированию;
в) к ее исчезновению;
г) к торможению.
9. Наказание
а) действует так же, как отрицательное подкрепление;
б) способствует развитию других инициативных форм поведения;
в) препятствует определенной форме поведения.
г) Все ответы неверны.
10. Процесс, при котором индивидуум начинает воспроизводить одну и ту же поведенческую реакцию во всех ситуациях, сходных с той, в которой раньше происходило подкрепление, называется
а) генерализацией;
б) дифференцировкой;
в) подражанием;
г) воспроизведением.
11. При научении путем наблюдения
а) индивидуум просто-напросто подражает модели;
б) модель должна осуществлять очень простое поведение;
в) вероятность подражания модели выше, если модель в результате данного поведения вознаграждается.
г) Все ответы верны.
12. Викарное поведение осуществляется
а) путем простого подражания модели;
б) с учетом тех последствий, которые оно имеет для модели;
в) после переструктурирования ситуации высшими психическими процессами.
г) Все ответы верны.
13. При латентном научении индивидуум научается
а) понимать значение раздражителя;
б) разрабатывать когнитивные карты;
в) использовать все то, чему он научился в результате подкрепления.
г) Все ответы верны.
14. При освоении сложных психомоторных навыков вырабатывается когнитивная стратегия, необходимая для того, чтобы
а) концентрировать внимание на различных сторонах задачи;
б) программировать деятельность в зависимости от характера задачи;
в) воспроизводить различные элементы поведения в определенном порядке.
г) Все ответы верны.
15. Особенность инсайта заключается
а) в способе выработки гипотез;
б) в оригинальности решения;
в) в выработке когнитивных стратегий.
г) Все ответы неверны.
16. При научении путем рассуждений разработка гипотез
а) начинается после учета исходных данных задачи;
б) позволяет установить связи между этими данными;
в) лишь в редких случаях опирается на предшествующий опыт.
г) Все ответы верны.
17. Первая стадия выработки понятий состоит
а) в обобщении;
б) в дифференцировке;
в) в абстрагировании.
г) Все ответы неверны.
18. Развитие организма
а) определяется генотипом каждого индивидуума;
б) специфично для каждого вида;
в) зависит от внутреннего процесса созревания.
г) Все ответы верны.
19. Критические периоды -это такие периоды развития, во время которых
а) научение затруднено;
б) организм достигает зрелости;
в) организм более восприимчив к тому или иному научению;
г) созревание осуществляется быстрее всего.
20. Эффективность деятельности, связанной с тем или иным научением, зависит
а) от состояния сознания;
б) от стресса;
в) от ситуации, в которой эта деятельность осуществляется.
г) Все ответы верны.
Ответы на вопросы
Заполнить пробелы
1-реактивного, оперантного, когнитивное; 2 - реактивных; 3-оперантных;
4- Когнитивные, оценки, прошлого, возможностей, адекватное; 5 - Привыкание, сенсибилизация, повторяющиеся; 6 - репертуаре; 7 - безусловными, условия, стимула; 8 - индифферентным, сочетания; 9-действия, результат; 10-проб, ошибок, желаемому, отбрасываются; 11 - Подкрепление, повышает; 12-Выработка, приближений; 13- неприятной, подкрепление, воспроизводиться; 14-исчезновению, неприятные; 15-физиологической; 16-Угасание, безусловный; 17-дифференцировке, безусловным стимулом, угасают; 18-условного; 19-Викарное, модели, последствия; 20-латентном, когнитивные, связи; 21-психомоторным, стратегии; 22-инсайтом; 23 - рассуждения, гипотезы; 24 - абстрагирование, обобщение; 25-созревание, зрелости; 26 - Критические, чувствителен; 27-способность, эффективность; 28-Перенос, облегчать, затруднять; 29 - положительный.
Верно или неверно?
1-В; 2-Н; 3-Н; 4-Н; 5-В; 6-Н; 7-В; 8-В; 9-Н; 10-Н; 11-В; 12-В; 13-Н;
14-Н; 15-Н; 16-В; 17-В; 18 Н; 19-Н; 20-В.
Выбрать правильный ответ
1-в; 2-а; 3-в; 4-г; 5-г; 6-б; 7-б; 8-б; 9-в; 10-а; 11-в; 12-б; 13-г; 14-г:
15-г; 16-а; 17-в; 18-г; 19-в; 20-г.
Еще по теме Глава 7 Научение:
- Глава 7. Научение и обусловливание
- Нейронный базис научения
- Глава 10. Базовые мотивы
- Глава 16.ТЕОРЕТИЧЕСКОЕ ВВЕДЕНИЕ В НАУЧЕНИЕ
- Глава 22. Альберт Бандура и социально-когнитивная теория.
- Глава 1. Психология личности: введение в дисциплину
- Глава 7. Научающе-бихевиоральное направление в теории личности: Б. Ф. Скиннер
- Глава 8. Социально-когнитивное направление в теории личности: Альберт Бандура и Джулиан Роттер
- Глава 10. Интербихевиоральная психология: событийное поле...
- ГЛАВА 6ПОДРОСТКОВАЯ АГРЕССИЯ
- ГЛАВА 5. СТРУКТУРА ПСИХИКИ
- Глава 6 Интегрированная социальнаяпсихология
- Глава 1 Что такое поведение?
- Глава 3 Чем занимаются психологи?
- Глава 7 Научение
- Глава 8 Память, мышление и общение
- 5. Расстройства как последствия истории научения: теоретические модели научения
- Глава 5. Психологическая теория деятельности
- Научение и память
- Аверсивное научение избегание приманки»)