Инструментальный условный рефлекс

Инструментальный условный рефлекс

text_fields
text_fields
arrow_upward

Инструментальный условный рефлекс — это условный рефлекс, при котором реакция на условный раздражитель (обычно двигатель­ная) является обязательным условием получения подкрепления. На­пример,  если нажатие на педаль,  сопровождаемое получением животным пищи, предваряется звуковым или световым раздражителем, то после ряда сочетаний нажатие на педаль становится инструмен­тальной реакцией, а внешний стимул — сигналом для совершения такой реакции. Это и есть инструментальный условный рефлекс. Такой вид обучения, основанный на активной деятельности, играет важную роль в организации поведения человека в раннем постна-тальном онтогенезе и остается доминирующим на протяжении даль­нейшей жизни. Примером инструментальной реакции ребенка явля­ется его плач, в результате которого ребенок получает пищу. В этом случае плач играет для ребенка роль инструмента, изменяющего условия среды. Ребенок овладевает реакцией, которая определяет получение  поощрения.

Инструментальный условный рефлекс успешно вырабатывается не только на поощрение, но и на наказание. Так, если собаку поместить в помещение, разделенное барьером, с целью научить ее перепрыгивать через него, для эффективного обучения возможно использование не поощрения (пища), а наказания (ток). Металлический пол подвергается воздействию электрического тока и животное, испытывая неприятное ощущение или боль, быстро обучается преодолевать препятствие и оказываться за барьером, где пол не находится под напряжением. При этом, одновременно с током включается световой или звуковой сигнал. В дальнейшем, если за 10 секунд до включения тока загорается световой или слышен звуковой сигнал, то собака избегает «наказания» — она перепрыгивает через барьер в течение того времени, которое отделяет световой или звуковой сигнал от включения тока.

Инструментальные условные рефлексы отличаются от классичес­ких условных рефлексов тем, что на их основе возникает бесконеч­ное разнообразие новых двигательных реакций. Таким образом, поведение формируется на основе результата действия. Закрепляются в памяти субъекта в этом случае не безусловно-рефлекторные ре­акции,   а  произвольные  активные действия.

Подкрепление (например, пища, электрический ток) является сред­ством, помогающим человеку или животному обучиться той реакции, за которой это подкрепление следует. В то же время, подкрепление в инструментальном обучении служит сигналом, который указывает на то, какие действия желательны, целесообразны, а какие — нет. Максимальную эффективность подкрепление достигает при условии его воздействия непосредственно после совершения действия (по­рядка 5 секунд). Подкрепление может исходить из внешнего источ­ника — например, получение пищи за нажатие на определенный рычаг, или из внутреннего источника, например, возникновение положительной эмоции. Известны эксперименты с вживлением в мозг крысы электродов, по которым животное, путем нажатия на рычаг, замыкающий электрическую цепь, могло посылать к различ­ным структурам импульсы электрического тока. Подобное раздраже­ние ряда лимбических структур мозга, так называемых, «центров удовольствия», осуществлялось крысой непрерывно, до полного из­неможения. Это — пример инструментального обучения с внутрен­ним подкреплением  —  получением положительной  эмоции.

Механизм реализации инструментального условного рефлекса

text_fields
text_fields
arrow_upward

В механизмах реализации инструментального условного рефлекса наиболее выраженное участие принимают нейроны двигательной коры и центрального серого вещества, окружающего сильвиев водо­провод. Реакции нейронов этих отделов мозга возникают на 500-800 мс раньше начала движения. Условный раздражитель (например, звуковой щелчок) вызывает в тех же нейронах длительный тоничес­кий разряд, постепенно угасающий при отсутствии подкрепления. В выборе правильной инструментальной реакции, т.е. движения с последующим положительным подкреплением, принимают участие нейроны лобной коры, в которых импульсация значительно учаща­ется. При ошибочном выборе активность нейронов лобной коры не усиливается по сравнению с фоном. Нейроны двигательных ядер таламуса и пирамидной системы непосредственно связаны с орга­низацией движения  при  инструментальном  условном  рефлексе.

В условнорефлекторном обучении и основанном на нем поведе­нии существенную роль играют следующие факторы:

  • эффективность раздражителя,
  • доминирующая мотивация,
  • избирательность реагиро­вания.

Наиболее эффективными являются биологически значимые сигналы, а также первоначально индифферентные раздражители, физические параметры которых соответствуют максимальной чувствительности органов чувств. Наибольший успех в обучении дости­гается при согласовании мотива и результата, как, в частности, в случае успеха пищевого подкрепления в условиях голода. Избира­тельность реагирования — конечного звена рефлекторной деятель­ности, проявляется как во врожденных формах поведения (типа таксисов у животных), так и в приобретенных: например, рефлекс на сгибание вырабатывается легче, чем рефлекс на разгибание конечностей.

Выработка условного рефлекса

text_fields
text_fields
arrow_upward

Выработка условного рефлекса проходит две стадии.

  • Первая ста­дия — генерализации — характеризуется тем, что все близкие по физическим параметрам условные раздражители вызывают одинако­вую условную реакцию.
  • Вторая стадия — специализации — харак­теризуется тем, что постепенно в процессе выработки условного рефлекса различные раздражители, кроме условного, становятся не­эффективными и не  вызывают условного  рефлекса.