Reinforcement

Reinforcement

Creator
Created
Created
2019 Nov 5 3:14
Editor
Edited
Edited
2024 Jan 28 3:22
Refs
Refs

개성, 습관의 원인 - 행동이 나타나고 유지되는 원리

효과의 법칙 - 행동의 강도(빈도, 지속시간)은 그 행동이 유발했던 결과의 함수이다
(← puzzle box of thorndike)
진화론적 설명- 다시 행동할 지 말지 행동 늘이냐 줄이냐
종교는 보상을 얻기 위한 방법을 모를 때 일어나는 비논리적 작화의 결과물
notion image
can make verbal behabior, 미신행동
(parsimonious explanation 경제적 설명 - william of occam 오컴의 면도날) by behaviorism in skinner box (정신분석학 검증 불가 학파와 대립(프로이트)) - 객관적 행동주의
 

Reinforce & punishment


Skinner box - use dopamine system

강화물 reinforcing stimulus → give dopamine (전기자극은 오직 도파민 뉴런에만 중독성 있다) 도파민 = 중독
→ 목표의 사전행동 에 대한 강화를 통해 목표행동 만들게 함→ 다음행동으로 강화 변경→ 원래하던거에서 뒤의 행동에 좌절 → 우연히 다양행동중 그 다음 행동 까지 하면 보상 → recursion →(일련의 하나의 행동으로 합쳐짐)
1차 강화물 - ex. 먹이로 바로 도파민 주는거
2차강화물 - 1차에 비해서 효과적 - limit 가 없다 배불러도
측핵에 전기자극 → 도파민
 

도파민 뉴런 - 긍정심리학에서 아주 중요


보상예측 올 = 실제보상 - 기대치
적응 이전에는 보상시기에 도파민 나옴
적응 이후에는 예측시기에만 도파민 나옴
예측과 결과 다르면 도파민 더 많이 분비되고 원인찾기 시작 → (예측을 하여 도파미 얻고 예측과 다른 보상 얻기)

도파민 뉴런의 활동은 보상이 주는 “쾌락”을 반영하는 것이 아니라 보상을 주는 행동을 반복하려는 “동기”를 반영한다(inform reward value) - 진화론적 설명
 

punishment


공포와 연관되는 특정 상황에 다가가는 행동이 처벌받는 상황
 
우울증 - 모든 상황에서 좌절 = 학습된 무기력 at 왕복 상자 (shutle box)
ex. 법치주의
수반성 (contingency) 지각 - 미신행동
행동이 보상을 수반한다는 기본적 지각 → 효과의 법칙의 기본 가정
 

안와전두피질 orbitofrontal cortex


피니스 게이지 손상 부위 → 감정 없어짐 (전두엽 절제술 → 무기력, 감정조절 못함)
미래 생각 못함 → (전인습적)
충동 억제,보상과 처벌에 따라 행동 수정를 못해서 →
사회 사회정서단서 의사결정이용 하는데 1차원적만 (사회적응 못함)
수반성 지각 까지만 사용행동과 모방행동하여 사회적응 못함
안와전두 피질하면 2가지 행동을 없이 보상 처벌에 따라만 행동한다
 

kohlberg의 도덕발달 단계 - 후천적 사회 병질


하인즈 이야기
  • 1수준 - 전인습적 - 처벌 회피/자기욕구충족
  • 2 수준 - 인습적 - 타인 시선, 질서 - 법치주의
  • 3수준 - 후인습적 - 사회계약, 보편윤리 지향
notion image
이론의 돤점 - 도덕판단과 순간판단에 의한 행도잉 다른것을 고려안함
 
 
 

Recommendations