티스토리 뷰

반응형
강화, 소거, 강화 스케줄, Humphreys의 역설 완벽 정리

🎰 왜 어떤 행동은 멈추기 어려울까?

— 강화, 소거, 그리고 Humphreys's Paradox에 대한 아주 친절한 설명



🔷 1. 행동을 만들고 없애는 기본 원리: 강화와 소거

✅ 1-1. 강화(강하게 만들기): 보상이 행동을 반복하게 만든다

‘강화’는 어떤 행동을 한 후 보상을 받으면, 그 행동을 더 자주 하게 되는 것을 말합니다.

  • 아이가 숙제를 했을 때 칭찬을 받으면 → 숙제를 더 열심히 하게 됨
  • 강아지가 ‘앉아’를 했을 때 간식을 받으면 → 다음에도 ‘앉아’를 잘 함

이처럼 보상은 행동을 ‘강화’하는 힘이 있습니다. 여기서 보상은 ‘좋은 말’, ‘간식’, ‘돈’, ‘시간’, ‘관심’ 등 매우 다양할 수 있습니다.


✅ 1-2. 소거(없애기): 보상이 사라지면 행동도 사라진다

‘소거’는 반대로, 보상이 더 이상 주어지지 않으면, 그 행동이 점점 줄어들다 사라지는 것입니다.

  • 자판기에서 음료가 나오지 않으면 → 몇 번 누르다 포기
  • 부모가 아이의 떼쓰기를 계속 무시하면 → 언젠가는 떼쓰기 멈춤
💡 요약표:
용어 설명 예시
강화 행동 후 보상 → 행동이 증가 칭찬 → 숙제 계속함
소거 보상 제거 → 행동이 점점 사라짐 칭찬 없음 → 숙제 안 함


 


🔷 2. 보상을 주는 방법에 따라 행동이 달라진다: 4가지 강화 스케줄

✅ 2-1. 왜 ‘언제’ 보상이 오느냐가 중요할까?

보상을 매번 주는 것과 가끔 주는 것, 혹은 횟수 기준으로 주느냐 시간 기준으로 주느냐에 따라 행동의 패턴이 달라집니다. 이를 강화 스케줄이라고 합니다.

✅ 2-2. 4가지 단순 강화 스케줄

스케줄 이름 기준 설명 예시 행동의 특징
FR (고정비율) 반응 횟수 정해진 횟수만큼 행동하면 보상 10개 생산 → 보너스 빠르게 반복 후 휴식
VR (변동비율) 반응 횟수 평균적으로 몇 번 행동하면 보상 슬롯머신 계속 빠르게 반복
FI (고정간격) 시간 정해진 시간 지나고 첫 반응에만 보상 매주 금요일 숙제 검사 시간이 다가올수록 행동 증가
VI (변동간격) 시간 보상이 언제 올지 모르고 평균 시간 기준 낚시 꾸준히 일정한 행동




🔷 3. 이상한 실험 결과 하나: 부분 강화 소거 효과 (PREE)

✅ 3-1. 당연한 예상 vs 실제 실험 결과

많은 사람이 이렇게 생각합니다:

“항상 보상을 받은 쥐는 행동을 더 오래 하지 않을까?”

하지만 실제 실험 결과는 정반대입니다. 가끔 보상을 받은 쥐가 훨씬 더 오래 행동을 지속했습니다.

✅ 3-2. 대표적인 실험 장면

두 마리 쥐가 레버를 누르면 먹이를 주는 장치를 사용한 실험입니다.

  • A쥐: 레버를 누를 때마다 먹이 제공 (CRF)
  • B쥐: 평균 10번 중 1번만 먹이 제공 (VR 10)

그 후 아무리 눌러도 먹이가 나오지 않게 했을 때, B쥐가 더 오래 레버를 눌렀습니다.



 


🔷 4. Humphreys's Paradox: 덜 보상받은 쪽이 더 끈질기다?

이 결과는 1939년 Humphreys라는 심리학자가 처음 관찰하여, 그의 이름을 따 Humphreys's Paradox라 불립니다.

왜 보상을 더 자주 받은 쥐가 행동을 더 빨리 멈출까?
왜 보상을 드물게 받은 쥐가 더 오래 행동을 계속할까?

이 역설은 현실에서도 자주 발견됩니다.

  • 자판기처럼 항상 보상을 주던 기계가 안 주면 → “고장났나?” 하고 금방 포기
  • 슬롯머신처럼 가끔 보상을 주던 기계는 → “곧 나올 거야” 하며 계속 시도


🔷 5. 이 이상한 현상을 설명하는 두 가지 심리학 이론

✅ 5-1. 변별 가설 (Discrimination Hypothesis)

개념 설명
변별(discrimination) 상황이 바뀌었음을 얼마나 빨리 알아차리는가

보상을 항상 받은 쥐는 보상이 안 나오자 금방 이상함을 느끼고 행동을 멈췄습니다. 반면, 가끔 받던 쥐는 원래도 가끔이었으므로 변화에 눈치채지 못하고 행동을 계속했습니다.


✅ 5-2. 일반화 감소 가설 (Generalization Decrement Hypothesis)

이 가설은 새로운 상황이 과거 상황과 얼마나 비슷한가에 주목합니다.

  • 항상 보상 → 지금은 보상이 아예 없음 → 너무 다름 → 포기
  • 가끔 보상 → 지금도 보상이 잘 없음 → 비슷함 → 계속함

즉, 변화가 작게 느껴질수록 행동을 유지하려는 경향이 강합니다.



 


🔷 6. 일상에선 어떻게 적용할 수 있을까요?

상황 적용 방법
아이 교육 항상 칭찬하지 말고 가끔 해줘야 더 오랫동안 노력함
게임 설계 보상을 무작위로 주면 사용자 행동이 지속됨
나쁜 습관 고치기 가끔 보상이 있던 습관은 더 고치기 어려움
반려동물 훈련 처음엔 자주 간식, 나중엔 가끔 줘야 행동이 오래 유지됨


🔷 ✅ 마무리 정리

핵심 개념 한 줄 요약
강화 보상이 행동을 반복하게 만듦
소거 보상이 사라지면 행동도 줄어듦
강화 스케줄 보상 방식이 행동 패턴을 바꿈 (FR, VR, FI, VI)
PREE 가끔 보상받은 행동이 더 오래 지속됨
Humphreys's Paradox 많이 보상받은 행동이 오히려 더 빨리 사라지는 역설
설명 이론 변별 가설, 일반화 감소 가설로 설명됨


반응형
공지사항
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday
링크
«   2025/07   »
1 2 3 4 5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28 29 30 31
글 보관함
반응형