티스토리 뷰
반응형
🎰 왜 어떤 행동은 멈추기 어려울까?
— 강화, 소거, 그리고 Humphreys's Paradox에 대한 아주 친절한 설명
🔷 1. 행동을 만들고 없애는 기본 원리: 강화와 소거
✅ 1-1. 강화(강하게 만들기): 보상이 행동을 반복하게 만든다
‘강화’는 어떤 행동을 한 후 보상을 받으면, 그 행동을 더 자주 하게 되는 것을 말합니다.
- 아이가 숙제를 했을 때 칭찬을 받으면 → 숙제를 더 열심히 하게 됨
- 강아지가 ‘앉아’를 했을 때 간식을 받으면 → 다음에도 ‘앉아’를 잘 함
이처럼 보상은 행동을 ‘강화’하는 힘이 있습니다. 여기서 보상은 ‘좋은 말’, ‘간식’, ‘돈’, ‘시간’, ‘관심’ 등 매우 다양할 수 있습니다.
✅ 1-2. 소거(없애기): 보상이 사라지면 행동도 사라진다
‘소거’는 반대로, 보상이 더 이상 주어지지 않으면, 그 행동이 점점 줄어들다 사라지는 것입니다.
- 자판기에서 음료가 나오지 않으면 → 몇 번 누르다 포기
- 부모가 아이의 떼쓰기를 계속 무시하면 → 언젠가는 떼쓰기 멈춤
💡 요약표:
🔷 2. 보상을 주는 방법에 따라 행동이 달라진다: 4가지 강화 스케줄
✅ 2-1. 왜 ‘언제’ 보상이 오느냐가 중요할까?
보상을 매번 주는 것과 가끔 주는 것, 혹은 횟수 기준으로 주느냐 시간 기준으로 주느냐에 따라 행동의 패턴이 달라집니다. 이를 강화 스케줄이라고 합니다.
✅ 2-2. 4가지 단순 강화 스케줄
🔷 3. 이상한 실험 결과 하나: 부분 강화 소거 효과 (PREE)
✅ 3-1. 당연한 예상 vs 실제 실험 결과
많은 사람이 이렇게 생각합니다:
“항상 보상을 받은 쥐는 행동을 더 오래 하지 않을까?”
하지만 실제 실험 결과는 정반대입니다. 가끔 보상을 받은 쥐가 훨씬 더 오래 행동을 지속했습니다.
✅ 3-2. 대표적인 실험 장면
두 마리 쥐가 레버를 누르면 먹이를 주는 장치를 사용한 실험입니다.
- A쥐: 레버를 누를 때마다 먹이 제공 (CRF)
- B쥐: 평균 10번 중 1번만 먹이 제공 (VR 10)
그 후 아무리 눌러도 먹이가 나오지 않게 했을 때, B쥐가 더 오래 레버를 눌렀습니다.
🔷 4. Humphreys's Paradox: 덜 보상받은 쪽이 더 끈질기다?
이 결과는 1939년 Humphreys라는 심리학자가 처음 관찰하여, 그의 이름을 따 Humphreys's Paradox라 불립니다.
왜 보상을 더 자주 받은 쥐가 행동을 더 빨리 멈출까?
왜 보상을 드물게 받은 쥐가 더 오래 행동을 계속할까?
이 역설은 현실에서도 자주 발견됩니다.
- 자판기처럼 항상 보상을 주던 기계가 안 주면 → “고장났나?” 하고 금방 포기
- 슬롯머신처럼 가끔 보상을 주던 기계는 → “곧 나올 거야” 하며 계속 시도
🔷 5. 이 이상한 현상을 설명하는 두 가지 심리학 이론
✅ 5-1. 변별 가설 (Discrimination Hypothesis)
보상을 항상 받은 쥐는 보상이 안 나오자 금방 이상함을 느끼고 행동을 멈췄습니다. 반면, 가끔 받던 쥐는 원래도 가끔이었으므로 변화에 눈치채지 못하고 행동을 계속했습니다.
✅ 5-2. 일반화 감소 가설 (Generalization Decrement Hypothesis)
이 가설은 새로운 상황이 과거 상황과 얼마나 비슷한가에 주목합니다.
- 항상 보상 → 지금은 보상이 아예 없음 → 너무 다름 → 포기
- 가끔 보상 → 지금도 보상이 잘 없음 → 비슷함 → 계속함
즉, 변화가 작게 느껴질수록 행동을 유지하려는 경향이 강합니다.