티스토리 뷰

반응형
Rescorla-Wagner 모델: 예측과 놀람으로 배우는 뇌의 원리

📘 Rescorla-Wagner 모델: 예측과 놀람으로 배우는 뇌의 원리

1. 들어가며: 우리는 어떻게 배우는가?

사람은 반복적인 경험 속에서 규칙을 찾고, 예상하며, 배우는 존재입니다.
그런데 뇌는 단순히 “같은 자극이 반복되었다”는 이유만으로 학습하지는 않습니다.
오히려 ‘예상과 다른 결과’, 즉 놀람(surprise)이 있을 때 뇌는 더 강하게 반응하고 새로운 연결을 만듭니다.

예를 들어, 평소와 달리 오늘따라 친구가 조용히 있다면, 우리는 그 이유를 궁금해하고 관찰하게 됩니다.
평소와 다른 결과가 우리의 주의를 끌고, 학습을 유도하는 것이죠.

이러한 생각을 바탕으로 제안된 이론이 바로 Rescorla-Wagner 모델(1972)입니다.
이 글에서는 그 핵심 개념부터 학습이 일어나는 조건, 실험 예시, 한계까지 차근차근 설명하겠습니다.




2. Rescorla-Wagner 모델이란?

Rescorla-Wagner 모델은 고전적 조건형성(classical conditioning)의 과정을 예측 중심으로 설명한 이론입니다.

전통적인 파블로프(Pavlov)의 조건형성은 "종소리(CS)와 음식(US)을 반복해서 같이 주면 개는 종소리만 들어도 침을 흘리게 된다"는 식의 설명이었습니다.
하지만 이 설명은 단순 반복만으로는 왜 어떤 자극은 학습되지 않는지, 왜 학습이 중단되거나 약화되는지를 설명할 수 없었습니다.

Rescorla-Wagner 모델은 여기서 한 걸음 더 나아가 말합니다:
“학습은 자극이 예상과 다를 때, 즉 놀람이 있을 때만 일어난다.”

즉, 학습이란 무조건 자극(US)을 얼마나 정확히 예측했는지, 그 차이에 따라 달라집니다.




3. 학습은 어떻게 일어나는가? – 기본 원리

Rescorla-Wagner 모델에서는 매 시행(trial)마다 뇌가 다음 두 가지 정보를 비교합니다:

✅ 학습을 결정하는 2가지 핵심 요소

  • 기대치 (Expected strength)
    → 조건자극(CS)이 지금까지의 경험을 바탕으로, US(무조건 자극)를 얼마나 예측하고 있는가?

  • 실제 결과 (Actual strength of US)
    → 이번 시행에서 실제로 제시된 무조건 자극의 강도는 얼마인가?

✅ 이 두 요소가 만드는 3가지 조건화 결과

조건 학습 결과 뇌의 반응
실제 US > 기대치 흥분성 조건형성
(excitatory)
놀람 발생 → 학습 강화
실제 US < 기대치 억제성 조건형성
(inhibitory)
실망 → 예측값 감소
실제 US = 기대치 학습 없음
(no conditioning)
놀람 없음 → 변화 없음

💡 직관적 비유: 자동문과 발판

마트에 갔을 때, 처음엔 발판을 밟자마자 문이 자동으로 열려서 깜짝 놀랐습니다.
몇 번 반복되면 '발판을 밟으면 문이 열린다'는 예측이 생기고, 더 이상 놀라지 않게 되죠.
그런데 어느 날, 발판을 밟았는데 문이 열리지 않았습니다. 그 순간 우리는 '뭔가 이상하다'고 생각하고 주목하게 됩니다.

이처럼 우리의 뇌는 예상과 실제 결과가 다를 때 '놀람'을 느끼며 학습을 조정합니다.



4. Rescorla-Wagner 모델의 6가지 학습 규칙 (예시 및 부등호 포함)

모델은 학습이 발생할지를 다음 6가지 규칙에 따라 설명합니다.
각 규칙마다 기대치와 실제 자극(US)의 관계를 부등호로 표시하고, 조건형성 또는 일상 예시를 함께 제공합니다.


1️⃣ 실제 US가 기대보다 크면 → 흥분성 조건형성

자극이 예상보다 강한 결과를 만들면, 놀람이 발생하고 학습이 일어납니다.
(기대 < 실제 US)

📌 예시:

  • 처음 종소리(CS) 뒤에 갑자기 음식(US)이 나왔을 때
  • 개는 놀라며 종소리를 ‘음식의 신호’로 학습하기 시작함



2️⃣ 실제 US가 기대보다 작으면 → 억제성 조건형성

기대한 만큼의 결과가 오지 않으면, 실망과 함께 학습이 줄어듭니다.
(기대 > 실제 US)

📌 예시:

  • 종소리 뒤에 늘 음식이 나왔는데, 갑자기 음식이 생략됨
  • 개는 종소리에 대한 기대를 점점 줄이며 반응이 약화됨



3️⃣ 실제 US가 기대와 같으면 → 학습 없음

결과가 예상한 것과 똑같다면, 뇌는 더 이상 학습하지 않습니다.
(기대 = 실제 US)

📌 예시:

  • 종소리가 항상 음식과 함께 등장하는 상황이 반복되면
  • 더 이상 새로운 정보가 없기 때문에 학습은 멈춤



4️⃣ 기대와 실제의 차이가 클수록 → 학습량도 큼

뇌는 놀람이 클수록 더 빠르게 배우며, 차이가 작아지면 학습도 느려집니다.
(|기대 – 실제 US| ↑ → 학습량 ↑)

📌 예시:

  • 갑자기 나타난 전기충격이 큰 놀람을 유발했다면
  • 그 전에 울린 소리 자극은 아주 빠르게 학습됨



5️⃣ 자극이 눈에 띌수록 → 더 빨리 학습됨

주의가 가는 자극일수록 더 빠르게 조건형성에 영향을 미칩니다.
(salience ↑ → 학습 속도 ↑)

📌 예시:

  • 약한 소리보다 큰 소리, 평범한 빛보다 깜빡이는 빛이 더 강하게 학습 대상이 됨



6️⃣ 여러 자극이 함께 나올 경우 → 기대는 그들의 합

여러 조건자극이 동시에 제시되면, 각 자극이 예측하는 US의 양이 합쳐집니다.
(총 기대 = 각 CS의 기대값 합계)

📌 예시:

  • 빛(Light)과 소리(Tone)이 함께 제시되고 음식이 나오면
  • 개는 두 자극 모두를 음식의 신호로 받아들이지만,
  • 이미 빛만으로도 충분히 예측되었다면, 소리는 학습되지 않음(차단)



반응형

 


Rescorla-Wagner 모델 실험 정리

🧪 5. 실험으로 이해하는 학습 현상들

Rescorla-Wagner 모델은 학습이 언제, 어떻게 일어나는지를
“예상과 실제의 차이(예측 오류)”를 통해 설명합니다.

이 과정은 실험에서 관찰되는 CR(조건반응)을 통해 검증됩니다.



📌 표 기호 안내

항목 설명
Expected 자극(CS)이 예측하는 US의 강도 (0~1)
Actual (US) 실제로 제시된 무조건 자극
0 = 제시 안됨 / 1 = 제시됨
CR (조건반응) 실험 중 관찰된 행동 반응. 학습의 정도를 반영함



🧪 5-1. 습득 (Acquisition)

쥐에게 종소리(CS)를 들려준 후 음식(US)을 주면,
처음엔 놀라움과 함께 예측이 형성됩니다.
이후 반복될수록 예측은 강화되며, 더 이상 놀라지 않게 되면 학습은 멈춥니다.

단계 제시된 자극(CS) Expected Actual (US) CR (조건반응)
첫 시행 종소리 0 1 활동량 크게 증가 (놀람 큼)
반복 시행 종소리 0.6 1 활동량 약간 증가
학습 완료 종소리 1 1 활동량 변화 없음 (예측 완성)



🧪 5-2. 차단 (Blocking)

이 실험에서는 먼저 빛(L)이 음식(US)과 반복적으로 연합되어 학습됩니다.
이후, 빛(L)과 새로운 자극인 소리(T)를 함께 제시하지만,
뇌는 이미 빛만으로 충분히 예측할 수 있기 때문에 소리는 학습되지 않습니다.
이를 차단 효과라고 부릅니다.

단계 제시된 자극(CS) Expected (빛 / 소리) Actual (US) CR (조건반응)
단일 학습 0 → 1 / - 1 활동량 증가 (빛에 대한 학습)
복합 제시 빛 + 소리 1 / 0 1 활동량 유지 (소리는 학습되지 않음)
소리만 제시 소리 0 / 0 0 반응 없음 (차단됨)

📌 주석: 소리는 음식과 짝지어지지 않았기 때문에 기대치가 증가하지 않음.


2025.05.12 - [심리학/학습심리학(James E. Mazur, Amy L. Odum )] - 고전적 조건화에서 차단효과(Blocking Effect)란?

 

고전적 조건화에서 차단효과(Blocking Effect)란?

✅ Blocking Effect – 개념 및 실험 요약 정리 (도식 포함)🧠 정의: Blocking Effect란?이미 학습된 자극이 무조건 자극을 예측하고 있을 때,새로운 자극이 동일한 무조건 자극과 함께 제시되더라도,그

eunjin123123.tistory.com




🧪 5-3. 소거 (Extinction)

종소리와 음식의 연결이 완전히 학습된 후,
종소리만 제시되고 음식이 나오지 않으면,
뇌는 이 연결을 점점 약화시키며 기존의 기대를 버립니다.

단계 제시된 자극(CS) Expected Actual (US) CR (조건반응)
학습 완료 종소리 1 1 활동량 증가
소거 시작 종소리 1 0 활동량 감소 (예상 깨짐)
반복 소거 종소리 0.4 0 활동량 더 감소
소거 완료 종소리 0 0 활동량 없음 (예측 소멸)



반응형

 


Rescorla-Wagner 실험: 조건 억제, 가려짐, 과잉기대

🧪 5-4. 조건 억제 (Conditioned Inhibition)

자극 A는 단독으로 음식(US)을 예고하는 자극이고,
자극 X는 A와 함께 제시되면 음식이 나오지 않는다는 부정적 신호로 작용합니다.
이때 뇌는 X를 “이번엔 안 나올 거야”라는 억제 신호로 학습하게 됩니다.

단계 제시된 자극(CS) Expected (A / X) Actual (US) CR (조건반응)
단일 학습 (A) A 0 → 1 / - 1 활동량 증가 (A에 대한 학습)
억제 학습 (A+X) A + X 1 / 0 0 활동량 감소 (X가 기대를 억제함)
X 단독 테스트 X 0 / 0 0 활동량 없음
A + X 테스트 A + X ↓ / ↓ 0 활동량 억제됨 (X의 억제 작용 확인)

📌 주석: X는 음식과 직접 연결되지 않았지만, A의 기대를 낮추는 조절 자극으로 학습됨.


2025.05.09 - [심리학/학습심리학(James E. Mazur, Amy L. Odum )] - 조건 억제(conditioned inhibition)란 무엇인가?

 

조건 억제(conditioned inhibition)란 무엇인가?

🔬 조건 억제: 행동을 멈추는 것도 학습일까?✅ 1. 조건 억제란 무엇인가요?조건 억제(Conditioned Inhibition)는 특정 자극이 조건 반응을 일으키는 것이 아니라, 이미 형성된 조건 반응이 발생하지 않

eunjin123123.tistory.com

 



🧪 5-5. 가려짐 (Overshadowing)

강한 자극(밝은 빛)약한 자극(약한 소리)를 동시에 제시하며 음식(US)을 제공합니다.
뇌는 더 눈에 띄는 자극인 밝은 빛을 우선적으로 학습하고,
상대적으로 주목성이 낮은 소리는 거의 학습되지 않습니다.
이 현상을 가려짐 효과(Overshadowing)라고 합니다.

단계 제시된 자극(CS) Expected (빛 / 소리) Actual (US) CR (조건반응)
첫 시행 밝은 빛 + 약한 소리 0 / 0 1 활동량 증가 (빛 중심의 반응)
반복 시행 밝은 빛 + 약한 소리 ↑ / ≈ 0 1 활동량 지속 (빛에 대한 CR 유지)
소리 단독 제시 소리 ≈ 0 0 반응 없음 (소리는 학습되지 않음)

📌 주석: 자극 간 salience(주목성) 차이로 인해, 더 눈에 띄는 자극이 학습을 독점하게 됩니다.




🧪 5-6. 과잉기대 (Overexpectation)

빛(L)소리(T)가 각각 음식(US)과 충분히 연합된 후,
두 자극을 동시에 제시하면서 음식은 1회만 제공되면,
뇌는 “기대보다 적다”는 실망을 경험하고 두 자극 모두에 대해 기대치를 조정합니다.
결과적으로 CR이 약화되는 현상이 나타나며, 이를 과잉기대 효과라고 부릅니다.

단계 제시된 자극(CS) Expected (L / T) Actual (US) CR (조건반응)
개별 학습 (빛) 빛 (L) 0 → 1 / - 1 활동량 증가
개별 학습 (소리) 소리 (T) - / 0 → 1 1 활동량 증가
함께 제시 빛 + 소리 1 / 1 → 합 2 1 활동량 감소 (실망 반응)
후속 반응 (L 또는 T) L / T ↓ / ↓ 1 활동량 약화된 반응

📌 주석: 기대치의 합이 실제보다 클 경우, 뇌는 두 자극 모두를 과대평가했다고 판단하고 → 예측력을 낮추는 방향으로 학습 조정이 일어납니다.




Rescorla-Wagner 모델 핵심 요약 정리

✅ 6. Rescorla-Wagner 모델의 핵심 메시지

학습은 단순한 반복이 아니라 “예측이 틀렸을 때”에만 일어난다.
뇌는 자극들 사이의 관계에서 예측 가능성을 계산하고,
예측 오류(기대 ≠ 실제)가 존재할 때만 그 차이를 기반으로 학습을 조정한다.

🔑 핵심 개념 3줄 요약

  • 자극(CS)은 무조건자극(US)을 예고하려고 학습된다.
  • 자극들의 예측 합계가 실제 결과와 일치하면, 더 이상 학습은 일어나지 않는다.
  • 예측이 틀렸을 때(놀람 발생 시) → 연결 강도가 조정된다.

📐 학습의 수식적 구조 (비수식 개념 설명)

학습량 = 실제 US – 기대된 US의 합
(즉, 예측 오류의 크기가 곧 학습의 양)
  • 예: 기대치 = 0.8, 실제 = 1 → 오류 = 0.2 → 약간의 학습 발생
  • 예: 기대치 = 1, 실제 = 1 → 오류 = 0 → 학습 없음
  • 예: 기대치 = 1.5, 실제 = 1 → 오류 = –0.5 → 기대치 감소 (억제성 학습)

🎯 학습 방향 3가지

기대 vs 실제 결과 학습 유형
기대 < 실제 놀람 → 연결 강화 흥분성 조건화
기대 > 실제 실망 → 연결 약화 억제성 조건화
기대 = 실제 놀람 없음 → 변화 없음 학습 없음



🧠 7. 전체 요약

📘 정의

Rescorla-Wagner 모델은 고전적 조건형성(classical conditioning)
예측 오류 기반의 수학적 방식으로 설명한 이론이다.


🧩 핵심 원리

  • 학습은 오직 예측이 틀렸을 때만 발생한다.
  • 자극들의 예상값을 합산하여 전체 기대치를 만들고,
  • 이 기대치와 실제 US가 일치하지 않을 때 → 연결 강도가 조정된다.

🔄 학습 변화 구조

상황 학습 방향
기대 < 실제 흥분성 학습 (강화)
기대 > 실제 억제성 학습 (약화)
기대 = 실제 학습 없음

반응형

 


🧪 실험적 뒷받침

실험명 주요 메시지
습득 예측력이 커질수록 학습량은 줄어든다
차단 이미 예측된 결과에는 새 자극이 학습되지 않는다
소거 예측된 결과가 나오지 않으면, 기존 연결이 약화된다
조건 억제 특정 자극은 “이번엔 결과가 없을 것”임을 학습시킨다
가려짐 눈에 잘 띄는 자극이 학습을 독점할 수 있다
과잉기대 기대가 실제보다 크면, 기존의 잘 학습된 자극도 약화된다

⚠️ 한계 요약

  • 주의(attention)의 변화 반영 불가
  • 자극 간 시간 구조 무시
  • 조건반응(CR)의 형태 다양성 설명 부족

💬 결론

Rescorla-Wagner 모델은 조건형성의 기본 원리를 정확하고 강력하게 설명하지만,
주의, 시간, 복잡한 반응의 다양성을 설명하려면
이후 이론들과의 결합이 필요하다.
반응형
공지사항
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday
링크
«   2025/05   »
1 2 3
4 5 6 7 8 9 10
11 12 13 14 15 16 17
18 19 20 21 22 23 24
25 26 27 28 29 30 31
글 보관함
반응형