티스토리 뷰

반응형
강화계획: 스키너의 고정비율 강화계획

🔷 강화계획: 스키너의 고정비율 강화계획

✅ 1. 강화란?

🔹 정의

우리가 무언가를 반복해서 하게 되는 이유는 무엇일까요?
칭찬을 받았을 때, 게임에서 보상을 얻었을 때, 과자를 받은 적이 있을 때…
이 모든 경우에 공통된 심리적 메커니즘이 있습니다. 그것이 바로 ‘강화’입니다.

강화란 어떤 행동을 한 뒤에 보상이 주어져서, 그 행동이 다시 일어날 가능성이 높아지는 현상입니다.
즉, 강화는 “이 행동을 하면 좋은 일이 생긴다”는 경험을 통해 그 행동을 더 자주 하게 만드는 힘입니다.

예를 들어, 강아지가 앉았을 때 간식을 주면, 다음에도 '앉아'라는 말에 반응해 앉을 가능성이 높아집니다.

🔹 기본 구조 도식

[자극] → [반응] → [강화물]
구성 요소 예시 (쥐 실험) 설명
자극 스키너 상자 안의 레버 반응을 유도하는 조건
반응 쥐가 레버를 누름 행동 또는 반응
강화물 먹이 제공 행동 이후 주어지는 보상

🔹 지속 강화(Continuous Reinforcement)

1. 정의

매번 행동이 일어날 때마다 즉시 보상이 주어지는 방식입니다.
즉, 쥐가 레버를 한 번만 누르면 바로 먹이가 나오는 상황이 이에 해당합니다.

2. 왜 중요한가?

지속 강화는 새로운 행동을 처음 가르칠 때 매우 효과적입니다.
행동과 보상이 1:1로 연결되므로 빠르게 학습이 이루어집니다.

3. 한계

보상이 끊기면 행동도 빠르게 사라지는 단점이 있습니다.

4. 예시

  • 레버 한 번 → 먹이 한 번
  • 문제 하나 풀 때마다 칭찬 받기
  • 게임에서 버튼을 누르면 바로 보상 아이템 제공



 


✅ 2. 고정비율 강화계획이란?

🔹 정의

일정 횟수의 행동이 쌓였을 때만 보상을 주는 방식입니다.
예: FR 10 → 10번 행동 시 보상, FR 100 → 100번 후 보상

이 방식은 예측 가능한 보상으로 인해 높은 반응률을 유도합니다.

🔹 실험 방법

1. 훈련 시작: 지속 강화로 초기 학습

레버 한 번 → 먹이 (FR 1). 학습 이후 점진적 증가

2. 강화계획 점진적 전환

FR 1 → FR 5 → FR 20 → FR 100

많은 행동 후에도 보상이 있다는 것을 학습하게 됩니다.

🔹 고정비율 강화계획의 행동 특징

1. 보상 직후에는 행동이 멈춤 (Postreinforcement Pause)

보상 직후에는 잠시 행동을 멈추는 현상이 나타납니다.

2. 빠르게 반복되는 행동 (몰아서 행동)

휴지기 후 일정하고 빠르게 레버를 누르는 행동이 반복됩니다.
이것을 stop-and-go pattern이라고 부릅니다.

🔎 왜 이런 현상이 나타나는가?

  • 피로설: 피로해서 쉰다는 가설 → 약함
  • 기대 예측설: 지금 눌러도 보상이 없다는 걸 알기 때문에 효율적 중단
  • 남은 행동 계산설: 앞으로 해야 할 행동량이 많다는 사실을 인식하여 휴식

🏭 실생활 예시: 공장에서의 고정비율

100개 문 경첩 제작 → 10달러 지급

→ 빠르게 100개 작업 → 잠시 쉬기 → 반복
쥐의 실험과 동일한 행동 패턴이 관찰됨

💡 일상 속 고정비율 예시

상황 강화 조건 설명
카페 스탬프 음료 10잔 구매 시 1잔 무료 고정비율 10
운동 20회 반복 운동 후 1분 휴식 고정비율 20
학습 문제 30개 풀면 5분 휴식 고정비율 30
업무 5명 고객 응대 후 체크리스트 제출 고정비율 5




 


✅ 3. 최종 요약

📌 요약

  • 고정비율 강화계획은 정해진 수의 행동 후 보상을 주는 스케줄입니다.
  • 보통 지속 강화로 시작해 점차 고정비율로 전환됩니다.
  • 보상 전 집중 행동, 보상 후 휴지기라는 독특한 리듬을 가집니다.
  • 심리적 동기 조절이 이 패턴의 주요 원인입니다.
  • 소비, 운동, 학습, 노동 등 실생활에서도 자주 나타나는 구조입니다.

🧾 최종 요약표

항목 내용
정의 정해진 횟수(n)의 행동 후 보상 제공
구성 자극 → 반응 → 강화물
초기 훈련 지속 강화로 시작
강화 전환 점진적으로 행동 수 증가 (FR1 → FR100)
행동 패턴 보상 후 멈춤 → 빠른 반복 → 다시 보상
행동 정지 원인 남은 과업 인식에 따른 심리적 조절
실생활 예시 스탬프 적립, 반복 운동, 공장 작업 등
의의 동기 유지, 작업 효율 조절, 일상 패턴화 가능

반응형
공지사항
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday
링크
«   2025/07   »
1 2 3 4 5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28 29 30 31
글 보관함
반응형