티스토리 뷰

반응형
기타 강화 스케줄 완전 해설 – DRL, DRH, Concurrent Schedule

📘 Chapter 6 – 기타 강화 스케줄(Other Reinforcement Schedules) 완전 해설

*— DRL, DRH, Concurrent Schedule까지 차근차근 구조적으로*


🔷 1. 들어가며: 왜 새로운 스케줄이 필요한가?

기초 심리학이나 행동분석을 배울 때, 우리가 가장 먼저 접하는 건 다음 네 가지 강화 스케줄입니다:

  • 고정비율 (Fixed Ratio; FR)
  • 변동비율 (Variable Ratio; VR)
  • 고정간격 (Fixed Interval; FI)
  • 변동간격 (Variable Interval; VI)

이 네 가지는 실험실에서도 많이 쓰이고, 현실에서도 꽤 많은 행동을 설명할 수 있습니다.

하지만 현실 속 행동은 더 복잡합니다. 예를 들어 누군가의 행동을 단순히 “많이 하게” 혹은 “적게 하게” 하는 것이 아니라,

  • “너무 자주 하지 않도록” 조절하고 싶거나
  • “느리지 않게, 일정 속도로 하게” 만들고 싶거나
  • “여러 선택지 중에서 무엇을 선택할지” 알고 싶을 때는

위 네 가지 기본 스케줄만으로는 부족합니다.

그래서 심리학자들은 목적에 따라 특수한 강화 스케줄들을 설계했습니다. 그 대표적인 예가 저빈도 반응 차등강화(DRL), 고빈도 반응 차등강화(DRH), 그리고 동시 강화 스케줄(Concurrent Schedule)입니다.



 


🔷 2. DRL: 느린 행동을 보상하는 스케줄

✅ 2-1. DRL(Differential Reinforcement of Low Rates)의 정의

DRL은 일정한 시간 간격 이상을 기다렸다가 행동했을 때에만 보상을 제공하는 방식입니다.

즉, 이전 행동 이후 충분한 시간이 흐른 다음에 다시 행동하면 강화가 주어지고, 그보다 짧으면 강화가 주어지지 않습니다.

예시: DRL 10초 → 앞선 반응 이후 최소 10초가 지나야 다음 반응에 보상이 주어짐

DRL은 기본적으로 행동 빈도를 낮추는 데 초점을 둔 스케줄입니다. “너무 자주 하는 행동을 줄이고 싶을 때” 유용합니다.

✅ 2-2. 작동 방식

  • 기준 시간(예: 10초)이 지난 후 행동하면 ✅ 보상
  • 기준 시간 이전에 행동하면 ❌ 보상 없음, 그리고 타이머는 다시 리셋됨

이 때문에 DRL은 단순히 ‘기다리는 것’이 아니라, 정확한 타이밍을 요구하는 절차입니다.

✅ 2-3. 적용 예시

상황 적용 방식
성인이 직장에서 질문을 너무 자주 함 DRL 절차를 통해 질문 사이의 간격을 늘림. 예: 10분 이상 기다린 후 질문하면 칭찬 또는 보상
아이가 장난감을 너무 자주 요구함 일정 시간 이상 요구하지 않고 조용히 있을 경우에만 요청을 들어줌 (예: 30분 대기 기준)

💡 DRL은 “기다리는 연습”, “충동 억제 훈련”에 매우 적합합니다.



 


🔷 3. DRH: 빠른 행동을 강화하는 스케줄

✅ 3-1. DRH(Differential Reinforcement of High Rates)의 정의

DRH는 일정한 시간 내에 많은 횟수의 반응을 보였을 때에만 보상을 주는 방식입니다.

즉, 짧은 시간 안에 얼마나 자주 행동했는가가 기준이 됩니다.

예시: DRH (3초에 10회) → 3초 안에 10번 이상 행동하면 보상, 그 미만이면 보상 없음

이 스케줄은 주로 빠른 행동, 고속 반복을 요구하는 상황에서 사용됩니다.

✅ 3-2. 작동 방식

  • 일정 시간 내에 목표 반응 횟수 도달 시 ✅ 보상
  • 기준 미달이면 ❌ 보상 없음
  • 다음 평가 구간으로 넘어감

DRH는 행동 속도를 증가시키고, 작업 효율성이나 집중력 강화를 위한 훈련에 적합합니다.

✅ 3-3. 적용 예시

상황 적용 방식
타자 연습 1분 안에 50타 이상일 때만 포인트 지급
체력 훈련 30초 안에 팔굽혀펴기 20회 달성 시 휴식 허용
책 읽기 훈련 10분 안에 8쪽 이상 읽으면 간식 제공

💡 DRH는 특정한 성과 기준을 정해두고, 빠르고 강한 행동을 유도하는 데 효과적입니다.



🔷 4. 복합 강화 스케줄: 여러 개의 규칙이 동시에 존재할 때

✅ 4-1. 동시 강화 스케줄 (Concurrent Schedule)

동시 강화 스케줄이란, 둘 이상의 강화 규칙이 동시에 작동하는 상황을 말합니다.

이 경우, 실험 대상(쥐, 사람 등)은 어떤 행동을 선택할지 직접 결정하게 됩니다.

예시:

  • 실험실에서 두 개의 레버가 동시에 존재하고,
  • 레버 A: 일정 비율로 보상 (예: VR 10)
  • 레버 B: 일정 시간 간격으로 보상 (예: VI 30초)

→ 실험 대상은 어느 레버를 더 자주 누르는지, 그리고 언제 바꾸는지를 선택하게 됩니다.

이 스케줄은 주로 선택 행동, 효율성 판단, 최적화 전략을 연구할 때 사용됩니다.

일상에서는 여러 선택지가 있는 상황에서 사람들이 어떻게 행동하는지를 분석하는 데 활용됩니다.



 


🔷 5. 요약 정리표

스케줄 유형 핵심 원리 주요 목적
저빈도 반응 차등강화 (DRL) 행동 사이 간격이 충분히 길 때만 보상 행동 빈도 줄이기, 충동 억제
고빈도 반응 차등강화 (DRH) 제한된 시간 안에 많은 행동을 했을 때만 보상 행동 속도 증가, 효율 향상
동시 강화 스케줄 (Concurrent) 두 개 이상의 강화 규칙을 동시에 제시함 선택 행동 분석, 선호도 확인


🔷 6. 왜 이 스케줄들이 중요한가?

현실에서의 행동 조절은 단순히 “많이 하게 하자” 또는 “하지 않게 하자”로 끝나지 않습니다. 우리는 다음과 같은 정교한 목표를 갖습니다:

  • 너무 자주 반복되는 말이나 요청을 줄이고 싶다 → DRL
  • 일정한 속도로 집중해서 일하게 하고 싶다 → DRH
  • 두 가지 과제를 동시에 줬을 때 어떤 걸 더 자주 선택하는지 보고 싶다 → Concurrent

이처럼 행동의 빈도, 속도, 선택 방식을 모두 조절하기 위해서는 단순한 강화 스케줄이 아니라, 목적에 맞는 정밀한 강화 체계가 필요합니다.



🔷 🧩 마무리

심리학에서 행동을 다룰 때 가장 중요한 건, 언제 어떤 행동에 보상을 주느냐입니다.

DRL, DRH, Concurrent 같은 스케줄은 단순히 보상을 “많이 주느냐”가 아니라, 보상의 기준을 어떻게 세우고 그 기준이 어떤 행동을 만들어내느냐를 다루는 정밀한 도구입니다.

교육, 치료, 훈련, 게임 설계, 조직 관리 등 다양한 분야에서 이 스케줄들은 사람의 행동을 바람직한 방향으로 유도하는 핵심 수단이 됩니다.



반응형
공지사항
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday
링크
«   2025/07   »
1 2 3 4 5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28 29 30 31
글 보관함
반응형