티스토리 뷰
DRL, DRH, Concurrent Schedule 기타강화계획 총정리!
키성열 2025. 6. 1. 17:37📘 Chapter 6 – 기타 강화 스케줄(Other Reinforcement Schedules) 완전 해설
*— DRL, DRH, Concurrent Schedule까지 차근차근 구조적으로*
🔷 1. 들어가며: 왜 새로운 스케줄이 필요한가?
기초 심리학이나 행동분석을 배울 때, 우리가 가장 먼저 접하는 건 다음 네 가지 강화 스케줄입니다:
- 고정비율 (Fixed Ratio; FR)
- 변동비율 (Variable Ratio; VR)
- 고정간격 (Fixed Interval; FI)
- 변동간격 (Variable Interval; VI)
이 네 가지는 실험실에서도 많이 쓰이고, 현실에서도 꽤 많은 행동을 설명할 수 있습니다.
하지만 현실 속 행동은 더 복잡합니다. 예를 들어 누군가의 행동을 단순히 “많이 하게” 혹은 “적게 하게” 하는 것이 아니라,
- “너무 자주 하지 않도록” 조절하고 싶거나
- “느리지 않게, 일정 속도로 하게” 만들고 싶거나
- “여러 선택지 중에서 무엇을 선택할지” 알고 싶을 때는
위 네 가지 기본 스케줄만으로는 부족합니다.
그래서 심리학자들은 목적에 따라 특수한 강화 스케줄들을 설계했습니다. 그 대표적인 예가 저빈도 반응 차등강화(DRL), 고빈도 반응 차등강화(DRH), 그리고 동시 강화 스케줄(Concurrent Schedule)입니다.
🔷 2. DRL: 느린 행동을 보상하는 스케줄
✅ 2-1. DRL(Differential Reinforcement of Low Rates)의 정의
DRL은 일정한 시간 간격 이상을 기다렸다가 행동했을 때에만 보상을 제공하는 방식입니다.
즉, 이전 행동 이후 충분한 시간이 흐른 다음에 다시 행동하면 강화가 주어지고, 그보다 짧으면 강화가 주어지지 않습니다.
예시: DRL 10초 → 앞선 반응 이후 최소 10초가 지나야 다음 반응에 보상이 주어짐
DRL은 기본적으로 행동 빈도를 낮추는 데 초점을 둔 스케줄입니다. “너무 자주 하는 행동을 줄이고 싶을 때” 유용합니다.
✅ 2-2. 작동 방식
- 기준 시간(예: 10초)이 지난 후 행동하면 ✅ 보상
- 기준 시간 이전에 행동하면 ❌ 보상 없음, 그리고 타이머는 다시 리셋됨
이 때문에 DRL은 단순히 ‘기다리는 것’이 아니라, 정확한 타이밍을 요구하는 절차입니다.
✅ 2-3. 적용 예시
💡 DRL은 “기다리는 연습”, “충동 억제 훈련”에 매우 적합합니다.
🔷 3. DRH: 빠른 행동을 강화하는 스케줄
✅ 3-1. DRH(Differential Reinforcement of High Rates)의 정의
DRH는 일정한 시간 내에 많은 횟수의 반응을 보였을 때에만 보상을 주는 방식입니다.
즉, 짧은 시간 안에 얼마나 자주 행동했는가가 기준이 됩니다.
예시: DRH (3초에 10회) → 3초 안에 10번 이상 행동하면 보상, 그 미만이면 보상 없음
이 스케줄은 주로 빠른 행동, 고속 반복을 요구하는 상황에서 사용됩니다.
✅ 3-2. 작동 방식
- 일정 시간 내에 목표 반응 횟수 도달 시 ✅ 보상
- 기준 미달이면 ❌ 보상 없음
- 다음 평가 구간으로 넘어감
DRH는 행동 속도를 증가시키고, 작업 효율성이나 집중력 강화를 위한 훈련에 적합합니다.
✅ 3-3. 적용 예시
💡 DRH는 특정한 성과 기준을 정해두고, 빠르고 강한 행동을 유도하는 데 효과적입니다.
🔷 4. 복합 강화 스케줄: 여러 개의 규칙이 동시에 존재할 때
✅ 4-1. 동시 강화 스케줄 (Concurrent Schedule)
동시 강화 스케줄이란, 둘 이상의 강화 규칙이 동시에 작동하는 상황을 말합니다.
이 경우, 실험 대상(쥐, 사람 등)은 어떤 행동을 선택할지 직접 결정하게 됩니다.
예시:
- 실험실에서 두 개의 레버가 동시에 존재하고,
- 레버 A: 일정 비율로 보상 (예: VR 10)
- 레버 B: 일정 시간 간격으로 보상 (예: VI 30초)
→ 실험 대상은 어느 레버를 더 자주 누르는지, 그리고 언제 바꾸는지를 선택하게 됩니다.
이 스케줄은 주로 선택 행동, 효율성 판단, 최적화 전략을 연구할 때 사용됩니다.
일상에서는 여러 선택지가 있는 상황에서 사람들이 어떻게 행동하는지를 분석하는 데 활용됩니다.
🔷 5. 요약 정리표
🔷 6. 왜 이 스케줄들이 중요한가?
현실에서의 행동 조절은 단순히 “많이 하게 하자” 또는 “하지 않게 하자”로 끝나지 않습니다. 우리는 다음과 같은 정교한 목표를 갖습니다:
- 너무 자주 반복되는 말이나 요청을 줄이고 싶다 → DRL
- 일정한 속도로 집중해서 일하게 하고 싶다 → DRH
- 두 가지 과제를 동시에 줬을 때 어떤 걸 더 자주 선택하는지 보고 싶다 → Concurrent
이처럼 행동의 빈도, 속도, 선택 방식을 모두 조절하기 위해서는 단순한 강화 스케줄이 아니라, 목적에 맞는 정밀한 강화 체계가 필요합니다.
🔷 🧩 마무리
심리학에서 행동을 다룰 때 가장 중요한 건, 언제 어떤 행동에 보상을 주느냐입니다.
DRL, DRH, Concurrent 같은 스케줄은 단순히 보상을 “많이 주느냐”가 아니라, 보상의 기준을 어떻게 세우고 그 기준이 어떤 행동을 만들어내느냐를 다루는 정밀한 도구입니다.
교육, 치료, 훈련, 게임 설계, 조직 관리 등 다양한 분야에서 이 스케줄들은 사람의 행동을 바람직한 방향으로 유도하는 핵심 수단이 됩니다.
'심리학 > 학습심리학(James E. Mazur, Amy L. Odum )' 카테고리의 다른 글
스키너의 4가지 강화 계획과 소거(extinction) (2) | 2025.06.01 |
---|---|
미국 의회와 스키너의 고정간격 강화계획(FI) 행동 패턴! (0) | 2025.06.01 |
스키너의 네 가지 강화계획 총정리: 고정간격,비율, 변동간격,비율! (0) | 2025.05.31 |
🧠 스키너의 네 가지 강화계획: 변동간격 강화계획 (Variable Interval Schedule, VI) (1) | 2025.05.31 |
스키너의 네 가지 강화계획: 고정간격계획. (0) | 2025.05.31 |
- Total
- Today
- Yesterday
- C
- 코딩테스트
- 학습이론
- 강화학습
- 정보처리기사
- 오블완
- 회계
- 행동심리학
- c++
- 일본어문법무작정따라하기
- 행동주의
- 류근관
- 유통관리사
- 백준
- 파이썬
- 물류관리사
- Python
- 보세사
- 조건형성
- 티스토리챌린지
- K-MOOC
- 일문따
- 열혈프로그래밍
- 심리학
- 데이터분석
- 인지부조화
- 윤성우
- 통계
- 학습심리학
- 통계학
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 | 31 |