티스토리 뷰
1. 두 변수간의 관계
회귀 분석(regression analysis)
키와 몸무게가 있다면 키 1단위가 증가하면 몸무게는 어느 정도 증가할까?
표준편차선(SD):평균점을 지나며 두 변수의 표준단위가 같은 점들로 이루어진 직선
키의 평균이 167.5이고 표준편차가 11.5라면, 키가 표준편차 1단위 증가한다면, 몸무게는 얼마나 증가하는가?
몸무게의 평균은 63.5이고 표준편차가 11.9일 때 SD 1단위인 11.9만큼 상승할까?
->상관계수가 0.67이기에 0.67*11.9인 단위만큼 상승한다.
회귀직선 y의 x에 대한 회귀직선은 각각의 x값에 대응하는 y값의 평균을 추정한다.
2. 평균의 그래프(graph of averages)
각각의 키에 대하여 그 키에 해당하는 집단의 평균 몸무게를 나타낸다.
그 평균점을 이으면 직선이 나타난다.
회귀직선은 평균의 그래프를 직선으로 근사시킨 것이라고 볼 수 있다. 만일 평균의 그래프 자체가 직선이면, 그 직선이 바로 회귀직선이다. 평균의 그래프가 비선형이라면 회귀직선으로 근사는 적절하지 못하다.
3. 회귀분석 방법
경제원론이 평균이 3.0이고 표준편차가 0.87이고
경제통계학의 평균이 2.8이고 표준편차가 0.86이라고 상관계수가 0.36이다
A의 경제원론 학점이 평균보다 0.8SD만큼 높다면, 0.36*0.8=0.29SD
경제통계학은 2.8(평균)+0.29*0.86=3.05점이다.
회귀분석을 통혜 점수를 구하면, 표준편차를 통해 백분위도 추측할 수가 있다.
4. 회귀효과(regression effect)
첫 번째 검사에서 점수가 높은 집단은 두 번째 검사에서 평균적으로 점수가 떨어지는 경향이 있다.
회귀오류(regression fallacy)
:회귀효과는 개개의 자료가 표준편차선 주위로 퍼져 있기 때문에 발생하지만, 그럼에도 회귀효과가 뭔가 다른 중요한 이유 때문에 발생한다고 오해하는 것.
관찰된 점수=실제실력+확률 오차
평균보다 잘했다가도 오차(우연)에 의해 한 번 잘보고 못 볼수도 있다. 그러나 보통 평균이나 표준편차선 주위에 머무른다.
5. y의 x에 대한 회귀직선과 x의 y에 대한 회귀직선
회귀직선은 두 가지가 나올 수 있는데, 분석목적에 따라 하나를 선택하면 된다.
키와 몸무게
키를 중심으로 부분집단별 평균 몸무게
몸무게를 중심으로 집단별 평균 키
'통계학 > 류근관-통계학' 카테고리의 다른 글
제 8장 회귀직선 (5) | 2022.03.31 |
---|---|
제 7장 회귀분석의 오차 (0) | 2022.03.31 |
제5장 상관관계 (0) | 2022.03.28 |
제4장 정규분포로의 근사 (0) | 2022.03.28 |
제3장 표준과 표준편차 (0) | 2022.03.26 |
- Total
- Today
- Yesterday
- 백준
- 사회심리학
- 티스토리챌린지
- 인프런
- 일본어문법무작정따라하기
- 열혈프로그래밍
- 오블완
- 통계학
- 회계
- 통계
- K-MOOC
- 뇌와행동의기초
- 심리학
- Python
- EBS
- 윤성우
- 보세사
- jlpt
- 류근관
- c++
- C
- C/C++
- 인지부조화
- stl
- 데이터분석
- 코딩테스트
- 일본어
- 파이썬
- 여인권
- 일문따
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |