📌 확률변수란?1️⃣ 정의확률변수 (Random Variable) 란우연하게 발생하는 사건의 결과를 숫자로 표현한 변수즉, 불확실한 실험의 결과를 수치화하기 위해 도입된 개념입니다.수학적으로는 확률변수는 표본공간(가능한 모든 사건의 집합)에서 실수로 가는 함수입니다.기호로는 주로 X, Y, Z 등으로 표현합니다.종류는 크게 2가지이산 확률변수 (Discrete Random Variable) → 결과가 셀 수 있음 (예: 주사위 눈, 동전 앞뒤 등)연속 확률변수 (Continuous Random Variable) → 결과가 연속적임 (예: 키, 몸무게, 시간 등)2️⃣ 왜 나왔는가? (등장 배경)▶️ 확률변수의 필요성초기 확률론은 단순히 사건의 확률만 다루었습니다. 예를 들어, 주사위를 던질 때 "3이 ..
✨ Z 표준화 공식: 평균 0, 표준편차 1의 마법 풀기 ✨안녕하세요, 데이터 마니아 여러분! 🎉오늘은 통계의 숨은 보석, Z 표준화 (Z-score standardization)에 대해 파헤쳐볼게요.특히 “왜 평균이 0이고 표준편차가 1이 되는 걸까?”라는 미스터리를 수학적으로 풀며 화려하게 증명해보려고 합니다.준비되셨죠? Let’s dive in! 🚀🌟 Z 표준화 공식: 이게 대체 뭐야?Z 표준화는 데이터를 표준 정규 분포라는 멋진 세계로 초대하는 공식이랍니다.공식은 심플하지만 강력해요:$$ z = \frac{x - \mu}{\sigma} $$x: 원래 데이터 값μ (뮤): 데이터의 평균σ (시그마): 데이터의 표준편차z: 표준화된 값, 즉 Z-score쉽게 말해, 데이터가 평균에서 얼마나 떨어..
📌 왜 통계학에서는 절댓값보다 제곱을 쓸까?– 퍼짐 측정에서 평균절대편차(L1)와 분산(L2)의 진짜 차이1️⃣ 시작 – 평균만으로는 부족하다시험을 보고 나면 선생님이 이렇게 말씀하시죠."이번 시험 평균은 75점입니다."그런데 평균만 듣고 "다들 비슷하게 맞았겠네"라고 생각하면사실은 전혀 다른 상황일 수도 있습니다. 학생점수 A75 B75 C75 D75 혹은 이렇게: 학생점수 A30 B50 C100 D120 평균은 똑같이 75점인데점수의 퍼짐 정도는 전혀 다릅니다.2️⃣ 퍼짐을 재는 두 가지 방법이 퍼짐을 숫자로 표현하는 방법은 크게 두 가지가 있습니다. L1 방식 – 평균절대편차: 편차의 절댓값 평균 L2 방식 – 분산..
📊 불확실한 세상을 이해하는 도구, 통계학우리가 매일 마주치는 숫자들은 단순한 데이터 그 이상입니다.뉴스에서는 "국민의 65%가 찬성했다", "올해 평균 기온은 14.2도였다" 같은 숫자가 쏟아지고, 마트에서는 "80%의 고객이 이 제품을 재구매했다"는 문구가 붙어 있습니다.하지만 이런 숫자들은 그냥 기록된 정보일까요?아니면 우리가 모르는 어떤 사실을 알려주기 위한 힌트일까요?그 숫자들 뒤에는 하나의 학문이 숨어 있습니다.바로 통계학입니다.1️⃣ 통계학이란 무엇인가?통계학은 간단히 말해,불확실한 상황에서, 일부 데이터를 이용해 전체의 특성을 파악하고 예측하는 학문입니다.조금 풀어서 말하면,세상에 흩어진 수많은 정보들 속에서 규칙을 찾아내고, 미래를 예측하거나 현상을 설명하기 위해 확률적 사고를 사용하는..
우리는 확률변수와 확률의 곱이 평균이라는 것을 배웠을 것이다.그 이유를 고등학교 때는 이해를 못했지만 다시 통계를 공부하며 이해했던 부분을 쓰려고 한다. 주사위를 던진다고 하면 나올 수 있는 값 X는 확률변수이며, 1 ~ 6을 가진다.이 때 나올 수 있는 확률은 각각 1/6이다.이를 표로 나타내면 아래와 같다.X123456P1/61/61/61/61/61/6 위의 표를 보고 X값과 그 X값에 해당하는 확률을 곱하면 1 * (1/6) + 2*(1/6) + ... + 6 * (1/6) = 3.5다.이는 평균이며 E(X)가 된다. 왜 이렇게 되는지 이유가 궁금했는데, 모집단의 확률이 아니라 표본이 있다고 해보자.표본에서는 값이1,1,1,2,3,4 가 나왔다고 가정하자. 이 경우 총 6번의 시행을 해서1은 3번..

평균이 중심위치로 적절한 이유중심위치는 중심으로부터 거리가 최소화되는 곳을 삼는다.분산은 평균으로부터 점의 거리를 나타내는데, 이 공식을 사용하여 특정점으로부터 거리가 최소화되는 점을 찾는다.$$ \sum_{x_i}^{n}(x_i -\bar{x})^2 $$위 공식이 어떻게 나오게 된걸까? 중심이 평균일 경우와 평균이 아닌 다른 경우를 보면의 거리들의 합을 살펴보자. 평균인 경우: 거리 17.5 점중심거리 제곱13.56.252 2.253 0.254 0.255 2.256 6.25 sum17.5위의 공식을 쓰면 평균에서 거리가 가장 짧게 나타난다.다른 점들도 봐보자 중심이 3, 2, 1인 경우. 점점 멀어진다 점중심거리 제곱1342 13 04 15 46 9 sum19점중심거리 제곱1102 13 44 95 16..
- Total
- Today
- Yesterday
- EBS
- 코딩테스트
- 심리학
- 통계학
- c++
- jlpt
- 뇌와행동의기초
- 티스토리챌린지
- 사회심리학
- 보세사
- C/C++
- 인지부조화
- 파이썬
- C
- 일문따
- Python
- 일본어
- 오블완
- 열혈프로그래밍
- 류근관
- 회계
- 인프런
- 여인권
- 윤성우
- 백준
- stl
- 일본어문법무작정따라하기
- 통계
- 데이터분석
- K-MOOC
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |