티스토리 뷰

반응형

1-1. 확률의 성질

일반인들은 통계학자가 무슨 일을 하는지 잘 모른다.

그들이 하는 일에 대해 알아보자.

 

  • 1) 어떤 문제에 통계학이 필요할 때, 통계학자들은 이 문제를 함께 해결하려 한다.
  • 2) 우리가 상황을 잘 이해하려면, 그 상황을 재는 측도(measure)가 잘 정의되어야 하지만, 좋은 측도는 얻지 못하였다.
  • 3) 평가수단이 개발된 뒤에는 조사나 실험에 의해 결과를 관측하여 데이터를 수집한다
  • 4) 통계학자들은 수집된 자료나 기술통계와 그래프를 이용하여 그 결과를 요약한다
  • 5) 통계학자들은 요약된 자료를 분석하여 통계적 추론을 한다
  • 6) 자료분석에 근거하여 권장사항을 보고서로 작성한다. 그러나 분석결과가 다른 실험의 필요성을 요구하거나 논제와 관련된 인자를 변경하여 조사나 실험을 다시 수행해야 할 경우가 있다. 과학자는 해답을 찾기 위해 여러 가지 다른 가능성에 대해서도 연구하여야 하며 비슷한 실험을 반복적으로 시행하여야 한다.

통계학 분야는 '자료의 수집'과 '자료의 분석'으로 나뉜다

동일한 조건하에 측정된 자료라도 보텽 결과가 같지 않다.

이렇게 자료의 변동성으로 인하여 모든 자료를 한 가지 패턴으로 설명할 수 없다.

그럼에도 통계학자들은 자료를 대표하는 한 가지 패턴을 찾으려고 한다.

예를 들면, 몸무게를 계속 재 보면 한번은 60kg, 한번은 60.5kg 한번은 59.8kg가 나올 수 있다. 그렇다면 나의 몸무게는 몇인가? 59.8~ 60.5kg라고 말하는 것보다 아마 60이라는 대표값을 말하려고 하지 않을까?

 

통계학자들은 자료분석에서 찾은 패턴에 오류가 있을 것이라는 것을알기 때문에 오류를 최소화하려고 노력한 후 오류에 대한 범위를 제시한다.

만약 그 범위가 넓다면 더 많은 자료를 수집하려 할 것이고, 범위가 좁다면 의사결정을 하고 연구를 계속 진행해 가려고 할 것이다.

몸무게를 계속 재어본다면 범위가 59.8 ~60.5의 사이에서 나온다면 이 사이에서 대표값을 구해도 신뢰성이 있다고 볼 수 있지만 몸무게가 50~100 사이로 나온다면 아마 그 값은 대표값으로 쓰이기 어려울 수 있다.

 

통계학에서 사용되는 많은 자료에 내재되어 있는 변동성 때문에 불확실성이 내포되어 있다.

이 때문에 통계학에서는 과학적 방법의 끝없는 주기(cycle)를 이해해야 한다.

 

1) 자연현상을 관측한다

2) 의문점을 제시한다

3) 의문점을 해결할 실험을 계획한다

4) 자료를 수집한다

5) 자료를 분석한다

6) 자료분석 결과를 이전의 결과와 비교한다

7) 새로운 의문점을 제시한다

 

 

확률실험(Random experiments)

통계학 연구에는 확률실험이라는 것이 있다.

 

확률실험의 특징

시행 전에는 그 결과를 예측할 수 없으나 가능한 결과의 집합은 확정될 수 있어야 한다.

예를 들어 주사위를 던지는 확률이 1/6이라면, 던지기 전 까지 어떤 눈이 나올지 모른다.

그러나 그 나올 눈은 S={1,2,3,4,5,6}의 안에서 나온다.

 

이러한 가능한 결과의 집합을 표본공간(sample space)이라고 하고 S라고 표기한다.

S의 부분집합 A는 S내에 있는 요소들의 부분집합이며 사상(event) A라고 한다.

확률실험이 수행되어 실험의 결과가 A안에 있다면 사상 A가 발생했다고 한다.

즉, S={1,2,3,4,5,6}에서 주사위의 눈이 1이 나왔다면 A=1이 된다.

 

\(\emptyset \): 공집합(null or empty set)

\(A \subset B\): A가 B의 부분집합(subset)

\(A \cup B\) : A와 B의 합집합(union)

\(A \cap B\): A와 B의 교집합(intersection)

A': A의 여집합(complement)

 

 

이러한 집합은 몇 특징이 있다.

  • 1) 사건 \(A_1, A_2, ..., A_k\)가 서로 공통부분이 없으면, 즉 \(i \neq j\)에 대하여 \(A_i \cap A_j = \emptyset\)이면, 이들을 상호 배반사상(mutually exclusive event)이라고 한다.

  • 2) \(A_1, A_2, ...,A_k\)가 \(A_1 \cup A_2 \cup \dots \cup A_k =S\)를 만족하면 이들을 포괄적 사상(exhausitive event)이라고 한다. 따라서 \(A_1, A_2, \dots, A_k\)가 상호 배반이며 포괄적인 사상(mutually exclusive and exhausitive event)들이면 \(i \neq j\)에 대하여 \(A_i \cap A_j = \emptyset\) 그리고 \(A_1 \cup A_2 \cup \dots \cup A_k =S\)이다.

 

확률

확률을 정의함에 있어 상대도수(relative frequency)를 알아야 한다.

n회 반복 실험에서 사상 A가 발생한 건수를 N(A)라 하면, A가 발생할 확률 P(A)는 처음에 불안정하지만 n이 커짐에 따라 안정적으로 된다.

P(A) = N(A) / n으로 정의한다.

 

확률의 정의

정의 1.1-1

확률(probability)이란 표본공간 S에 속해 있는 각 사상 A에 대하여 사상 A의 확률이라고 하는 수 P(A)를 지정하는 실수값 집합함수 P이며 다음의 성질들을 만족한다.

  1. \(P(A) \geq 0\)
  2. P(S)=1
  3. 사상 \(A_1, A_2, A_3, ...\)들이 \(i \neq j\)에 대하여 \(A_i \cap A_j = \emptyset\)를 만족하면 양의 정수 k에 대하여 \(P(A_1 \cup A_2 \cup \dots \cup A_k) = P(A_1) +P(A_2) + \dots + P(A_k)\)이며, 사상의 갯수가 무한이고 셀 수 있는 경우 \(P(A_1 \cup A_2 \cup A_3 \cup \dots) = P(A_1) + P(A_2) + P(A_3) + \dots\)이다.

정리 1.1-1: 사상 A에 대하여 P(A) = 1 - P(A')이다.

\(S = A \cup A'\)이며 \(A \cap A' = \emptyset\)이므로 정의 1.1-1의 성질 (b), (c)에 의하여 1= P(A) + P(A')이다. 따라서 P(A) = 1- P(A')이다.

 

 

위를 보면 A와 A'의 교집합이 없고, 둘을 합치면 전체 표본공간이 되는 것을 볼 수 있다.

 

정리 1.1-2 \(P(\emptyset)=0\)

증명: 정리 1.1-1에서 \(A = \emptyset\)일 때, A'=S이다. 그러면

\(P(\emptyset) = 1 - P(S) = 1-1=0\)

 

정리 1.1-3 두 사상 A,B가 \(A \subset B\)이면 \(P(A) \leq P(B)\)이다.

 

정리 1.1-4 사상 A에 대하여 \(P(A) \leq 1\)이다.

 

정리 1.1-5 임의의 두 사상 A,B에 대하여 \(P(A \cup B) = P(A) + P(B) - P(A \cap B)\)이다.

 

정리 1.1-6 임의의 사상 A, B, C에 대하여 \(P(A \cup B \cup C) = P(A) +(B) +P(C) - P(A \cap B) - P(A \cap B) - P(B \cap C) + P(A \cap B \cap C)\)

 

 

확률집합함수가 표본공간 S에서 정의된다고 하자. \(e_i\)를 확률실험의 가능한 실현치라 할 때, \(S = \{e_1,e_2,...e_m\}\)으로 표시할 수 있다.이 때 정수 m은 확률실험의 결과로서 얻어질 수 있는 모든 경우의 수이다. 만약 각각의 실현치들의 발생 가능성이 모두 같으면 m개의 실현치들을 등확률(equally likely)을 갖는다고 한다. 즉

 

$$ P(\{e_i\}) = \frac{1}{m}, i=1,2,...,m$$

 

사상A에 속한 실현치의 개수를 h라고 하면, P(A)는 A에 속해 있는 실현치의 개수를 확률실험의 결과로서 얻어질 수 있는 모든 실현치의 수로 나눈 것과 같다. 즉 등확률의 가정하에서

 

$$P(A) = \frac{h}{m} = \frac{N(A)}{N(S)} $$

 

반응형

'통계학 > Hogg 확률과 통계적 추론' 카테고리의 다른 글

1-4. 독립사상 문제풀이  (0) 2024.03.15
1-3 조건부확률  (1) 2024.02.27
1-2 연습문제풀이  (1) 2024.02.25
1-1 연습문제 풀이  (1) 2024.02.24
1.2 경우의 수  (1) 2024.02.24
공지사항
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday
링크
«   2025/04   »
1 2 3 4 5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28 29 30
글 보관함
반응형