
머신러닝을 공부하면서 대부분 sklearn으로 시작한다. 근데 내부동작이 어떻게 돌아가는지 모르고 라이브러리를 사용하니 도저히 이해가 안간다. predict는 무엇이며, fit은 무엇인지, fit_transform은 무엇인지 어떻게 내부에서 동작하고 있는지, 데이터가 어떻게 들어가서 어떻게 변환되어 나온다는 것이 잘 감이 안오기에 밑바닥부터 구현하는 책을 도서관에서 찾았다 앞으로 이 책으로 공부할 것이며, 관련 코드는 다행히 저자께서 공개를 해두셨다. https://github.com/joelgrus/data-science-from-scratch GitHub - joelgrus/data-science-from-scratch: code for Data Science From Scratch book code..

https://www.youtube.com/watch?v=ngLyX54e1LU&list=PLqnslRFeH2Upcrywf-u2etjdxxkL8nl7E&index=1 이 유투브에 있는 강의를 보고 공부한 내용 정리 1. KNN이란? K-nearest Neighers를 뜻하는 것으로, 위의 그림에서 녹색 점은 빨간색으로 분류를 해야할까? 아니면 파란색으로 분류해야할까? 이를 주위에 있는 점 K개를 선택해 많은 숫자쪽으로 분류하는 것이다. K는 초록색 점으로부터 유클리디안 거리를 사용해 계산한다. 유클리디안 거리란? 우리가 중고등학교 때 배운 점과 점 사이의 거리를 통해 구한다. \(d=\sqrt{(x_1-x_2)^2-(y_1-y_2)}\) 위의 공식을 통해 나온 거리를 통해, 최근접점 k개를 해서, 많은 수..
회귀분석은 x와 y의 관계를 가장 잘 나타내는 직선을 찾는 것이다. y=b0+b1 * x이다. b0과 b1의 계수는 데이터로부터 추정되어야 한다. 회귀식을 구하기 위해 필요한 절차 1) 평균과 분산을 계산한다 2) 공분산을 계산한다 3) 계수를 추정한다 4) 예측을 한다 1. 평균 및 분산구현 평균 def mean(values): return sum(values)/float(len(values)) 분산 def variance(values,mean): return sum([(x-mean)**2 for x in values]) 평균은 모든 값의 합/ 값의 갯수 분산은 (값-평균)^2 2. 공분산 계산 def covariance(x, mean_x, mean_y): covar=0.0 for i in range(..
- Total
- Today
- Yesterday
- 정보처리기사
- 일본어문법무작정따라하기
- 코딩테스트
- 데이터분석
- 일문따
- c++
- 여인권
- 강화학습
- 인지부조화
- 심리학
- stl
- C
- Python
- 백준
- 윤성우
- C/C++
- 열혈프로그래밍
- 보세사
- 통계학
- K-MOOC
- 일본어
- 뇌와행동의기초
- 류근관
- 통계
- 티스토리챌린지
- 인프런
- 사회심리학
- 파이썬
- 회계
- 오블완
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |