'머신러닝' 카테고리의 글 목록 (3 Page)

머신러닝을 공부하면서 대부분 sklearn으로 시작한다. 근데 내부동작이 어떻게 돌아가는지 모르고 라이브러리를 사용하니 도저히 이해가 안간다. predict는 무엇이며, fit은 무엇인지, fit_transform은 무엇인지 어떻게 내부에서 동작하고 있는지, 데이터가 어떻게 들어가서 어떻게 변환되어 나온다는 것이 잘 감이 안오기에 밑바닥부터 구현하는 책을 도서관에서 찾았다 앞으로 이 책으로 공부할 것이며, 관련 코드는 다행히 저자께서 공개를 해두셨다. https://github.com/joelgrus/data-science-from-scratch GitHub - joelgrus/data-science-from-scratch: code for Data Science From Scratch book code..

머신러닝/밑바닥부터하는 데이터과학 2022. 11. 24. 11:05

KNN알고리즘

https://www.youtube.com/watch?v=ngLyX54e1LU&list=PLqnslRFeH2Upcrywf-u2etjdxxkL8nl7E&index=1 이 유투브에 있는 강의를 보고 공부한 내용 정리 1. KNN이란? K-nearest Neighers를 뜻하는 것으로, 위의 그림에서 녹색 점은 빨간색으로 분류를 해야할까? 아니면 파란색으로 분류해야할까? 이를 주위에 있는 점 K개를 선택해 많은 숫자쪽으로 분류하는 것이다. K는 초록색 점으로부터 유클리디안 거리를 사용해 계산한다. 유클리디안 거리란? 우리가 중고등학교 때 배운 점과 점 사이의 거리를 통해 구한다. \(d=\sqrt{(x_1-x_2)^2-(y_1-y_2)}\) 위의 공식을 통해 나온 거리를 통해, 최근접점 k개를 해서, 많은 수..

머신러닝/머신러닝 from scratch 2022. 11. 15. 13:09

단순 회귀분석

회귀분석은 x와 y의 관계를 가장 잘 나타내는 직선을 찾는 것이다. y=b0+b1 * x이다. b0과 b1의 계수는 데이터로부터 추정되어야 한다. 회귀식을 구하기 위해 필요한 절차 1) 평균과 분산을 계산한다 2) 공분산을 계산한다 3) 계수를 추정한다 4) 예측을 한다 1. 평균 및 분산구현 평균 def mean(values): return sum(values)/float(len(values)) 분산 def variance(values,mean): return sum([(x-mean)**2 for x in values]) 평균은 모든 값의 합/ 값의 갯수 분산은 (값-평균)^2 2. 공분산 계산 def covariance(x, mean_x, mean_y): covar=0.0 for i in range(..

머신러닝/머신러닝 from scratch 2022. 9. 11. 14:34

이전 1 2 3 다음

이전 다음

공지사항

최근에 올라온 글

최근에 달린 댓글

Total

Today

Yesterday

링크

TAG more

« 2025/05 »
일	월	화	수	목	금	토
				1	2	3
4	5	6	7	8	9	10
11	12	13	14	15	16	17
18	19	20	21	22	23	24
25	26	27	28	29	30	31

글 보관함

일상 일기 블로그

티스토리툴바