
파이썬의 시각화 라이브러리인 pyplot으로 그래프를 그려보자. import pandas as pd import matplotlib.pyplot as plt data=[1,5,3,9,7] plt.plot(data) 위의 함수를 보듯이 가장 기본적인 그래프를 그리는 함수는 plot이다. plot에 들어가는 자료형은 리스트, 튜플 등이 되어야 한다. plt.plot([1,2,3,4,5]) 이런식이 되어도 그래프를 그릴 수 있다. 그래프를 보면 기본적으로 x축과 y축이 있는데, x축을 입력하지 않으면 y축의 인덱스가 자동으로 들어간다. x축만 입력하는 것은 불가능하다. 인덱스의 지정방법 ss=pd.Series([1,5,3,9,7],index=[10,20,30,40,50]) plt.plot(ss) 파이플롯의 인..

데이터 가져오기 df=pd.read_csv('./국비2일차/202110_202110_주민등록인구및세대현황_월간.csv',encoding='cp949') df.head() 행정구역 2021년10월_총인구수 2021년10월_세대수 2021년10월_세대당 인구 2021년10월_남자 인구수 2021년10월_여자 인구수 2021년10월_남여 비율 0 전국 (1000000000) 51,662,290 23,415,533 2.21 25,760,238 25,902,052 0.99 1 서울특별시 (1100000000) 9,532,428 4,422,587 2.16 4,630,630 4,901,798 0.94 2 부산광역시 (2600000000) 3,356,311 1,541,975 2.18 1,642,368 1,713,943..

df_2020=df[df['일시'].dt.year==2020].copy() df_2020 지점 지점명 일시 평균기온(°C) 최저기온(°C) 최고기온(°C) 1257373 90 속초 2020-01-01 0.8 -3.4 4.8 1257374 90 속초 2020-01-02 2.8 -2.1 6.6 1257375 90 속초 2020-01-03 4.7 0.8 8.5 1257376 90 속초 2020-01-04 4.0 1.1 8.1 1257377 90 속초 2020-01-05 3.1 -0.6 8.8 ... ... ... ... ... ... ... 1597071 295 남해 2020-12-27 4.4 2.5 6.0 1597072 295 남해 2020-12-28 4.7 1.1 11.5 1597073 295 남해 202..

데이터 가져오기 import pandas as pd import matplotlib.pyplot as plt import seaborn as sns plt.rcParams['font.family']='Malgun Gothic' plt.rcParams['axes.unicode_minus']=False tips=sns.load_dataset('tips') tips.head() total_bill tip sex smoker day time size 0 16.99 1.01 Female No Sun Dinner 2 1 10.34 1.66 Male No Sun Dinner 3 2 21.01 3.50 Male No Sun Dinner 3 3 23.68 3.31 Male No Sun Dinner 2 4 24.59 3...

1. rcParams (runtime configuration parameters) 그래프를 구성하는 공통속성을 지정한다. import pandas as pd import matplotlib.pyplot as plt plt.rcParams['font.family']='Malgun Gothic' plt.rcParams['axes.unicode_minus']=False 파라미터의 종류 확인 plt.rcParams RcParams({'_internal.classic_mode': False, 'agg.path.chunksize': 0, 'animation.avconv_args': [], 'animation.avconv_path': 'avconv', 'animation.bitrate': -1, 'animation..

히스토그램 scores=[0,10,15,15,16,19,20,21,25,25,26,26,29,30,35,36,37,39,40,41,41,44,45,45,45,45,47 ,50,50,50,51,51,51,53,54,55,55,56,60,61,62,63,64,65,65,66,66,66,66,67 ,68,68,69,70,70,70,70,70,70,70,71,71,71,71,72,72,72,72,74,74,74,75,75 ,76,76,76,77,77,77,78,78,78,78,79,79,79,80,80,80,80,80,81,81,82,82 ,85,85,85,88,88,89,90,90,90,93,93,95,95,97,100] plt.hist(scores) bins=구간 개수 plt.hist(scores,bins=..

import pandas as pd import matplotlib.pyplot as plt plt.rc('font',family='Malgun Gothic') plt.rcParams['axes.unicode_minus']=False df1=pd.DataFrame({'요일':['월','화','수','목','금','토','일'], '매출액':[10000,9000,11000,8000,13000,15000,14000]}) df2=pd.DataFrame({'요일':['월','화','수','목','금','토','일'], '매출액':[9000,9500,13000,7000,12000,14000,11000]}) 막대그래프 plt.bar(x,y) plt.barh(x,y) plt.barh(df1['요일'],df1['매출액..

공공데이터 분석 해보기 df=pd.read_csv('서울시 코로나19 확진자 현황.csv',encoding='UTF-8') df.head() 1. 데이터 탐색 데이터를 추출해서 보면, 환자번호, 국적, 환자정보 등 NaN으로 값이 돼 있는 것이 꽤 보인다. 만약 값이 하나도 없다면 이 값을 제거 해준다. 1) 아무것도 없는 값을 찾는다. unique() 메소드를 사용하면 고유값이 몇 개 있는지 알 수 있고, nan 이외에 아무값도 없는 것을 확인할 수 있다. #아무것도 없는 데이터 찾기 print(df['국적'].unique()) print(df['환자번호'].unique()) print(df['환자번호'].unique()) print(df['조치사항'].unique()) 값이 있다면 그 값들이 출력된다..
- Total
- Today
- Yesterday
- 오블완
- 일본어문법무작정따라하기
- 파이썬
- 심리학
- jlpt
- 윤성우
- 회계
- 뇌와행동의기초
- C/C++
- 보세사
- Python
- 통계
- 사회심리학
- C
- c++
- 류근관
- 백준
- 강화학습
- stl
- 일문따
- 인지부조화
- K-MOOC
- 인프런
- 코딩테스트
- 데이터분석
- 티스토리챌린지
- 여인권
- 일본어
- 통계학
- 열혈프로그래밍
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |