티스토리 뷰
반응형
판다스 데이터의 구조
import pandas as pd
df=pd.DataFrame(
[['james',30,'programmer'],
['amy',20,'student'],
['david',25,'designer']],
columns=['name','age','job'],
index=['a','b','c']
)
df
데이터를 가져온 이후에 갯수 확인하기
import pandas as pd
df=pd.read_csv('scores.csv')
df.head()
head() 상위 5개를 출력한다.
tail() 하위 5개를 출력한다.
()안에 숫자를 쓰면 보고싶은 갯수만 볼 수 있다.
sample() 랜덤으로 몇 개를 보여준다. ()안에 숫자를 입력하면 된다. 디폴트값은 1
df.nlargest(5,'eng') 상위 5개, 특정 열
df.nsmallest(5,'eng') 하위 5개 특정 열
df.shape, 행과 열의 갯수
len(df) 행의 갯수
df.columns 칼럼들, 수학 영어 국어
df.index 인덱스, 행들 1~30
df.dtypes 데이터 타입
df.info() 정보, 이름, 갯수, 데이터타입 등
df.value_counts(): 벨류의 값들 출력
df.describe() : 통계값
시리즈 만들기

시리즈 만들고 인덱스 확인, 0부터 3까지

0, 1, 2 를 name, height, footsize로 변경
시리즈 통계값 사용하기 - 숫자 자료일 때 쓸 수 있다.
s2=pd.Series([10,20,30,40,50])
print('평균',s2.mean())
print('최소값',s2.min())
print('최대값',s2.max())
print('중간값',s2.median())
print('표준편차',s2.std())
통계값 보기
시리즈 주요 메소드
sort_values()
값으로 정렬
sort_index()
인덱스로 정렬
reset_index()
행번호를 인덱스로 지정
replace(찾을값, 교체할 값)
특정 값을 변경
시리즈.to_frame()
->데이터 프레임으로 변경
반응형
'새싹 > 새싹데이터' 카테고리의 다른 글
9. 데이터 가공하기 (1) | 2022.05.04 |
---|---|
8 데이터를 추출하고 그래프 그리기 (0) | 2022.05.03 |
6. 라이브러리 사용을 위한 모듈, 패키지, 클래스의 이해 (0) | 2022.05.01 |
5. 코드를 모아만드는 함수 (0) | 2022.04.30 |
4. 키와 값 쌍으로 된 데이터, 딕셔너리 (0) | 2022.04.29 |
공지사항
최근에 올라온 글
최근에 달린 댓글
- Total
- Today
- Yesterday
링크
TAG
- 여인권
- 통계학
- 인프런
- Python
- 데이터분석
- 티스토리챌린지
- C
- 일본어
- 뇌와행동의기초
- stl
- jlpt
- 보세사
- 인지부조화
- K-MOOC
- 사회심리학
- 류근관
- 코딩테스트
- 일문따
- EBS
- 백준
- 통계
- 회계
- c++
- C/C++
- 일본어문법무작정따라하기
- 윤성우
- 파이썬
- 열혈프로그래밍
- 심리학
- 오블완
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
글 보관함
반응형