오늘은 Python pandas의 기능중 pivot를 올려보겠다. 

엑셀에서 데이터 분석을 하면 가장 많이 쓰는 기능이 pivot(피벗)이다. 

그런데, pandas에서 피벗을 이쁘게(?) 지원해주고 있어서 정리해보고자 한다. 


문제점은 엑셀은 마우스로 필드 드래그만 하면 알아서 계산도 해주고 표도 만들어지는데, 

역시 python 친철하지 않지요.. 간단한 몇줄의 코딩이 필요하다. 


익숙해지면, 엑셀처럼 편하게 쓸수 있겠지..일단 정리 GoGo!




## pandas와 파일 불러오기

import pandas as pd

import numpy as np


sale = pd.read_excel('../xls_data/판매현황.xlsx',parse_cols='A,B,C,D,E,F,G' ,encoding='cp949')


sale.head() 




## pivot_table은 옵션이 없을 경우 평균값이 디폴트다. 


 

pd.pivot_table(sale, index = '분류')




## pivot_table은 옵션으로 np.sum(합계) 추가하였다.


 

pd.pivot_table(sale, index = '분류', aggfunc=np.sum)





## pivot_table은 옵션으로 np.sum(합계) 추가하였다.


 

pd.pivot_table(sale, index = '분류', aggfunc=np.sum)




## pivot에서 index 여러가지를 넣어보았다. head는 줄이 길어서 20줄로 제한했다.


 

pd.pivot_table(sale, index = ['분류','상품코드','상품명'],aggfunc=np.sum).head(20)



## pivot에서  여러 index + 계산함수 2가지(sum, mean) 하였다.


 

pd.pivot_table(sale, index=['분류','상품명'],values='소비자가', aggfunc=[np.sum,np.mean]).head(20)




'python' 카테고리의 다른 글

python - pandas 중복제거  (0) 2019.03.01
python타입 바꾸기  (0) 2019.03.01
python 위경도 거리 구하기  (0) 2018.03.03
python encoding 종류  (0) 2018.03.03
python 공부해볼까?  (0) 2018.03.02

+ Recent posts