원시 데이터(raw data)로 피벗 테이블을 생성하는 함수
import pandas as pd
data = {'이름': ['김판다', '강승주', '조민영', '안지선', '최진환', '박연준'],
'성별': ['남', '여', '여', '여', '남', '남'],
'반': ['A', 'A', 'A', 'B', 'B', 'B'],
'점수': [97, 88, 78, 64, 85, 89]}
df = pd.DataFrame(data)
df.pivot_table(values=None, index=None, columns=None, aggfunc='mean')
values
집계할 대상 열을 지정하는 인자. 그림의 경우 점수 열을 집계했다.
index (열, 또는 grouper)
그룹을 나누는 기준 열. 그림의 경우 피벗 테이블의 index에서 반이 구분된다.
columns (열, 또는 grouper)
그룹을 나누는 기준 열. 그림의 경우 피벗 테이블의 columns에서 성별이 구분된다.
aggfunc (집계 함수)
그룹의 차원을 축소할 집계 함수를 지정하는 인자. 기본값은 'mean'으로 그룹의 평균을 구해 차원을 축소한다.
fill_value (scalar / 기본값은 None)
특정 그룹에 해당하는 값이 없을 때, NaN 대신 채울 값을 지정하는 인자
margins (인수는 bool / 기본값은 False)
합계를 만드는 인자
그외 많은 인자들이 있다. 더 궁금하면 아래 링크를 참고
https://pandas.pydata.org/docs/reference/api/pandas.pivot_table.html
'판다스 > 함수 cheat sheet' 카테고리의 다른 글
[pandas] dropna (0) | 2023.02.13 |
---|---|
[pandas] pivot (0) | 2023.02.12 |
[pandas] to_numeric (0) | 2023.02.08 |
[pandas] apply (0) | 2023.02.07 |
[pandas] sort_index (0) | 2023.02.06 |