데이터 프레임이나 시리즈의 고유값의 개수를 파악하는 함수
import pandas as pd
s = pd.Series(['A', 'C', 'A', 'B'])
pandas value_counts
시리즈에 적용할 때는 아래와 같다
s.value_counts(normalize=False, sort=True, ascending=False)
normalize (인수는 bool / 기본값은 False)
True일때는 표준화해서 비율로 보여준다
sort (인수는 bool / 기본값은 True)
빈도에 따라 정렬한다
ascending (인수는 bool / 기본값은 False)
정렬 방식을 결정하는 인자, 기본값은 내림차순
bins (정수 혹은 리스트)
구간을 나눠 빈도수를 파악할 때 사용하는 인자
정수는 균등한 구간을 나누고 구간을 경계의 리스트로 입력하는 것도 가능하다
데이터 프레임에 적용할 때는 아래와 같다
df.value_counts(subset=None, normalize=False, sort=True, ascending=False)
subset (인수는 레이블 / 기본값은 None)
고유값의 개수를 파악할 열을 지정하는 인자
그외의 인자는 시리즈에 적용할 때와 동일하다
그외 많은 인자들이 있다. 더 궁금하면 아래 링크를 참고
https://pandas.pydata.org/docs/reference/api/pandas.Series.value_counts.html
'판다스 > 함수 cheat sheet' 카테고리의 다른 글
[pandas] apply (0) | 2023.02.07 |
---|---|
[pandas] sort_index (0) | 2023.02.06 |
[pandas] cut (0) | 2023.02.04 |
[pandas] mask (0) | 2023.02.04 |
[pandas] 불리언 인덱싱(boolean indexing) (0) | 2023.02.04 |