본문 바로가기
판다스/함수 cheat sheet

[pandas] value_counts

by 김판다t 2023. 2. 6.

 

 

데이터 프레임이나 시리즈의 고유값의 개수를 파악하는 함수

 

import pandas as pd
s = pd.Series(['A', 'C', 'A', 'B'])

 

 

 

 

pandas value_counts

 

 

시리즈에 적용할 때는 아래와 같다

 

s.value_counts(normalize=False, sort=True, ascending=False)

 

 

normalize (인수는 bool / 기본값은 False)

True일때는 표준화해서 비율로 보여준다

 

sort (인수는 bool / 기본값은 True)

빈도에 따라 정렬한다

 

ascending (인수는 bool / 기본값은 False)

정렬 방식을 결정하는 인자, 기본값은 내림차순

 

bins (정수 혹은 리스트)

구간을 나눠 빈도수를 파악할 때 사용하는 인자

정수는 균등한 구간을 나누고 구간을 경계의 리스트로 입력하는 것도 가능하다

 

 

 

데이터 프레임에 적용할 때는 아래와 같다

 

df.value_counts(subset=None, normalize=False, sort=True, ascending=False)

 

subset (인수는 레이블 / 기본값은 None)

고유값의 개수를 파악할 열을 지정하는 인자

 

 

그외의 인자는 시리즈에 적용할 때와 동일하다

 

 

 

그외 많은 인자들이 있다. 더 궁금하면 아래 링크를 참고

 

 

https://pandas.pydata.org/docs/reference/api/pandas.Series.value_counts.html

https://pandas.pydata.org/docs/reference/api/pandas.DataFrame.value_counts.html#pandas.DataFrame.value_counts

 

'판다스 > 함수 cheat sheet' 카테고리의 다른 글

[pandas] apply  (0) 2023.02.07
[pandas] sort_index  (0) 2023.02.06
[pandas] cut  (0) 2023.02.04
[pandas] mask  (0) 2023.02.04
[pandas] 불리언 인덱싱(boolean indexing)  (0) 2023.02.04