본문 바로가기
판다스/함수 cheat sheet

[pandas] qcut

by 김판다t 2023. 7. 6.

백분위수를 기준으로 구간을 나누어 범주화(categorization)하는 함수

 

 

import pandas as pd
s = pd.Series({'가': 90, '나': 10, '다': 50, '라': 95})

 

 

 

 

 

 

pandas qcut

 

pd.qcut(x, q, labels=None)

 

인자

 

x 

백분위수로 나눠 범주화를 수행할 배열을 입력. 반드시 1차원이어야 한다.

 

q 

구간을 나누는 백분위수 기준을 입력받는 매개변수

정수 : 정수만큼의 균등한 구간으로 분할한다. ex1) 2를 입력하면 하위 50%와 상위 50%의 2개의 구간으로 분할한다.

정렬된 배열 : ex2) [0, 0.25, 0.75, 1] 이라면 백분위로 최소 ~ 25%, 25% ~ 75%, 75% ~ 최대 까지의 3개의 구간으로 분할

 

labels

각 구간의 이름을 지정하는 매개변수. False는 가장 왼쪽 구간부터 0, 1, 2, 3... 으로 이름을 부여한다

기본값은 구간의 경계를 구간의 이름으로 부여한다

반드시 q로 나누어진 구간수와 같아야 한다

 

 

 

 

 

공식문서

 

https://pandas.pydata.org/docs/reference/api/pandas.qcut.html

 

 

 

 

'판다스 > 함수 cheat sheet' 카테고리의 다른 글

[pandas] drop_duplicates  (0) 2023.07.16
[pandas] replace  (0) 2023.07.16
[pandas] pct_change  (0) 2023.07.06
[pandas] diff  (0) 2023.07.06
[pandas] where  (0) 2023.07.05