백분위수를 기준으로 구간을 나누어 범주화(categorization)하는 함수
import pandas as pd
s = pd.Series({'가': 90, '나': 10, '다': 50, '라': 95})
pandas qcut
pd.qcut(x, q, labels=None)
인자
x
백분위수로 나눠 범주화를 수행할 배열을 입력. 반드시 1차원이어야 한다.
q
구간을 나누는 백분위수 기준을 입력받는 매개변수
정수 : 정수만큼의 균등한 구간으로 분할한다. ex1) 2를 입력하면 하위 50%와 상위 50%의 2개의 구간으로 분할한다.
정렬된 배열 : ex2) [0, 0.25, 0.75, 1] 이라면 백분위로 최소 ~ 25%, 25% ~ 75%, 75% ~ 최대 까지의 3개의 구간으로 분할
labels
각 구간의 이름을 지정하는 매개변수. False는 가장 왼쪽 구간부터 0, 1, 2, 3... 으로 이름을 부여한다
기본값은 구간의 경계를 구간의 이름으로 부여한다
반드시 q로 나누어진 구간수와 같아야 한다
공식문서
https://pandas.pydata.org/docs/reference/api/pandas.qcut.html
'판다스 > 함수 cheat sheet' 카테고리의 다른 글
[pandas] drop_duplicates (0) | 2023.07.16 |
---|---|
[pandas] replace (0) | 2023.07.16 |
[pandas] pct_change (0) | 2023.07.06 |
[pandas] diff (0) | 2023.07.06 |
[pandas] where (0) | 2023.07.05 |