import pandas as pd
s = pd.Series([90, 70, 80, 60], index=list('ABCD'))
s.rank()
pandas rank
rank 함수의 주요 매개변수(parameter)와 인수(argument), 기본값(default)
df.rank(method='average', ascending=True, pct=False)
데이터 프레임이나 시리즈의 순위를 매기는 함수
method
동점자 처리방식을 지정하는 매개변수
예시) 90, 89, 89, 88을 내림차순으로 순위를 매기자 (ascending=False)
- 'average': 평균 순위, 기본값, 예시는 1, 2.5, 2.5, 4 부여
- 'min': 최소 순위, 예시는 1, 2, 2, 4 부여
- 'max': 최대 순위, 예시는 1, 3, 3, 4 부여
- 'first': 출현 순서에 따라 순위 부여 예시는 1, 2, 3, 4 부여
- 'dense': 'min' 과 같지만 동점자가 여러명 있어도 다음 순위가 1을 더해서 부여, 예시는 1, 2, 2, 3 부여
ascending
오름차순과 내림차순을 지정하는 매개변수. 기본값은 오름차순 (True)
pct
순위를 백분위수(percentile)로 반환할지 지정하는 매개변수. False가 기본값이라서 순위를 반환하며 True는 백분위수를 반환한다.
그외 많은 매개변수들이 있다. 더 궁금하면 아래 링크를 참고
https://pandas.pydata.org/docs/reference/api/pandas.DataFrame.rank.html
'판다스 > 함수 cheat sheet' 카테고리의 다른 글
[pandas] 불리언 인덱싱(boolean indexing) (0) | 2023.02.04 |
---|---|
[pandas] astype (0) | 2023.02.03 |
[pandas] drop (0) | 2023.01.07 |
[pandas] read_html (0) | 2023.01.07 |
[pandas] to_excel (0) | 2022.12.30 |