본문 바로가기
판다스/함수 cheat sheet

[pandas] clip

by 김판다t 2023. 7. 16.

임계값을 적용해 이상치(outlier)를 처리하는 함수

 

import pandas as pd
data1 = {'국어': {'A': 89, 'B': 29, 'C': 40, 'D': 29}, 
         '영어': {'A': 4, 'B': 46, 'C': 19, 'D': 91}, 
         '수학': {'A': 74, 'B': 83, 'C': 60, 'D': 76}}
df = pd.DataFrame(data1)

 

 

 

 

df.clip(lower=None, upper=None)

 

 

인자(parameter)

 

lower (실수 혹은 배열)

최솟값으로 적용할 임계값. 배열을 입력하면 열마다 다르게 적용한다.

 

upper (실수 혹은 배열)

최댓값으로 적용할 임계값. 배열을 입력하면 열마다 다르게 적용한다.

 

 

 

 

 

공식문서

 

https://pandas.pydata.org/docs/reference/api/pandas.DataFrame.clip.html

 

pandas.DataFrame.clip — pandas 2.0.3 documentation

Minimum threshold value. All values below this threshold will be set to it. A missing threshold (e.g NA) will not clip the value.

pandas.pydata.org

 

 

 

 

 

유튜브에서 판다스 강의 중입니다

 

https://www.youtube.com/@KimPandas

 

 

'판다스 > 함수 cheat sheet' 카테고리의 다른 글

[pandas] cumcount  (0) 2023.08.17
[pandas] crosstab  (0) 2023.07.30
[pandas] duplicated  (0) 2023.07.16
[pandas] drop_duplicates  (0) 2023.07.16
[pandas] replace  (0) 2023.07.16