본문 바로가기
판다스/함수 cheat sheet

[pandas] resample

by 김판다t 2023. 8. 21.

시간의 흐름에 따라 그룹화해서 함수를 적용하는 함수

 

 

import pandas as pd
data = {'날짜': ['2023-01-01', '2023-01-15', '2023-01-30', 
                 '2023-01-31', '2023-02-02', '2023-02-05'], 
        '금액': [10000, 20000, 30000, 40000, 50000, 60000]}
df = pd.DataFrame(data)
df['날짜'] = pd.to_datetime(df['날짜'])

 

 

 

df.resample('M', on='날짜')['금액'].cumsum()

 

 

 

resample 함수의 주요 매개변수(parameter)와 인수(argument), 기본값(default)

 

df.resample(rule, on=None, level=None, origin='start_day')

 

rule

집계할 주기를 입력 (예: 일단위 집계라면 'D', 월단위 집계라면 'M' 또는 'MS')

 

on

시계열 데이터가 담긴 열을 지정하는 매개변수. 반드시 datetime 자료형이어야 한다

시계열 데이터가 index라면 지정할 필요가 없다

 

level

멀티인덱스일때 시계열 데이터가 존재하는 index의 level을 지정하는 매개변수.

 

 

origin

기간의 기준 시작점을 수정하고 싶을 때 지정하는 매개변수.

  • 'epoch': 1970-01-01
  • 'start': 시계열 데이터의 첫 번째 값
  • 'start_day': 시계열 데이터의 첫 번째 날짜의 00:00:00

 

 

 

 

 

 

 

 

유튜브에서 판다스 강의 중입니다

 

https://www.youtube.com/@KimPandas

 

 

 

 

 

 

 

'판다스 > 함수 cheat sheet' 카테고리의 다른 글

[pandas] select_dtypes  (0) 2023.12.20
[pandas] between  (2) 2023.11.25
[pandas] cumcount  (0) 2023.08.17
[pandas] crosstab  (0) 2023.07.30
[pandas] clip  (0) 2023.07.16