[pandas] resample
시간의 흐름에 따라 그룹화해서 함수를 적용하는 함수 import pandas as pd data = {'날짜': ['2023-01-01', '2023-01-15', '2023-01-30', '2023-01-31', '2023-02-02', '2023-02-05'], '금액': [10000, 20000, 30000, 40000, 50000, 60000]} df = pd.DataFrame(data) df['날짜'] = pd.to_datetime(df['날짜']) df.resample('M', on='날짜')['금액'].cumsum() resample 함수의 주요 매개변수(parameter)와 인수(argument), 기본값(default) df.resample(rule, on=None, level=None,..
2023. 8. 21.
[pandas] cumcount
그룹으로 나누어 순번을 매기는 함수. 반드시 그룹화와 함께 사용한다. excel의 countif와 유사하다 import pandas as pd df = pd.DataFrame({'제품': ['A', 'B', 'B', 'A', 'C', 'A'], '판매량': [10, 20, 30, 40, 50, 60]}) ascending(True 또는 False / 기본값은 True) 오름차순 혹은 내림차순으로 순번을 부여할 것을 지정하는 매개변수. 기본값은 True이며 오름차순이고 위에서 순번을 부여한다.(순번의 시작은 0) 유튜브에서 판다스 강의 중입니다 https://www.youtube.com/@KimPandas
2023. 8. 17.
[pandas] 특정 열의 값으로 데이터 프레임 나눠서 리스트로 만들기
아래의 예제를 보자 import pandas as pd data = {'종류':['사과', '사과', '귤', '사과', '바나나', '바나나'], '판매량' : [10, 20, 30, 40, 50, 60]} df = pd.DataFrame(data) df 이 df를 종류의 값으로 나눠 사과, 귤, 바나나의 데이터 프레임을 분리하고 싶다. 이것을 분리해 리스트(dfs)에 담아보자 dfs = [df for key, df in df.groupby('종류')] 확인을 위해 dfs[0]를 출력해보자 귤의 데이터 프레임을 얻었다. 혹은 아래와 같은 코드로도 가능하다 g = df.groupby('종류') dfs = [g.get_group(x) for x in g.groups] 유튜브에서 판다스 강의 중입니다 htt..
2023. 8. 6.