아래의 예제를 보자
import pandas as pd
data = {'종류':['사과', '사과', '귤', '사과', '바나나', '바나나'],
'판매량' : [10, 20, 30, 40, 50, 60]}
df = pd.DataFrame(data)
df
이 df를 종류의 값으로 나눠 사과, 귤, 바나나의 데이터 프레임을 분리하고 싶다. 이것을 분리해 리스트(dfs)에 담아보자
dfs = [df for key, df in df.groupby('종류')]
확인을 위해 dfs[0]를 출력해보자
귤의 데이터 프레임을 얻었다.
혹은 아래와 같은 코드로도 가능하다
g = df.groupby('종류')
dfs = [g.get_group(x) for x in g.groups]
유튜브에서 판다스 강의 중입니다
'판다스 > 판다스 팁' 카테고리의 다른 글
[pandas] csv파일의 멀티 인덱스를 판다스로 읽었을 때 Unnamed columns가 생성된다면? (0) | 2023.08.23 |
---|---|
[pandas] set과 frozenset의 차이 (0) | 2023.08.07 |
[pandas] 정규표현식에서 그룹명을 지정하기 (0) | 2023.08.06 |
[pandas] 일부만 %로 표기된 열을 float으로 바꿀 때 (0) | 2023.07.05 |
[pandas] 파일에서 데이터 프레임을 읽어올 때 공통된 열이름이 있을 때 해결책 (0) | 2023.06.25 |