[pandas] 특정 열의 값으로 데이터 프레임 나눠서 리스트로 만들기

아래의 예제를 보자

import pandas as pd
data = {'종류':['사과', '사과', '귤', '사과', '바나나', '바나나'], 
        '판매량' : [10, 20, 30, 40, 50, 60]}
df = pd.DataFrame(data)

이 df를 종류의 값으로 나눠 사과, 귤, 바나나의 데이터 프레임을 분리하고 싶다. 이것을 분리해 리스트(dfs)에 담아보자

dfs = [df for key, df in df.groupby('종류')]

확인을 위해 dfs[0]를 출력해보자

귤의 데이터 프레임을 얻었다.

혹은 아래와 같은 코드로도 가능하다

g = df.groupby('종류')    
dfs = [g.get_group(x) for x in g.groups]

유튜브에서 판다스 강의 중입니다

[pandas] csv파일의 멀티 인덱스를 판다스로 읽었을 때 Unnamed columns가 생성된다면? (0)	2023.08.23
[pandas] set과 frozenset의 차이 (0)	2023.08.07
[pandas] 정규표현식에서 그룹명을 지정하기 (0)	2023.08.06
[pandas] 일부만 %로 표기된 열을 float으로 바꿀 때 (0)	2023.07.05
[pandas] 파일에서 데이터 프레임을 읽어올 때 공통된 열이름이 있을 때 해결책 (0)	2023.06.25

엑셀투파이썬