import pandas as pd
df = pd.DataFrame({'name': ['a', 'b', 'a', 'c'],
'colA': [ 3, 2, 5, 1], 'colB': [ 1, 2, 3, 4]})
df
예의 데이터 프레임을 name으로 그룹화 해서 colA와 colB를 모두 합산을 하고 싶다면 아래와 같은 코드를 사용하면 된다
df.groupby('name')[['colA', 'colB']].sum()
groupby를 복수의 열에 적용하려면 대괄호 안에 리스트를 넣는 이중 대괄호가 되어야 한다. [['colA', 'colB']]
이것을 단일 대괄호 안에 넣으면 판다스 +2.0 부터 아래의 에러가 발생하니 반드시 이중대괄호에 넣자
df.groupby('name')['colA', 'colB'].sum()
ValueError: Cannot subset columns with a tuple with more than one element. Use a list instead.
유튜브에서 판다스 강의 중입니다
https://www.youtube.com/@KimPandas
'여러 가지 이야기 > 에러 모음' 카테고리의 다른 글
AttributeError: 'Figure' object has no attribute 'subtitle' (0) | 2023.05.19 |
---|---|
FileNotFoundError: [Errno 2] No such file or directory: 'file.xlsx' (0) | 2023.05.16 |
ValueError: The truth value of a Series is ambiguous. Use a.empty, a.bool(), a.item(), a.any() or a.all(). (0) | 2023.05.03 |
ValueError: unconverted data remains: 4 (0) | 2023.05.02 |
ValueError: ('Lengths must match to compare' (0) | 2023.05.02 |