[pandas] 문자열에서 정규 표현식으로 그룹을 활용하는 방법
예제 import pandas as pd data1 = ['Home: 롯데, Away: 한화', 'Home: 삼성, Away: 기아'] s = pd.Series(data1) s 0 Home: 롯데, Away: 한화 1 Home: 삼성, Away: 기아 dtype: object 홈팀과 어웨이팀을 맞교환하자. 다양한 방법이 있겠지만, 정규 표현식으로 그룹을 나눠 해당 그룹을 맞바꾼 결과로 해결할 수 있다. 문자열 대체를 위해 str.replace 함수를 정규 표현식으로 사용하자. df['팀'].str.replace(r'Home: (.+), Away: (.+)', r'Home: \2, Away: \1', regex=True) out: 0 Home: 한화, Away: 롯데 1 Home: 기아, Away: 삼성 ..
2024. 2. 27.
[pandas] groupby + transform
주로 집계 결과로 시리즈를 생성하는 함수. groupby 함수에 사용자 정의 함수를 적용해 열을 생성할 때도 쓰인다. 예제: import pandas as pd data = {'제품': ['A', 'A', 'B', 'B', 'C', 'A'], '판매량': [10, 20, 20, 30, 10, 60]} df = pd.DataFrame(data) df.groupby('제품')['판매량'].transform('sum')
2024. 2. 22.
[pandas] AttributeError 강의 (3) - 함수에서 발생한 경우
대부분의 AttributeError는 에러 메세지만 읽을 줄 알면 해결이 됩니다. 판다스에서 발생하는 AttributeError는 크게 세 가지 종류가 있습니다. 1. 모듈(module)에서 발생한 경우2. 객체(object)에서 발생하는 경우3. 함수(function)에서 발생하는 경우 ← 이번 포스팅 세 종류의 에러는 에러 메세지로 구분할 수 있습니다. 이번 포스팅은 객체 중 함수에서 AttributeError가 발생한 경우입니다. 예시 에러가 발생하는 코드의 예시를 볼게요# 실습 예제 코드import pandas as pddata = {'제품': ['A', 'B', 'B', 'A', 'C', 'A'], '판매량': [10, 20, 30, 40, 50, 60]}df = pd..
2024. 2. 21.