단일 패턴으로 복수의 문자열을 추출하는 함수.
str.extract 함수는 단일 패턴으로는 맨 처음 문자열만 추출하기에 str.extractall 함수가 필요하다
import pandas as pd
s2 = pd.Series(['A반박연준/A반권보아', 'A반임재범'])
s2.str.extract('A반([가-힇]+)') # 아래의 1번 그림
s2.str.extractall('A반([가-힇]+)') # 아래의 2번 그림
s2.str.extractall('A반([가-힇]+)')[0].unstack() # 아래의 3번 그림
str.extactall의 결과는 멀티 인덱스를 가진 데이터 프레임이 반환되므로, 멀티 인덱스에 취약하다면 인덱싱과 unstack 함수를 활용해 단일 인덱스인 데이터 프레임으로 변환하자.
'판다스 > 함수 cheat sheet' 카테고리의 다른 글
[pandas] date_range (0) | 2024.02.29 |
---|---|
[pandas] groupby + transform (0) | 2024.02.22 |
[pandas] str.startswith, str.endswith (0) | 2024.02.09 |
[pandas] str.extract (0) | 2024.02.09 |
[pandas] str.contains (0) | 2024.02.09 |