판다스/함수 cheat sheet
[pandas] str.extractall
김판다t
2024. 2. 9. 17:43
단일 패턴으로 복수의 문자열을 추출하는 함수.
str.extract 함수는 단일 패턴으로는 맨 처음 문자열만 추출하기에 str.extractall 함수가 필요하다
import pandas as pd
s2 = pd.Series(['A반박연준/A반권보아', 'A반임재범'])
s2.str.extract('A반([가-힇]+)') # 아래의 1번 그림
s2.str.extractall('A반([가-힇]+)') # 아래의 2번 그림
s2.str.extractall('A반([가-힇]+)')[0].unstack() # 아래의 3번 그림
str.extactall의 결과는 멀티 인덱스를 가진 데이터 프레임이 반환되므로, 멀티 인덱스에 취약하다면 인덱싱과 unstack 함수를 활용해 단일 인덱스인 데이터 프레임으로 변환하자.