판다스/함수 cheat sheet

[pandas] str.extractall

김판다t 2024. 2. 9. 17:43

단일 패턴으로 복수의 문자열을 추출하는 함수.

 

str.extract 함수는 단일 패턴으로는 맨 처음 문자열만 추출하기에 str.extractall 함수가 필요하다

 

 

import pandas as pd
s2 = pd.Series(['A반박연준/A반권보아', 'A반임재범'])

 

 

 

 

 

s2.str.extract('A반([가-힇]+)') # 아래의 1번 그림
s2.str.extractall('A반([가-힇]+)') # 아래의 2번 그림 
s2.str.extractall('A반([가-힇]+)')[0].unstack() # 아래의 3번 그림

 

 

str.extactall의 결과는 멀티 인덱스를 가진 데이터 프레임이 반환되므로, 멀티 인덱스에 취약하다면 인덱싱과 unstack 함수를 활용해 단일 인덱스인 데이터 프레임으로 변환하자.