본문 바로가기
판다스/함수 cheat sheet

[pandas] str.extractall

by 김판다t 2024. 2. 9.

단일 패턴으로 복수의 문자열을 추출하는 함수.

 

str.extract 함수는 단일 패턴으로는 맨 처음 문자열만 추출하기에 str.extractall 함수가 필요하다

 

 

import pandas as pd
s2 = pd.Series(['A반박연준/A반권보아', 'A반임재범'])

 

 

 

 

 

s2.str.extract('A반([가-힇]+)') # 아래의 1번 그림
s2.str.extractall('A반([가-힇]+)') # 아래의 2번 그림 
s2.str.extractall('A반([가-힇]+)')[0].unstack() # 아래의 3번 그림

 

 

str.extactall의 결과는 멀티 인덱스를 가진 데이터 프레임이 반환되므로, 멀티 인덱스에 취약하다면 인덱싱과 unstack 함수를 활용해 단일 인덱스인 데이터 프레임으로 변환하자.

'판다스 > 함수 cheat sheet' 카테고리의 다른 글

[pandas] date_range  (0) 2024.02.29
[pandas] groupby + transform  (0) 2024.02.22
[pandas] str.startswith, str.endswith  (0) 2024.02.09
[pandas] str.extract  (0) 2024.02.09
[pandas] str.contains  (0) 2024.02.09