본문 바로가기

판다스/함수 cheat sheet71

[pandas] str.startswith, str.endswith 시리즈의 각 셀이 특정 문자열로 시작 또는 종료 여부를 확인하는 함수 import pandas as pd s = pd.Series(['cat01', 'cat02', 'dog01', '03cat', '01cow']) 2024. 2. 9.
[pandas] str.extract 시리즈의 각 셀에서 지정한 문자열을 추출하는 함수 import pandas as pd s = pd.Series(['cat01', 'cat02', 'dog01', '03cat', '01cow']) s1 = pd.Series(['A반김판다/B반강승주', 'A반최진환/B반안지선']) s.str.extract('(cat)') 정규 표현식을 활용하면 다양한 문자열 추출이 가능하다 s1.str.extract('A반([가-힇]+)/B반([가-힇]+)') 2024. 2. 9.
[pandas] str.contains 시리즈의 각 셀이 특정 문자열을 포함하고 있는지 확인하는 함수 import pandas as pd s = pd.Series(['cat01', 'cat02', 'dog01', '03cat', '01cow']) str.startswith 함수와 str.endswith 함수를 사용하면 특정 문자열로 시작과 종결여부를 확인할 수 있다. 2024. 2. 9.
[pandas] str.replace 시리즈의 각 셀에서 문자열 치환하기 import pandas as pd data1 = {'col1': ['cat01', 'cat02', 'pig03'], 'col2': ['cat', 'cat', 'pig'], 'col3': ['1,234', '1,456,234', '67,890']} df = pd.DataFrame(data1) 2024. 2. 7.
[pandas] str.split 시리즈의 각 셀에서 문자열 분할하는 함수. 결과는 셀안의 리스트로 반환하는 것이 특징이다. (기본값) import pandas as pd s = pd.Series(['a-001', 'b-002', 'cd-003']) data1 = {'주소': ['서울특별시 용산구 독서당로', '경상남도 남해군 옥천로12길 302호', '경상남도 김해시 가야로47길']} df = pd.DataFrame(data1) expand=True를 활용하면 데이터 프레임으로 확장할 수 있다. 2024. 2. 7.
[pandas] str.strip 시리즈의 각 셀에서 문자열의 좌우 공백을 제거하는 함수 import pandas as pd data1 = {'col1':[' 205', '12 '], 'col2':['00205', '12000']} df = pd.DataFrame(data1) 공백(white space)뿐만 아니라 제거할 문자를 지정할 수 있다. df의 col2 열은 문자열의 좌우가 ‘0’으로 둘러싸여 있다. str.len 함수에 제거할 문자인 ‘0’을 인수로 입력하면 해당 문자가 제거된다. 이 때 문자열 좌우측의 ‘0’만 제거하고, ‘205’와 같이 중간에 위치한 ‘0’은 제거하지 않는다. col2 열은 수치형으로 처리할 때 문자열 좌측의 ‘0’은 제거해야 하지만, 우측의 ‘0’은 유지해야 한다. str.lstrip 함수를 사용하면 좌.. 2024. 2. 7.