본문 바로가기

전체 글242

[pandas] str.contains 시리즈의 각 셀이 특정 문자열을 포함하고 있는지 확인하는 함수 import pandas as pd s = pd.Series(['cat01', 'cat02', 'dog01', '03cat', '01cow']) str.startswith 함수와 str.endswith 함수를 사용하면 특정 문자열로 시작과 종결여부를 확인할 수 있다. 2024. 2. 9.
[pandas] str.replace 시리즈의 각 셀에서 문자열 치환하기 import pandas as pd data1 = {'col1': ['cat01', 'cat02', 'pig03'], 'col2': ['cat', 'cat', 'pig'], 'col3': ['1,234', '1,456,234', '67,890']} df = pd.DataFrame(data1) 2024. 2. 7.
[pandas] str.split 시리즈의 각 셀에서 문자열 분할하는 함수. 결과는 셀안의 리스트로 반환하는 것이 특징이다. (기본값) import pandas as pd s = pd.Series(['a-001', 'b-002', 'cd-003']) data1 = {'주소': ['서울특별시 용산구 독서당로', '경상남도 남해군 옥천로12길 302호', '경상남도 김해시 가야로47길']} df = pd.DataFrame(data1) expand=True를 활용하면 데이터 프레임으로 확장할 수 있다. 2024. 2. 7.
[pandas] str.strip 시리즈의 각 셀에서 문자열의 좌우 공백을 제거하는 함수 import pandas as pd data1 = {'col1':[' 205', '12 '], 'col2':['00205', '12000']} df = pd.DataFrame(data1) 공백(white space)뿐만 아니라 제거할 문자를 지정할 수 있다. df의 col2 열은 문자열의 좌우가 ‘0’으로 둘러싸여 있다. str.len 함수에 제거할 문자인 ‘0’을 인수로 입력하면 해당 문자가 제거된다. 이 때 문자열 좌우측의 ‘0’만 제거하고, ‘205’와 같이 중간에 위치한 ‘0’은 제거하지 않는다. col2 열은 수치형으로 처리할 때 문자열 좌측의 ‘0’은 제거해야 하지만, 우측의 ‘0’은 유지해야 한다. str.lstrip 함수를 사용하면 좌.. 2024. 2. 7.
[pandas] str.len 시리즈에서 문자열의 길이 반환하는 함수 import pandas as pd s = pd.Series(['mom', 'get', 'pandas', 'level']) 2024. 2. 7.
[pandas] 시리즈의 각 셀의 인덱싱과 슬라이싱 str 속성에 인덱싱과 슬라이싱을 하면 시리즈의 각 셀의 인덱싱과 슬라이싱을 수행한다 예제 import pandas as pd data = {'문자열': ['A0', 'B1', 'C2', 'D3'], '문자열2': ['물리01', '물리02', '화학01', 99], '리스트': [['물리', 1], ['물리', 2], ['화학', 1], ['화학', 2]]} df = pd.DataFrame(data) 먼저 각 셀의 인덱싱을 수행하는 방법은 다음과 같다. 슬라이싱도 수행이 가능하다. 문자열이 아닌 리스트의 인덱싱과 슬라이싱도 가능하다 2024. 1. 30.