[pandsa] NaN 위치에 데이터를 끌어 올리는 방법
예제 import pandas as pd data = {'반': ['A', 'A', 'A', 'B', 'B', 'B'], '점수': [91, 90, 80, 90, 80, 70], '국어': ['김판다', float('nan'), float('nan'), '최진환', float('nan'), float('nan')], '영어': [float('nan'), '조민영', '안지선', float('nan'), '박연준', '권보아'], '수학': [float('nan'), float('nan'), '강승주', float('nan'), float('nan'), '임재범']} df = pd.DataFrame(data) NaN 위치에 데이터를 끌어 올려 다음과 같은 데이터를 만들어 보자. 이럴 때 transform ..
2024. 3. 19.
[pandas] wide_to_long
판다스 wide_to_long 가로 형식(wide) 데이터 프레임을 세로 형식(long)으로 변환하는 함수. 예제 import pandas as pd data = {'이름': ['김판다', '강승주', '조민영'], '가형_국어': [60, 69, 83], '나형_국어': [63, 79, 66], '가형_영어': [63, 81, 84], '나형_영어': [99, 96, 84]} df = pd.DataFrame(data) pd.wide_to_long( df, i='이름', stubnames=['가형', '나형'], j='과목', sep='_', suffix=r'.+' ) wide_to_long 함수의 주요 매개변수(parameter)와 인수(argument), 기본값(default) pd.wide_to_l..
2024. 3. 15.
[pandas] 문자열에서 정규 표현식으로 그룹을 활용하는 방법
예제 import pandas as pd data1 = ['Home: 롯데, Away: 한화', 'Home: 삼성, Away: 기아'] s = pd.Series(data1) s 0 Home: 롯데, Away: 한화 1 Home: 삼성, Away: 기아 dtype: object 홈팀과 어웨이팀을 맞교환하자. 다양한 방법이 있겠지만, 정규 표현식으로 그룹을 나눠 해당 그룹을 맞바꾼 결과로 해결할 수 있다. 문자열 대체를 위해 str.replace 함수를 정규 표현식으로 사용하자. df['팀'].str.replace(r'Home: (.+), Away: (.+)', r'Home: \2, Away: \1', regex=True) out: 0 Home: 한화, Away: 롯데 1 Home: 기아, Away: 삼성 ..
2024. 2. 27.