[pandas] 그룹별로 가장 가까운 값을 기준으로 NaN을 채우기
Example Code import pandas as pd data = {'code': [1, 1, 2, 2, 2, 2, 3], 'year': [2000, 2001, 2000, 2001, 2002, 2003, 2000], 'val': [1.6, None, 1.4, None, None, 1.7, 0.1]} df = pd.DataFrame(data) df: Problem code열의 값을 그룹화해서 가장 가까운 값을 기준으로 df의 NaN을 채우고 싶다. 거리에 따라 전방 혹은 후방값으로 채울지가 정해지기에 단순히 전방값 혹은 후방값으로 NaN을 채우는 ffill, bfill 로는 수행이 불가능하다 Code interpolate 함수를 nearest method로 적용하면 된다. code열로 그룹화해서 적용..
2023. 5. 27.
[pandas] 주피터 노트북에서 여러개의 데이터 프레임을 가로로 출력하기
# 데이터 프레임을 가로로 출력하자 from IPython.display import display, HTML HTML('') 위 코드를 실행시키고 display 함수로 데이터 프레임을 출력하면 된다 import pandas as pd data = [[1, 2, 3], [4, 5, 6], [7, 8, 9]] df1 = pd.DataFrame(data, index=list('ABC'), columns=['국어', '수학', '영어']) df2 = pd.DataFrame([[3, 1], [2, 10]], list('AC'), columns=['국어', '영어']) display(df1) display(df2) output: 유튜브에서 판다스 강의중입니다 https://www.youtube.com/@KimPa..
2023. 5. 26.
[pandas] 데이터 프레임 2개를 concat할 때 열을 교대로 concat하는 방법
다음 두개의 데이터 프레임이 있다 import pandas as pd data1 = [[1, 2, 3], [4, 5, 6]] data2 = [[5, 2, 4], [3, 5, 1]] df1 = pd.DataFrame(data1, columns=['a1', 'd1', 'c1']) df2 = pd.DataFrame(data2, columns=['a2', 'd2', 'c2']) df1 df2 df1과 df2의 열을 교대로 합쳐보자. 열의 순서가 a1-a2-d1-d2-c1-c2가 되면 된다 그냥 concat한 다음에 sort_index 함수로 정렬을 하면 그저 a1-a2-c1-c2-d1-d2의 순서가 되므로 가능하지 않다 다음의 방법을 사용하자 1. 먼저 df1.columns와 df2.columns를 교대로 합친..
2023. 5. 4.