[pandas] dropna
결측값(null)이 있는 열이나 행을 삭제하는 함수 import pandas as pd data = [[88, 66, None], [None, None, 69], [69, 82, None], [71, 89, 98]] df = pd.DataFrame(data, index=list('ABCD'), columns=['국어', '영어', '수학']) pandas dropna df.dropna(axis=0, how='any', subset=None) axis 행을 삭제하는지 열을 삭제하는지 지정하는 매개변수. 기본값은 0이고 결측값이 존재하는 행을 삭제한다. how 어떤 기준으로 NaN을 보유한 열이나 행을 어떻게 삭제할지 지정하는 매개변수. 'any'는 하나라도 NaN이 있으면 삭제하고, 'all'은 모두 Na..
2023. 2. 13.
[pandas] pivot
집계 함수 없이 피벗 테이블을 만드는 함수. 주로 문자열 피보팅에 쓰인다 import pandas as pd data = {'반': ['A', 'A', 'A', 'B', 'B', 'B'], '등수': ['1등', '2등', '3등', '1등', '2등', '3등'], '이름': ['김판다', '강승주', '조민영', '최진환', '박상현', '권보아']} df = pd.DataFrame(data) df.pivot(index=None, columns=None, values=None) index (열의 레이블) 행으로 그룹을 나눌 열의 레이블 columns (열의 레이블) 열로 그룹을 나눌 열의 레이블 values (열의 레이블) values에 위치하게 될 열의 레이블. 집계함수가 없기에 복수인 그룹이 하나..
2023. 2. 12.
[pandas] pivot_table
원시 데이터(raw data)로 피벗 테이블을 생성하는 함수 import pandas as pd data = {'이름': ['김판다', '강승주', '조민영', '안지선', '최진환', '박연준'], '성별': ['남', '여', '여', '여', '남', '남'], '반': ['A', 'A', 'A', 'B', 'B', 'B'], '점수': [97, 88, 78, 64, 85, 89]} df = pd.DataFrame(data) df.pivot_table(values=None, index=None, columns=None, aggfunc='mean') values 집계할 대상 열을 지정하는 인자. 그림의 경우 점수 열을 집계했다. index (열, 또는 grouper) 그룹을 나누는 기준 열. 그림의 ..
2023. 2. 12.