본문 바로가기

전체 글263

[pandas] reset_index index에서 데이터를 제거하는 함수. (columns를 대상으로는 사용할 수 없다.)인덱스에서만 제거해 데이터 프레임의 열로 생성할 수도 있고, 데이터를 완전히 삭제할 수도 있다. 인덱스가 제거되면 새로운 RangeIndex가 생성된다. data = [[70, 'A'], [80, 'A'], [93, 'B'], [92, 'B']]idx = pd.Series(['송중기', '강승주', '김판다', '이예준'], name='이름')df = pd.DataFrame(data, index=idx, columns=['점수', '반'])           reset_index 함수의 주요 매개변수(parameter)와 인수(argument), 기본값(default) df.reset_index(level=None, d.. 2023. 2. 19.
[pandas] set_index 데이터 프레임의 index를 설정하는 함수 (columns에는 적용되지 않는다) data = {'이름': {0: '송중기', 1: '강승주', 2: '김판다', 3: '이예준'}, '점수': {0: 70, 1: 80, 2: 93, 3: 92}, '반': {0: 'A', 1: 'A', 2: 'B', 3: 'B'}} df = pd.DataFrame(data) df.set_index(keys) keys (열의 레이블 또는 배열) index로 설정될 열을 지정하는 매개변수 그외 많은 인자들이 있다. 더 궁금하면 아래 링크를 참고 https://pandas.pydata.org/docs/reference/api/pandas.DataFrame.set_index.html 2023. 2. 19.
구글 코랩에서 그래프에 한글 폰트 적용시키는 방법(matplotlib, seaborn) 폰트설치 코드 (1번코드) import matplotlib.font_manager as fm !apt-get -qq -y install fonts-nanum > /dev/null fontpath = '/usr/share/fonts/truetype/nanum/NanumBarunGothic.ttf' font = fm.FontProperties(fname=fontpath, size=9) fm._rebuild() 1. 작업하는 노트북 맨위에 셀을 만들어 먼저 폰트 설치코드인 1번코드를 실행합니다 폰트 적용 코드(2번코드) import matplotlib.pyplot as plt import matplotlib as mpl import matplotlib.font_manager as fm # 마이너스 표시 문제 .. 2023. 2. 16.
[pandas] dropna 결측값(null)이 있는 열이나 행을 삭제하는 함수 import pandas as pd data = [[88, 66, None], [None, None, 69], [69, 82, None], [71, 89, 98]] df = pd.DataFrame(data, index=list('ABCD'), columns=['국어', '영어', '수학']) pandas dropna df.dropna(axis=0, how='any', subset=None) axis 행을 삭제하는지 열을 삭제하는지 지정하는 매개변수. 기본값은 0이고 결측값이 존재하는 행을 삭제한다. how 어떤 기준으로 NaN을 보유한 열이나 행을 어떻게 삭제할지 지정하는 매개변수. 'any'는 하나라도 NaN이 있으면 삭제하고, 'all'은 모두 Na.. 2023. 2. 13.
[pandas] pivot 집계 함수 없이 피벗 테이블을 만드는 함수. 주로 문자열 피보팅에 쓰인다 import pandas as pd data = {'반': ['A', 'A', 'A', 'B', 'B', 'B'], '등수': ['1등', '2등', '3등', '1등', '2등', '3등'], '이름': ['김판다', '강승주', '조민영', '최진환', '박상현', '권보아']} df = pd.DataFrame(data) df.pivot(index=None, columns=None, values=None) index (열의 레이블) 행으로 그룹을 나눌 열의 레이블 columns (열의 레이블) 열로 그룹을 나눌 열의 레이블 values (열의 레이블) values에 위치하게 될 열의 레이블. 집계함수가 없기에 복수인 그룹이 하나.. 2023. 2. 12.
[pandas] pivot_table 원시 데이터(raw data)로 피벗 테이블을 생성하는 함수 import pandas as pd data = {'이름': ['김판다', '강승주', '조민영', '안지선', '최진환', '박연준'], '성별': ['남', '여', '여', '여', '남', '남'], '반': ['A', 'A', 'A', 'B', 'B', 'B'], '점수': [97, 88, 78, 64, 85, 89]} df = pd.DataFrame(data) df.pivot_table(values=None, index=None, columns=None, aggfunc='mean') values 집계할 대상 열을 지정하는 인자. 그림의 경우 점수 열을 집계했다. index (열, 또는 grouper) 그룹을 나누는 기준 열. 그림의 .. 2023. 2. 12.