본문 바로가기

분류 전체보기242

[pandas] read_csv pd.read_csv(filepath_or_buffer, sep=',', header='infer', index_col=None) csv파일을 데이터프레임으로 불러오는 함수 filepath_or_buffer 파일의 경로명 sep (인수는 문자열 / 기본값은 ',') 구분자를 지정하는 인자 header (인수는 정수, 정수의 리스트 / 기본값은 'infer') columns를 지정하는 인자. 지정하지 않으면 대부분 맨 윗줄이 columns가 된다.(기본 값이 0인것과 비슷하다) 리스트로 지정하면 멀티 인덱스인 columns가 된다. index_col (인수는 정수, 정수의 리스트 / 기본값은 None) index를 지정하는 인자. 지정하지 않으면 RangeIndex가 index로 부여된다. 리스트로 지정하.. 2023. 1. 16.
[pandas] rank import pandas as pds = pd.Series([90, 70, 80, 60], index=list('ABCD'))s.rank()  pandas rank  rank 함수의 주요 매개변수(parameter)와 인수(argument), 기본값(default)df.rank(method='average', ascending=True, pct=False) 데이터 프레임이나 시리즈의 순위를 매기는 함수 method동점자 처리방식을 지정하는 매개변수 예시) 90, 89, 89, 88을 내림차순으로 순위를 매기자 (ascending=False)'average': 평균 순위, 기본값, 예시는 1, 2.5, 2.5, 4 부여'min': 최소 순위, 예시는 1, 2, 2, 4 부여'max': 최대 순위, 예시는 .. 2023. 1. 16.
[pandas] drop Example Code import pandas as pd data1 = [[95, 84, 91], [65, 83, 88], [82, 76, 69]] df = pd.DataFrame(data1, index=['A', 'B', 'C'], columns=['국어', '영어', '수학']) 데이터 프레임의 행이나 열을 삭제하는 함수 drop 함수의 주요 매개변수(parameter)와 인수(argument), 기본값(default) df.drop(labels, axis=0, level=None) labels 삭제할 행 또는 열을 지정한다. 복수의 행이나 열을 지정하려면 리스트로 묶어서 입력한다. axis 행을 삭제할지 열을 삭제할지 지정하는 매개변수. 기본값은 0이고 행을 삭제한다 level 멀티인덱스일 때 삭.. 2023. 1. 7.
[pandas] read_html pd.read_html(io, match='.+', header=None, index_col=None) 웹페이지의 테이블을 데이터프레임으로 불러오는 함수. 리스트에 데이터프레임을 담아준다. io 웹페이지의 경로명 match (인수는 문자열 혹은 정규표현식 / 기본값은 ‘.+’ ) 테이블 중에서 특정 문자열을 포함한 테이블을 지정하는 매개변수. 기본값은 빈 문자열을 제외한 모든 문자열이다.(지정하지 않으면 문자열이 포함된 모든 테이블을 가져온다) header (인수는 정수, 정수의 리스트 / 기본값은 None) columns를 지정하는 매개변수. 리스트로 지정하면 멀티 인덱스인 columns가 된다. index_col (인수는 정수, 정수의 리스트 / 기본값은 None) index를 지정하는 매개변수. 지.. 2023. 1. 7.
[pandas] to_excel 데이터 프레임이나 시리즈를 엑셀시트에 저장하는 함수 pandas to_excel df.to_excel(excel_writer, sheet_name='Sheet1', index=True) excel_writer (인수는 경로명 또는 ExcelWriter) 저장할 경로를 지정하는 인자. 하나의 시트에 저장할때는 저장할 파일경로명을 입력하고 다수의 시트에 저장할 때는 ExcelWriter를 이용한다. sheet_name (인수는 문자열 / 기본값은 ‘Sheet1’) 데이터프레임을 저장할 시트의 시트명을 지정하는 인자 index (인수는 bool / 기본값은 True) index를 저장할지 지정하는 인자. 파일을 불러올 때 RangeIndex를 붙여 데이터프레임을 불러오기에 RangeIndex를 저장할 필요는 .. 2022. 12. 30.
[pandas] rename 열 이름을 변경하는 함수. index에도 적용이 되지만 주로 열 이름을 변경한다. import pandas as pd data = {'이름': {0: '송중기', 1: '김나현', 2: '권보아', 3: '박효신'}, '점수': {0: 92, 1: 75, 2: 88, 3: 62}} df = pd.DataFrame(data) df.rename(columns={'점수' : '성적'}) rename 함수의 주요 매개변수(parameter)와 인수(argument), 기본값(default) df.rename(mapper=None, axis=0, level=None) mapper 이전 이름과 새롭게 부여할 이름을 매퍼(mapper)로 입력받는 매개변수 mapper란? 딕셔너리나 시리즈나 함수와 같이 맵핑을 할수 .. 2022. 12. 30.