본문 바로가기

분류 전체보기263

[pandas] read_html pd.read_html(io, match='.+', header=None, index_col=None) 웹페이지의 테이블을 데이터프레임으로 불러오는 함수. 리스트에 데이터프레임을 담아준다. io 웹페이지의 경로명 match (인수는 문자열 혹은 정규표현식 / 기본값은 ‘.+’ ) 테이블 중에서 특정 문자열을 포함한 테이블을 지정하는 매개변수. 기본값은 빈 문자열을 제외한 모든 문자열이다.(지정하지 않으면 문자열이 포함된 모든 테이블을 가져온다) header (인수는 정수, 정수의 리스트 / 기본값은 None) columns를 지정하는 매개변수. 리스트로 지정하면 멀티 인덱스인 columns가 된다. index_col (인수는 정수, 정수의 리스트 / 기본값은 None) index를 지정하는 매개변수. 지.. 2023. 1. 7.
[pandas] to_excel 데이터 프레임이나 시리즈를 엑셀시트에 저장하는 함수 pandas to_excel df.to_excel(excel_writer, sheet_name='Sheet1', index=True) excel_writer (인수는 경로명 또는 ExcelWriter) 저장할 경로를 지정하는 인자. 하나의 시트에 저장할때는 저장할 파일경로명을 입력하고 다수의 시트에 저장할 때는 ExcelWriter를 이용한다. sheet_name (인수는 문자열 / 기본값은 ‘Sheet1’) 데이터프레임을 저장할 시트의 시트명을 지정하는 인자 index (인수는 bool / 기본값은 True) index를 저장할지 지정하는 인자. 파일을 불러올 때 RangeIndex를 붙여 데이터프레임을 불러오기에 RangeIndex를 저장할 필요는 .. 2022. 12. 30.
[pandas] rename 열 이름을 변경하는 함수. index에도 적용이 되지만 주로 열 이름을 변경한다. import pandas as pd data = {'이름': {0: '송중기', 1: '김나현', 2: '권보아', 3: '박효신'}, '점수': {0: 92, 1: 75, 2: 88, 3: 62}} df = pd.DataFrame(data) df.rename(columns={'점수' : '성적'}) rename 함수의 주요 매개변수(parameter)와 인수(argument), 기본값(default) df.rename(mapper=None, axis=0, level=None) mapper 이전 이름과 새롭게 부여할 이름을 매퍼(mapper)로 입력받는 매개변수 mapper란? 딕셔너리나 시리즈나 함수와 같이 맵핑을 할수 .. 2022. 12. 30.
[pandas] concat 데이터 프레임을 연결하는 함수 import pandas as pd data1 = {'이름': {0: '송중기', 1: '김나현', 2: '권보아', 3: '박효신'}, '점수': {0: 92, 1: 75, 2: 88, 3: 62}} data2 = {'이름': {0: '이효리', 1: '김범수', 2: '이경서'}, '점수': {0: 78, 1: 81, 2: 83}} df1 = pd.DataFrame(data1) df2 = pd.DataFrame(data2) pd.concat([df1, df2]) pandas concat concat 함수의 주요 매개변수(parameter)와 인수(argument), 기본값(default) pd.concat(objs, axis=0, join='outer', keys=Non.. 2022. 12. 30.
[pandas] sort_values 데이터 프레임이나 시리즈의 정렬을 수행하는 함수 import pandas as pd data = {'이름': {0: '김판다', 1: '강승주', 2: '조민영', 3: '최진환'}, '점수': {0: 92, 1: 75, 2: 88, 3: 62}} df = pd.DataFrame(data) pandas sort_values sort_values 함수의 주요 매개변수(parameter)와 인수(argument), 기본값(default) df.sort_values(by, ascending=True) by 정렬의 기준(주로 정렬의 기준인 열)을 지정. 기준이 복수라면 리스트로 묶어 입력한다. ascending 정렬 방식을 오름차순 또는 내림차순으로 지정하는 매개변수 그외 많은 인자들이 있다. 더 궁금하면 아래.. 2022. 12. 30.
[pandas] merge_asof 범위를 기준으로 병합을 수행하는 함수. 엑셀의 index와 match 조합과 비슷하다. import pandas as pddata1 = {'이름': ['라', '나', '다', '가', '마'], '점수': [60, 72, 80, 88, 95]}data2 = {'점수': [0, 70, 80, 90], '학점': ['F', 'C', 'B', 'A']}df1 = pd.DataFrame(data1)df2 = pd.DataFrame(data2)pd.merge_asof(df1, df2, on='점수')       pandas merge_asof pd.merge_asof(left, right, on=None, by=None, allow_exact_matches=True, direction='backward')   .. 2022. 12. 29.