본문 바로가기

분류 전체보기263

[pandas] merge 엑셀의 vlookup 방식과 유사한 병합을 수행하는 함수 import pandas as pd data1 = {'이름': ['김판다', '조민영', '강승주', '최진환', '박연준'], '제품': ['아이스티', '카페라떼', '카페라떼', '아이스티', '녹차']} data2 = {'제품': ['카페라떼', '아이스티', '녹차'], '가격': [4500, 4600, 4800]} df1 = pd.DataFrame(data1) df2 = pd.DataFrame(data2) df1.merge(df2, how='left', on='제품') # 기본값으로 on='제품'은 생략가능 pandas merge merge 함수의 주요 매개변수(parameter)와 인수(argument), 기본값(default) df... 2022. 12. 29.
[pandas] read_excel pd.read_excel(io, sheet_name=0, header=0, index_col=None) 엑셀파일을 데이터프레임으로 불러오는 함수 io 파일의 경로명 sheet_name (인수는 문자열, 정수, 리스트 / 기본값은 0) 불러올 시트를 지정하는 인자 예) 지정하지 않을 때: 첫번째 시트를 불러온다 1: 2번째 시트를 불러온다 "Sheet1": 문자열을 입력하면 해당 이름을 가진 시트를 불러온다. 여기서는 "Sheet1"이라는 이름의 시트를 불러온다 [0, 1, "Sheet5"]: 첫번째 시트와 두번째 시트 그리고 "Sheet5"라는 이름의 시트 세개를 딕셔너리로 통합해 가져온다. None: 모든 시트를 딕셔너리로 통합해 가져온다. header (인수는 정수, 정수의 리스트 / 기본값은 0) .. 2022. 12. 29.
[판다스 Q&A] 열이나 행마다 같은 조건으로 불리언 인덱싱을 할때 열이나 행마다 같은 조건으로 불리언 인덱싱을 할때는 any나 all을 쓰면 됩니다 해당 강의 shorts 영상 링크입니다 https://youtube.com/shorts/s3px6HFkXZA?feature=share - YouTube www.youtube.com 실습에 쓸 데이터를 불러보자 import pandas as pd df = pd.DataFrame([[56, 56, 56, 63], [78, 78, 73, 76], [79, 77, 78, 86], [89, 89, 56, 88], [66, 84, 71, 61], [86, 57, 71, 62]], index=list('ABCDEF'), columns=['국어', '영어', '수학', '과학']) df 각 과목이 전부 60점이 넘어야 합격일때 합격자 데.. 2022. 7. 24.
[판다스 Q&A] 판다스에서 특정 열을 원하는 위치로 옮기기 자주 나오는 질문을 쇼츠 영상으로 제작했습니다. 해당 쇼츠 영상 링크입니다. https://youtube.com/shorts/0C6K0ixe-DI?feature=share   먼저 pandas import 하고 실습할 데이터 프레임을 부르고 출력 옵션을 지정하자.import pandas as pdpd.set_option('max_row', 6) #6행까지만 출력df = pd.read_csv("https://raw.githubusercontent.com/panda-kim/pandas/shorts/titanic_shorts01.csv")df   이름 열을 맨 앞으로 옮겨보자.df.insert(0, '이름', df.pop('이름'))df 맨 앞으로 옮겨갔다.pop은 특정 열의 데이터를 불러오면서 해당 위치에서.. 2022. 7. 17.
[pandas] 숫자로 바꿀 때 to_numeric과 astype의 차이 판다스에서 수치형 데이터로 변환할 때 to_numeric과 astype의 차이데이터 분석에서 수치형 데이터는 중요한 역할을 차지합니다. 특히 판다스 라이브러리는 연산과 처리에 강점을 발휘하며, 이를 위해 비 수치형 데이터를 수치형으로 변환하는 작업은 데이터 정제 과정에서 자주 요구됩니다. 판다스는 이러한 변환을 위해 두 가지 함수를 제공합니다. astype과 to_numeric입니다.이 두 함수는 겉보기에는 비슷한 기능을 수행하는 것처럼 보이지만, 실제로는 각기 다른 목적과 용도를 지니고 있습니다. astype 함수는 대부분의 자료형으로 변환을 지원하는 범용성을 갖추고 있고 수치형으로도 변환이 가능하지만, 모든 데이터가 해당 형식으로 변환할 수 있어야만 올바르게 작동합니다. 반면, to_numeric 함.. 2022. 6. 13.
[파이썬주식] #02 필터링해서 주식데이터 수집하고 활용하기 krx에서 오늘의 주식데이터를 다운받아 필터링해서 FinanceDataReader로 개별종목의 기간별 ohlcv를 수집하여 pandas와 결합해 활용하는 강의입니다 해당 종목의 data를 손쉽게 수집할수 있습니다 강의보기 2023.12월에 확인해보니 fdr라이브러리에서 krx의 종목 코드열의 이름이 변경되었습니다. 기존은 Symbol열에 종목코드를 가지고 있었는데 지금은 Code열에 종목코드를 갖고 있습니다. 이미 판다스에 익숙한 분은 알고 계셨겠지만 강의 코드에서 df["Symbol"] 부분을 전부 df['Code']로 바꾸시면 코드 잘 돌아갑니다. 아래 코드는 바꾼 코드입니다 지난시간 코드 import FinanceDataReader as fdr import pandas as pd df_krx = f.. 2022. 5. 23.