본문 바로가기

분류 전체보기242

[판다스 Q&A] 판다스에서 특정 열을 원하는 위치로 옮기기 자주 나오는 질문을 쇼츠 영상으로 제작했습니다. 해당 쇼츠 영상 링크입니다. https://youtube.com/shorts/0C6K0ixe-DI?feature=share   먼저 pandas import 하고 실습할 데이터 프레임을 부르고 출력 옵션을 지정하자.import pandas as pdpd.set_option('max_row', 6) #6행까지만 출력df = pd.read_csv("https://raw.githubusercontent.com/panda-kim/pandas/shorts/titanic_shorts01.csv")df   이름 열을 맨 앞으로 옮겨보자.df.insert(0, '이름', df.pop('이름'))df 맨 앞으로 옮겨갔다.pop은 특정 열의 데이터를 불러오면서 해당 위치에서.. 2022. 7. 17.
[pandas] 숫자로 바꿀 때 to_numeric과 astype의 차이 판다스에서 수치형 데이터로 변환할 때 to_numeric과 astype의 차이데이터 분석에서 수치형 데이터는 중요한 역할을 차지합니다. 특히 판다스 라이브러리는 연산과 처리에 강점을 발휘하며, 이를 위해 비 수치형 데이터를 수치형으로 변환하는 작업은 데이터 정제 과정에서 자주 요구됩니다. 판다스는 이러한 변환을 위해 두 가지 함수를 제공합니다. astype과 to_numeric입니다.이 두 함수는 겉보기에는 비슷한 기능을 수행하는 것처럼 보이지만, 실제로는 각기 다른 목적과 용도를 지니고 있습니다. astype 함수는 대부분의 자료형으로 변환을 지원하는 범용성을 갖추고 있고 수치형으로도 변환이 가능하지만, 모든 데이터가 해당 형식으로 변환할 수 있어야만 올바르게 작동합니다. 반면, to_numeric 함.. 2022. 6. 13.
[파이썬주식] #02 필터링해서 주식데이터 수집하고 활용하기 krx에서 오늘의 주식데이터를 다운받아 필터링해서 FinanceDataReader로 개별종목의 기간별 ohlcv를 수집하여 pandas와 결합해 활용하는 강의입니다 해당 종목의 data를 손쉽게 수집할수 있습니다 강의보기 2023.12월에 확인해보니 fdr라이브러리에서 krx의 종목 코드열의 이름이 변경되었습니다. 기존은 Symbol열에 종목코드를 가지고 있었는데 지금은 Code열에 종목코드를 갖고 있습니다. 이미 판다스에 익숙한 분은 알고 계셨겠지만 강의 코드에서 df["Symbol"] 부분을 전부 df['Code']로 바꾸시면 코드 잘 돌아갑니다. 아래 코드는 바꾼 코드입니다 지난시간 코드 import FinanceDataReader as fdr import pandas as pd df_krx = f.. 2022. 5. 23.
[파이썬주식] #01 전 종목의 주식데이터 수집하고 활용하기 FinanceDataReader로 개별종목의 기간별 ohlcv를 수집하여 pandas와 결합해 활용하는 강의입니다 모든 종목의 data를 손쉽게 수집할수 있습니다 강의중 가져올 종목코드가 담겨있는 엑셀파일입니다 작업하시는 파이썬 파일과 반드시 같은 폴더에 저장해주세요 강의의 전체코드입니다 2023.12월에 확인해보니 fdr라이브러리에서 krx의 종목 코드열의 이름이 변경되었습니다. 기존은 Symbol열에 종목코드를 가지고 있었는데 지금은 Code열에 종목코드를 갖고 있습니다. 이미 판다스에 익숙한 분은 알고 계셨겠지만 강의 코드에서 df["Symbol"] 부분을 전부 df['Code']로 바꾸시면 코드 잘 돌아갑니다. 아래 코드는 바꾼 코드입니다 # !pip install -U finance-datare.. 2022. 5. 18.
[pandas] 판다스로 하는 웹크롤링(crawling) 판다스로 웹크롤링을 해보는 강의입니다 표데이터는 정말 쉽게 가져올수있어요 크롤링에 쓰인 웹페이지 주소 링크입니다 https://sports.news.naver.com/kbaseball/record/index?category=kbo&year=2021 네이버 스포츠 스포츠의 시작과 끝! sports.news.naver.com 전체코드입니다 import pandas as pd #공통인 url부분을 변수로 선언 url = "https://sports.news.naver.com/kbaseball/record/index?category=kbo&year=" df = pd.DataFrame([]) # for문의 결과물을 담을 빈데이터프레임 for i in range(2015, 2022): # 2015 이상 2022 미.. 2022. 2. 23.
[pandas] #02 iloc 인덱싱 loc인덱싱은 판다스에서 데이터프레임을 인덱싱과 슬라이싱하는 방법입니다 파이썬의 리스트에서 list[0] 혹은 list[1:5] 와 같이 인덱싱과 슬라이싱을 하는데 마찬가지로 데이터프레임도 인덱싱과 슬라이싱을 할수 있는겁니다 loc 인덱싱은 레이블로 인덱싱을 했는데 데이터 프레임도 리스트처럼 위치(인덱스의 숫자)로 인덱싱을 할수있는데 그게 바로 iloc인덱싱입니다 먼저 데이터프레임의 위치를 넘버링 하는 방식은 다음과 같습니다 행은 위에서부터 0부터 넘버링이 되고 열은 왼쪽열부터 0부터 넘버링이 됩니다 데이터프레임은 2차원이기때문에 인덱싱할때 [ , ] 대괄호안에 콤마로 구분해서 각각의 차원의 인덱싱을 2차원 평면의 (x, y) 좌표처럼 설정합니다 df.iloc[행위치(숫자), 열위치(숫자)] loc 인덱.. 2022. 2. 19.