github에 올려진 csv파일을 별도의 다운로드 없이 바로 데이터프레임으로 불러 오는 방법을 알려 드리겠습니다
1. 먼저 github에서 불러올 파일을 클릭합니다
저와 똑같은 github로 실습할 분들을 위한 github 링크 : https://github.com/panda-kim/csv
2. 다음으로 해당 파일의 주소를 복사합니다
3. pandas를 import하고 해당 주소를 파이썬 개발 환경에 따옴표와 함께 붙여 넣습니다
본 실습은 주피터 노트북을 사용했습니다
import pandas as pd
'https://github.com/panda-kim/csv/blob/main/git_csv.csv'
4. 해당 주소의 끝에 ?raw=true 를 추가하고 변수 url로 지정한 뒤 read_csv 함수로 불러오면 끝입니다
import pandas as pd
url = 'https://github.com/panda-kim/csv/blob/main/git_csv.csv' + '?raw=true'
df = pd.read_csv(url)
완성입니다.
데이터 프레임을 무사히 불러 왔습니다
참고
저는 여러분이 알아보기 좋게 편의상 문자열로 '?raw=true'을 만들어 두개의 문자열을 더해 주었지만, 여러분은 주소 뒷부분에 ?raw=true 을 추가하셔도 괜찮습니다
import pandas as pd
url = 'https://github.com/panda-kim/csv/blob/main/git_csv.csv?raw=true'
df = pd.read_csv(url)
마찬가지로 무사히 데이터 프레임을 불러오는 결과를 얻을 수 있습니다
유튜브에서 판다스 강의 중입니다
https://www.youtube.com/@KimPandas
'판다스 > 판다스 팁' 카테고리의 다른 글
pandas 에서 plotly 기반으로 그래프를 그리는 방법 (0) | 2023.12.22 |
---|---|
[pandas] 데이터 프레임을 가로로 정렬하는 방법 (0) | 2023.11.15 |
[pandas] read_csv 함수로 데이터 프레임 부를 때 파일의 encoding 방식 알아내기 (0) | 2023.11.11 |
[pandas] csv 파일에서 따옴표 안의 콤마(,)는 seperator로 적용하고 싶지 않을 때 (0) | 2023.09.05 |
[pandas] 날짜(timestamp)에서 특정 기간이 흐른 뒤의 날짜를 반환하는 방법 (0) | 2023.09.05 |