판다스/판다스 팁
[pandas] GitHub의 csv파일을 바로 데이터 프레임으로 불러오기
김판다t
2023. 11. 13. 10:45
github에 올려진 csv파일을 별도의 다운로드 없이 바로 데이터프레임으로 불러 오는 방법을 알려 드리겠습니다
1. 먼저 github에서 불러올 파일을 클릭합니다
저와 똑같은 github로 실습할 분들을 위한 github 링크 : https://github.com/panda-kim/csv
2. 다음으로 해당 파일의 주소를 복사합니다
3. pandas를 import하고 해당 주소를 파이썬 개발 환경에 따옴표와 함께 붙여 넣습니다
본 실습은 주피터 노트북을 사용했습니다
import pandas as pd
'https://github.com/panda-kim/csv/blob/main/git_csv.csv'
4. 해당 주소의 끝에 ?raw=true 를 추가하고 변수 url로 지정한 뒤 read_csv 함수로 불러오면 끝입니다
import pandas as pd
url = 'https://github.com/panda-kim/csv/blob/main/git_csv.csv' + '?raw=true'
df = pd.read_csv(url)
완성입니다.
데이터 프레임을 무사히 불러 왔습니다
참고
저는 여러분이 알아보기 좋게 편의상 문자열로 '?raw=true'을 만들어 두개의 문자열을 더해 주었지만, 여러분은 주소 뒷부분에 ?raw=true 을 추가하셔도 괜찮습니다
import pandas as pd
url = 'https://github.com/panda-kim/csv/blob/main/git_csv.csv?raw=true'
df = pd.read_csv(url)
마찬가지로 무사히 데이터 프레임을 불러오는 결과를 얻을 수 있습니다
유튜브에서 판다스 강의 중입니다
https://www.youtube.com/@KimPandas