csv 파일에서 따옴표 안의 comma(,)는 seperator로 적용하고 싶지 않을 때
예
Issue,Content
Test,"A, B"
Test,"A, B, C"
위와 같은 csv 파일이 있을 때 Test 다음의 콤마(,)는 seperator로 적용하고 싶지만 "A,B"의 콤마는 seperator로 적용하고 싶지 않아서 따옴표(")에 묶여있다. 이때는 read_csv 함수의 quotechar인자를 사용하면 된다
예제코드
import io
csvs = '''
Issue,Content
Test,"A, B"
Test,"A, B, C"
'''
url = io.StringIO(csvs)
csv 파일로 실습해야 하지만 문자열을 csv 파일처럼 읽게 해주는 StringIO 함수를 사용해서 마치 csv 파일의 url과 같은 변수 url을 만들자
다음으로 read_csv 함수의 quotechar인자를 사용하면 된다. 큰 따옴표(") 안을 인용구로 처리할 것이므로 quotechar='"' 라고 입력하면 된다
import pandas as pd
df = pd.read_csv(url, quotechar='"')
df
Content열의 따옴표 속에 있던 콤마(,)는 seperator로 열을 분리하는게 아니라 내용속에 존재하게 되었다
유튜브에서 판다스 강의 중입니다
https://www.youtube.com/@KimPandas
'판다스 > 판다스 팁' 카테고리의 다른 글
[pandas] GitHub의 csv파일을 바로 데이터 프레임으로 불러오기 (0) | 2023.11.13 |
---|---|
[pandas] read_csv 함수로 데이터 프레임 부를 때 파일의 encoding 방식 알아내기 (0) | 2023.11.11 |
[pandas] 날짜(timestamp)에서 특정 기간이 흐른 뒤의 날짜를 반환하는 방법 (0) | 2023.09.05 |
집계 결과를 열로 만드는 방법 (0) | 2023.08.30 |
Timedelta 자료형을 실수(float)로 바꾸는 방법 (0) | 2023.08.30 |