본문 바로가기
판다스/판다스 팁

[pandas] csv 파일에서 따옴표 안의 콤마(,)는 seperator로 적용하고 싶지 않을 때

by 김판다t 2023. 9. 5.

csv 파일에서 따옴표 안의 comma(,)는 seperator로 적용하고 싶지 않을 때

 

 

 

Issue,Content
Test,"A, B"
Test,"A, B, C"

 

위와 같은 csv 파일이 있을 때 Test 다음의 콤마(,)는 seperator로 적용하고 싶지만 "A,B"의 콤마는 seperator로 적용하고 싶지 않아서 따옴표(")에 묶여있다. 이때는 read_csv 함수의 quotechar인자를 사용하면 된다

 

 

예제코드

import io
csvs = '''
Issue,Content
Test,"A, B"
Test,"A, B, C"
'''
url = io.StringIO(csvs)

 

csv 파일로 실습해야 하지만 문자열을 csv 파일처럼 읽게 해주는 StringIO 함수를 사용해서 마치 csv 파일의 url과 같은 변수 url을 만들자

 

 

 

 다음으로 read_csv 함수의 quotechar인자를 사용하면 된다. 큰 따옴표(") 안을 인용구로 처리할 것이므로 quotechar='"' 라고 입력하면 된다

 

 

import pandas as pd
df = pd.read_csv(url, quotechar='"')

 

df

 

 

 

 

Content열의 따옴표 속에 있던 콤마(,)는 seperator로 열을 분리하는게 아니라 내용속에 존재하게 되었다

 

 

 

 

 

 

 

유튜브에서 판다스 강의 중입니다

 

https://www.youtube.com/@KimPandas