본문 바로가기

전체 글242

[pandas] date_range date_range고정된 주기를 가진 datetime 자료형 배열(DatetimeIndex)를 생성한다.   pd.date_range(start=None, end=None, periods=None, freq='D') - start : 시작 시점을 지정한다. start, end, period 셋 중에 둘만 지정해도 된다.- end : 끝 시점을 지정한다.- period : 생성할 배열의 개수를 지정한다. - freq : 배열에 적용될 고정된 주기를 지정한다.    예시) import pandas as pd# 2025-01-03부터 2025-01-14까지 모든 날짜를 배열로 생성하기pd.date_range('2025-01-03', '2025-01-14') DatetimeIndex(['2025-01-03', .. 2024. 2. 29.
[pandas] NaN이 포함된 열에서 정수를 유지하는 방법 판다스 NaN이 포함된 열에서 정수를 유지하는 방법 데이터 분석 과정에서, NaN 값을 포함한 열은 dtype이 실수(float)로 변환됩니다. 그 결과, 정수로 입력된 값이 실수 형태로 변환되어 표현됩니다. 예제:import pandas as pds = pd.Series([1, 2, 3, float('nan')]) s:0 1.0   NaN 값을 포함하는 열은 자동으로 실수형으로 변환되기 때문에, 정수를 유지할 수 없습니다. 일반적으로 NaN은 결측값을 의미하기에 반드시 NaN을 사용할 필요는 없습니다. NaN 대신 다른 null 값을 사용하면 정수를 유지할 수 있습니다. 판다스에서 제공하는 Int64 자료형을 사용하면 가능합니다. s.astype('Int64') out:0 11 .. 2024. 2. 27.
[pandas] 문자열에서 정규 표현식으로 그룹을 활용하는 방법 예제 import pandas as pd data1 = ['Home: 롯데, Away: 한화', 'Home: 삼성, Away: 기아'] s = pd.Series(data1) s 0 Home: 롯데, Away: 한화 1 Home: 삼성, Away: 기아 dtype: object 홈팀과 어웨이팀을 맞교환하자. 다양한 방법이 있겠지만, 정규 표현식으로 그룹을 나눠 해당 그룹을 맞바꾼 결과로 해결할 수 있다. 문자열 대체를 위해 str.replace 함수를 정규 표현식으로 사용하자. df['팀'].str.replace(r'Home: (.+), Away: (.+)', r'Home: \2, Away: \1', regex=True) out: 0 Home: 한화, Away: 롯데 1 Home: 기아, Away: 삼성 .. 2024. 2. 27.
[pandas] 판다스의 KeyError 강의 (2) 판다스의 KeyError는 99%의 경우 데이터 프레임에 해당 열이 없기 때문에 발생합니다.그리고 이 글을 읽는 여러분도 99%에 해당할 것입니다.그래서 이 시리즈를 다 읽으시면 대부분은 본인의 에러를 해결하실 수 있을 겁니다.    판다스의 KeyError 시리즈 판다스의 KeyError (1) : KeyError 기본편판다스의 KeyError (2) : 판다스의 코드를 chain method로 사용할 때의 KeyError ← 이번 포스팅   1편에서 마법의 주문 print(df.columns) 코드로 대부분의 KeyError를 해결하셨을 테지만, chain method를 사용했을 때는 위 방식으로 확인은 어렵습니다. 2편에서는 chain method로 코드를 사용할 때 확인하는 방법을 알려 드리겠습니.. 2024. 2. 23.
[pandas] groupby + transform 주로 집계 결과로 시리즈를 생성하는 함수. groupby 함수에 사용자 정의 함수를 적용해 열을 생성할 때도 쓰인다. 예제: import pandas as pd data = {'제품': ['A', 'A', 'B', 'B', 'C', 'A'], '판매량': [10, 20, 20, 30, 10, 60]} df = pd.DataFrame(data) df.groupby('제품')['판매량'].transform('sum') 2024. 2. 22.
[pandas] AttributeError 강의 (3) - 함수에서 발생한 경우 대부분의 AttributeError는 에러 메세지만 읽을 줄 알면 해결이 됩니다.  판다스에서 발생하는 AttributeError는 크게 세 가지 종류가 있습니다. 1. 모듈(module)에서 발생한 경우2. 객체(object)에서 발생하는 경우3. 함수(function)에서 발생하는 경우     ← 이번 포스팅 세 종류의 에러는 에러 메세지로 구분할 수 있습니다.  이번 포스팅은 객체 중 함수에서 AttributeError가 발생한 경우입니다.  예시 에러가 발생하는 코드의 예시를 볼게요# 실습 예제 코드import pandas as pddata = {'제품': ['A', 'B', 'B', 'A', 'C', 'A'], '판매량': [10, 20, 30, 40, 50, 60]}df = pd.. 2024. 2. 21.