본문 바로가기

판다스/중급 판다스11

[pandas] 영업일(business day)을 배열로 생성하는 방법 판다스에서 영업일(business day)을 배열로 생성하는 방법주말을 제외해 영업일 가져오기 판다스에서는 date_range 함수를 통해 날짜 배열을 얻을 수 있으며, 주기(freq)를 'B'로 지정하면 토요일과 일요일을 제외한 영업일을 얻을 수 있습니다. 다음 코드를 통해 2023-08-10부터 5개의 영업일을 추출해 보겠습니다.import pandas as pdpd.date_range('2023-08-10', periods=5, freq='B')DatetimeIndex(['2023-08-10', '2023-08-11', '2023-08-14', '2023-08-15', '2023-08-16'], dtype='datetime64[ns]', freq='B')  지정한 공휴일을 제.. 2023. 8. 28.
[pandas] 멀티 인덱스에서 특정 값 수정하기 판다스 멀티 인덱스에서 특정 값 수정하기이번 글에서는 판다스에서 멀티 인덱스 값을 일부 변경하는 다양한 방법을 다루겠습니다. 단계별로 예시를 통해 설명할 예정이니, 먼저 아래의 코드를 통해 예시 데이터프레임을 생성해 주세요.import pandas as pddata1 = {('A팀', '삼성전자'): [10, 20, 30, 30, 30], ('A팀', '카카오'): [20, 20, 40, 40, 40], ('B팀', '삼성전자'): [30, 30, 10, 10, 30], ('B팀', '카카오'): [40, 40, 20, 20, 40], ('C팀', '삼성전자'): [50, 50, 50, 50, 30], ('C팀', '카카오'.. 2023. 8. 23.
[pandas] 범주형 데이터를 정수로 코드화하는 다양한 방법 판다스에서 범주형 데이터를 정수로 코드화하는 다양한 방법데이터 분석에서 범주형 데이터를 정수로 변환하면 데이터를 더 효율적으로 처리할 수 있습니다. 예를 들어, '사과', '바나나', '포도'와 같은 상품명을 각각 0, 1, 2로 매핑하는 것을 말합니다. 이해를 돕기 위해 간단한 예시를 살펴보겠습니다. 예시 데이터 생성 범주형 데이터를 정수로 변환하는 것은 대규모 데이터 처리에서 자주 필요한 작업이므로, 예시에서도 10,000행의 데이터를 생성합니다. 여러분도 아래 코드를 실행하면 동일한 10,000행의 데이터를 얻을 수 있습니다.import pandas as pdimport numpy as nppd.options.display.max_rows = 6 # 6행까지만 출력np.random.seed(1)go.. 2023. 5. 27.
[pandas] 시리즈에 apply 대신 map 함수로 매핑하는 이유 시리즈에 apply 대신 map 함수로 매핑하는 이유apply 함수와 map 함수의 가장 큰 차이는 데이터 프레임에 적용할 수 있는지 여부입니다. apply 함수는 데이터 프레임과 시리즈 모두에 사용할 수 있는 반면, map 함수는 시리즈에만 사용할 수 있습니다. (map 함수는 인덱스 클래스에는 적용 가능합니다.) 시리즈에 매핑을 수행할 때는 apply와 map 함수를 모두 사용할 수 있지만, 일반적으로 map 함수를 더 자주 사용합니다. 그렇다면 왜 범용성이 높은 apply를 두고 굳이 map 함수로 매핑을 하는 것일까요?  결론부터 말하자면 apply 함수는 함수로만 매핑이 가능하지만, map 함수는 apply와는 달리 함수뿐만 아니라 매퍼(mapper), 즉 딕셔너리와 같은 구조체도 사용할 수 있.. 2023. 5. 27.
[pandas] 숫자로 바꿀 때 to_numeric과 astype의 차이 판다스에서 수치형 데이터로 변환할 때 to_numeric과 astype의 차이데이터 분석에서 수치형 데이터는 중요한 역할을 차지합니다. 특히 판다스 라이브러리는 연산과 처리에 강점을 발휘하며, 이를 위해 비 수치형 데이터를 수치형으로 변환하는 작업은 데이터 정제 과정에서 자주 요구됩니다. 판다스는 이러한 변환을 위해 두 가지 함수를 제공합니다. astype과 to_numeric입니다.이 두 함수는 겉보기에는 비슷한 기능을 수행하는 것처럼 보이지만, 실제로는 각기 다른 목적과 용도를 지니고 있습니다. astype 함수는 대부분의 자료형으로 변환을 지원하는 범용성을 갖추고 있고 수치형으로도 변환이 가능하지만, 모든 데이터가 해당 형식으로 변환할 수 있어야만 올바르게 작동합니다. 반면, to_numeric 함.. 2022. 6. 13.