apply2 [pandas] 범주형 데이터를 정수로 코드화하는 다양한 방법 판다스에서 범주형 데이터를 정수로 코드화하는 다양한 방법데이터 분석에서 범주형 데이터를 정수로 변환하면 데이터를 더 효율적으로 처리할 수 있습니다. 예를 들어, '사과', '바나나', '포도'와 같은 상품명을 각각 0, 1, 2로 매핑하는 것을 말합니다. 이해를 돕기 위해 간단한 예시를 살펴보겠습니다. 예시 데이터 생성 범주형 데이터를 정수로 변환하는 것은 대규모 데이터 처리에서 자주 필요한 작업이므로, 예시에서도 10,000행의 데이터를 생성합니다. 여러분도 아래 코드를 실행하면 동일한 10,000행의 데이터를 얻을 수 있습니다.import pandas as pdimport numpy as nppd.options.display.max_rows = 6 # 6행까지만 출력np.random.seed(1)go.. 2023. 5. 27. [pandas] 시리즈에 apply 대신 map 함수로 매핑하는 이유 시리즈에 apply 대신 map 함수로 매핑하는 이유apply 함수와 map 함수의 가장 큰 차이는 데이터 프레임에 적용할 수 있는지 여부입니다. apply 함수는 데이터 프레임과 시리즈 모두에 사용할 수 있는 반면, map 함수는 시리즈에만 사용할 수 있습니다. (map 함수는 인덱스 클래스에는 적용 가능합니다.) 시리즈에 매핑을 수행할 때는 apply와 map 함수를 모두 사용할 수 있지만, 일반적으로 map 함수를 더 자주 사용합니다. 그렇다면 왜 범용성이 높은 apply를 두고 굳이 map 함수로 매핑을 하는 것일까요? 결론부터 말하자면 apply 함수는 함수로만 매핑이 가능하지만, map 함수는 apply와는 달리 함수뿐만 아니라 매퍼(mapper), 즉 딕셔너리와 같은 구조체도 사용할 수 있.. 2023. 5. 27. 이전 1 다음