본문 바로가기

판다스/판다스에 유용한 넘파이 함수들5

[numpy] np.sort 함수로 행이나 열의 개별적 정렬 넘파이의 np.sort 함수를 사용해 행이나 열을 개별적으로 정렬하기판다스의 sort_values 함수로 특정 열을 기준으로 정렬할 수 있지만, 행이나 열을 개별적으로 정렬하려면 넘파이의 np.sort 함수를 사용하는 것이 더 편리합니다. 이해를 돕기 위해 간단한 예시를 살펴보겠습니다. 예시 다음 예시 데이터 프레임은 각 학생의 선택 과목을 포함하고 있습니다.import pandas as pdimport numpy as np# 예시 데이터 프레임 생성data = {'선택1': ['물리', '화학', '물리', '화학', '물리'], '선택2': ['화학', '물리', '화학', '생물', '지학'], '선택3': ['지학', '지학', '생물', '역사', '화학']}df =.. 2024. 10. 26.
[numpy] np.fmax와 np.fmin 함수를 이용해 배열 비교 넘파이의 np.fmax와 np.fmin 함수를 이용해 배열 비교 넘파이의 np.fmax와 np.fmin 함수는 두 배열을 비교하여 각 위치에서 더 큰 값이나 더 작은 값을 반환하는 유용한 함수입니다. 물론 불리언 마스킹으로도 구현할 수 있지만, 불리언 마스킹에 비해 더 간결한 코드로 수행할 수 있습니다. 이해를 돕기 위해 간단한 예시를 살펴보겠습니다. 예시import pandas as pd# 예시 데이터 프레임 생성data = {'반': ['A', 'B', 'B', 'A', 'A'], '국어': [81, 96, 83, 66, 84], '영어': [54, 42, 31, 68, 69]}df = pd.DataFrame(data) 예시 데이터 프레임 df에서 영어 점수에 30점을 가.. 2024. 10. 26.
[numpy] np.select 함수로 불리언 마스킹 np.select 함수를 이용해 조건에 따라 값 부여하기 np.select 함수와 불리언 마스킹 불리언 마스킹(Boolean Masking)은 조건에 따라 특정 값을 부여하는 작업을 의미합니다. 판다스에서는 불리언 마스킹을 위해 다양한 기법을 제공하며, 일반적으로 mask, np.where 함수가 자주 사용됩니다. 이와 함께 넘파이의 np.select 함수 역시 여러 조건을 기반으로 다양한 값을 부여할 때 매우 유용한 함수로 활용할 수 있습니다. 예시 이해를 돕기 위해 간단한 예시를 살펴보겠습니다.import pandas as pd# 예시 데이터 프레임 생성data = {'국어': {'가': 86, '나': 79, '다': 93, '라': 80}, '영어': {'가': 90, '나': 10.. 2024. 10. 26.
[numpy] np.where 함수로 불리언 마스킹 np.where 함수를 이용해 조건에 따라 값 부여하기 np.where 함수와 불리언 마스킹 불리언 마스킹(Boolean Masking)은 조건에 따라 값을 부여하는 작업을 의미합니다. 넘파이의 np.where 함수는 불리언 마스킹 작업에 있어 유용한 함수입니다. 판다스는 넘파이를 기반으로 개발되었기에 판다스 객체에서도 넘파이 함수 대부분을 사용할 수 있으며, 특히 np.where 함수는 판다스의 불리언 마스킹에 자주 사용됩니다. 판다스에서 불리언 마스킹을 수행하는 함수는 mask나 where 등이 있습니다. 그러나 이 함수들은 True인 경우와 False인 경우의 값을 각각 별도로 설정해야 합니다. 반면 np.where 함수는 단 한 번의 설정으로 True일 때의 값과 False일 때의 값을 동시에 부.. 2024. 10. 26.
[numpy] 난수 생성 함수 넘파이의 난수 생성 함수 데이터 분석 및 처리 과정에서 랜덤 샘플 데이터를 생성하는 것은 유용한 기법입니다. 특히 판다스(Pandas)와 넘파이(Numpy)를 결합하면 다양한 방식으로 난수를 생성하여 데이터 프레임을 쉽게 구성할 수 있습니다. 초심자는 샘플을 만들어서 코드를 점검하지 않기 때문에, 이 함수들의 가치를 알기 어렵지만 여러분의 코딩이 성장하면 가치를 알게 됩니다. 넘파이의 난수 생성 함수 넘파이는 다양한 난수 생성 함수를 제공하며, 이를 활용하면 특정 분포에 따라 난수 배열을 만들 수 있습니다. 판다스 데이터 프레임을 생성할 때 자주 사용되는 주요 함수는 다음과 같습니다. 참고로 아래 함수들은 모두 np.random으로 시작합니다. rand: 0부터 1 사이의 균일 분포를 따르는 난수를 생성.. 2024. 10. 26.