본문 바로가기

『파이썬의 엑셀, 판다스 라이브러리』 출판 소식 바로가기

전체 글263

매개변수(parameter)와 인수(argument)의 차이 코딩의 함수에는 매개변수(parameter)와 인수(argument)가 있습니다. 매개변수(parameter)와 인수(argument) 도대체 매개변수 (parameter)와 인수(argument)는 무엇일까요?매개변수와 인수에 대한 개념이 정립되지 않았다는 것은 아직 코딩의 입문자라는 이야기라서코딩의 함수가 아닌 여러분에게 조금이라도 친숙한 수학의 함수를 살펴 보겠습니다. 다음과 같은 수학 문제가 있습니다.f(x, y) : 2x + y 일 때 f(2,1)의 값은? 여러분은 어렵지 않게 이 문제를 풀어낼 수 있을 것입니다.x자리에 2를 넣고 y 자리에 1을 넣어서 5라는 정답을 도출할 것입니다.이 때 함수에 값을 입력받기 위해 만들어 둔 x와 y가 매개변수(parameter)이며 실제 매개변수에 입력.. 2023. 5. 28.

[pandas] 그룹별로 가장 가까운 값을 기준으로 NaN을 채우기 Example Code import pandas as pd data = {'code': [1, 1, 2, 2, 2, 2, 3], 'year': [2000, 2001, 2000, 2001, 2002, 2003, 2000], 'val': [1.6, None, 1.4, None, None, 1.7, 0.1]} df = pd.DataFrame(data) df: Problem code열의 값을 그룹화해서 가장 가까운 값을 기준으로 df의 NaN을 채우고 싶다. 거리에 따라 전방 혹은 후방값으로 채울지가 정해지기에 단순히 전방값 혹은 후방값으로 NaN을 채우는 ffill, bfill 로는 수행이 불가능하다 Code interpolate 함수를 nearest method로 적용하면 된다. code열로 그룹화해서 적용.. 2023. 5. 27.

[pandas] 범주형 데이터를 정수로 코드화하는 다양한 방법 판다스에서 범주형 데이터를 정수로 코드화하는 다양한 방법데이터 분석에서 범주형 데이터를 정수로 변환하면 데이터를 더 효율적으로 처리할 수 있습니다. 예를 들어, '사과', '바나나', '포도'와 같은 상품명을 각각 0, 1, 2로 매핑하는 것을 말합니다. 이해를 돕기 위해 간단한 예시를 살펴보겠습니다. 예시 데이터 생성 범주형 데이터를 정수로 변환하는 것은 대규모 데이터 처리에서 자주 필요한 작업이므로, 예시에서도 10,000행의 데이터를 생성합니다. 여러분도 아래 코드를 실행하면 동일한 10,000행의 데이터를 얻을 수 있습니다.import pandas as pdimport numpy as nppd.options.display.max_rows = 6 # 6행까지만 출력np.random.seed(1)go.. 2023. 5. 27.

[pandas] 시리즈에 apply 대신 map 함수로 매핑하는 이유 시리즈에 apply 대신 map 함수로 매핑하는 이유apply 함수와 map 함수의 가장 큰 차이는 데이터 프레임에 적용할 수 있는지 여부입니다. apply 함수는 데이터 프레임과 시리즈 모두에 사용할 수 있는 반면, map 함수는 시리즈에만 사용할 수 있습니다. (map 함수는 인덱스 클래스에는 적용 가능합니다.) 시리즈에 매핑을 수행할 때는 apply와 map 함수를 모두 사용할 수 있지만, 일반적으로 map 함수를 더 자주 사용합니다. 그렇다면 왜 범용성이 높은 apply를 두고 굳이 map 함수로 매핑을 하는 것일까요? 결론부터 말하자면 apply 함수는 함수로만 매핑이 가능하지만, map 함수는 apply와는 달리 함수뿐만 아니라 매퍼(mapper), 즉 딕셔너리와 같은 구조체도 사용할 수 있.. 2023. 5. 27.

[pandas] 데이터 프레임에서 큰 숫자를 가독성 좋게 표기하기 판다스의 데이터 프레임에서 큰 숫자의 가독성을 개선하는 방법데이터 분석을 하다 보면 대규모 데이터셋에서 큰 숫자를 다루게 되는 경우가 많습니다. 특히, 숫자가 크면 클수록 값을 직관적으로 이해하기 어려워지기에, 가독성을 높이는 것이 중요합니다. 이번 글에서는 데이터 프레임에서 큰 숫자를 좀 더 가독성 좋게 표기하는 방법을 알아보고자 합니다. Example Code import pandas as pddata = {'일련번호':[2101, 2102, 2103], '금액':[123000000, 456000000, 1230000000]}df = pd.DataFrame(data) df Problem예시 데이터 프레임은 금액 열에 큰 숫자가 포함되어 있어 가독성이 떨어집니다.이를 개선하기 위해 금액 .. 2023. 5. 26.

[pandas] 데이터 프레임에서 퍼센트(%)로 수치를 표기하는 방법 Example Code import pandas as pddata = {'종가': {0: 1000, 1: 1200, 2: 1300, 3: 1100}, '등락률': {0: 0.1, 1: 0.2, 2: 0.0833, 3: -0.1538}}df = pd.DataFrame(data)df df : Problem 아래 그림처럼 위 데이터 프레임에서 등락률을 소수점 아래 두자리만 표기하는 %로 나타내고자 한다 어떻게 해야 할까? 해결방법1 등락률의 데이터를 100을 곱한 뒤 : mul(100)소수점 셋째 자리에서 반올림을 하고 : round(2)문자열로 바꾸고 : astype('str')%를 붙여주면 된다. df['등락률'].mul(100).round(2).astype('str') + '%' 0 .. 2023. 5. 26.

이전 1 ··· 27 28 29 30 31 32 33 ··· 44 다음

티스토리툴바