본문 바로가기

전체 글263

[pandas] 판다스의 KeyError 강의 (2) 판다스의 KeyError는 99%의 경우 데이터 프레임에 해당 열이 없기 때문에 발생합니다.그리고 이 글을 읽는 여러분도 99%에 해당할 것입니다.그래서 이 시리즈를 다 읽으시면 대부분은 본인의 에러를 해결하실 수 있을 겁니다.    판다스의 KeyError 시리즈 판다스의 KeyError (1) : KeyError 기본편판다스의 KeyError (2) : 판다스의 코드를 chain method로 사용할 때의 KeyError ← 이번 포스팅   1편에서 마법의 주문 print(df.columns) 코드로 대부분의 KeyError를 해결하셨을 테지만, chain method를 사용했을 때는 위 방식으로 확인은 어렵습니다. 2편에서는 chain method로 코드를 사용할 때 확인하는 방법을 알려 드리겠습니.. 2024. 2. 23.
[pandas] groupby + transform 주로 집계 결과로 시리즈를 생성하는 함수. groupby 함수에 사용자 정의 함수를 적용해 열을 생성할 때도 쓰인다. 예제: import pandas as pd data = {'제품': ['A', 'A', 'B', 'B', 'C', 'A'], '판매량': [10, 20, 20, 30, 10, 60]} df = pd.DataFrame(data) df.groupby('제품')['판매량'].transform('sum') 2024. 2. 22.
[pandas] AttributeError 강의 (3) - 함수에서 발생한 경우 대부분의 AttributeError는 에러 메세지만 읽을 줄 알면 해결이 됩니다.  판다스에서 발생하는 AttributeError는 크게 세 가지 종류가 있습니다. 1. 모듈(module)에서 발생한 경우2. 객체(object)에서 발생하는 경우3. 함수(function)에서 발생하는 경우     ← 이번 포스팅 세 종류의 에러는 에러 메세지로 구분할 수 있습니다.  이번 포스팅은 객체 중 함수에서 AttributeError가 발생한 경우입니다.  예시 에러가 발생하는 코드의 예시를 볼게요# 실습 예제 코드import pandas as pddata = {'제품': ['A', 'B', 'B', 'A', 'C', 'A'], '판매량': [10, 20, 30, 40, 50, 60]}df = pd.. 2024. 2. 21.
[pandas] 각 열을 고윳값의 순서대로 정렬하기 예제: import pandas as pd data = { '지점': ['양재점', '관악점', '서초점', '관악점', '서초점', '양재점', '서초점', '양재점', '관악점'], '제품': ['콜라', '환타', '환타', '사이다', '콜라', '환타', '사이다', '사이다', '콜라'], '매출': [5000, 3000, 7000, 2000, 9000, 6000, 8000, 4000, 1000] } df = pd.DataFrame(data) df의 지점 열의 고윳값의 순서인 양재점-> 관악점-> 서초점 순서로 정렬하고 지점 안에서 제품을 정렬할 때도 제품 열의 고윳값 순서인 콜라-> 환타-> 사이다 순으로 정렬합니다 # 카테고리 자료형을 활용해 정렬합니다. out = df.sort_value.. 2024. 2. 20.
[pandas] 그룹내에서 정렬하기 예제: import numpy as np import pandas as pd data1 = {'지점' : ['관악점', '관악점', '관악점', '양재점', '양재점', '양재점', '서초점', '서초점', '서초점'], '제품' : ['콜라', '사이다', '환타', '사이다', '콜라', '환타', '환타', '사이다', '콜라'], '매출' : np.arange(1, 10) * 1000} df = pd.DataFrame(data1) 지점의 정렬상태는 그대로 두고 제품만 콜라-> 사이다 -> 환타 순으로 정렬해 보겠습니다. Category 데이터를 활용해 정렬 순서를 정할 수 있습니다. # 정렬 순서 정하기 order = df['지점'].unique().tolist() + ['콜라', '사이다', '.. 2024. 2. 20.
[pandas] 멀티 인덱스의 각 레벨의 유일 값 찾기 예제. import pandas as pddata1 = {('김판다', '영어'): [50, 20, 35], ('김판다', '국어'): [60, 5, 45], ('강승주', '영어'): [70, 10, 60], ('강승주', '국어'): [100, 30, 50]}df = pd.DataFrame(data1)  df:     columns의 첫 번째 레벨의 값을 반환해 보자. df.columns.unique(0)  Index(['김판다', '강승주'], dtype='object')  김판다, 강승주 두 유일 값을 반환한다. 판다스 책이 출판되었습니다. 교보문고 구매 페이지, 알라딘 구매 페이지, yes24 구매 페이지 2024. 2. 20.