본문 바로가기

판다스168

[pandas] 특정 대상만 끌어 올려 정렬하기 예제 import pandas as pddata1 = {'col1': pd.Index(['B', 'C', 'A', 'E', 'D']).repeat([2, 3, 1, 1, 1]), 'col2': [5, 0, 3, 3, 7, 9, 3, 5]}df = pd.DataFrame(data1)  df:   정렬 예제  D를 가장 위에 올리고 E를 다음으로 올리고 나머지는 알파벳 순서로 정렬하라        sort_values 함수의 매개변수 key를 사용해 정렬을 수행합니다. # 정렬 대상order = {'D': 0, 'E': 1}# sort_values의 매개변수 key로 정렬out = df.sort_values( by="col1", key=lambda x: [(order.get(i,.. 2024. 3. 28.
[pandas] 정해진 임의 순서로 정렬 하기 예제 import pandas as pd data1 = { '지점': ['서초점', '서초점', '양재점', '양재점', '서초점', '양재점'], '제품': ['환타', '콜라', '콜라', '사이다', '사이다', '콜라'], '매출': [7000, 9000, 5000, 1000, 2000, 4000] } df = pd.DataFrame(data1) 정렬 문제 1. 지점을 서초→양재 순으로 먼저 정렬하고 2. 제품은 콜라→환타→사이다 순으로 정렬하고 3. 지점과 제품이 동일할 때는 매출이 적은 순서로 정렬하라 먼저 지점과 제품의 정렬 순서로 카테고리를 생성하는 코드를 만들어 지점과 제품 열에만 적용하면 됩니다. # 정렬 순서 order = ['서초점', '양재점', '콜라', '환타', '사이다'] .. 2024. 3. 28.
[pandsa] NaN 위치에 데이터를 끌어 올리는 방법 예제 import pandas as pd data = {'반': ['A', 'A', 'A', 'B', 'B', 'B'], '점수': [91, 90, 80, 90, 80, 70], '국어': ['김판다', float('nan'), float('nan'), '최진환', float('nan'), float('nan')], '영어': [float('nan'), '조민영', '안지선', float('nan'), '박연준', '권보아'], '수학': [float('nan'), float('nan'), '강승주', float('nan'), float('nan'), '임재범']} df = pd.DataFrame(data) NaN 위치에 데이터를 끌어 올려 다음과 같은 데이터를 만들어 보자. 이럴 때 transform .. 2024. 3. 19.
[pandas] datetime을 연도와 쿼터를 표기하는 문자열로 변환하고 싶을 때 datetime을 연도와 쿼터를 표기하는 문자열로 변환하고 싶을 때 예제 import pandas as pd df = pd.DataFrame(['2022-01-03', '2023-05-04'], columns=['date']) df['date'] = pd.to_datetime(df['date']) 쿼터를 의미하는 strftime의 %q 지시자는 datetime 자료형을 대상으로 사용할 수 없다. 해결1 to_period 함수로 period 자료형으로 변환하면 연도와 쿼터의 조합으로 표기된다. 문자열로 만들려면 결과에 astype 함수를 적용해 문자열로 변환하자 df['date'].dt.to_period('Q').astype('str') 0 2022Q1 1 2023Q2 Name: date, dtype: o.. 2024. 3. 18.
[pandas] wide_to_long 판다스 wide_to_long 가로 형식(wide) 데이터 프레임을 세로 형식(long)으로 변환하는 함수. 예제 import pandas as pd data = {'이름': ['김판다', '강승주', '조민영'], '가형_국어': [60, 69, 83], '나형_국어': [63, 79, 66], '가형_영어': [63, 81, 84], '나형_영어': [99, 96, 84]} df = pd.DataFrame(data) pd.wide_to_long( df, i='이름', stubnames=['가형', '나형'], j='과목', sep='_', suffix=r'.+' ) wide_to_long 함수의 주요 매개변수(parameter)와 인수(argument), 기본값(default) pd.wide_to_l.. 2024. 3. 15.
[pandas] date_range date_range고정된 주기를 가진 datetime 자료형 배열(DatetimeIndex)를 생성한다.   pd.date_range(start=None, end=None, periods=None, freq='D') - start : 시작 시점을 지정한다. start, end, period 셋 중에 둘만 지정해도 된다.- end : 끝 시점을 지정한다.- period : 생성할 배열의 개수를 지정한다. - freq : 배열에 적용될 고정된 주기를 지정한다.    예시) import pandas as pd# 2025-01-03부터 2025-01-14까지 모든 날짜를 배열로 생성하기pd.date_range('2025-01-03', '2025-01-14') DatetimeIndex(['2025-01-03', .. 2024. 2. 29.