본문 바로가기

판다스/함수 cheat sheet71

[pandas] rename_axis 인덱스명을 변경하는 함수 import pandas as pd data = [['송중기', 70, 'A'], ['강승주', 80, 'A'], ['김판다', 93, 'B'], ['이예준', 92, 'B']] df = pd.DataFrame(data, columns=['이름', '점수', '반']).set_index('이름') rename_axis 함수의 주요 매개변수(parameter)와 인수(argument), 기본값(default) df.rename_axis(mapper=None, axis=0) mapper : 변경할 인덱스명을 입력하는 매개변수. 매퍼로도 입력이 가능하고 배열로도 입력이 가능하다. axis : 인덱스의 인덱스명을 변경할 것인지 컬럼즈의 인덱스명을 변경하라 것인지 지정 유튜브에서 판다스 .. 2023. 12. 22.
[pandas] select_dtypes import pandas as pd data1 = {'이름': ['김판다', '강승주', '권보아', '임재범'], '국어': [81, 80, 65, 62], '영어': [62, 88.5, 87, 78], '성별': ['남', '여', '여', '남']} df = pd.DataFrame(data1) 열의 자료형에 기반하여 데이터 프레임을 필터링하는 함수 select_dtypes 함수의 주요 매개변수 (parameter)와 인수(argument), 기본값(default) df.select_dtypes(include=None, exclude=None) include 포함할 자료형을 지정하는 매개변수. 단일 값 또는 리스트 형태로 지정 가능. exclude 제외할 자료형을 지정하는 매개변수. 단일 값 또는 리.. 2023. 12. 20.
[pandas] between 시리즈의 각 셀이 주어진 두개의 값 사이인지 True, False로 반환 import pandas as pds = pd.Series([98, 72, 85, 65, 91])      유튜브에서 판다스 강의 중입니다 https://www.youtube.com/@KimPandas 2023. 11. 25.
[pandas] resample 시간의 흐름에 따라 그룹화해서 함수를 적용하는 함수 import pandas as pd data = {'날짜': ['2023-01-01', '2023-01-15', '2023-01-30', '2023-01-31', '2023-02-02', '2023-02-05'], '금액': [10000, 20000, 30000, 40000, 50000, 60000]} df = pd.DataFrame(data) df['날짜'] = pd.to_datetime(df['날짜']) df.resample('M', on='날짜')['금액'].cumsum() resample 함수의 주요 매개변수(parameter)와 인수(argument), 기본값(default) df.resample(rule, on=None, level=None,.. 2023. 8. 21.
[pandas] cumcount 그룹으로 나누어 순번을 매기는 함수. 반드시 그룹화와 함께 사용한다. excel의 countif와 유사하다 import pandas as pd df = pd.DataFrame({'제품': ['A', 'B', 'B', 'A', 'C', 'A'], '판매량': [10, 20, 30, 40, 50, 60]}) ascending(True 또는 False / 기본값은 True) 오름차순 혹은 내림차순으로 순번을 부여할 것을 지정하는 매개변수. 기본값은 True이며 오름차순이고 위에서 순번을 부여한다.(순번의 시작은 0) 유튜브에서 판다스 강의 중입니다 https://www.youtube.com/@KimPandas 2023. 8. 17.
[pandas] crosstab 빈도수를 집계해 교차표로 만든다. import pandas as pddata = {'반': ['A', 'A', 'A', 'B', 'B', 'B'], '성별': ['남', '여', '여', '여', '남', '남']}df = pd.DataFrame(data)     인자(parameter) index (시리즈 또는 시리즈의 리스트)행으로 구분될 그룹 columns (시리즈 또는 시리즈의 리스트)열로 구분될 그룹  공식문서 https://pandas.pydata.org/docs/reference/api/pandas.crosstab.html  유튜브에서 판다스 강의 중입니다 https://www.youtube.com/@KimPandas 2023. 7. 30.