본문 바로가기

전체 글263

[pandas] pct_change 바로 위 칸의 데이터와의 변동률을 구하는 함수 import pandas as pd data = [['01/01', 1000], ['01/02', 1200], ['01/03', 900], ['01/04', 1200], ['01/05', 1500]] df = pd.DataFrame(data, columns=['날짜', '가격']) pct_change 함수의 주요 매개변수(parameter)와 인수(argument), 기본값(default) df.pct_change(periods=1, axis=0) periods (정수) 연산할 데이터와의 거리를 지정하는 매개변수 axis (0 or 1) 가로 방향으로 함수를 적용할 것인지 , 세로 방향으로 함수를 적용할 것인지 지정하는 매개변수 공식문서 https://pan.. 2023. 7. 6.
[pandas] diff 바로 위 칸의 데이터와의 차이를 구하는 함수 import pandas as pddata = [['01/01', 1000], ['01/02', 1200], ['01/03', 900], ['01/04', 1200], ['01/05', 1500]]df = pd.DataFrame(data, columns=['날짜', '가격'])      diff 함수의 주요 매개변수(parameter)와 인수(argument), 기본값(default) df.diff(periods=1, axis=0) periods (정수)연산할 데이터와의 거리를 지정하는 매개변수 axis (0 or 1)가로 방향으로 함수를 적용할 것인지 , 세로 방향으로 함수를 적용할 것인지 지정하는 매개변수    공식 문서 https://pandas.pyda.. 2023. 7. 6.
[pandas] where 조건문이 False인 부분의 값을 변환하는 함수 즉 불리언 마스킹(boolean masking) 을 수행하는 함수 import pandas as pd s = pd.Series([86, 79, 93, 80], index=list('ABCD')) pandas where mask 함수의 주요 매개변수(parameter)와 인수(argument), 기본값(default) df.where(cond, other=nan) cond 조건문처럼 작동하는 True와 False의 배열을 입력받는 매개변수. other 조건문이 False일 때 변환될 값을 지정하는 매개변수 . 기본값은 NaN이다 그외 많은 매개변수들이 있다. 더 궁금하면 아래 링크를 참고 https://pandas.pydata.org/docs/referenc.. 2023. 7. 5.
[pandas] 일부만 %로 표기된 열을 float으로 바꿀 때 아래 시리즈 s는 일부만 %로 표기되어 있고 %로 표기된 부분은 문자열이 된다 import pandas as pd s = pd.Series(['1', 2, '300%']) s 0 1 1 2 2 300% dtype: object 이 s의 dtype을 float로 바꾸려면 %로 된 문자열 부분 때문에 그냥은 쉽지 않다 이럴 때는 아래와 같은 코드를 사용하면 된다 cond1 = s.astype('str').str.contains('%') s.mask(cond1, s.astype('str').str.replace('%', '').astype('float').div(100)).astype('float') output 0 1.0 1 2.0 2 3.0 dtype: float64 %외에도 문자열로 섞여있는 다른 값이 .. 2023. 7. 5.
[pandas] map 시리즈나 인덱스의 데이터를 매퍼(주로 딕셔너리)로 매핑하는 함수 import pandas as pd s = pd.Series(['사과', '바나나', '바나나', '포도', '사과']) dict1 = {'사과' : 0, '바나나' : 1, '포도' : 2} s.map(dict1) output: 0 0 1 1 2 1 3 2 4 0 dtype: int64 s.map(func) 매퍼는 주로 딕셔너리가 많이 쓰이지만 딕셔너리와 똑같은 구조인 시리즈도 가능하다 또한 함수도 가능하다 2023. 6. 27.
[pandas] round 데이터 프레임이나 시리즈를 반올림하는 함수 import pandas as pd data = [[1.025, 2.249], [3.923, 4.035], [5.418, 6.736]] df = pd.DataFrame(data, index=list('ABC'), columns=['col1', 'col2']) df.round(decimals=0) decimals : 소수점 자리수를 지정한다. 기본값은 0이고 소수점 첫째 자리에서 반올림을 수행한다. 0~4는 버림 6~9는 올림 5는 앞 숫자가 짝수라면 버리고 앞 숫자가 홀수라면 올린다 2023. 6. 26.