데이터 프레임에서 무작위로 행을 추출하는 함수
import pandas as pd
data1 = {'이름': ['김판다', '강승주', '최진환', '조민영', '권보아', '임재범'],
'점수': [62, 77, 61, 75, 90, 92]}
df = pd.DataFrame(data1)
df에서 무작위로 행을 추출해 보자.
df.sample(2)
위 코드를 사용하면 두 개의 행이 무작위로 추출이 된다. 랜덤 추출이라 시행마다 결과가 다르다.
df.sample(n=None, frac=None, replace=False)
sample 함수의 주요 매개변수(parameter)와 인수(argument), 기본값(default)
- n : 추출할 행의 개수를 지정하는 매개변수. 정수로 지정하며, frac과 동시 사용 불가
- frac : 추출할 비율을 지정하는 매개변수. 0과 1 사이의 실수. n과 동시 사용 불가
- random_state : 난수 생성의 시드를 지정.
시드를 부여하면 고정된 결과로 추출할 수 있다.
df.sample(2, random_state=1)
여러분의 추출 결과도 위와 같을 것이다.
frac=1을 활용하면 전체를 재배열할 수 있다. (시드로 결과도 고정하자)
df.sample(frac=1, random_state=2)
'판다스 > 함수 cheat sheet' 카테고리의 다른 글
[pandas] ffill, bfill (0) | 2024.01.06 |
---|---|
[pandas] update (2) | 2024.01.02 |
[pandas] nlargest, nsmallest (1) | 2023.12.28 |
[pandas] rename_axis (0) | 2023.12.22 |
[pandas] select_dtypes (0) | 2023.12.20 |