본문 바로가기
판다스/함수 cheat sheet

[pandas] sample

by 김판다t 2023. 12. 28.

데이터 프레임에서 무작위로 행을 추출하는 함수

 

import pandas as pd
data1 = {'이름': ['김판다', '강승주', '최진환', '조민영', '권보아', '임재범'], 
         '점수': [62, 77, 61, 75, 90, 92]}
df = pd.DataFrame(data1)

 

 

df에서 무작위로 행을 추출해 보자.

 

df.sample(2)

 

위 코드를 사용하면 두 개의 행이 무작위로 추출이 된다. 랜덤 추출이라 시행마다 결과가 다르다.

 

 

df.sample(n=None, frac=None, replace=False)

 

 

sample 함수의 주요 매개변수(parameter)와 인수(argument), 기본값(default)

 

  •  n : 추출할 행의 개수를 지정하는 매개변수. 정수로 지정하며, frac과 동시 사용 불가
  •  frac : 추출할 비율을 지정하는 매개변수. 0과 1 사이의 실수. n과 동시 사용 불가
  • random_state : 난수 생성의 시드를 지정.

 

시드를 부여하면 고정된 결과로 추출할 수 있다.

 

df.sample(2, random_state=1)

 

 

여러분의 추출 결과도 위와 같을 것이다.

 

 

 

frac=1을 활용하면 전체를 재배열할 수 있다. (시드로 결과도 고정하자)

 

df.sample(frac=1, random_state=2)

 

 

'판다스 > 함수 cheat sheet' 카테고리의 다른 글

[pandas] ffill, bfill  (0) 2024.01.06
[pandas] update  (2) 2024.01.02
[pandas] nlargest, nsmallest  (1) 2023.12.28
[pandas] rename_axis  (0) 2023.12.22
[pandas] select_dtypes  (0) 2023.12.20