[pandas] 시리즈의 각 셀의 인덱싱과 슬라이싱
str 속성에 인덱싱과 슬라이싱을 하면 시리즈의 각 셀의 인덱싱과 슬라이싱을 수행한다 예제 import pandas as pd data = {'문자열': ['A0', 'B1', 'C2', 'D3'], '문자열2': ['물리01', '물리02', '화학01', 99], '리스트': [['물리', 1], ['물리', 2], ['화학', 1], ['화학', 2]]} df = pd.DataFrame(data) 먼저 각 셀의 인덱싱을 수행하는 방법은 다음과 같다. 슬라이싱도 수행이 가능하다. 문자열이 아닌 리스트의 인덱싱과 슬라이싱도 가능하다
2024. 1. 30.
[pandas] update
입력된 데이터 프레임의 null이 아닌 값으로 기존 데이터 프레임을 수정하는 함수. 실행 즉시 원본을 덮어 쓴다 import pandas as pd data1 = {'국어': {'A': 25, 'B': 72, 'C': 13, 'D': 78, 'E': 25}, '영어': {'A': 45, 'B': 94, 'C': 92, 'D': 70, 'E': 18}} data2 = {'국어': {'A': 64, 'E': 75, 'C': 94}, '영어': {'A': 76, 'E': 85, 'C': float('nan')}} df1 = pd.DataFrame(data1) df2 = pd.DataFrame(data2) df.update(other=None)
2024. 1. 2.
[pandas] sample
데이터 프레임에서 무작위로 행을 추출하는 함수 import pandas as pd data1 = {'이름': ['김판다', '강승주', '최진환', '조민영', '권보아', '임재범'], '점수': [62, 77, 61, 75, 90, 92]} df = pd.DataFrame(data1) df에서 무작위로 행을 추출해 보자. df.sample(2) 위 코드를 사용하면 두 개의 행이 무작위로 추출이 된다. 랜덤 추출이라 시행마다 결과가 다르다. df.sample(n=None, frac=None, replace=False) sample 함수의 주요 매개변수(parameter)와 인수(argument), 기본값(default) n : 추출할 행의 개수를 지정하는 매개변수. 정수로 지정하며, frac과 동시 사..
2023. 12. 28.
[pandas] nlargest, nsmallest
값을 기준으로 데이터의 일부만 가져오는 함수 nlargest 함수는 기준 열의 값이 높은 순으로 요구하는 행만큼 가져오고 nsmallest 함수는 기준 열의 값이 낮은 순으로 요구하는 행만큼 가져온다 import pandas as pd data1 = {'이름': ['김판다', '강승주', '최진환', '조민영', '권보아', '임재범'], '점수': [62, 77, 61, 75, 90, 92]} df = pd.DataFrame(data1) df.nlargest(n, columns, keep='first') n: 상위 몇 개의 행을 가져올 지 지정하는 정수 값 columns: 정렬 기준이 되는 열 keep: 동점이 존재하는 경우, 그 중 어떤 행을 가져올 지 결정하는 옵션. 기본값은 첫 행만 가져 오는 '..
2023. 12. 28.