본문 바로가기
판다스/함수 cheat sheet

[pandas] merge

by 김판다t 2022. 12. 29.

 

엑셀의 vlookup 방식과 유사한 병합을 수행하는 함수

 

 

import pandas as pd
data1 = {'이름': ['김판다', '조민영', '강승주', '최진환', '박연준'], 
         '제품': ['아이스티', '카페라떼', '카페라떼', '아이스티', '녹차']}
data2 = {'제품': ['카페라떼', '아이스티', '녹차'], '가격': [4500, 4600, 4800]}
df1 = pd.DataFrame(data1)
df2 = pd.DataFrame(data2)

df1.merge(df2, how='left', on='제품') # 기본값으로 on='제품'은 생략가능

 

 

 

 

 

 


pandas merge

 

 

merge 함수의 주요 매개변수(parameter)와 인수(argument), 기본값(default)

df.merge(right, how='inner', on=None)

 

  • right: 병합할 객체를 지정
  • how: 병합 방식을 지정하는 매개변수 
    • left: 왼쪽 데이터프레임의 키(key)만을 병합에 사용한다. (vlookup 방식)
    • right: 오른쪽 데이터프레임의 키(key)만을 병합에 사용한다.
    • outer: 양쪽 데이터프레임의 키(key)들의 합집합을 병합에 사용한다.
    • inner: 양쪽 데이터프레임의 키(key)들의 교집합을 병합에 사용한다.
    • cross: 양쪽 데이터프레임의 곱집합(cartesian product)을 생성한다.
  • on: 병합의 기준이 되는 열을 지정하는 매개변
    • 기본값으로 양쪽 데이터프레임에서 이름이 공통인 열들이 지정된다.
    • 리스트로 입력하면 복수의 열을 기준으로 병합한다.

 

 

 

그외 많은 매개변수들이 있다. 더 궁금하면 아래 링크를 참고

 

https://pandas.pydata.org/docs/reference/api/pandas.DataFrame.merge.html

'판다스 > 함수 cheat sheet' 카테고리의 다른 글

[pandas] sort_values  (0) 2022.12.30
[pandas] merge_asof  (0) 2022.12.29
[pandas] read_excel  (0) 2022.12.29
[pandas] #02 iloc 인덱싱  (0) 2022.02.19
[pandas] #01 loc 인덱싱  (0) 2022.02.17