본문 바로가기

분류 전체보기242

[pandas] 시리즈에 apply 대신 map 함수로 매핑하는 이유 시리즈에 apply 대신 map 함수로 매핑하는 이유apply 함수와 map 함수의 가장 큰 차이는 데이터 프레임에 적용할 수 있는지 여부입니다. apply 함수는 데이터 프레임과 시리즈 모두에 사용할 수 있는 반면, map 함수는 시리즈에만 사용할 수 있습니다. (map 함수는 인덱스 클래스에는 적용 가능합니다.) 시리즈에 매핑을 수행할 때는 apply와 map 함수를 모두 사용할 수 있지만, 일반적으로 map 함수를 더 자주 사용합니다. 그렇다면 왜 범용성이 높은 apply를 두고 굳이 map 함수로 매핑을 하는 것일까요?  결론부터 말하자면 apply 함수는 함수로만 매핑이 가능하지만, map 함수는 apply와는 달리 함수뿐만 아니라 매퍼(mapper), 즉 딕셔너리와 같은 구조체도 사용할 수 있.. 2023. 5. 27.
[pandas] 데이터 프레임에서 큰 숫자를 가독성 좋게 표기하기 판다스의 데이터 프레임에서 큰 숫자의 가독성을 개선하는 방법데이터 분석을 하다 보면 대규모 데이터셋에서 큰 숫자를 다루게 되는 경우가 많습니다. 특히, 숫자가 크면 클수록 값을 직관적으로 이해하기 어려워지기에, 가독성을 높이는 것이 중요합니다. 이번 글에서는 데이터 프레임에서 큰 숫자를 좀 더 가독성 좋게 표기하는 방법을 알아보고자 합니다. Example Code import pandas as pddata = {'일련번호':[2101, 2102, 2103], '금액':[123000000, 456000000, 1230000000]}df = pd.DataFrame(data) df Problem예시 데이터 프레임은 금액 열에 큰 숫자가 포함되어 있어 가독성이 떨어집니다.이를 개선하기 위해 금액 .. 2023. 5. 26.
[pandas] 데이터 프레임에서 퍼센트(%)로 수치를 표기하는 방법 Example Code import pandas as pddata = {'종가': {0: 1000, 1: 1200, 2: 1300, 3: 1100}, '등락률': {0: 0.1, 1: 0.2, 2: 0.0833, 3: -0.1538}}df = pd.DataFrame(data)df df :  Problem  아래 그림처럼 위 데이터 프레임에서 등락률을 소수점 아래 두자리만 표기하는 %로 나타내고자 한다 어떻게 해야 할까? 해결방법1 등락률의 데이터를 100을 곱한 뒤 : mul(100)소수점 셋째 자리에서 반올림을 하고 : round(2)문자열로 바꾸고 : astype('str')%를 붙여주면 된다. df['등락률'].mul(100).round(2).astype('str') + '%' 0 .. 2023. 5. 26.
[pandas] 주피터 노트북에서 여러개의 데이터 프레임을 가로로 출력하기 # 데이터 프레임을 가로로 출력하자 from IPython.display import display, HTML HTML('') 위 코드를 실행시키고 display 함수로 데이터 프레임을 출력하면 된다 import pandas as pd data = [[1, 2, 3], [4, 5, 6], [7, 8, 9]] df1 = pd.DataFrame(data, index=list('ABC'), columns=['국어', '수학', '영어']) df2 = pd.DataFrame([[3, 1], [2, 10]], list('AC'), columns=['국어', '영어']) display(df1) display(df2) output: 유튜브에서 판다스 강의중입니다 https://www.youtube.com/@KimPa.. 2023. 5. 26.
[pandas] 구글 코랩과 주피터 노트북 비교 : 파일에서 데이터 프레임을 불러오는 방식의 차이 구글 코랩 구글 코랩은 내 컴퓨터의 파일을 불러올 수 없으므로 위 그림의 폴터 아이콘을 클릭해 구글코랩에 일단 파일을 업로드해서 경로명을 따서 부른다구글 코랩에 업로드를 한 뒤 경로명을 복사해서 해당 경로명으로 파일을 사용한다 상세한 설명이 더 필요하다면 아래 영상을 참고하라 (10:26 부터 파일 업로드해서 쓰는 부분 설명)    주피터 노트북 주피터 노트북은 내 컴퓨터의 파일을 부를 수 있으므로 내 컴퓨터의 경로명을 이용해 파일을 부른다 이때 역슬래쉬(\) 혹은 원화(₩)로 된 경로명은 슬래쉬 두개로 바꿔준다(//)   만약 불러오려는 엑셀 파일과 ipynb파일이 같은 폴더라면 파일명만으로 부를 수 있다.     유튜브에서 판다스 강의중입니다https://www.youtube.com/@KimPanda.. 2023. 5. 25.
[pandas] 코딩에 데이터에 대한 질문을 할 때 예시를 작성하는 방법 데이터는 말로 설명하면 안됩니다 먼저 여러분에게 직면한 문제를 작고(minimal) 재현가능한(reproducible)한 예로 만들어야 합니다그래야 답변자도 여러분의 질문을 손쉽게 돌려볼 수 있고, 여러분의 질문을 공부하려는 사람도 손쉽게 돌려볼 수 있습니다. 여러가지 방법이 있겠지만 코딩에 미숙한 분들이 가장 쉽게 예를 코드로 만드는 방법을 알려드립니다 문제과목별 점수로 이루어진 데이터프레임을 이용해 석차로 이루어진 데이터프레임을 만들어 보자  1. 엑셀을 열어 시트에서 작고(minimal) 재현가능한(reproducible)한 예로 만듭니다 저는 편의상 columns는 주황색 index는 하늘색으로 표현합니다    2. 왼쪽의 input에 해당하는 데이터 프레임을 copy합니다   3. 주피터 노트북.. 2023. 5. 25.