본문 바로가기
파이썬의 엑셀, 판다스 라이브러리/서문 및 목차

서문

by 김판다t 2024. 10. 15.

 

교보문고 구매 페이지

알라딘 구매 페이지

yes24 구매 페이지

 

 

데이터는 새로운 원유로 불리며, 현대 사회에서 그 중요성이 나날이 커지고 있습니다. 데이터 분석을 통해 기업은 전략적 결정을 내릴 수 있고, 연구자는 새로운 통찰을 얻을 수 있으며, 개인은 자신의 업무 효율성을 극대화할 수 있습니다. 그 중요성을 반영하듯 수많은 사람들이 데이터를 다루는 직군에 종사합니다. 그렇지만 그와 함께 데이터 분석의 과정에서 고통받는 이들 역시 많아지고 있습니다. 데이터만 전문적으로 다루는 데이터 분석가들조차 큰 스트레스를 받기는 마찬가지입니다.


데이터를 다루는 사람이라면, 최소한 수집한 원시 데이터를 원하는 방향으로 바꾸는 과정이 고통스러운 시간이 되는 것은 피해야 하지 않을까요? 저는 이것을 ‘데이터 인권’이라는 단어로 부르고자 합니다. 데이터를 스트레스 받지 않고 편하게 다룰 수 있다면, 데이터 인권을 지키고 있는 것이지요. 그만큼 데이터 분석의 ‘과정’은 데이터를 다루는 사람의 삶의 질에 큰 영향을 미치며, 경쟁력, 자신감, 나아가 자기존중감까지 관련있다고 생각합니다.


이 책에서 다루는 판다스(Pandas)는 파이썬의 강력한 데이터 조작 라이브러리로, 대량의 데이터를 효율적으로 처리하고 분석할 수 있게 해줍니다. 엑셀 같은 전통적인 스프레드시트 프로그램의 한계를 극복하고자 하는 여러분에게 새로운 가능성을 열어줄 것입니다. 이미 마이크로소프트도 판다스의 효용성을 인정해 파이썬과 판다스 라이브러리를 사용할 수 있도록 업데이트하였습니다. 이 책은 판다스를 통해 데이터 분석을 시작하고, 심화할 수 있는 통로를 제공함으로써 독자가 데이터 인권을 지키는 데 도움을 주고자 합니다.


또한 이 책을 집필하기 이전, 저는 현재 코딩책이 입문서와 전문가용 서적 두 가지로 양분되어 있다는 것에 깊이 공감하였습니다. 저 역시 입문서로 구매한 책들을 실제 코딩할 때는 거의 참고하지 않는 경우가 많았습니다. “입문자와 전문가 모두에게 도움되는 한 권의 책을 만들 수는 없을까?”라는 고민 끝에 이 책을 집필하게 되었습니다. 그래서 초심자도 쉽게 이해할 수 있도록 내용을 풀어 썼으며, 개발자들의 최대 질문 사이트인 stackoverflow에서 1,000개에 가까운 질문을 처리한 경험을 바탕으로 중급자들이 실제로 판다스를 사용할 때 어려움을 겪는 부분을 설명하여, 실전적으로 꼭 필요한 부분들을 담았습니다. 또한 판다스 숙련자들에게 필요한 고급 기술도 심화 파트에서 심도 있게 다루었습니다.

이 책이 데이터를 다루는 직종에 종사하거나 그러한 직종을 희망하지만 원하는 바를 아직 이루지 못한 분들에게 도움이 되기를 바랍니다. 또한 독자 여러분이 수많은 원시 데이터와 빅데이터로부터 자신이 원하는 데이터를 스트레스 없이 정확하게 산출할 수 있는 역량을 갖추길 바랍니다.


끝으로, 검토와 교정에 참여해 책의 완성도를 높여 주신 김민지 조교님께 감사드립니다.