* 3줄 요약
- 판다스를 소개하는 외국 번역서이다.
- 판다스 입문서를 표방한 책이지만 그림도 거의 없고 다소 딱딱하다
- 그럼에도 불구하고 판다스를 알고 싶다면 이 책외에 선택지는 거의 없다.
* 추천 대상
- [입문자] 를 벗어난 [파이썬 초급자]
판다스(pandas)란?
판다스란 데이터를 조작하기 위한 파이썬 라이브러리(library)입니다. 라이브러리란 쉽게 생각하면 확장 프로그램 정도로 생각하면 됩니다. 최근 많이 얘기하는 파이썬은 사실 데이터 분석을 위해 탄생한 프로그래밍 언어는 아닙니다. 범용(여거저기 다 쓰기위한) 언어였지만 머신러닝이 뜨면서 갑자기 크게 주목 받게 됐죠. 주요한 머신러닝 라이브러리들이 파이썬을 지원했거든요. 데이터 분석과 통계에 특화된 언어는 오히려 R이라 할 수 있습니다. (다만 R은 또 범용 언어가 아니네요....) 파이썬 자체는 익히기 쉽고 사용하기도 쉽다고 합니다. 뭐, 자바나 C언어보다는 확실히 쉽게 보이긴 합니다. 다만, 앞서 언급했듯이 파이썬 자체가 데이터를 다루기 위한 전용 언어가 아니다 보니, 데이터를 조금 더 쉽게 다루려면 다양한 패키지(라이브러리 꾸러미)의 도움을 받아야 합니다. 그중에서 데이터 조작에 관련된 가장 유명한 라이브러리가 판다스입니다. 판다스는 R의 주요 저장 구조인 데이터 프레임으로 부터 영감을 받아 제작되었다고 합니다. 사실 데이터 프레임 자체는 SQL의 '테이블' 엑셀의 '시트'와 거의 같은 개념인데 사용 방법에 따라 달리 부르는 개념입니다. 판다스에서 다루는 저장 구조인 시리즈(series)는 R의 벡터(vector)와 데이터 프레임은 R의 데이터 프레임과 같습니다. 아무튼 한마디로 정리하면 판다스는 파이썬이란 프로그래밍 언어에 조금더 데이터를 쉽게 다루기 위해 붙여서 사용하는 확장 프로그램이라고 생각하면 됩니다. 이 책은 판다스의 사용법을 소개하고 있는 책입니다.
나의 외국 번역서에 대한 선입견
사실 저는 외국 번역서를 별로 좋아하지 않습니다. 제대로 번역이 되지 않았다면 이해하기도 어려울 뿐만 아니라, 책속에 담긴 그들만의 서양식 조크도 썰렁하고 공감도 잘 안되기 때문입니다. 한때 IT서적중에 헤드 퍼스트(head first)시리즈가 유행했던 적이 있습니다. 사실 그중에 몇개는 좋은 책이기도 하죠. 하지만 그 특유의 어색한 친절함과 조작된 유머를 전 별로 안좋아합니다. 마치 회사에서 단합을 위해 단체 교육 받게 하는 '우리는 하나다, 우리는 할수 있다!' 구호를 외치며 시작하는, 그 어색한 강제 인성교육 느낌이 들어서 말입니다.
이런거 시르다....
그나마 번역이 잘되었으면 모르겠는데 도대체 무슨 말을 하는지 모르게 번역된 책들은 정말 곤혹스럽습니다. 하지만 이 책 같은 경우 그정도 괴로움은 없습니다. 적절히 번역되었으며, 적절히 이해됩니다. 그점에서 거부감은 없었습니다.
적절히 번역된 내용들
하지만 거부감이 없다뿐이지 잘 읽힌다? 그것도 아닌 느낌입니다. 내용은 충실하게 나열하고 있지만 친절함은 다소 부족합니다.
그림...그림이 왜 이렇게 없을까
그림, 즉 개념에 대한 이미지는 입문자에게 이해를 쉽게하는 필수 요소입니다. 그런데 이책, 시각화 챕터인 '그래프 그리기' 외에 그림이 왜이리도 없을까요. 다 코드와 글로 주저리 주저리 설명합니다. 물론 경험이 많으신 분들은 쉽게 이해하시는 분들도 있을 겁니다만, 이 책 제목인 '입문자'를 위해서는 별로 좋지 않은 점입니다. 헤드 퍼스트 시리즈는 그림이 과하게 많아서 (+외국 쪼크) 오히려 맥락 이해를 해치는 면이 있었다면, 이책은 쉽게 그림으로 표현해서 알려줄수 있는 요소에도 과감히 그림이 없습니다. 그렇다고 설명이 또 아주 친절하진 않습니다. 그래서 입문자들에게 이 책을 선뜻 추천하긴 어렵습니다. 하지만 데이터 분석 개념이 있는 초급자 이상에게는 괜찮은 선택이 될 수도 있을 듯 합니다.
전문가가 될 사람에게 그림은 사치일뿐
그럼에도 선택할 책은....
20/12 현재 판다스를 다루는 책은 몇권 없습니다. 제 알기로 이 책 외에 한두권 더 있는 것으로 알고 있는데, 판다스는 양념이고 메인은 다른 주제의 책들인 듯 합니다. 때문에 어느 정도 판다스가 정리된 책을 선택하려면 본 책이 대안일수 밖에 없는 상황입니다. (물론 이책도 기본에 더 충실하면 좋았을텐데, matplotlib이나 seaborn에서 판다스 활용법이나 정규식 사용법에 지면을 할애한 점이 다소 아쉽습니다. 이것 참.... 이왕이렇게 된거 제가 기고 형식으로 정리해볼까요?)
다소 아쉽지만 대안이 없으니 판다스가 궁금한 사람들은 이 책으로 시작하는 것도 그리 나쁘진 않을 것 같습니다.
* 3줄 요약
- 판다스를 소개하는 외국 번역서이다.
- 판다스 입문서를 표방한 책이지만 그림도 거의 없고 다소 딱딱하다
- 그럼에도 불구하고 판다스를 알고 싶다면 이 책외에 선택지는 거의 없다.
* 추천 대상
- [입문자] 를 벗어난 [파이썬 초급자]
판다스(pandas)란?
판다스란 데이터를 조작하기 위한 파이썬 라이브러리(library)입니다. 라이브러리란 쉽게 생각하면 확장 프로그램 정도로 생각하면 됩니다. 최근 많이 얘기하는 파이썬은 사실 데이터 분석을 위해 탄생한 프로그래밍 언어는 아닙니다. 범용(여거저기 다 쓰기위한) 언어였지만 머신러닝이 뜨면서 갑자기 크게 주목 받게 됐죠. 주요한 머신러닝 라이브러리들이 파이썬을 지원했거든요. 데이터 분석과 통계에 특화된 언어는 오히려 R이라 할 수 있습니다. (다만 R은 또 범용 언어가 아니네요....) 파이썬 자체는 익히기 쉽고 사용하기도 쉽다고 합니다. 뭐, 자바나 C언어보다는 확실히 쉽게 보이긴 합니다. 다만, 앞서 언급했듯이 파이썬 자체가 데이터를 다루기 위한 전용 언어가 아니다 보니, 데이터를 조금 더 쉽게 다루려면 다양한 패키지(라이브러리 꾸러미)의 도움을 받아야 합니다. 그중에서 데이터 조작에 관련된 가장 유명한 라이브러리가 판다스입니다. 판다스는 R의 주요 저장 구조인 데이터 프레임으로 부터 영감을 받아 제작되었다고 합니다. 사실 데이터 프레임 자체는 SQL의 '테이블' 엑셀의 '시트'와 거의 같은 개념인데 사용 방법에 따라 달리 부르는 개념입니다. 판다스에서 다루는 저장 구조인 시리즈(series)는 R의 벡터(vector)와 데이터 프레임은 R의 데이터 프레임과 같습니다. 아무튼 한마디로 정리하면 판다스는 파이썬이란 프로그래밍 언어에 조금더 데이터를 쉽게 다루기 위해 붙여서 사용하는 확장 프로그램이라고 생각하면 됩니다. 이 책은 판다스의 사용법을 소개하고 있는 책입니다.
나의 외국 번역서에 대한 선입견
사실 저는 외국 번역서를 별로 좋아하지 않습니다. 제대로 번역이 되지 않았다면 이해하기도 어려울 뿐만 아니라, 책속에 담긴 그들만의 서양식 조크도 썰렁하고 공감도 잘 안되기 때문입니다. 한때 IT서적중에 헤드 퍼스트(head first)시리즈가 유행했던 적이 있습니다. 사실 그중에 몇개는 좋은 책이기도 하죠. 하지만 그 특유의 어색한 친절함과 조작된 유머를 전 별로 안좋아합니다. 마치 회사에서 단합을 위해 단체 교육 받게 하는 '우리는 하나다, 우리는 할수 있다!' 구호를 외치며 시작하는, 그 어색한 강제 인성교육 느낌이 들어서 말입니다.
이런거 시르다....
그나마 번역이 잘되었으면 모르겠는데 도대체 무슨 말을 하는지 모르게 번역된 책들은 정말 곤혹스럽습니다. 하지만 이 책 같은 경우 그정도 괴로움은 없습니다. 적절히 번역되었으며, 적절히 이해됩니다. 그점에서 거부감은 없었습니다.
적절히 번역된 내용들
하지만 거부감이 없다뿐이지 잘 읽힌다? 그것도 아닌 느낌입니다. 내용은 충실하게 나열하고 있지만 친절함은 다소 부족합니다.
그림...그림이 왜 이렇게 없을까
그림, 즉 개념에 대한 이미지는 입문자에게 이해를 쉽게하는 필수 요소입니다. 그런데 이책, 시각화 챕터인 '그래프 그리기' 외에 그림이 왜이리도 없을까요. 다 코드와 글로 주저리 주저리 설명합니다. 물론 경험이 많으신 분들은 쉽게 이해하시는 분들도 있을 겁니다만, 이 책 제목인 '입문자'를 위해서는 별로 좋지 않은 점입니다. 헤드 퍼스트 시리즈는 그림이 과하게 많아서 (+외국 쪼크) 오히려 맥락 이해를 해치는 면이 있었다면, 이책은 쉽게 그림으로 표현해서 알려줄수 있는 요소에도 과감히 그림이 없습니다. 그렇다고 설명이 또 아주 친절하진 않습니다. 그래서 입문자들에게 이 책을 선뜻 추천하긴 어렵습니다. 하지만 데이터 분석 개념이 있는 초급자 이상에게는 괜찮은 선택이 될 수도 있을 듯 합니다.
전문가가 될 사람에게 그림은 사치일뿐
그럼에도 선택할 책은....
20/12 현재 판다스를 다루는 책은 몇권 없습니다. 제 알기로 이 책 외에 한두권 더 있는 것으로 알고 있는데, 판다스는 양념이고 메인은 다른 주제의 책들인 듯 합니다. 때문에 어느 정도 판다스가 정리된 책을 선택하려면 본 책이 대안일수 밖에 없는 상황입니다. (물론 이책도 기본에 더 충실하면 좋았을텐데, matplotlib이나 seaborn에서 판다스 활용법이나 정규식 사용법에 지면을 할애한 점이 다소 아쉽습니다. 이것 참.... 이왕이렇게 된거 제가 기고 형식으로 정리해볼까요?)
다소 아쉽지만 대안이 없으니 판다스가 궁금한 사람들은 이 책으로 시작하는 것도 그리 나쁘진 않을 것 같습니다.