[머신러닝 삽질기1 - 선형대수와 통계학으로 배우는 머신러닝 with 파이썬]

송진영
2021-07-27
조회수 535


음... 사진을 보자마자 이상함을 느낄지 모르겠다. '책을 사진찍는건 알겠는데, 밑에 노트 두권은 뭔가?'라고 말이다.


대답은 간단하다. 600페이지에 달하는 저 책의 개념설명을 노트 두권에 정리한 거다. 

(공부하려고 정리한거지 다른 목적이 있던게 아니었다. 그만큼 이 책에 대해 비판할 때 그저 대충 읽고 비판하는게 아니라는 의미기도 하다)


책의 xi페이지를 보면 다음과 같은 추천사가 나온다.


"어떤 사실에 대해 정말로 알고 있다면 뜻을 더 분명히 전달하기 위해 적어도 3번은 바꿔 이야기할 수 있어야 한다는 말이 있습니다. 이 책에서 어떤 확률 분포의 파라미터를 추정하는 것, 어떤 매니폴드 x에서 다른 매니폴드 y로 매핑하는 것, 특정 집합 위에서 정의된 어떤 값의 극값을 찾는 것이 사실은 다 같은 이야기를 하기 위함인 것도 어쩌면 같은 맥락의 일환이 아닐까 생각합니다." 김민성 (PUBG ML Service팀 데이터 분석가) 


이렇게 불필요한 수식어구를 없애고, 본질에 충실하면서 아름답게, 매혹적으로 추천사를 써줄 수 있을까. 


마치 소설 속의 문장에 매료되듯, 이 강렬한 추천사에 매료되었고 설레는 마음으로 읽기 시작했다.

실제로 이 책은 페이지 수도 많은 것에 더해 굉장히 꼼꼼하게 개념을 정리해주려고 노력한 흔적들이 엿보인다.

코드는 라이브러리가 제공하는 기본적인 데이터셋을 쓰고 튜토리얼 정도를 보여주지만, 개념은 수준있게 보여주는 편이다.


그렇기에 머신러닝을 아예 처음 접하는 사람에게 이 책은 어쩌면 적합하지 않을 수 있다. 수식이 엄청, 매우 많기 때문이다. 

(물론 머신러닝 공부하겠다면서 수식을 피한다는거 자체가 말이 안되지만, 코드실습을 위주로하는 초심자 책이 아니라는 말이다. 아래 사진을 첨부했다. 상콤한 선형대수^^)

그렇게 조금씩 책을 읽어가고 속도를 내볼까 하면 마치 과속방지턱처럼 오타가 튀어나왔다. 이미 저자가 정오표를 올려주긴 했지만, 그 정오표에도 나오지 않는 오타들이 수두룩했다. (저 위에 아름답게 추천사를 써주신 분은 책을 제대로 보신걸까 생각했다)


처음엔 그런가보다 했는데, 이게 계속되다보니 예민해졌다. 왜냐면 저자의 설명이나 글자 하나하나를 다 의심하면서 쳐다봐야하기 때문이다. 책을 보면 분명 실력이 뛰어나신 분이라는 건 의심할 여지가 없다. 다만, 설명하시면서 실수하진 않으셨을지, 아니면 편집과정에서 뭔가 잘못되진 않았을지, 깃헙에 있는 코드와 책에 있는 코드가 다르진 않는지, 환경설정이 맞진 않는지 이런 부분에서 오류를 잡아나가야하기 때문에 그렇다.


물론 이런 과정을 active learning으로 긍정적으로 평가할 수도 있지만(이렇게라도 의미부여를 해야 버틴다. 역시나 내가 그랬다) 편집과정에서 이런건 좀 필터링이 되었어야 한다고 생각이 들었다.


이 책의 깃헙에 많은 분이 제보를 했고, 나도 간단한 오타부터 결정적인 오타까지 제보를 많이 한 편이니 아마 다음에 개정되어 나올 땐 오타부분은 많이 줄어들거라고 생각한다. (혹시 개정된다면 어떤 개념이 가진 중요한 기하하적 의미나 주의해야 할 사항같이 중요한 내용을 초반부에 배치하고 수식이나 다른 내용이 뒤로 빠졌음 좋겠다.)


이전에 설명했듯이 이 책은 코드보다는 개념설명에 집중하는 편이다. 물론 다루는 내용이 워낙 방대하다보니 매우 깊게 따지진 않지만 그래도 지금까지 나온 여러 책들 가운데 수식을 가장 많이 사용하고, 이론적으로 정밀하게 다루려고 하는 책이다.


그렇기 때문에 이 책은 머신러닝 관련 면접을 준비할 때 유용할만한 책이라고 생각이 들었다.


머신러닝 관련 개념을 매우 추상적으로는 대답할 수 있는데, 실제로 구체적인 내용을 어떻게 답해야 할지 모른다면 이 책은 괜찮은 참고자료가 될 듯 하다.


다만, 기본적으로 두껍기에 인내심을 가져야하고, 지금 현재는 오타가 꽤 있는편이라 한 번 더 인내심을 발휘해야 한다.


참을 忍을 많이 새기며 책을 보시길. 

1 0

Data Chef.

datachef00@gmail.com

ⓒ 2020 Data Chef.

Hosting by I'M Datachef

Data Chef.
e-Mail

datachef00@gmail.com


Seoul, Korea  ㅣ  Biz License 000-00-00000  ㅣ Hosting by Datachef.