(해당 포스트에서 소개하고 있는 “딥러닝의 정석 (2판)” 책은 한빛미디어로부터 제공받았음을 알려드립니다.)
보통 시간이 날때마다 서점에서 딥러닝 관련 서적이 어떤게 있는지 찾아보곤 한다. 불과 몇년전만 해도 몇권 없던 딥러닝 개발 관련 책들이 이제는 정말 많아졌고, 요새는 LLM이나 생성AI 같은 최신 트렌드를 반영한 책들도 많이 나오고 있는것 같다. 개인적으로는 그런 최신 트렌드를 다룬 책들보다 원론적으로 딥러닝이 동작하는 원리에 대해서 잘 설명한 책이 나오면 좋겠다는 생각을 가지고 있고, 그런 내용을 위주로 원서나 역서를 찾아보는 편이다. 그런데 딥러닝 책이 정말 많다보니 다뤄지는 내용이나 설명하는 내용도 다양하다. 어떤 책은 밑바닥부터 처음부터 설명하는 책들도 있고, 기본적인 내용은 알고있다는 가정하에 바로 이론적인 내용을 다루는 책들도 있다.
이번에 소개하는 “딥러닝의 정석 (2판)” 책은 6년전에 나왔던 1판에서 내용 구성 및 실습 환경이 변경되어 출간된 책이다. 당시에는 텐서플로로 진행했던 실습 내용이 이번에는 파이토치로 변경되었다. 거기에 이해에 필요한 수학적인 배경까지 조금더 보강되어서 출간되었다. 그렇게 보면 앞에서 언급한 책의 기준으로 놓고 보자면 이론과 실습이 적절하게 배치된 책이 되겠다.
책을 읽어보면 딥러닝 이해에 필요한 선형대수학과 확률 관련 내용이 초반에 다뤄지고 있어, 처음 딥러닝을 접하는 사람들이 느낄법한 수학적인 이해의 어려움이나 궁금증을 해소할 수 있게 해놨다. 물론 기초 내용이기 때문에 분량도 많지 않고, 심도있게 다뤄지지 않지만, 그래도 뒷부분에 다뤄질 내용의 배경에 대해서 잘 배치가 된 것 같아 좋았다. 또한 내용을 설명할 수 있는 도식, 특히 모델의 구조에 대한 전체적인 그림들이 상당수 담겨져 있어, 내가 만든 모델이 이런 형태를 띄는구나를 보기에 좋았던 것 같다. 그리고 2판이 비교적 최근에 나온지라 어텐션이나 메모리 증강형 모델에 대한 설명도 포함되어 있어, 해당 모델에 대해서 직접 구현해보고 공부해보고자 하는 사람에게 도움이 될 듯 하다.
그런데 뭔가 “정석”이란 타이틀을 달고 있는 책이기에 책의 전체 분량이라던가 각 주제별 분량이 균형적이지 않은 부분이 조금 아쉬운 감이 있다. 사실 1판때도 언급된 내용이기도 한다. 영상이라던가 NLP, 강화학습 관련 내용이 자세하게 다뤄졌다기 보다는 조금 NLP에 편중되어 설명된 감이 있다. 특히 강화학습 관련 내용은 조금 실망스러울 정도로 내용이 정말 짧게 다뤄졌다. 영상쪽도 최근 기술이 언급되었다기 보다는 일반적인 예제에 대한 내용을 다루고 있었다. 물론 시퀀스 모델이나 생성모델, 메모리 증강형 모델에 대한 내용은 딥러닝 부분의 상당수를 다루고 있고, 내용 또한 디테일하게 잘 설명되어 있다. 그래서 관련 연구를 하거나 공부하는 사람에게는 정말 좋은 책이 될 수 있다. (아마 관련 내용을 다루는 저자의 성향이겠지만…) 그래도 이 내용으로 “정석”이라고 하기엔 조금 부족한 부분이 아닐까 생각한다.