b

한빛미디어 / 데이터 과학 입문 본문

카테고리 없음

한빛미디어 / 데이터 과학 입문

dev.bistro 2014. 12. 27. 15:47




링크 : http://www.hanbit.co.kr/book/look.html?isbn=978-89-6848-135-2


이 책에 대해서 몇번 들었지만, 생소한 분야를 원서로 읽을 용기는 없었다. 이번에 한빛에서 번역판이 나오게 되어서 읽었고, 슥슥 넘겨본 정도이지만, 이에 대한 이야기를 해볼까 한다.

책 서두에도 나오지만 '빅 데이터' 와 '데이터 분석'은 유행처럼 번졌고 아직도 대세다.  정확히 무엇을 뜻하는지 나 같은 평민 개발자는 쉽게 이해할 수 없었다. 

포털회사에서 검색에 근무하는 나는 이 정도의 데이터를 처리하고 있으니까 빅데이터인가? 검색로그를 보면서 의미있는 결과를 뽑기위해 삽질하는 나는 데이터 분석을 하고 있는가? 고민하면서 여기 저기 기웃거리며... 그게 여의치 않을때는 책으로 배울려고 했다 ( T_T http://bistros.tistory.com/88 베이지언 통계 내용은 이 책에서 스팸 필터를 처리하는 방법으로 다시 접하였다)

책의 시작은 이러한 고민을 함께 함으로써 시작된다. 그리고 기본적인 알고리즘 선형회귀나 k근접과 같은 아주 기본적인 개념부터 설명한다. (아... 심플한건 책 쓴사람들 입장이다 난 이때부터 어려웠다 -ㅇ-)


그리고 그나마 익숙한 베이지언부터  이야기를 시작한다. 하나의 사례에 대해서 20-30page의 적당한 양으로 분석 / 방법을 제시해 주고 마지막에는 R code로 실제 어떻게 프로그래밍으로 적용시켜야 하는지도 보여준다. (통계학자가 아닌 프로그래머 입장에서 매우 감사하다)


약간의 프로그래밍 지식(R) 과 대충 미적분을 아는 수학 실력이면 이 책을 훑어 볼 수 있다. (물론 다 이해한다는건 아니다). 

이 책이 나에게 실적적인 도움이 되었다고는 말 못한다. 하지만 나처럼, 왜? 뭐? 에 대한 약간의 조언과, 앞으로의 길라잡이 정도는 제시해 줄수 있을듯 하다. 

(개인적으로) 책 내용은 상당히 난해했고, 딱딱했다... 하지만, 꼭 한번 읽어보라 추천해주고 싶다. 

Comments