일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- Spring
- kafkastream
- reactive
- kafka interactive query
- Slick
- scala 2.10
- 플레이 프레임워크
- Kafka
- springboot
- schema registry
- aws
- statestore
- spring-batch
- kafka streams
- Elasticsearch
- 한빛미디어
- avo
- spring-kafka
- play framework
- spring-cloud-stream
- gradle
- confluent
- kafkastreams
- scala
- Elk
- enablekafkastreams
- coursera
- RabbitMQ
- Logstash
- 카프카
- Today
- Total
b
한빛미디어 / 데이터 과학 입문 본문
링크 : http://www.hanbit.co.kr/book/look.html?isbn=978-89-6848-135-2
이 책에 대해서 몇번 들었지만, 생소한 분야를 원서로 읽을 용기는 없었다. 이번에 한빛에서 번역판이 나오게 되어서 읽었고, 슥슥 넘겨본 정도이지만, 이에 대한 이야기를 해볼까 한다.
책 서두에도 나오지만 '빅 데이터' 와 '데이터 분석'은 유행처럼 번졌고 아직도 대세다. 정확히 무엇을 뜻하는지 나 같은 평민 개발자는 쉽게 이해할 수 없었다.
포털회사에서 검색에 근무하는 나는 이 정도의 데이터를 처리하고 있으니까 빅데이터인가? 검색로그를 보면서 의미있는 결과를 뽑기위해 삽질하는 나는 데이터 분석을 하고 있는가? 고민하면서 여기 저기 기웃거리며... 그게 여의치 않을때는 책으로 배울려고 했다 ( T_T http://bistros.tistory.com/88 베이지언 통계 내용은 이 책에서 스팸 필터를 처리하는 방법으로 다시 접하였다)
책의 시작은 이러한 고민을 함께 함으로써 시작된다. 그리고 기본적인 알고리즘 선형회귀나 k근접과 같은 아주 기본적인 개념부터 설명한다. (아... 심플한건 책 쓴사람들 입장이다 난 이때부터 어려웠다 -ㅇ-)
그리고 그나마 익숙한 베이지언부터 이야기를 시작한다. 하나의 사례에 대해서 20-30page의 적당한 양으로 분석 / 방법을 제시해 주고 마지막에는 R code로 실제 어떻게 프로그래밍으로 적용시켜야 하는지도 보여준다. (통계학자가 아닌 프로그래머 입장에서 매우 감사하다)
약간의 프로그래밍 지식(R) 과 대충 미적분을 아는 수학 실력이면 이 책을 훑어 볼 수 있다. (물론 다 이해한다는건 아니다).
이 책이 나에게 실적적인 도움이 되었다고는 말 못한다. 하지만 나처럼, 왜? 뭐? 에 대한 약간의 조언과, 앞으로의 길라잡이 정도는 제시해 줄수 있을듯 하다.
(개인적으로) 책 내용은 상당히 난해했고, 딱딱했다... 하지만, 꼭 한번 읽어보라 추천해주고 싶다.