0. 빅데이터, 인공지능, 통계지식이 필요하다.
요새 빅데이터, 인공지능 기술에 관심이 많아 지면서, 이 분야의 일자리가 수요가 폭발적으로 증가하고 있습니다. 그리고 이와 관련해서 너무도 많은 강좌들이 만들어지고, 급기야 이제는 사람들이 뭐 부터 시작해야 할지 혼란을 느낄 정도 그 수가 방대해지고 있습니다. 책도 마찮가지 상황입니다. 서점에 책을 사러 가면, 색션이 생길 정도 많은 책들이 출간되고 있습니다.
전, 데이터 사이언스로써 공부를 준비할 때, 통계학을 꼭 공부하라고 조언을 합니다. 그 이유는 결과를 분석하고, 추리할 때 통계학을 사용하지 않을 수 없기 때문입니다. 물론 머신러닝에서도 관련 지식이 필요하지만, 사실은 데이터 분석, 소위 우리가 말하는 빅데이터 분석을 할 때 이용되는게 통계분석입니다. 즉 많은 데이터를 통해서 그 데이터가 함의하고 있는 성향, 성질을 분석하는 학문에 통계학이므로, 빅데이터에서는 빠질 수 없는 지식입니다.
1. 그럼 통계학을 공부할 때 어떻게 해야할까요?
저의 경우에는 쉬운 책, 그리고 성질을 자세히 설정해 주는 책을 고르라고 합니다. 그리고 이 경우 수식이 되도록 많이 없을 것이고, 대신 사례가 많을 것이라는 이야기도 해주죠. 잉?
통계학을 공부하면, 사람들이 먼저 생각하기 쉬운 것이 수학입니다. 물론 통계학은 수학이 맞습니다. 그렇지만, 통계학을 이용하는 방법, 즉 통계 분석은 이우리가 종이에 수식을 적고, 계산을 통해 산출해야하는 것이 아니며, 실제 현장에서도 그렇게 사용하지 않습니다. 그렇지만, 다수의 책들은 수식을 사용해, 통계학만을 가르치는데 집중합니다. 그러나 데이터를 분석하는 사람들은 조금은 다른 관점으로 접근을 해야 합니다. 실무에서는 통계학 자체에 대해서 궁금한 것이 아니라 통계적인 분석 결과물을 얻고 싶은 것이기 때문이죠.
하지만 이렇게 책을 쓴다는 것은 정말 어렵습니다. 이는 수식을 이야기 하지 않으면서, 통계학을 말하는 것과 비슷하기 때문입니다. 분명한 사실은 이러한 내용을 잘 설명하기 위해서는 원리를 정확하게 알고 있어야 합니다. 또한 실제 이를 정학하게 짚고 설명할 수 사람이 책까지 내야 기는 쉽지 않을 테니 도서관이나 서점에서 찾기는 사실 쉽지 않습니다.
하지만, 다행히 최근에 이러한 책들이 빅데이터 분석이 주목을 받게 되면서 다수 출간되고 있고, 해외 좋은 책들이 국내에 번역되어 출간되고 있습니다. 오늘 소개할 책 또한 바로 그런 책입니다.
